Wat is (het nut van) big data discovery?
De nieuwe trend in de analyse van data bestaat uit drie woorden: big data discovery. Maar wat zijn we er mee? Naar aanleiding van ons (gratis) seminar over Business Intelligence en Analytics op 5 mei besteden we extra aandacht aan dit thema.
Volgens onderzoeksbureaus als Gartner is "Big Data Discovery" de nieuwe trend in de wereld van business intelligence en analytics. Nu ja, nieuw. Het is de logische combinatie van Big Data, Data Discovery en Data Science, drie begrippen die al eerder opdoken.
Drie
Elke van deze drie termen hebben, inzake gebruik maar ook qua buzz-factor, een opmerkelijke groei doorgemaakt de laatste jaren. Al hebben ze erg verschillende kenmerken.
[related_article id=”162120″]
Bij data discovery draait het om het creëren van interactieve rapporten en verkenbare gegevens. De focus ligt hier op het visualiseren van de informatie door de zakelijke gebruiker zelf. Dit concept springt er uit inzake gebruiksgemak en snelheid van het weergeven van analyses, maar staat slechts een beperkte diepgang inzake de exploratie van de data toe.
Data science is totaal anders. Dat biedt erg krachtige analyse, maar is in vergelijking eerder traag, complex en moeilijk om te implementeren. Bij big data ligt de focus op analyses op zeer grote volumes van data. De snelheid (velocity), waarmee deze data gegenereerd wordt, is zeer hoog, net als de diversiteit (variety) van de data.
Voordelen
Aangezien de nadelen van elke van de drie concepten redelijk goed stroken met de voordelen van de andere, beginnen ze zich te mengen, oordelen bureaus als Gartner. Deze laatste is van oordeel dat big data discovery een aparte marktcategorie zal zijn in 2017.
De opkomende toepassingen inzake big data discovery zullen eenvoudiger te gebruiken zijn dan data science-producten. Terwijl ze tegelijk toegankelijk zijn voor een brede waaier van gebruikers en een bredere reeks van databronnen. “Deze toepassingen zullen gebruikt worden door citizen data scientists die de stiel van business analist verenigen met de expertise van statistiek”, voorspelt Joao Tapadinhas, een analist bij Gartner.
Werelden
Helemaal nieuw is de trend overigens niet. Business intelligence en analytics draait al een tijdje op twee snelheden. Enerzijds zijn er de de grote en gebruiksintensieve datawarehouses waarop de diepgravende analyses gebeuren: die zijn langzaam, maar bieden wel de meest strategische inzichten.
Anderzijds is er de zogenaamde agile BI of self service BI, waarbij de eindgebruiker zich kan uitleven op de gegevens op zoek naar snel bruikbare inzichten. Die tweede stroom kan voor chaos zorgen, maar dat kan worden vermeden door bedrijfsgegevens te exporteren en ter beschikking te stellen in een zogeheten ‘sandbox’. Dit wordt dan letterlijk de zandbak waarbinnen de eindgebruiker zijn gang kan gaan.
Met big data discovery lijken die twee snelheden of uitersten geleidelijk meer en meer naar mekaar toe te groeien.
Op 5 mei organiseren Smart Business en ZDNet.be een (gratis) seminar over business intelligence en analytics in onze Business Meets IT-reeks. Meer info op: www.businessmeetsit.be.