Big data en koebeesten

Big data heeft een enorme disruptieve kracht. Voor zowat iedere sector zijn de voordelen legio maar er loeren gevaren om de hoek. Een verslag van het op 12 mei gehouden seminar van Business Meets IT rond big data en Business Intelligence.

 

Zes jaar lang al vinden we Daan Gerits aan het voorfront van de big data-beweging in België. De oprichter van Bigboards stond aan de wieg van de big data-community toen die nog maar zes personen telde, vandaag gaat het al om 1.500 geïnteresseerden. Als gastprofessor aan de Thomas Moore-hogeschool biedt Gerrits een uniek onafhankelijk perspectief over big data. Hij weet wat het is, wat het niet is en hoe je er mee aan de slag gaat, en die kennis deelt hij maar al te graag op het seminarie.

Verdeel en heers

“Eerst opslaan, dan verwerken.” Gerits valt met de deur in huis. “Alle gegevens die je later eventueel wil gebruiken moet je eerst op servers plaatsen. De data aannemen, verdelen en onderscheid maken komt later.” Dat past niet alleen in een handige workflow, het is ook nog eens veilig. Loopt er iets mis, dan kan je immers te allen tijde terugkeren naar de originele gegevens.

 

Verdeel en heers is de volgende stap. “Petabytes aan data kan je niet verwerken op één server. Bovendien is het een onbegonnen werk om dergelijke hoeveelheden data te versluizen over netwerken.” De oplossing is eenvoudig: “De werklast moet verdeeld worden over de servers, en de applicaties moeten de data opzoeken en daar hun werk doen.”

 

Tot slot geeft Gerrits een gouden raad mee: houd het eenvoudig, maar oversimplificeer niet.” Die raad lijkt goud waard. Wie in één keer alles wil analyseren en voorspellen met big data komt bedrogen uit: de resultaten zullen te lang op zich laten wachten en management zal vertrouwen verliezen. Duidelijke en haalbare doelen zijn een must, net als op een realistische schaal beginnen. Dezer dagen is schaalbaarheid immers een peulenschil.

Privacy en big data

Herman Croux, advocaat en partner bij MVVP, maakt meteen enkele bedenkingen. Dat het handig is om data te verzamelen en dan pas te verwerken betwist hij niet, maar hij heeft zijn twijfels bij de legaliteit, zeker wanneer het over persoonsgegevens gaat. Persoonsgegevens zijn data waarmee je mensen kan identificeren. Ze zijn waardevol voor bedrijven maar zowel Belgische als Europese wetgeving kijken nauw toe op het juiste gebruik ervan.

 

“Wanneer iemand zijn persoonsgegevens meedeelt, heeft die redelijke verwachtingen over het gebruik er van”, verduidelijkt Croux. “Je mag de gegevens niet overmatig gebruiken en al wat je doet moet proportioneel blijven.” Wil dat dan zeggen dat de Googles en de Facebooken van deze wereld illegaal bezig zijn? “Absoluut niet: je kan altijd toestemming vragen voor de verwerking van persoonsgegevens, zolang je maar eerlijk en transparant bent over je doelstellingen.”

 

Zelfs dan zijn de mogelijkheden echter niet onbeperkt. Waar Gerits het een goed idee vindt om data bij te houden, ligt dat in het geval van persoonsgegevens moeilijk. Croux: “Je moet een duidelijke reden hebben voor het bijhouden van de gegevens, en dataretentie mag in de regel niet onbeperkt zijn.”

 

Ook wie niet actief met persoonsgegevens aan de slag is, loopt tegen de beperkingen van de juridische omkadering op. Zo mag je databases niet zomaar over de oceaan verplaatsen, tenzij ook daar uitdrukkelijk toestemming voor gegeven wordt.

Moogle

Dat begrijpt Bonny Van Ranst, dierenarts bij de UGent als geen ander. Hij heeft bij voorsprong de meest excentrieke presentatie van de ochtend. “Hoe kunnen we big data toepassen op koeien?”, vraagt hij zich luidop af. Het antwoord: MmmooOgle. Moogle demonstreert dat big data niet beperkt is tot bepaalde sectoren. Van Ranst maakt ons duidelijk dat de koeiensector, die 1 op de 7 mensen op onze planeet van brood voorziet, enorm is en bovendien enkel groeit. In zo’n markt schuilt potentieel, ook voor big data. “Een koe wordt uitgerust met veel sensoren”, aldus de veearts. “Ook de volautomatische melkmachines op de boerderijen en zelfs de watertoevoer worden van sensoren voorzien.” Door alle gegevens te combineren weten boeren met honderden koeien vandaag evenveel of zelfs meer over hun individuele dieren dan een boer met slechts enkele beesten een halve eeuw geleden.

Arm in de koe

Zoals steeds bij big data zit de echte kracht in de analyse van gegevens. Door parallellen in data te trekken, verbanden te leggen en naar het verleden te kijken kan een datawetenschapper de toekomst voorspellen. Meer gegevens zijn daarbij beter, waardoor Van Ranst aanvankelijk geen graten zag het verplaatsen van data buiten de Europese grenzen en omgekeerd. “We hebben intussen veel geleerd. De data wordt beter geüpload maar we kennen de wettelijke beperkingen intussen en houden er rekening mee. Aanvankelijk gingen we te pragmatisch te werk.”

 

Het resultaat is een systeem waarbij een dierenarts met één arm in de koe zit, maar terwijl de hele geschiedenis van het dier aan zijn (andere) vingertippen heeft. “Bovendien kunnen we dagen op voorhand voorspellen wanneer een koe ziek zal worden.”

Digitale supermarketeer

De vergelijking is cru, maar wat werkt voor koeien werkt ook voor mensen. Bas Nieland, medeoprichter van Datatrics, wil met big data niet voorspellen wanneer mensen ziek of drachtig worden. Hij wil marketeers met zijn platform de nodige informatie geven om potentiële klanten te overtuigen van een aankoop. “Waar marketing vroeger veel gebruik maakte van buikgevoel, moeten campagnes vandaag beter onderbouwd zijn”, verduidelijkt Nieland. Datatrics brengt daartoe gegevens van bedrijven en externe databases samen om klanten te analyseren. Bezoekers van een website krijgen zo een soort ‘profiel’, rekening houdend met wat het systeem al over hen weet. “We willen klanten zo vroeg mogelijk identificeren door hun gedrag te vergelijken met historische info. Vervolgens helpt Datatrics marketeers om unieke content te bieden, afgestemd op het profiel van een klant, en dat via verschillende kanalen.”

 

Het systeem werkt door één eenvoudige waarheid: niemand is écht helemaal uniek. Wie voldoende data ter beschikking heeft en die correct analyseert kan verbanden en patronen ontdekken. Door het gedrag van nieuwe klanten (of koeien) met de oude data te vergelijken kan een datascientist, of in het geval van Datatrics een digitaal platform, veel accurate voorspellingen maken.

Supersnel reageren

Onze overheidsinstanties beseffen het nut van big data goed genoeg. “De stad Antwerpen maakt sinds vorig jaar gebruik van het meten van mobiele data, in samenwerking met Orange, om bezoekers doorheen de stad te volgen”, illustreert Milan Rutten. “Zo weten we van waar mensen naar specifieke events komen, hoe lang ze blijven, en wat ze verder nog doen in Antwerpen.” Dat laat de stad en de politie toe om bliksemsnel te anticiperen op verschuivende mensenmassa’s maar Rutten, die directeur is Marketingstrategie voor Antwerpen, krijgt zo ook een zicht op de return of investment bij events.

 

Steven Dauw, BI Data Analyst van Infrabel, vertelt een gelijkaardig verhaal. Door gegevens van sensoren in realtime te combineren met data van bijvoorbeeld meettreinen en de automatische rapportering van incidenten kan Infrabel zijn technici sneller en efficiënter dan ooit ter plaatse sturen. Bovendien is de data voortaan erg toegankelijk voor de spoorweginfrastructuurbeheerder. In combinatie met SAP-software is het zo eenvoudig voor iedereen binnen het grote bedrijf om data te analyseren en te visualiseren, en er dus meerwaarde uit te halen.

Niet sectorgebonden

De conclusie van het seminarie is duidelijk: met big data is er enorm veel mogelijk, ongeacht de sector. Zowat ieder domein genereert gegevens, en de combinatie en analyse met andere interne maar ook externe data geeft bedrijven een voorspellend vermogen. Vergeet echter niet om realistisch te beginnen, en houd zeker de Europese wetgeving in het achterhoofd.

Big Databusinessbusiness meets itevent reportitprofessionalseminar

Gerelateerde artikelen

Volg ons

€350 korting op de Tenways CGO600

€350 korting op de Tenways CGO600

Bekijk de CGO600