Nieuws

“De data-economie is geen all-you-can-eat-buffet meer”

Elke technologiedeskundige die ik heden ten dage spreek, voorspelt hetzelfde voor de toekomst. Geen cyborgs of andere wereldschokkende ontwikkelingen, maar data, data en nog eens data. Volgens de overgrote meerderheid van die experts zouden data op steeds grotere schaal worden toegepast, en zal het woordje ‘data-economie’ deel uitmaken van onze dagelijkse woordenschat.

 

Data is de nieuwe munteenheid

 

De data-economie bestaat vandaag echter al, en duidt op het feit dat het meest kostbare goed vandaag geen goud, geld, olie, of – God forbid – zelfs tijd meer is, maar data. In ons informatietijdperk sturen data economische groei en verandering aan, en verbeteren ze onze levenskwaliteit.

 

Een voorbeeld daarvan zijn de vele toepassingen van big data binnen de gezondheidssector, waar data steeds meer gebruikt worden om epidemieën te voorspellen, om ziekten te voorkomen en om medische behandelingen te verbeteren.

 

Het World Economic Forum gaat zelfs zo ver om te beweren dat praktisch alle onderdelen van onze moderne digitale maatschappij gebaat zouden zijn bij een betere toegang tot data. Dat creëert uiteraard ook immense economische kansen omtrent data. Zo schat de Europese Commissie in dat de Europese dataeconomie in 2016 zo’n 300 miljard euro waard was, en dat die waarde tegen 2020 zou stijgen naar een 739 miljard euro.

 

Maar de dataeconomie komt niet altijd even gunstig in het nieuws. Zo hoor je elke maand wel over een datalek hier of daar, hebben bevooroordeelde algoritmen het maar al te vaak op de zwakkeren in de maatschappij gemunt en zijn we Cambridge Analytica nog steeds niet vergeten.

 

Een manusje van alles

 

Tijd dus om mijn licht op te steken bij SAS Analytics, gespecialiseerd in – je raadt het al – big data en analytics. Van 22 tot 24 oktober organiseerde SAS de Analytics Experience in Milaan, waar de laatste inzichten op het gebied van analytics uitgebreid werden toegelicht.

 

Als er één ding is wat ik op de SAS-conferentie heb geleerd, is het wel dat je data voor zowat alles kan gebruiken. En dat gebeurt ook effectief. Zo kan je uiteraard data inzetten om als bedrijf je marketing gerichter aan te pakken, zoals ik leerde tijdens de presentatie van Serhat Keçici, data scientist bij Türkcell.

 

Keçici liet me inzien dat deep learning uitzondelijk veel voordelen bevat voor marketingdoeleinden. Zo kan via deep learning voorspeld worden voor hoeveel Turkse lira een Turkcell-klant zal willen herladen, en wordt via lineaire regressie voorspeld wanneer een gebruiker precies zal herladen. Op basis van die inzichten worden er pushberichtjes gestuurd naar de consumenten die lezen als “herlaad nu voor 30 Turkse Lira en krijg dagelijks 1 gigabyte / wekelijks 100 belminuten gratis”.

 

Ook Matthias Coopmans en Véronique van Vlasselaer van SAS België maakten me attent op die boodschap; namelijk dat we big data en analytics kunnen gebruiken om  marketingboodschappen op maat te maken en zo uiteindelijk betere verkoopcijfers te genereren.

 

Bij Capgemini leerde ik dat je analytics ook perfect kan inzetten bij fraudebestrijding. Richard Hogenberg van Capgemini benadrukte daarbij dat een  vroege detectie van anomalieën in je datasets van cruciaal belang is om fraudeurs bij de lurven te vatten, en maakte ons daarnaast attent op de six degrees of separation. Iedereen staat namelijk wel met iedereen op de wereld in verbinding, met zes of minder stappen van verwijdering tussen beide personen in. Daar bewijzen sociale media zich trouwens vaak als erg nuttig.

 

De ene ontwikkeling is de andere niet!

 

Uiteraard zijn thought leaders en semi-inspirerende quotes nooit ver weg op een conferentie met meer dan 1800 genodigden. Zo werden ook wij getrakteerd op speeches van executive coach Giles Hutchins die het had over het belang van verschillende perspectieven, en ons bewust maakte van het verschil tussen horizontal en vertical development.

 

Bij horizontale ontwikkeling denken we voornamelijk aan talentontwikkeling zoals een cursus coding studeren, of een extra taal bijleren. Kort gezegd; zaken die je CV aandikken. Volgens Hutchins is verticale ontwikkeling, oftewel de ontwikkeling van onze soft skills echter minstens zo belangrijk.

 

Verschuiving op de werkvloer

 

Volgens conventionele kennis heb je datawetenschappers nodig om aan datawetenschap te doen, maar volgens Gerhard Svolhba van SAS gaat het echter veel verder dan dat en zijn de gevraagde profielen vandaag de dag sterk uitgebreid.

 

Zo is de data-industrie vandaag zodanig geëvolueerd dat er al profielen bestaan als demand planner, demand analyst, IT automation officer enzovoort. Wie nu dus vers van de middelbare schoolbanken komt, kiest dus maar beter een richting in de datawetenschappen; de vraag naar verschillende profielen is immers torenhoog.

 

SAS en zijn vernufte vernuftig? softwareplatform VIYA kan trouwens gewag maken van een aantal belangrijke klanten zoals Baloise en Vodafone, maar ook de overheid maakt gretig gebruik van de analysesoftware van SAS. Zo werken de federale overheidsdiensten van Financiën en Economie met de software en wil de FOD Financiën (”Fodfin” voor de insiders) zich steeds meer profileren als een analytics driven overheidsdienst. Daarom werken er ondertussen al zo’n 60 data scientists bij de dienst financiën, ook al heeft die verandering aanvankelijk op weerstand van de werkcultuur gestoten.

 

 

GDPR, big data en analytics: an unlikely brotherhood

 

Wat echter het meest van al mijn interesse wegdraagt op het vlak van big data en analytics, is het overduidelijke spanningsveld tussen de dataeconomie en de recent geïmplementeerde GDPR. Want data is de brandstof van AI en innovatie in het algemeen, maar hoe innoveren wanneer die data nu extra worden beschermd door de verhoogde bezorgdheid over onze privacy.

 

Olivier Penel van SAS stelde tijdens zijn breakout sessie luidop de vraag die ik me ook al meermaals heb gesteld: “is privacy wel compatibel met innovatie?” Penel gaf het voorbeeld van Predpol, een software waarbij een algoritme kan bepalen of een persoon al dan niet een misdaad zal begaan. “Hoe?” zul je enigszins verbouwereerd bij jezelf denken, “kan een algoritme ervoor zorgen dat je gearresteerd wordt?”

 

Predpol baseert zich daar simpelweg voor op kwantificeerbare gegevens zoals je postcode en of je ooit in een bende hebt gezeten en werd al toegepast door de LAPD. “Preventive policing” wordt Predpol ook wel genoemd, terwijl de aard van politiewerk per definitie niet preventief is. Daarenboven hoeft het ook geen betoog dat die algoritmen niet altijd even objectief zijn.

 

Volgens Penel maakt de GDPR innovatie niet onmogelijk, maar is het een bijkomend obstakel waar vooral datawetenschappers rekening mee moeten houden. In de context van GDP moeten ze een legale basis hebben om die data te gebruiken. Dat kan de expliciete toestemming zijn van die data subjects.

 

Ze zullen dus inderdaad in de mogelijkheid zijn om hetzelfde te blijven doen als voorheen, maar met bijkomstige aandacht voor het juiste beleid. Een belangrijk aspect hier; het de impact die voortkomt uit het algoritme en zijn beslissingen. Als de impact van een algoritme verregaand is, heeft de persoon in kwestie het recht om daarvan op de hoogte gebracht te worden.

 

Het is duidelijk dat de GDPR heel wat opschudding heeft teweeggebracht in de wereld van de datawetenschappen, maar het is vooral in de zakelijke wereld dat die impact het sterkst merkbaar is. Elke organisatie moet namelijk voldoen aan de richtlijnen van de GDPR, en aangezien de meeste zakelijke processen sterk gebaseerd zijn op data, is die impact op de onderneming erg groot.

 

Hoewel Penel een fervent voorstander is van de GDPR, waarschuwt hij voor te strikte regels; “te strenge regels kunnen een data-economie net schade toebrengen. We moeten daarom op zoek naar een goede balans tussen privacy en innovatie.”

 

“Om toch op legale wijze innovatie door te voeren moet je data dus uitermate goed beheren.” Maar dat is niet de enige tip die Penel heeft. “Je moet privacy in feite al in je datawetenschap zelf verwerken.” Privacy is dus geen stap die aan het einde van het hele dataproces nog snel eventjes wordt toegevoegd om aan alle richtlijnen te voldoen, maar is eerder een ethisch besef dat al in het begin van je dataverwerkingsproces aanwezig dient te zijn.

 

“Voorheen was er een beetje een ‘all you can eat’ aanpak, waar je gewoon alle data gebruikte die je maar kon vinden. Nu moeten we effectief nadenken of we wel het recht hebben om die data te gebruiken”, aldus Penel.

 

De GDPR geeft individuen het recht om te weten wat voor soort beslissingen over hen worden gemaakt, welke data daarvoor werden gebruikt, wat voor een proces werd doorlopen, of er tijdens het proces sprake was van menselijke inmenging, en wat de impact is op het individu in kwestie. Wanneer een algoritme bijvoorbeeld op basis van je postcode beslist dat je niet in aanmerking komt voor een bepaalde verzekering, heb je als individu het recht om te weten waarom het algoritme net die beslissing heeft genomen.

 

Hoewel Penel toegeeft dat de GDPR misschien een competitief nadeel mag zijn tegenover landen met een vrijere dataflow zoals China, is dat volgens hem nog geen excuus om niet aan de richtlijnen te voldoen. Langs de andere kant werd de GDPR net in het leven geroepen om die dataflow binnen Europa te faciliteren. Je zou het een beetje de Schengenzone van de data kunnen noemen. Dat is dan weer in het voordeel van de EU.

 

Maar wat dan met die nieuwe datamodellen die gebouwd worden op basis van onschuldig ogende geanonimiseerde informatie zoals je e-mailadres, je leeftijd, en ohja; je mening over Brexit? Ook daar is sprake van een inbreuk op je privacy, al is de lijn daar niet meer zo duidelijk omdat die gegevens geanonimiseerd werden.

 

Toch heeft een individu volgens Penel steeds het recht om te weten waar bepaalde informatie voor zal gebruikt worden. “Uiteraard is het logisch dat organisaties nieuwe inzichten willen vergaren uit hun data, maar ze moeten hun GDPR-standaarden naar een hoger niveau tillen. Dat mag dan misschien betekenen dat bepaalde zaken vanaf nu uit den boze zijn, maar dat is de prijs die we allemaal moeten betalen.”

alayticsb2bBig Databusinesssas

Gerelateerde artikelen

Volg ons

€350 korting op de Tenways CGO600

€350 korting op de Tenways CGO600

Bekijk de CGO600