Er komt een tekort aan big data specialisten. Maar hoe kan je in Vlaanderen opgeleid worden om later met big data aan de slag te gaan? Onderzoeksbureau Gartner becijferde recent dat big data tegen 2015 goed is voor 4,4 miljoen jobs wereldwijd. Maar slechts een derde ervan zal worden ingevuld. Big data is nog relatief […]

Er komt een tekort aan big data specialisten. Maar hoe kan je in Vlaanderen opgeleid worden om later met big data aan de slag te gaan?

Onderzoeksbureau Gartner becijferde recent dat big data tegen 2015 goed is voor 4,4 miljoen jobs wereldwijd. Maar slechts een derde ervan zal worden ingevuld. Big data is nog relatief nieuw, zijn er dan wel opleidingen die de informatici van morgen kunnen klaarstomen?

Die denkpiste is op zich al niet correct. Big data bestaat vandaag al en wordt dus aangepakt door mensen die er per definitie niet specifiek voor hebben gestudeerd. Big data is het beheren en analyseren van grote ongestructureerde hoeveelheden data. In de eerste plaats denken we dus aan informaticaopleidingen die dieper ingaan op datacentertechnologie en storage op zich.

Cloud computing
Toch zijn er veranderingen op til. Zo biedt de Universiteit van Gent op zijn campus in Kortrijk vanaf volgend jaar de afstudeerrichting Cloud Computing aan. Die focust specifiek op big data, social media, cloud computing, mobile computing en cloud security.

“Daar gaan we in op drie lagen”, zegt Jan Devos, docent informatica aan de HoWest en de UGent campus Kortrijk. “Infrastructuur: wat heb je nodig? De bekende technologieën zoals virtualisatie.

De tweede laag is applicaties: hoe worden die geschreven, service oriënted architecture enz… De derde is de businesslaag: hoe dergelijke fenomenen met een technologische oorsprong een sociologische impact hebben en hoe bedrijven hun businessmodel aanpassen.”

Over jobs in big data is nog niet veel bekend. “Informaticaopleidingen zijn breed”, zegt Devos. “De klassieke jobomschrijvingen van programmeur en analist zien we verdwijnen en evolueren naar functies waar men ook een business inzicht heeft.”

In Kortrijk zet men al een stap richting big data, maar alomtegenwoordig is de trend nog niet in ICT-opleidingen. “Er zijn er weinig die er mee uitpakken, in Nederland zie je dat al iets meer. Maar blijft het zoeken naar de juiste namen voor die nieuwe functies.”

Datamining
Aan de KULeuven is er geen opleiding die expliciet zegt dat ze focust op big data, maar binnen de ingenieursopleidingen met optie computerwetenschappen zijn er wel vakken die nauw aan de trend raken. Zoals datamining.

“Daar worden wetenschappelijke principes aangeleerd, de achterliggende wiskundige modellen om efficiënt met data om te gaan, patronen en trends te ontdekken enz…” Aldus Philip Dutré, programmadirecteur van de opleiding computerwetenschappen aan de KULeuven.

“Binnen die grote datasets leren we er manueel in kijken, en via datamining gaan we verbanden vinden. Maar je moet ook zoeken naar goede manieren om dat te visualiseren en dat zit dan weer in de informatievisualisatietechniek.”

Ook in het aparte masterprogramma bio-informatica worden studenten geconfronteerd met grote hoeveelheden data, maar dan van medische of biologsiche aard.

Een ‘master big data’ zit er niet meteen aan te komen. Daarvoor is de trend te nieuw. Maar er wordt wel op verschillende vlakken aan gewerkt. Bijvoorbeeld in opleidingen waar men met datacentertechnologie in aanraking komt.

Kennis blijft bruikbaar
Bovendien is het niet zo dat nieuwe trends zoals de cloud of big data oude zaken vervangen. “Het is een en-en verhaal” zegt Devos.

“Kennis van relationele databases is nog altijd bruikbaar. Zo is twintig procent van alle data nog steeds gestructureerde data en van daaruit starten de meeste bedrijven ook. Voor de overige tachtig procent, filmpjes, tweets, e-mails enz… is het nog wat zoeken. Al is er met JSON wel een formaat voor tweets bijvoorbeeld.”

Volgens Devos zal er meer en meer structuur komen in die data. In de opleiding vertaalt zich dat in meer statistiek in de opleiding. “Vroeger liet je daar een SQL op los, vandaag is dat met statistische gegevens.”

Real time of niet?
Big data slaat vaak op gegevens uit sociale media en daarvan horen we regelmatig dat je die best op het moment zelf analyseert om zo snel mogelijk te reageren. Maar daar is Devos het niet helemaal mee eens. “Het hoeft zeker niet in real time, maar het is wel hoe sneller hoe beter.”

Zo moet de data worden omgezet naar informatie om er vervolgens kennis uit te halen. Al is het bij dit soort gegevens vaak wel best dat het relatief snel gebeurt. Zo vergelijkt Devos big data recent nog in een blogpost met verse vis die op zijn best is als je hem direct na het vangen klaarmaakt, anders wordt hij slecht.

Terkort, ondanks stijging
Gaat ons onderwijs de big data specialisten kunnen leveren? Ja en neen. De opleidingen zijn er rechtstreeks of onrechtstreeks mee bezig en de opleiding evolueert mee met de technologie.

Een groter probleem blijkt het aantal studenten dat kiest voor een IT-opleiding. Hun aantal blijft elk jaar stijgen. Maar die toename is niet in verhouding tot de vraag, die al groot was en blijft toenemen. Devos hoopt dat er op termijn ook meer vrouwen voor de opleiding kiezen. “Soms kan je als IT’er heel mooie zaken realiseren, en ons land heeft het potentiëel om die mensen op te leiden."

Het gebrek aan big data specialisten waar Gartner over spreekt heeft op dat vlak dus minder met kennis te maken, maar des te meer met een te grote vraag naar informatici die de steeds groter wordende cloud in de lucht moeten houden.