10 dingen die je moet doen om big data te starten
Bedrijven die zich op big data hebben geworpen stellen al snel vast dat hun bigdata-initiatief maar moeilijk van grond raakt. Welke 10 vinkjes moet je zetten op je checklist als je wil slagen in dit nieuwe gebied in de IT?
1: Versta je zakelijke doelstelling
Dit zal eenvoudig klinken, maar er is altijd die neiging om te snel op de kar te springen van de nieuwste technologie, met de diensten, hard- en softwareverkopers die je vertellen wat te doen. Dan handel je voor je nadenkt over wat je wil bereiken met de analyse van big data.
De bedrijven die nu al het meeste halen uit big data weten hoe ze die gegevens moeten oogsten en bewerken. Als het over een winkel gaat, willen ze sociale media en de activiteit van klanten op de site in de gaten houden om te zien of ze de juiste goederen hebben aangeprezen bij de juiste doelgroep. En ze kunnen het ook snel aanpassen als dat nodig is. Als het over fabrieken gaat, willen ze van hun leveranciers weten wie het best op tijd levert. Hoe scherper je focus is op je zakelijke doelstellingen, hoe beter de resultaten zullen zijn.
2: Schoon je data eerst op
Je bigdata-analyse wordt maar zo goed als de gegevens die je erin stopt. Als je geplaagd bent door onvolledige of onjuiste gegevens, los dat probleem dan eerst op. Het opschonen van gegevens kan dan wel een ondankbaar project zijn, maar het is belangrijk dat de CIO de noodzaak ervan kan uitleggen aan het hogere management.
3: Schat in hoe klaar de IT’ers ervoor zijn
De meeste bedrijven hebben geen bigdatatalent op de loonlijst staan. Dat is de reden waarom zoveel verkopers en adviseurs bij hen komen aankloppen om een project op de rails te krijgen. Daarom moet de eerste stap voor CIO’s zijn om in te schatten hoe klaar de medewerkers zijn om aan big data te doen voor er geïnvesteerd wordt in de technologie.
4: herbekijk je IT-infrastructuur
Als je toch nakijkt of je medewerkers klaar zijn voor big data, kan je meteen ook eens kijken of je IT-infrastructuur het erbij kan nemen. Big data vereist parallelle procesverwerking en voedt grote brokken ongestructureerde en halfgestructureerde data door analytische algoritmes. Traditionele servers spitsen zich toe op de verwerking van een vast en kleiner aantal gegevens.
Tussen deze twee uitersten ligt er analytische rapportering van de oude stijl die gegevens verwerkt van data warehouses om dagelijkse, wekelijkse en maandelijkse rapporten uit te draaien. Omdat bigdataverwerking zo hard verschilt van deze batch reporting, zal je veranderingen moeten doorvoeren in de IT-infrastructuur om nieuwe zakelijke regels, meetinstrumenten en monitortools voor big data te omvatten.
5: Bepaal strategieën voor korte en lange termijn
In de nasleep van punten drie en vier, moet de CIO strategieën instellen die rekening houdt dat medewerkers en materiaal er amper klaar voor zijn, maar meegroeien met de tijd. Veel bedrijven pakken dit aan door een consultant binnen te halen die big data start en dan na training het zaakje aan de medewerkers overlaat.
Wat het materiaal betreft, kunnen er ook stappen richting de cloud worden gezet. Dat geeft het bedrijf de mogelijkheid om al met big data te beginnen en na een aantal projecten te beslissen of het zinnig is om de middelen voor big data in huis te halen.
6: Bepaal de juiste KPI’s
Probeer niet om dezelfde set kritieke prestatie-indicatoren of KPI’s te gebruiken die je ook voor transactionele processen hanteert. Transacties en hun servers worden beoordeeld op hun verwerkingssnelheid. Big data zou afgemeten moeten worden aan het aantal bewerkingen die parallel kunnen uitgevoerd worden en de efficiëntie waarmee dat gebeurt. Dat betekent dat een grote taak voor big data een aantal uur in beslag kan nemen, maar dat er ondertussen wel enkele kleine bigdatataken ook kunnen lopen en verwerkt worden.
7: besteed tijd aan je archiveringsmethoden
Bedrijven storten zich in bigdataprojecten, happig op de analyses die het bedrijf een concurrentieel voordeel kunnen geven. Jammer genoeg besteden ze niet even veel tijd aan hun strategie om big data te archiveren en toegankelijk te maken. Als bedrijven een historische trend willen zien, moeten ze terug kunnen gaan naar de brongegevens om er een nieuwe analyse op los te laten.
Dat is waarom het belangrijk is om je opslag en archivering op de beste manier te koppelen. Gegevens die waarschijnlijk opgevraagd gaan worden, kunnen op een opslagmedium dat makkelijker toegankelijk is op dagelijkse basis. Gegevens die waarschijnlijk niet opgevraagd zullen worden, kunnen op goedkopere en tragere dragers. Gegevens die zeker niet meer nodig gaan zijn moeten weggegooid worden. Niets van dit archiveringsplan kan je uitschrijven zonder er de zakelijke beslissers erbij te betrekken. Zij moeten mee bepalen welke big data op lange termijn van belang zullen zijn.
8: Begin met een klein beheersbaar project
Een bigdataproject is niet anders dan eender welk IT-project. Als de technologie nieuw is, begin dan eerst met een klein pilootproject. Dat zal je toestaan om ervaring op te doen en om te kunnen inschatten wat je langs IT-kant moet doen om het te ondersteunen. Het staat ook eindgebruikers toe om kennis te maken met de analytische capaciteiten van big data. Net zo belangrijk is de mogelijkheid om uit te proberen hoe IT en gebruikers best kunnen samenwerken.
9: Stel de juiste vragen
Weten hoe je big data best kan bevragen voor optimale resultaten is de grootste uitdaging. Je kan enkel verstaan dat dat mensen in het Midwesten van de VS van minder dan 30 jaar het meest waarschijnlijk een tickets voor sportwedstrijden kopen op sneeuwdagen in februari, als je genoeg gegevens hebt en de juiste vragen kan stellen om tot die conclusie te komen.Het is niet eenvoudig. En het gaat even duren voor bedrijven de nodige vaardigheden ontwikkelen.
10: Probeer niet om je oude servers op te lappen
In een poging om kostenefficiënt te zijn, proberen bedrijven hun x86-servers te hergebruiken. Met zijn parallelle verwerkingsprocessen is big data een heel ander diertje (zelfs al draait het toch vaak op x86-servers). Als je aan big data wil beginnen, zorg dan dat gespecialiseerde hardware binnen je budget valt.