18 april 2014 09:39

Vier stappen in een bigdatapijplijn

Om het meeste uit big data te halen, hebt u allereerst een goede infrastructuur nodig. Alleen zo zet u ruwe gegevens om in actiegerichte informatie.

Hoewel het bij big data vaak om ongestructureerde gegevens gaat, moet de benodigde architectuur heel wat structuur hebben. Ruwe gegevens in bruikbare, actiegerichte informatie omzetten gebeurt in een pijplijn met vier stappen:

1. Verwerven en opslaan

Krijg toegang tot allerlei types gegevens van diverse platforms met behulp van adapters voor operationele en legacy systemen, sociale media enzovoort. Daarbij hoort ook de mogelijkheid om gegevens in batch te verzamelen en op te slaan, evenals realtime en bijna realtime modes.

2. Verfijnen en verrijken

Integreer en zuiver gegevens en maak ze klaar voor analyse. Verzamel tegelijk technische en operationele metadata en verrijk daarmee de datasets, waardoor ze gemakkelijker te vinden en te hergebruiken zijn.

3. Verkennen en cureren

Blader door gegevens, visualiseer ze en ontdek zo patronen, trends en inzichten met potentieel een businessimpact. Cureer die datasets die de meeste bedrijfswaarde in zich hebben.

4. Verdelen en beheren

Transformeer en verdeel actiegerichte informatie naar de eindgebruikers met behulp van mobiele apparaten, bedrijfstoepassingen en andere middelen. Beheer en ondersteun service-level agreements met een flexibele architectuur voor deployment.

In samenwerking met InfoWorld.com.