Vier stappen in een bigdatapijplijn
Hoewel het bij big data vaak om ongestructureerde gegevens gaat, moet de benodigde architectuur heel wat structuur hebben. Ruwe gegevens in bruikbare, actiegerichte informatie omzetten gebeurt in een pijplijn met vier stappen:
1. Verwerven en opslaan
Krijg toegang tot allerlei types gegevens van diverse platforms met behulp van adapters voor operationele en legacy systemen, sociale media enzovoort. Daarbij hoort ook de mogelijkheid om gegevens in batch te verzamelen en op te slaan, evenals realtime en bijna realtime modes.
2. Verfijnen en verrijken
Integreer en zuiver gegevens en maak ze klaar voor analyse. Verzamel tegelijk technische en operationele metadata en verrijk daarmee de datasets, waardoor ze gemakkelijker te vinden en te hergebruiken zijn.
3. Verkennen en cureren
Blader door gegevens, visualiseer ze en ontdek zo patronen, trends en inzichten met potentieel een businessimpact. Cureer die datasets die de meeste bedrijfswaarde in zich hebben.
4. Verdelen en beheren
Transformeer en verdeel actiegerichte informatie naar de eindgebruikers met behulp van mobiele apparaten, bedrijfstoepassingen en andere middelen. Beheer en ondersteun service-level agreements met een flexibele architectuur voor deployment.
In samenwerking met InfoWorld.com.