Belg ontdekt manier om sneller en goedkoper big data te verwerken
Omdat er steeds meer data wordt gegenereerd, zijn big data-systemen het onderwerp van talrijke studies. Er wordt daarbij gezocht naar een manier om de overweldigende hoeveelheid data efficiënter verwerken, en de Hasseltse wetenschapper Jonny Daenen lijkt alvast iets op het spoor te zijn.
In zijn doctoraatsthesis verrichte Daenen onderzoek naar een verbeterde berekeningsmethode op basis van parallel computing. “Computertechnieken die meerdere databerekeningen tegelijk doen,” verduidelijkt Daenen. “Hierdoor zijn er minder machines nodig, maar je moet niet langer wachten op het resultaat.”
[related_article id=”168580″]
Dat is het geheim van Gumbo. “Het principe is eenvoudig: je geeft je vraag over bepaalde data in, en Gumbo zoekt dan de beste manier om die te evalueren,” vertelt de onderzoeker. Daardoor zou het systeem zowel sneller als goedkoper data kunnen analyseren. Bijvoorbeeld kan het dubbele berekeningen detecteren, en die eruit pikken. Zo wordt er geen dubbel werk geleverd.
Gumbo is gebaseerd op de opensourceframeworks Hadoop en Spark, en is gratis verkrijgbaar. Daenen hoopt nu dat het systeem aanslaat, en geïntegreerd wordt in bestaande analytics-oplossingen.
Indien je je het af zou vragen: de naam verwijst niet naar het soulfood-gerecht, maar naar het tekenfilmfiguurtje, volgens de thesis. “Gumbo’s broer is een olifant die in verschillende geanimeerde films komt,” schrijft Daenen, “maar niet geïnteresseerd is in guarded fragment queries.”
Foto: UHasselt