De tien grootste datavreters ter wereld
We deden voor deze lijst beroep op een goede inschatting van de blog Tech Expectations, en vulden deze aan met openbare data. Het blijft voor een stuk een inschatting, maar het geeft een goed overzicht waar de meeste data worden bewaard. Kortom, big data met de b van big.
1. NSA
De NSA is de absolute slokop als het om data gaat. De Amerikaanse geheime dienst bouwde met het oog op verdere digitale spionage onlangs een datacenter waar het 2 exabytes aan data kan opslaan. Dat is dus tweeduizend petabytes of 2 miljard gigabytes. Dat de Amerikaanse overheidsinstantie bovenaan staat is geen verrassing, omdat het heel veel digitale data capteert. Naar verluidt ook vaak van sommige partijen die je in deze lijst nog ziet terugkeren.
[related_article id=”161452″]
2. EMC
Project Beatle is een project van dataopslaggigant EMC. In 14 datacenters over de gehele wereld verspreid heeft EMC zo 6 miljard bestanden opgeslagen. Goed voor een totaal van 880 petabytes, een kwart miljoen disk drives en zowat 5.000 individuele servers. Meer dan 1 miljoen klanten maken hier, volgens EMC, gebruik van.
3. Facebook
Facebook staat derde op de lijst van grootste dataverzamelaars. Alleen al voor foto"s en video"s heeft de netwerksite 282 petabytes aan opslagruimte nodig. Foto’s en video’s zijn de slokop bij Facebook, en dit domein groeit ook het snelst. Maar daarnaast wordt ook nog zo"n 250 petabytes aan andere data van gebruikers opgeslagen.
4. YouTube
De videodienst van Google, waar elke minuut meer dan 5 miljoen YouTube-video’s worden bekeken, staat op nummer vier. De schatting is dat YouTube de 400 petabytes aan opslag haalt. Er wordt elke minuut 100 uur aan video naar YouTube geüpload. 80 procent van het YouTube-verkeer is afkomstig van buiten de Verenigde Staten.
5. CERN
CERN is geen pure internetspeler, en dus ook een beetje de vreemde eend in de bijt. De organisatie, die zich in Zwitserland bevindt, doet aan fundamenteel wetenschappelijk onderzoek naar elementaire deeltjes. Maar al dat werk creëert enorm veel data. Die databerg is inmiddels gegroeid naar minstens 200 petabytes, een verdubbeling op twee jaar tijd.
6. Microsoft Azure
Zowel de clouddiensten Microsoft Azure als Amazon Web Services bevatten ettelijke petabytes aan informatie, elk vermoedelijk tussen de 150 en 200 petabytes. Het totale volume is echter niet bekend. Azure plaatsen we op zes omdat het aantal bestanden (zowat 9.000 miljard) groter is dan Amazon.
7. Amazon Web Services
Ook Amazon Web Services zit dus tussen de 150 en 200 petabytes, maar heeft met 2.000 miljard bestanden niet zo veel bestanden als Azure. Al is ‘niet zo veel’ in deze lijst uiteraard een relatief begrip. Amazon slaat in verhouding misschien nog meer data digitaal op dan in zijn magazijnen.
8. Outlook.com
Outlook.com is het vroegere Hotmail.com, en dus een klassieker op internet. De dienst bewaart naar schatting ongeveer 150 petabytes. Om een inschatting te geven: het zou u ruim 300.000 jaar in beslag nemen om naar 150 petabytes aan muziekbestanden te luisteren.
9/10. Mozy & Backblaze
Backblaze is een online backupdienst die vooral actief is in de Verenigde Staten. Zij bezetten de negende plaats die ze delen met Mozy, een andere speler die een gelijkaardige activiteit uitvoert. Het totale volume aan data van deze diensten wordt geschat op 100 petabytes.
Is de lijst volledig?
Neen, zeker niet. Belangrijke namen die nog ontbreken zijn iCloud (van Apple), Dropbox, Box en zeker Google met Gmail en Google Drive. Dailymotion is als populaire videodienst ook een bedrijf met veel data in huis. Andere kandidaten zijn de datacenters en databronnen van IBM, HP, Netapp of Salesforce.com
Ook Flickr is een potentiële kandidaat, maar mogelijk niet voor deze top 10. Instagram haalt bijvoorbeeld 50 petabyte, ook al groeit het ook bij hen erg snel.
Op 5 februari verzorgen Smart Business en ZDNet.be een (gratis) seminarie over big data & datacenters. Meer info over dit seminarie vindt u op: www.businessmeetsit.be.