23 januari 2015 12:54

Hoe de cloud onze digitale geschiedenis wist

We vertrouwen steeds sterker op de cloud, zowel voor de opslag van onze bestanden als het achterliggende radarwerk voor softwaretoepassingen. Dat houdt echter een aantal verborgen risico's in.

Beeld je eens in dat de eerste exemplaren van Gutenbergs drukwerk niet bewaard zouden zijn, omdat ze telkens gedachteloos vervangen werden door de nieuwere versies; dat schilderijen uit eender welke historische periode niet meer gekend zouden zijn omdat ze, telkens een nieuwe stroming uitkwam, collectief op de brandstapel gekieperd werden; of dat de eerste 8-bit spelletjes enkel nog een vage herinnering zouden zijn voor wie ze zelf nog speelden. Klinkt absurd? Het is nochtans exact wat er op dit moment gebeurt in de cloud.

We leven in een gouden eeuw voor cloud-computing. We bewaren allerlei data en voorkeuren op het internet, want daarmee wordt ons leven, waar we een flink deel van doorbrengen achter verschillende toestellen, zoveel makkelijker. Voeg je data in op het ene toestel, dan is die meestal meteen beschikbaar op je andere apparaten, waardoor je naadloos kan overstappen van je smartphone naar je laptop naar je tablet. Geen probleem, zou je denken; niemand heeft zin om tijd te verliezen met het manueel synchroniseren van data tussen al z"n toestellen. We leven uiteindelijk in de toekomst.

Sommige toepassingen zijn ondertussen echter zo afhankelijk geworden van deze cloud dat we een volledig ecosysteem van software aan het creëren zijn dat geen enkel spoor zal nalaten in de geschiedenis – en dat is een probleem.

Software-archeologie

Computers zijn een van de belangrijkste verwezenlijkingen van de laatste decennia, en het computertijdperk heeft op een relatief korte tijd enorm grote veranderingen en evoluties met zich meegebracht – sneller dan ooit. Hoewel het op het eerste zicht misschien weinig lijkt bij te dragen, is het belangrijk om een historisch document te bewaren. We hebben het, zoals in de eerder aangehaalde voorbeelden, voor zo ongeveer elk cultureel of technisch onderdeel van onze geschiedenis wel met veel zorg gedaan: van landbouwwerktuigen tot schilderijen, en van kledij tot de muurschilderingen van de oermensen.

Op dit moment is de cloudrevolutie, met al z"n voordelen, ervoor aan het zorgen dat er voor komende generaties geen snippertje materiaal meer zal achterblijven uit een periode waarin software en computertoepassingen enorme sprongen gemaakt hebben. Bij veel cloudtoepassingen ligt de nadruk immers op het constant verbeteren, bijwerken en updaten. Dat wil echter onherroepelijk zeggen dat eerdere versies van de software verloren gaan, overschreven door nieuw en beter. Dat fenomeen wordt soms wel omschreven als cloud rot.

Knagende termieten

Wat is cloud rot precies? In feite kan je het beschouwen als een onderdeel van een groep problemen die ook wel worden aangeduid als bit rot of software rot. In eerste instantie gaat het om het verdwijnen van eerdere versies van software die wordt vernieuwd en geüpdatet, waardoor de evolutie van onze computertoepassingen niet gedocumenteerd wordt. De enigen die ervoor kunnen zorgen dat dat digitale erfgoed bewaard blijft, zijn immers de makers van de toepassingen in kwestie, maar op dit moment lijken er geen conventies of wetten in actie te zijn om hen aan te moedigen of te verplichten dat te doen.

Erger nog is het als een bepaald platform niet rendabel blijkt te zijn en het gewoon uit de cloud geplukt wordt. Het bedrijf gaat op de fles of wordt overgenomen, de servers waarop de dienst draaide worden stilgelegd – en dan? Tenzij het bedrijf een zekere waarde hecht aan geschiedschrijving, wordt er mogelijk helemaal geen hard copy bewaard. Een spijtige zaak, denk maar aan bijvoorbeeld stopgezette MMORPG"s: daarbij wordt letterlijk een volledige virtuele wereld met de grond gelijkgemaakt.

Onder andere daarom ijveren een aantal groeperingen ervoor om alle stopgezette software automatisch te laten opnemen in het publieke domein. Zo zouden computergeschiedkundigen oude en niet langer functionele software toch kunnen bewaren en catalogeren.

Als een MMORPG op de fles gaat, verdwijnt een volledige digitale wereld.

Praktische problemen

Dat zou nog een bijkomend voordeel hebben, want cloud rot heeft niet alleen een historische component.

Data wordt op dit moment aan een steeds grotere snelheid onbruikbaar, omdat in vele domeinen niet met industrieel bepaalde standaarden wordt gewerkt. En zelfs wanneer dat wel het geval is, is er geen enkele garantie dat die standaard niet vervangen wordt wanneer een beter, efficiënter systeem wordt bedacht. Daardoor wordt oudere data simpelweg onleesbaar.

Een correcte bemerking is dat dit fenomeen niet voorbehouden is aan cloud-toepassingen. Data die bewaard wordt op fysieke dragers, van zips tot cd"s en dvd"s, heeft hetzelfde probleem: de software waarin zij ooit aangemaakt zijn is niet meer voorzien op de nieuwste generatie computers en nieuwere software is op zijn beurt niet meer geschikt voor nu verouderde bestandstypes. Het verschil is dat in het geval van oudere softwaretoepassingen meestal wél een hard copy bewaard is. Met andere woorden: wie een exemplaar van de originele software heeft, en een nog werkende computer uit dezelfde tijd – allemaal niet ondenkbaar, want hardware wordt wel degelijk verzameld – kan deze data wel nog aanspreken. Omslachtig, maar doenbaar. Als echter de oudere versie van de software niet langer bestaat, omdat die volledig gehost werd op servers van het desbetreffende bedrijf, is ook die omslachtige methode niet langer een optie.

De consequenties gaan nog verder. Als het internet een inherent instabiele omgeving is, waar weinig aandacht besteed wordt aan conservatie, wat dan met de vele belangrijke functies die we er in ons dagdagelijks leven aan toevertrouwen? Heel wat meer dan een handvol mensen – ondergetekende is geen uitzondering – vertrouwt heel wat toe aan de cloud en de vele spelers daarin. Onze adresboeken en agenda"s worden door iCloud of Google Calendar in sync gehouden tussen onze toestellen; onze foto"s verzamelen we op Facebook; we maken connecties met gelijkgestemden en communities via blogs en sociale netwerken zoals Tumblr of Twitter.

Donderwolken

Het verouderen van data is daarenboven niet het enige fenomeen dat onder de noemer cloud rot wordt gerekend. Vaak uit dezelfde hoek wordt aangeklaagd dat de groeiende tendens om steeds meer data in de cloud te verzamelen een aantal sterke nadelen heeft, die weinig belicht worden.

Cloudopslagdiensten, waar consumenten of bedrijven hun data kunnen opslaan, besteden namelijk vaak weinig aandacht aan de manier waarop ze die data beschermen – niet tegen invloeden of diefstallen van buitenaf, maar tegen corruptie of bit rot. Wat houdt dat precies in? Veel datasystemen in de cloud werken niet met een back-uprotatie waarbij bestanden in verschillende versies of instances bijgehouden worden - of geven daar tenminste geen directe garanties rond. Als data dan door eender welke soort fout beschadigd of gecorrumpeerd raakt, blijft die beschadigde versie verder verplaatst en gekopieerd worden, waardoor de inhoud ervan verloren gaat. Specialisten raden dus aan om dit soort policies grondig na te kijken voor je in zee gaat met aanbieders van cloudopslag.

Interneterosie

De vraag is natuurlijk: als de bedrijven achter die diensten zo weinig bekommerd zijn om het bewaren van de geschiedenis van hun eigen software en producten, welke garanties bieden ze dan aan het stukje persoonlijke historie dat jij eraan toevertrouwt?

Webdiensten zijn van nature vluchtig. Bij fysiek aangekochte software kan een gebruiker zo lang mogelijk blijven hangen aan de laatste versie, ook al wordt het programma niet langer verder ontwikkeld. En zoals eerder aangehaald: als je de juiste hardware bewaart, kan je die stopgezette software in principe tot in de eeuwigheid bewaren en gebruiken. Een toepassing in de cloud is een geheel ander beestje. Oudere versies verdwijnen of zijn in ieder geval niet te bewaren door individuele consumenten.

Daarenboven kan er ook veel data eenvoudigweg verloren gaan als een webservice besluit de deuren te sluiten, en daar zijn vele gebruikers simpelweg niet op voorbereid. In ons gebruik van de cloud zijn we collectief plots wel erg optimistisch: we gaan er gemakshalve van uit dat alles wat we gisteren nog tot onze beschikking hadden, er morgen ook nog wel zal staan. Het tegengestelde is echter waar, en dat weten we al langer. Denk maar aan die andere gelijkaardige term: link rot. We linken op het internet naar andere content, in de overtuiging dat die content daar nog steeds zal zijn als een lezer die link aanklikt. De ervaring leert ons echter dat steeds meer links leiden naar content die opgeslokt werd in de digitale ether.

Hetzelfde geldt voor de vele clouddiensten die we als een vanzelfsprekendheid beschouwen. Denk maar aan Google Reader, de populaire RSS-dienst die vorige jaar werd stopgezet en vele gebruikers plots noodzaakte om hun verzameling feeds in hoog tempo naar een alternatieve aanbieder te verhuizen. Of neem Wikipedia als voorbeeld: de online encyclopedie is een instituut waar mensen zonder meer op vertrouwen, maar er zijn geen garanties dat de site die status zal kunnen blijven waarmaken. Dachten we uiteindelijk ooit ook niet dat GeoCities voor eeuwig zou blijven bestaan?

Laat bovenstaande geen reden zijn tot nodeloze paniek: de cloud als geheel is een systeem met gigantische voordelen, en het zou al te gek zijn om het kind met het badwater buiten te kieperen. Het wordt echter wel tijd om meer aandacht te gaan besteden aan de vluchtige en tijdelijke aard van internetdiensten en platformen en actie te ondernemen – voor grote delen van de softwaregeschiedenis onherroepelijk verloren gaan, met alle historische en praktische gevolgen van dien.