Error 404: de legendarische foutmelding ontleed
404: Deze pagina kon niet worden gevonden. Tijdens het surfen botsen we wel eens op een webpagina die niet (meer) bestaat. Die moet volgens de internetprotocollen worden aangeduid met de code 404. Een 404-error kan het gevolg zijn van een typfoutje dat je hebt gemaakt bij het ingeven van de URL, maar evengoed van slordig websitebeheer. Internetgebruikers ervaren 404-errors vooral als een storende onderbreking van hun surfsessie, maar heb je je ooit al eens afgevraagd wat er achter zo’n errorpagina schuilgaat? Vanwaar komt die code 404 en hoe moeten webbeheerders ermee omgaan?
HTTP-statuscodes
Om te weten hoe een 404-error kan ontstaan, moeten we een goed begrip hebben van wat er precies achter de schermen gebeurt als we naar een website willen surfen. Wanneer je een URL intypt of aanklikt, zal het apparaat waarmee je surft via de browser een verzoek sturen naar de servers waar de gecachete bestanden van die webpagina bewaard staan. Die server kan een fysieke server zijn die bij wijze van spreken op de zolder van de websitebeheerder staat, maar evengoed een virtuele server van een cloudprovider.
Die communicatie verloopt volgens een gestandaardiseerde codeertaal: het hypertext transfer protocol, beter bekend onder de afkorting HTTP. Op elk verzoek dat de webserver krijgt zal die antwoorden met een HTTP-statuscode. Een 404-error is dus slechts een van de vele mogelijke antwoorden. Er zit wel een duidelijke systematiek in die HTTP-codes. Ze bestaan altijd uit drie cijfers en worden op basis van het eerste cijfer ondergebracht in verschillende categorieën. De 100-statuscodes delen mee dat het verzoek van je browser in behandeling is en een 200-statuscode wijst op een geslaagd verzoek. Bij een 300-code wordt je verzoek omgeleid, waar 400- of 500-codes wijzen op een communicatiefout tussen browser en server.
Een ‘502 Bad Gateway’ of ‘504 Gateway Time-out’ bijvoorbeeld, wijst erop dat de server van de website eventjes overbelast is of er zich een andere technische storing heeft voorgedaan. Een 400-error zoals de 404 wijst eerder op een fout in het verzoek zelf. Je hebt heel veel verschillende 400-foutcodes, maar in de praktijk zien we dat 404 gebruikt wordt bij verscheidene situaties. Op zijn beurt kan je de HTTP-code 404 ook nog eens gaan onderverdelen in subcodes (404.0, 404.1, …), maar de kernboodschap is dezelfde: de webpagina naar waar je wilde surfen kan niet worden gevonden.
Dode links
Er zijn drie scenario’s waarin een 404-error zich voordoet. In het meest frequente scenario ligt dat aan de internetgebruiker zelf: een fout in de ingegeven URL. Maar in een aantal gevallen ligt de fout bij de websitebeheerder. Veel webpagina’s linken door naar externe of interne links die niet bestaan en zo een 404-errorpagina uitlokken. Dat is vaak een gevolg van een fenomeen dat we ‘link rot’ of ‘dode links’ noemen. Webpagina’s hebben geen eindeloze levensduur. Het veranderen of schrappen van een domeinnaam, het invoeren van een paywall, geblokkeerde content op de webpagina, … Er zijn veel factoren die de levensduur van een webpagina kunnen inkorten.
Een recente studie uit 2021 toonde aan dat bijna één op de vier geregistreerde URL’s inmiddels niet meer toegankelijk is. Die dode URL’s zijn niet zo onschuldig als ze lijken. De website-auteurs steken heel wat tijd en moeite om (waar het past) interne en externe links in de inhoud van hun webpagina’s te integreren. Zo proberen ze de algoritmen van zoekmachines te paaien. Door je eigen webpagina’s naar elkaar te laten linken creëer je een sitemap die het bezoekers van je website eenvoudiger maakt om de juiste informatie op je website te zoeken.
Als een externe website naar je pagina refereert, komt dat je betrouwbaarheid als bron uiteraard ook ten goede. Op basis van interne en externe links kennen de algoritmen van zoekmachines de webpagina een score toe. Hoe beter dat rapport, hoe prominenter je webpagina naar voren zal komen in de zoekresultaten en hoe eenvoudiger je bezoekers zal kunnen aantrekken. Bevat je sitemap echter meerdere dode links, dan geeft dat de indruk van een slecht onderhouden webpagina en zullen de algoritmen van Google je daar ook genadeloos voor afstraffen. Het is daarom een belangrijke taak van een websitebeheerder om regelmatig die dode links eens op te kuisen. Daar kunnen ze programma’s zoals Google Analytics voor gebruiken, om ze snel op te sporen.
Child Focus
Hoewel 404-pagina’s dus zoveel mogelijk te vermijden zijn, bieden ze webbeheerders wel veel vrijheid om ze naar hun hand te zetten. Er zijn een paar wettelijke spelregels waaraan een 404-pagina moet voldoen. Zo moet de statuscode 404 altijd expliciet vermeld worden, vergezeld van een mededeling dat de opgevraagde pagina niet kon worden gevonden. Maar hoe die pagina verder ingericht wordt, daar mag de webdesigner zich creatief mee uitleven. De pagina mag volledig opgaan in het thema van de website en een gepersonaliseerde en/of visuele boodschap bevatten.
Webdesigners zullen bijna altijd een knop naar hun homepage invoegen om bezoekers niet te verliezen. Een goed ontworpen 404 zal de bezoekervaring van je website slechts minimaal beïnvloeden en in sommige gevallen is het zelfs beter een 404-pagina te tonen dan bezoekers om te leiden naar een pagina die helemaal niet relevant is voor wat ze zoeken. Een mooi voorbeeld van hoe een 404-pagina een positieve maatschappelijke bijdrage kan leveren is de #NotFound-campagne die Child Focus in 2018 lanceerde. Door gebruik te maken van een webapplicatie NotFound.org kunnen webbeheerders hun 404-pagina’s omtoveren naar opsporingsberichten voor vermiste kinderen. Ondertussen zouden al meer dan 6.000 websites in 7 Europese landen op deze manier hun dode links een tweede leven hebben gegeven.