Skype onderuit door softwarebug
Skype legt de schuld van de grote storing van vorige week grotendeels bij een bug in de Windowsversie van zijn clientsoftware.
In een blogpost vertelt Lars Rabbe van Skype iets meer over het kaartenhuisje dat instortte en de internettelefoniedienst een hele dag lang onbeschikbaar maakte.
Op 22 december was er een overbelasting op enkele ondersteunende servers die offline berichten verwerken, volgens Rabbe. En daarom kregen een aantal Skype-clients hun antwoord van de server trager dan anders. Een bug in de Windowsversie van Skype (versie 5.0.0.152) zorgde ervoor dat die antwoorden niet verwerkt werden, waardoor de clientsoftware crashte.
Kaartenhuisje
Omdat Skype een P2P-netwerk is, kan elke computer die de software draait dienst doen als een node om verkeer door te schakelen. Sommige pc’s worden ingezet als supernodes, die instaan om de connecties van verschillende gebruikers overeind te houden.
Ongeveer de helft van alle Skypegebruikers wereldwijd werkte met de gebugde software. Je hoeft geen genie te zijn om te raden wat er vervolgens is gebeurd: de softwarecrashes zorgden dat zo’n 25 à 30 procent van de Skype-supernodes onderuit ging. Daardoor werden de overblijvende supernodes extra belast, waardoor ook die begonnen uit te vallen. Ondanks verwoede pogingen van de techneuten bij Skype om het netwerk overeind te houden, gaf uiteindelijk het hele Skypenetwerk de geest.
Automatische updates?
Intussen zijn de problemen opgelost, maar wat gaat Skype nu doen om dergelijke voorvallen in de toekomst te vermijden? Rabbe zegt dat het bedrijf al snel een softwarefix klaar had (versie 5.0.0.156), maar dat veel gebruikers die nog niet geïnstalleerd hebben. Daarom wil Skype overwegen om automatische updates te introduceren.
Er wordt ook een grondige analyse gemaakt van de storing, om er voor te zorgen dat ze in de toekomst sneller kunnen reageren. En Skype gaat volgens Rabbe voortaan ook de softwaretests grondiger evalueren, om te voorkomen dat een simpele bug het hele systeem neerhaalt.
Betere communicatie
"We trekken hier lessen uit, en we zien dit als een kans om verbeteringen aan te brengen in onze software, manieren te vinden om sneller te herstellen en beter te communiceren naar onze gebruikers", besluit Lars Rabbe nog.