17 maart 2008 13:04

Wat u wilt weten over opslag (2)

Nu opslag ieder jaar belangrijker en complexer wordt, kan het geen kwaad om nog eens terug te gaan naar de basis en enkele veelvoorkomende begrippen te verklaren. In deel twee van deze ‘handleiding voor dummy’s’ behandelen we een aantal opslagsystemen en kijken we naar de kosten.

6. Wat is DAS, NAS en SAN?
DAS staat voor direct attached storage. Het is een extern opslagsysteem dat rechtstreeks aan de server of client is verbonden. De externe harde schijven van bijvoorbeeld Iomega zijn de meest gebruikte vorm van directe opslag.

Bij network attached storage (NAS) is het opslagsysteem aan de server gekoppeld via het bedrijfsnetwerk. NAS is meestal krachtiger dan DAS en biedt in de regel ook meer beheermogelijkheden via bijgeleverde software.

De krachtigste, intelligentste en meest flexibele maar ook duurste oplossing is een storage area network (SAN). Hier worden verschillende opslagsystemen in één afzonderlijk netwerk ondergebracht. Het bijzondere is dat de systemen binnen dit netwerk zich aan de server aandienen als één groot opslagsysteem. De gebruiker merkt hier niet veel van: een bestand kan over verschillende opslagsystemen verspreid zijn zonder dat de gebruiker zich hier ooit om hoeft te bekommeren.

Het principe is als volgt. Er wordt een laag gelegd tussen de hardware en hetgeen naar buiten toe wordt getoond. Dankzij deze laag kan een reeks bestanden logisch bij elkaar gegroepeerd blijven terwijl de fysieke bestanden over verschillende disks verspreid kunnen worden. Zo blijft voor de gebruiker en de systeembeheerder de logische relatie tussen bestanden behouden, terwijl de opslagruimte toch optimaal kan worden ingevuld.

7. Welke technologieën zijn het best voor opslag via een netwerk?
Enkele jaren geleden was fibre channel de populairste technologie voor netwerkopslag. Gegevens konden via deze technologie met gigabitsnelheid worden overgezet, wat met andere technologieën geruime tijd onhaalbaar was.

De voorbije jaren heeft de small computer system interface (SCSI) een inhaalbeweging gemaakt, vooral via de internetvariant iSCSI. Deze laatste heeft als voordeel dat het kan meedrijven op de populariteit van het internet protocol (IP) en tegelijk steeds grotere snelheden aankan door de komst van Gigabit Ethernet.

In vergelijking met fibre channel is iSCSI beter integreerbaar met de rest van het netwerk, en vergt het geen aparte vaardigheden van de systeembeheerder. Hierdoor is iSCSI vooral populair bij de kleinere ondernemingen. iSCSI biedt ook meer standaardmogelijkheden voor het beheer van de opslagmedia.

Bovendien is iSCSI veel goedkoper dan fibre channel. Als u omzetcijfers van alle fibre channel opslagoplossingen vergelijkt met die van iSCSI, zult u merken dat fibre channel nog steeds vijf- tot tienmaal meer geld in het laatje brengt. Dit terwijl een vergelijking van het aantal verkochte eenheden intussen al in het voordeel van iSCI uitvalt.

8. Blijft storage wel betaalbaar?
Ieder jaar zien we de opslagbehoeften spectaculair toenemen. Vorig jaar alleen werd ruim twaalf exabyte (12 miljard gigabyte) aan nieuwe gegevens gecreëerd; meer dan een verdubbeling in vergelijking met het jaar daarvoor. Deze gegevens worden dan ook vaak nog eens ontdubbeld onder druk van de steeds strengere wetgeving. Steeds vaker worden langere periodes van beschikbaarheid van gegevens geëist.

Kunnen bedrijven nog wel mee met zulke stijgende opslagbehoeftes? Als ze hun budget voor storage nagenoeg gelijk houden wel. De stijging van de opslagbehoeften gaat immers jaar na jaar gepaard met een daling van de prijs per gigabyte opslagcapaciteit.

9. Wat is een Raid (en wat een Maid)?
RAID staat voor redundant array of independent disks. Het is een systeem om meerdere harde schijven te laten samenwerken, waardoor ze gezamenlijk naar buiten toe één grote harde schijf vormen. Dit bevordert zowel de snelheid als de veiligheid. Er zijn verschillende vormen van RAID. We sommen even de belangrijkste op.

RAID-0 koppelt twee harde schijven aan elkaar die zich vervolgens voordoen als één grote snelle schijf. Gaat er echter iets mis met een van de schijven, dan bent u al uw gegevens kwijt. Bij RAID-1 draaien twee schijven synchroon. Ze bevatten exact dezelfde gegevens, wat snelheidswinst oplevert. Mocht een van de twee schijven stuk gaan, dan vervangt u het defecte exemplaar, waarna de andere schijf ervoor zorgt dat de inhoud weer hersteld wordt.

RAID-10 is een combinatie van RAID-0 en -1, waarbij u dus minimaal vier harde schijven nodig hebt. RAID-5 ten slotte werkt met minimaal drie harde schijven. Alle schijven benutten een derde van hun ruimte om de data van de andere schijf in de groep gezond te houden. Valt er één schijf uit, dan vangen de andere twee de klap op om de verloren gegevens te herstellen.

MAID staat voor massive array of idle disks. In tegenstelling tot bij RAID is het de bedoeling dat een reeks schijven gewoon klaar staat om te worden ingezet wanneer nodig, zonder al te draaien. Zo kan het energieverbruik van deze verzameling schijven gevoelig worden teruggeschroefd.

Natuurlijk zijn deze inactieve schijven minder snel gebruiksklaar dan schijven die de hele dag staan te draaien. Daarom zijn ze dus minder geschikt voor bedrijfskritieke toepassingen. Ze zijn echter wel sneller dan tape en intussen bijna even goedkoop. Daardoor worden ze steeds vaker overwogen als alternatief voor tape; zelfs voor grote hoeveelheden gegevens die lange tijd moeten worden bewaard.