Wenn man Abends mit ein paar befreundeten Fotografen zusammensitzt und bei einem Glas Rotwein und einer Rucola-Pizza mit Parmaschinken und Parmesankäse verschiedene Themen andiskutiert, dann kann es passieren, dass man sich auch mal Gedanken über Datensicherung macht. Ernsthaft. 🙂
Die Frage war: „RAID oder nicht RAID – und wenn ja, warum? Oder doch lieber ein NAS? Ein Cloud-Backup? Oder einfach USB-Platten?“
Alles für den optimalen Schutz der eigenen Bilddatenbank mit den geliebten fotografischen Werken.
Meine erste Antwort war: „Erstmal Mac OS X mit Timemachine“. Das verwirrte meinen Bekannten dann doch etwas. Vermutlich hatte er erwartet, dass auf seine einfache Frage wie aus der Pistole geschossen irgendein Festplattenhersteller genannt werden würde.
Also konzentriere ich mich hier auf Backuplösungen und weniger auf die Backupsoftware. Nur soviel: Stressfreier als mit Timemachine und Mac OS X kann man sein Betriebssystem, seine Programme und seine Daten nicht sichern und wiederherstellen! Das ist eine exzellente Grundlage um sich anschliessend mit dem Thema „Art des Datenspeichers“ auseinanderzusetzen.
Zum Thema RAID (Redundant Array of Independent Disks) fielen mir auf dem Nachhauseweg dann ein paar Anmerkungen ein von denen die ein oder andere vielleicht auch für die Leser vom pawlik.viewing-Blog interessant sein könnte.
Mehrere Aspekte sind wichtig:
– Datensicherheit / Ausfallsicherheit / Langlebigkeit
– Schreib/Lesegeschwindigkeit
– Kosten pro GB
– Unterschiedliche Raid Varianten (Striping, Mirroring, Striping mit Parity, Mirrored Stripeset…)
– Schutz vor Viren
– Schutz vor Umwelteinflüssen / Offsite Backup nötig?
Im Prinzip hatte ein weiterer Bekannter, der mit am Tisch saß schon recht, dass ein RAID in erster Linie dafür konzipiert wurde, um als eingebauter Speicher zum Beispiel in einem Serversystem, als Storage-Basis für Virtuelle Maschinen oder in einem Videoschnittplatz genutzt zu werden.
Jedoch bietet RAID durchaus Vorteile auch im Backup- oder SAN/NAS Bereich.
Zu dem Punkt warum ich mein weekly backup auf einem RAID statt einer einfachen USB Festplatte oder einer DVD- oder Bluraydisk sichere komme ich gleich.
Zunächst nochmal zur Auffrischung eine Erklärung der verschiedenen RAID-Varianten.
Am weitesten verbreitet im Enduser-Bereich sind RAID 0 , 1, 5 und 10.
Im Videoschnittbereich kommen häufig Rechnerkonfigurationen mit RAID 0 (Striping), Raid 5 (Striping mit Parity) oder RAID 10 (Mirrored Stripeset) zum Einsatz.
Warum? Beim RAID 0 (Striping) addieren sich die Schreibgeschwindigkeiten mit jeder zusätzlichen Spindel (Festplatte) im Stripeset, da die zu schreibenden Bytes auf mehrere Platten verteilt werden.
Um es einfach zu machen: Block 1 auf Platte 1, Block 2 auf Platte 2, Block 3 auf Platte 3, Block 4 auf Platte 1, Block 5 auf Platte 2 usw. Die Schreibvorgänge 1-3, 4-6 etc. laufen dabei jeweils parallel ab.
RAID 0 ist auch sehr billig in puncto Kosten pro GB, da der gesamte Plattenplatz zur Verfügung steht.
Jedoch ist ein Stripeset sehr anfällig: Fällt eine Platte aus ist alles weg.
Sicherer ist RAID 1 (Mirroring): Sämtliche Daten werden jeweils auf der ersten und der zweiten Platte geschrieben. Fällt eine aus kann die Information von der Kopie auf der anderen Platte wiederhergestellt werden. Fallen beide aus ist natürlich alles weg. Dieses Verfahren ist mitunter sogar langsamer, bringt jedoch auf keinen Fall einen Geschwindigkeitsvorteil gegenüber einer 1-Platten-Lösung.
Die Kosten pro GB sind allerdings deutlich höher, da immer nur die Hälfte des insgesamt verfügbaren Plattenplatzes effektiv genutzt werden kann.
Um die Vorteile von Raid 0 und 1 zu kombinieren hat man RAID 5 (Striping mit Parity) erfunden. Hierbei kommen jeweils 3 Platten pro Raid 5-Set zum Einsatz. Aus der Information von zwei Platten kann man die dritte Platte wiederherstellen.
Ausserdem bekommt man eine fast doppelt so schnelle Schreibgeschwindigkeit wie mit nur einer Platte, weil die Information immer auf zwei Platten verteilt wird und dann nur noch die Parity Information auf die nächste geschrieben werden muss (stark vereinfacht ausgedrückt).
Kostentechnisch ist es ein guter Kompromiss. Es stehen etwa 66% des verfügbaren Speicherplatzes für Nutzdaten zur Verfügung.
Will man die Schreib/Lesegeschwindigkeit noch weiter erhöhen ist RAID 10 (Mirrored Striping) sinnvoll: Ein Stripeset aus beliebig vielen Festplatten wird auf ein anderes Stripeset aus genauso vielen Platten gespiegelt.
Kostentechnisch ist dies nicht wirklich optimal, da genau wie beim mirroring nur die hälfte des Plattenplatzes nutzbar ist. Dafür ist es ausfallsicher UND schnell.
Mein wöchentliches Langzeitbackup
Für mein wöchentliches Langzeitbackup habe ich mich für ein externes, per Firewire 800 angebundenes RAID (gemirrored) entschieden, da es mir dann egal sein kann ob eine der beiden Platten mit der Zeit nicht mehr lesbar ist.
Für Festplatten habe ich mich entschieden weil sie dauerhafter Daten Speichern als DVD-Rohlinge und vermutlich sogar als Bluray Disks. Gegen Bluray Disks habe ich mich vor allem aus Kostengründen entschieden (ich müsste erstmal einen Bluray-Brenner anschaffen und die Rohlinge sind auch nicht grade günstig). Der Hauptgrund: ich traue den Dingern noch nicht so recht.
Sollte doch mal eine Festplatte ausfallen tausche ich einfach die defekte Platte aus und alles bleibt erhalten. Hätte ich nur eine einzelne Platte könnte es sein, dass das Langzeitbackup (Datenendlager…) irgendwann Grütze wird und alles verloren ist, was nicht mehr auf der aktuellen Festplatte oder im inkrementellen Timemachine Backup vorhanden ist.
Hinzu kommt, dass mein langzeit Backup RAID nicht ständig angeschaltet ist und somit, falls es doch mal ein Virus auf den Rechner schafft, das Backup erstmal nichts davon mitbekommt.
Vor jeder Sicherung wird der Virenscanner angeschmissen, dann das RAID eingeschaltet – so kann (fast) nichts passieren.
Ebenso könnte ich mir vorstellen, mein Timemachine Backup auf ein RAID auszulagern. Mit dem Gedanken habe ich schon gespielt. Jedoch spielen mehrere Überlegungen eine Rolle: Ein weiteres RAID ist teuer. Zwischen 300 und 600 EUR wäre ich dafür los.
Ausserdem erstelle ich ohnehin wöchentliche Backups. wenn also die Timemachine Platte und GLEICHZEITIG meine Systemfestplatte abschmiert gehen mir maximal 7 Tage und die Historie auf dem Rechner verloren.
Da dies jedoch sehr unwahrscheinlich ist, sehe ich das Timemachine Backup eher als Archiv gegen versehentliches Löschen an. Und das darf ruhig mal kaputtgehen.
Die Timemachineplatte kann auch die ganze Zeit mitlaufen, da es nichts ausmacht, wenn doch mal ein blöder Virus die Daten auf der Platte über den Jordan schickt. Vor allem aber will ich nicht alle Stunde die Platte anschalten, damit Timemachine sein Backup erstellen kann.
Nur die „Site Redundancy“ hab ich noch nicht gelöst.
Cloud Backup Services sind mir bisher nicht sicher genug und/oder zu teuer. Hinzu kommt, dass mein Internetupstream zur Zeit nur bei 5 mbit/s liegt und die zu sichernden Datenmengen die GB Grenze in der Regel um ein Vielfaches überschreiten: Der Upload einer einzigen Vollsicherung würde Tage dauern.
Auch eine Festplatte alle paar Wochen irgendwohin zu schicken kommt für mich nicht in Frage, so wichtig ist das nun auch nicht.
Nach einem Wohnungsbrand oder einem ähnlich fatalen Ereignis hätte ich vermutlich ganz andere Probleme als eine verlorene Bilddatenbank auf einem kaputten Rechner…
Aber das mag jeder durchaus anders bewerten und für sich seine eigene Entscheidung treffen.
Von NAS Systemen halte ich nur dann etwas, wenn die Netzwerkanbindung zwischen den Systemen ausreichend schnell ist und zwingend mehrere Nutzer mit den gleichen Dateien arbeiten müssen. Und selbst dann kann es Zuhause sinnvoller sein die Daten über den Rechner zu Teilen, an dem die Platte hängt statt ein dediziertes NAS zu kaufen.
400 mbit/s sollten zwischen Computer und NAS allerdings mindestens übertragen werden können, damit ein NAS Spass macht. In der Regel bedeutet das: Gigabit Ethernet oder Fibrechannelanbindung. Mit einer einfachen, handelsüblichen Gigabit-Ethernet-Anbindung liegt die Datenübertragungsrate etwa bei 80-90 MByte/s.
Manche NAS Systeme die heute im Handel erhältlich sind unterstützen aber nur das ältere 100 mbit Ethernet – mit Datenübertragungsraten von nur 8-9 MByte/s.
Viel zu wenig um ‚zig Gigabytes von Daten sinnvoll übertragen zu können. Ausserdem bietet ein NAS, wenn es ständig am Netz hängt, keinen zuverlässigen Schutz gegen Viren oder Würmer.
Weil die schnelleren, Netzwerkbasierten Übertragungswege relativ teuer in der Anschaffung sind und ich nicht von mehreren Rechnern in einer verteilten Umgebung auf den Datenbestand zugreifen muss habe ich mich für das oben genannte RAID System mit Firewire 800 anbindung entschieden.
Alternativen für die lokale Anbindung sind Systeme mit USB 3.0 oder Thunderbolt, diese Anschlussarten müssen jedoch sowohl vom Computer als auch vom RAID System unterstützt werden. Speziell Thunderbolt ist auf dem Mac zu empfehlen, jedoch kostet ein WD MyBook Studio RAID mit Thunderbolt aktuell etwa 130 EUR mehr als das gleiche RAID System mit Firewire 800.
Ende Gut, alles Gut?
Heute Morgen meldete sich übrigens mein Bekannter per eMail: Sein Rechner bootet nicht mehr, die SSD ist kaputt. Zum Glück hat er das Wichtigste wiederhergestellt bekommen. Sieht so aus als wären die Tipps grade zur richtigen Zeit gekommen.