Wenn man Abends mit ein paar befreundeten Fotografen zusammensitzt und bei einem Glas Rotwein und einer Rucola-Pizza mit Parmaschinken und Parmesankäse verschiedene Themen andiskutiert, dann kann es passieren, dass man sich auch mal Gedanken über Datensicherung macht. Ernsthaft. 🙂
Die Frage war: „RAID oder nicht RAID – und wenn ja, warum? Oder doch lieber ein NAS? Ein Cloud-Backup? Oder einfach USB-Platten?“
Alles für den optimalen Schutz der eigenen Bilddatenbank mit den geliebten fotografischen Werken.
Meine erste Antwort war: „Erstmal Mac OS X mit Timemachine“. Das verwirrte meinen Bekannten dann doch etwas. Vermutlich hatte er erwartet, dass auf seine einfache Frage wie aus der Pistole geschossen irgendein Festplattenhersteller genannt werden würde.
Also konzentriere ich mich hier auf Backuplösungen und weniger auf die Backupsoftware. Nur soviel: Stressfreier als mit Timemachine und Mac OS X kann man sein Betriebssystem, seine Programme und seine Daten nicht sichern und wiederherstellen! Das ist eine exzellente Grundlage um sich anschliessend mit dem Thema „Art des Datenspeichers“ auseinanderzusetzen.
Zum Thema RAID (Redundant Array of Independent Disks) fielen mir auf dem Nachhauseweg dann ein paar Anmerkungen ein von denen die ein oder andere vielleicht auch für die Leser vom pawlik.viewing-Blog interessant sein könnte.
Mehrere Aspekte sind wichtig:
– Datensicherheit / Ausfallsicherheit / Langlebigkeit
– Schreib/Lesegeschwindigkeit
– Kosten pro GB
– Unterschiedliche Raid Varianten (Striping, Mirroring, Striping mit Parity, Mirrored Stripeset…)
– Schutz vor Viren
– Schutz vor Umwelteinflüssen / Offsite Backup nötig?
Im Prinzip hatte ein weiterer Bekannter, der mit am Tisch saß schon recht, dass ein RAID in erster Linie dafür konzipiert wurde, um als eingebauter Speicher zum Beispiel in einem Serversystem, als Storage-Basis für Virtuelle Maschinen oder in einem Videoschnittplatz genutzt zu werden.
Jedoch bietet RAID durchaus Vorteile auch im Backup- oder SAN/NAS Bereich.
Zu dem Punkt warum ich mein weekly backup auf einem RAID statt einer einfachen USB Festplatte oder einer DVD- oder Bluraydisk sichere komme ich gleich.
Zunächst nochmal zur Auffrischung eine Erklärung der verschiedenen RAID-Varianten.
Am weitesten verbreitet im Enduser-Bereich sind RAID 0 , 1, 5 und 10.
Im Videoschnittbereich kommen häufig Rechnerkonfigurationen mit RAID 0 (Striping), Raid 5 (Striping mit Parity) oder RAID 10 (Mirrored Stripeset) zum Einsatz.
Warum? Beim RAID 0 (Striping) addieren sich die Schreibgeschwindigkeiten mit jeder zusätzlichen Spindel (Festplatte) im Stripeset, da die zu schreibenden Bytes auf mehrere Platten verteilt werden.
Um es einfach zu machen: Block 1 auf Platte 1, Block 2 auf Platte 2, Block 3 auf Platte 3, Block 4 auf Platte 1, Block 5 auf Platte 2 usw. Die Schreibvorgänge 1-3, 4-6 etc. laufen dabei jeweils parallel ab.
RAID 0 ist auch sehr billig in puncto Kosten pro GB, da der gesamte Plattenplatz zur Verfügung steht.
Jedoch ist ein Stripeset sehr anfällig: Fällt eine Platte aus ist alles weg.
Sicherer ist RAID 1 (Mirroring): Sämtliche Daten werden jeweils auf der ersten und der zweiten Platte geschrieben. Fällt eine aus kann die Information von der Kopie auf der anderen Platte wiederhergestellt werden. Fallen beide aus ist natürlich alles weg. Dieses Verfahren ist mitunter sogar langsamer, bringt jedoch auf keinen Fall einen Geschwindigkeitsvorteil gegenüber einer 1-Platten-Lösung.
Die Kosten pro GB sind allerdings deutlich höher, da immer nur die Hälfte des insgesamt verfügbaren Plattenplatzes effektiv genutzt werden kann.
Um die Vorteile von Raid 0 und 1 zu kombinieren hat man RAID 5 (Striping mit Parity) erfunden. Hierbei kommen jeweils 3 Platten pro Raid 5-Set zum Einsatz. Aus der Information von zwei Platten kann man die dritte Platte wiederherstellen.
Ausserdem bekommt man eine fast doppelt so schnelle Schreibgeschwindigkeit wie mit nur einer Platte, weil die Information immer auf zwei Platten verteilt wird und dann nur noch die Parity Information auf die nächste geschrieben werden muss (stark vereinfacht ausgedrückt).
Kostentechnisch ist es ein guter Kompromiss. Es stehen etwa 66% des verfügbaren Speicherplatzes für Nutzdaten zur Verfügung.
Will man die Schreib/Lesegeschwindigkeit noch weiter erhöhen ist RAID 10 (Mirrored Striping) sinnvoll: Ein Stripeset aus beliebig vielen Festplatten wird auf ein anderes Stripeset aus genauso vielen Platten gespiegelt.
Kostentechnisch ist dies nicht wirklich optimal, da genau wie beim mirroring nur die hälfte des Plattenplatzes nutzbar ist. Dafür ist es ausfallsicher UND schnell.
Mein wöchentliches Langzeitbackup
Für mein wöchentliches Langzeitbackup habe ich mich für ein externes, per Firewire 800 angebundenes RAID (gemirrored) entschieden, da es mir dann egal sein kann ob eine der beiden Platten mit der Zeit nicht mehr lesbar ist.
Für Festplatten habe ich mich entschieden weil sie dauerhafter Daten Speichern als DVD-Rohlinge und vermutlich sogar als Bluray Disks. Gegen Bluray Disks habe ich mich vor allem aus Kostengründen entschieden (ich müsste erstmal einen Bluray-Brenner anschaffen und die Rohlinge sind auch nicht grade günstig). Der Hauptgrund: ich traue den Dingern noch nicht so recht.
Sollte doch mal eine Festplatte ausfallen tausche ich einfach die defekte Platte aus und alles bleibt erhalten. Hätte ich nur eine einzelne Platte könnte es sein, dass das Langzeitbackup (Datenendlager…) irgendwann Grütze wird und alles verloren ist, was nicht mehr auf der aktuellen Festplatte oder im inkrementellen Timemachine Backup vorhanden ist.
Hinzu kommt, dass mein langzeit Backup RAID nicht ständig angeschaltet ist und somit, falls es doch mal ein Virus auf den Rechner schafft, das Backup erstmal nichts davon mitbekommt.
Vor jeder Sicherung wird der Virenscanner angeschmissen, dann das RAID eingeschaltet – so kann (fast) nichts passieren.
Ebenso könnte ich mir vorstellen, mein Timemachine Backup auf ein RAID auszulagern. Mit dem Gedanken habe ich schon gespielt. Jedoch spielen mehrere Überlegungen eine Rolle: Ein weiteres RAID ist teuer. Zwischen 300 und 600 EUR wäre ich dafür los.
Ausserdem erstelle ich ohnehin wöchentliche Backups. wenn also die Timemachine Platte und GLEICHZEITIG meine Systemfestplatte abschmiert gehen mir maximal 7 Tage und die Historie auf dem Rechner verloren.
Da dies jedoch sehr unwahrscheinlich ist, sehe ich das Timemachine Backup eher als Archiv gegen versehentliches Löschen an. Und das darf ruhig mal kaputtgehen.
Die Timemachineplatte kann auch die ganze Zeit mitlaufen, da es nichts ausmacht, wenn doch mal ein blöder Virus die Daten auf der Platte über den Jordan schickt. Vor allem aber will ich nicht alle Stunde die Platte anschalten, damit Timemachine sein Backup erstellen kann.
Nur die „Site Redundancy“ hab ich noch nicht gelöst.
Cloud Backup Services sind mir bisher nicht sicher genug und/oder zu teuer. Hinzu kommt, dass mein Internetupstream zur Zeit nur bei 5 mbit/s liegt und die zu sichernden Datenmengen die GB Grenze in der Regel um ein Vielfaches überschreiten: Der Upload einer einzigen Vollsicherung würde Tage dauern.
Auch eine Festplatte alle paar Wochen irgendwohin zu schicken kommt für mich nicht in Frage, so wichtig ist das nun auch nicht.
Nach einem Wohnungsbrand oder einem ähnlich fatalen Ereignis hätte ich vermutlich ganz andere Probleme als eine verlorene Bilddatenbank auf einem kaputten Rechner…
Aber das mag jeder durchaus anders bewerten und für sich seine eigene Entscheidung treffen.
Von NAS Systemen halte ich nur dann etwas, wenn die Netzwerkanbindung zwischen den Systemen ausreichend schnell ist und zwingend mehrere Nutzer mit den gleichen Dateien arbeiten müssen. Und selbst dann kann es Zuhause sinnvoller sein die Daten über den Rechner zu Teilen, an dem die Platte hängt statt ein dediziertes NAS zu kaufen.
400 mbit/s sollten zwischen Computer und NAS allerdings mindestens übertragen werden können, damit ein NAS Spass macht. In der Regel bedeutet das: Gigabit Ethernet oder Fibrechannelanbindung. Mit einer einfachen, handelsüblichen Gigabit-Ethernet-Anbindung liegt die Datenübertragungsrate etwa bei 80-90 MByte/s.
Manche NAS Systeme die heute im Handel erhältlich sind unterstützen aber nur das ältere 100 mbit Ethernet – mit Datenübertragungsraten von nur 8-9 MByte/s.
Viel zu wenig um ‚zig Gigabytes von Daten sinnvoll übertragen zu können. Ausserdem bietet ein NAS, wenn es ständig am Netz hängt, keinen zuverlässigen Schutz gegen Viren oder Würmer.
Weil die schnelleren, Netzwerkbasierten Übertragungswege relativ teuer in der Anschaffung sind und ich nicht von mehreren Rechnern in einer verteilten Umgebung auf den Datenbestand zugreifen muss habe ich mich für das oben genannte RAID System mit Firewire 800 anbindung entschieden.
Alternativen für die lokale Anbindung sind Systeme mit USB 3.0 oder Thunderbolt, diese Anschlussarten müssen jedoch sowohl vom Computer als auch vom RAID System unterstützt werden. Speziell Thunderbolt ist auf dem Mac zu empfehlen, jedoch kostet ein WD MyBook Studio RAID mit Thunderbolt aktuell etwa 130 EUR mehr als das gleiche RAID System mit Firewire 800.
Ende Gut, alles Gut?
Heute Morgen meldete sich übrigens mein Bekannter per eMail: Sein Rechner bootet nicht mehr, die SSD ist kaputt. Zum Glück hat er das Wichtigste wiederhergestellt bekommen. Sieht so aus als wären die Tipps grade zur richtigen Zeit gekommen.
Hi Karsten,
yepp, anbei noch einige zusätzlich Gedanken ….:
Wie sichere ich meine Papier Dokumente (Bankunterlagen, Steuer, Verträge …..)?
Wer hier auch keinen Wert drauf legt, sollte das mit elektronischen Dokumenten auch nicht übertreiben.
Ein Unterschied sind natürlich „immaterielle Werte“. Was sind mit Fotos, Texte, Projekte (Geburtagsgeschenke, Hochzeitszeitungen usw.) Wert.
Für mich gilt hier, umso älter umso wertvoller.
Grundsätzlich trenne ich jedoch in Daten in zwei Bereiche.
Daten die ich mit Aufwand rekonstruieren kann (Betriebssystem, Programme, MP3 von meine CDs usw.) und meine Nutzdaten.
Die Nutzdaten haben wiederum zwei unterschiedliche Wertigkeiten.
→ Bearbeitungsdaten ca. 0-1 Jahre alte
→ Langzeit Archiv Daten (Ältere Daten und Projekte z.B. Hochzeitszeitungen)
Je nach Wertigkeit betreibe ich dann unterschiedlichen Aufwand.
Vor was soll denn die Datensicherung schützen bzw. bezwecken?
→ Vierenbefall
→ versehentliches löschen
→ höhere Gewalt (Feuer, Strom, Wasser, Diebstahl)
→ Datenmanipulation (absichtlich, versehentlich)
→ Hardwarefehler
→ gesetzliche Anforderungen (Steuer, Versicherungen, Banken)
→ eigene Anforderungen (gleicher Zweck wie Papierfotoalben usw.)
Noch ein paar Anmerkungen:
a) technisch:
RAID 1: ist nur quasi sicherer, jegliche Controller und Schnittstellen Fehler wirken sich fatal aus, da dann auf beiden Platten ebenfalls das Falsche steht.
Es sorgt eher dafür die Ausfallzeit so klein wie möglich zu halten.
Außerdem sorgt jede weiter Festplatte für eine höher Ausfallwahrscheinlichkeit.
Fallen bei einem RAID (ausgenommen RAID 0) eine Platte aus, sind höchste Alarm Glocken, da meist die gleichen Festplatten (Charge) verbaut wurde, könnten die anderen Festplatten ebenfalls bald „hops“ gehen. Im privat Gebrauch mit Hot-Spare (RAID 5+1 oder sogar RAID 6+2) zu fahren halte ich nicht für finanzierbar. Wie du schon erklärt hast, geht es hier dann eher um Performance und um Ausfallsicherheit.
b) Faktor Mensch „Faulheit“ – regelmäßig und Ordnung halten
→ das unsicherste ist eh der Mensch, sichere ich auch regelmäßig?
→ Sichere ich auch alle Daten (Smartphone, Tablet, VideoRecoder, Notebook, Fotokapperat, USB-Sticks …..)
→ Ordnung halten, Daten aussortieren
→ Überblick behalten (z.B. alle PDF-> JPEG konvertiert, und Picasa Indizieren lassen)
c) Worst-Case, simulieren / ausprobieren
→ Was hilfts, wenn ich im Notfall an die Daten doch nicht wieder hinkomme
→ da die Daten nicht gesichert wurden
→ kein Zugriff (Medium defekt, Rechner kaputt, nicht alle Daten gesichert ….)
d) Langzeitarchivierung über >10 Jahre
→ Langzeitarchivformate (PDF/A, TIFF/G4, JPEG, XML)
→ Quell Dateien > 5 Jahren lassen sich nur noch teils oeffnen
→ Sind alle Fonts (Schriftarten noch vorhanden)
→ regelmäßige Datenintgritätscheck (z.B. jpeg via cjc.exe)
Lösung pragmatisch:
Sich dem Datenverfall auf jedem Medium bewusst sein.
→ seriöse Fachmagazine beschreiben unterschiedliche Haltbarkeit von Medien:
→ selbst gebrannte CD zwischen 1 Jahr und 5 Jahre
→ selbst gebrannte DVD und BluRay liegen sie zwischen 1 Tag und 1 Jahr
Falls einer doch das macht, sollte er mit „dvdisaster“ (http://dvdisaster.net/de/index.html) zusätzliche Fehlerkorrektur Dateien anlegen und ebenfalls archivieren
→ SSD / USB-Sticks zu jung keine Langzeit Medien nicht N-Fach beschreibbar
→ Festplatten im Schrank bei guter Lagerung (Temperatur, Luftfeuchtigkeit, wenig Erschütterung) > 5 Jahre
Somit bleibe ich dabei, für mehrfaches und wiederkehrende Sicherungen sind Festplatten (via USB, Firewire, E-Sata, Netzwerk) das sicherste und guenstigeste Medium.
Hier sollten wenn schon paronid 2 USB Festplatten verwendet werden. Eine die immer Online ist und das wöchentliche Backup übernimmt. Und die zweite die einmal im Monat/Quartal die Datensicherung übernimmt und sonst im Schrank liegt. (Sicher gegen → Vieren, Überspannung)
Ein 32GB USB-Stick kann für die wichtigsten Daten als Jahressicherung verwendet werden und lässt sich gut per Brief zu seinen Eltern senden.
Apple macht hier schon sehr viel richtig. Dem stimme ich zu.
Aber auch unter Windows7 ist alles am Board was der Otto Normal Verbraucher benötigt
„Sichern und Wiederherstellen“.
→ zyklisch einstellbar (wöchentlich)
→ Systemabbild der Betriebssystemplatte, inkrementelle Datensicherung
→ Hinweis an den Benutzer falls Sicherung nicht geklappt hat
→ Aufs Netzwerk auch möglich
→ in Container Dateien und Suchindex
Daten mindestens 1 mal kopieren, besser sogar 2 mal. (Also inkl. Orginal 3 Kopien)
Bei mir z.B. Quelle (Notebook),
wöchentlich, RAID5 SoftRaid – Linux Festnetzrechner via GBit LAN (bei Bedarf täglich)
halbjährlich, Langzeitarchiv Daten via USB 2.0 Festplatte
Was ich mir schon seit einem halben Jahr vornehme ist, noch eine 4 Kopie auf einer USB-Festplatte zu erzeugen, und diese bei meinen Eltern hinterlege (sicher gegen Feuer, Diebstahl und Wasser).
Idee wäre hier diese mit der 3 Kopie halbjährlich auszutauschen.
Ich ertappe mich hier jedoch, das ich bei weitem nicht so „paranoid“ mit meinem Papierdokumenten bin. Außer wenn ich Schriftverkehr versende
Hier knipse ich mit der Digicam ein Foto und hier gibt’s dann wieder 3 digitale kopien 🙂
Viele Grüße
Thomas
Wie ich vorhin gesehen habe behandelt der aktuelle Fotoespresso (http://www.fotoespresso.de) in seiner Ausgabe 4/2012 das Thema Fotografie und Backup in einem ausführlichen Artikel von Jürgen Gulbins.
Inhaltlich in etwa das gleiche, was hier schon geschrieben wurde, aber etwas ausführlicher beschrieben und hübsch aufbereitet. Wer den Artikel lesen möchte – Hier ist der Direktlink zur Ausgabe:
http://fotoespresso.de/fileadmin/pdf/fotoespresso/FE_DE_4-2012_rev_1.0.pdf