Liebe Teilnehmerinnen und Teilnehmer des ChemieOnline Forums,
am frühen Morgen des 27. Januars kam es zu einem Ausfall des Festplattenverbundes auf dem ChemieOnline Server. In Folge dessen waren unsere Internetseiten nicht mehr zu erreichen. Die Auswertung des Schadens hat den Ausfall von zwei der drei Festplatten ergeben, wodurch es leider nicht möglich war die Daten zu retten, da auch die Backup-Festplatte aufgrund der Hardwarekonfiguration leider nicht mehr lesbar war.
Mit dieser Ausgangssituation wurde ein zweiter Server in Betrieb genommen und installiert. Auf diesen Server haben wir nun ein Backup installiert, welches wir am 21.12.2010 extern gespeichert haben. Wir mussten leider auch hier feststellen, dass die Festplatten bereits zu diesem Zeitpunkt Fehler produzierten, so dass das Backuparchiv ebenfalls teilweise beschädigt war. Welche Bereiche davon betroffen sind, dazu später mehr.
Für das Forum bedeutet dies, dass alle Beiträge, Themen, Anmeldungen, Abmeldungen, Private Nachrichten usw. die nach dem 21.12.2010 geschrieben worden sind, nicht mehr existieren. Dies bedauern wir sehr.
Die Schäden im Backuparchiv haben darüber hinaus zur Folge, dass ca. 7% der Dateianhänge (2.000 Stück) im Forum, alle Bilderalben und einige Bloganhänge verloren sind.
Aufgrund der kompletten Neueinrichtung der Internetseiten kann es natürlich sein, dass es hier und da noch klemmt. Sollten Fehler gefunden werden, so bitten wir darum, diese im entsprechenden Forum mitzuteilen. Wir arbeiten so schnell es uns möglich ist, damit alles wieder reibungslos funktioniert. Zusätzlich werden wir unsere Backupstrategie überarbeiten und verbessern, damit ein Datenverlust in Zukunft weiter minimiert wird und wir die nächsten 14 Jahre ohne Festplattenschaden überstehen.
Wir bitten für den Ausfall um Entschuldigung und wollen aus unseren Fehlern lernen und die Backups noch gewissenhafter durchführen und kontrollieren.
CO-Mertens
31.01.2011, 19:43
Es war möglich noch 600 Bilder aus den Alben wieder herzustellen.
pleindespoir
31.01.2011, 20:37
Meine bescheidene Erfahrung mit RAID-Systemen ist, dass die Platten theoretisch so konfiguriert sein sollten, dass im crash-Fall die Daten verhältnismässig leicht und ziemlich vollständig rekonstruierbar sein sollten.
Praktisch verrecken die Dinger jedoch wunderlicherweise stets mit "Party-Effekt". Also mehrere Platten verabreden sich und machen dann gemeinsam eine "Crash-Party". Damit ist die Rekonstruktion dann sehr erschwert und teilweise ganz unmöglich.
Die Ursache liegt in der Verwendung typgleicher Platten des gleichen Herstellers. Wenn die aus einer Serie sind, tickt in denen auch der gleiche SDT (SelfDestroyTimer).
Mein Tipp:
Verschiede Hersteller - unterschiedliche Typen - unterschiedliche Baureihen. Dann kann RAID auch funktionieren.
----
Ansonsten habe ich aufgrund des tagelangen Forenentzuges bereits Kaltschweissausbrüche und delir-ähnlich Zustände erleiden müssen - in meinem Alter steckt man das nicht mehr so leicht weg - also passt mal besser auf in Zukunft! ;)
nobody
31.01.2011, 22:59
:):):):):) ENDLICH WIEDER CO!
Ansonsten habe ich aufgrund des tagelangen Forenentzuges bereits Kaltschweissausbrüche und delir-ähnlich Zustände erleiden müssen - in meinem Alter steckt man das nicht mehr so leicht weg - also passt mal besser auf in Zukunft!
CO ist wie Strom... man merkt die Abhängigkeit erst, wenn er mal weg ist.
Ich hab glaub ich mindestens 50mal am Tag probiert, obs wieder geht.
Anfangs gar keine Nachricht, dann Systemaktualisierung und schliessslich die Ankündigung des Hardwarefehlers mit Diagnose auf Dienstag.
Ich habe Blut und Wasser geschwitzt :rolleyes:
Wo steht eigentlich der/die CO-Server?
Danke dass es wieder geht!... der Verlust einiger Daten ist zwar schade, aber ich habe schon befürchtet, dass ALLES weg ist.
LG Klaus
laborleiter
01.02.2011, 00:23
Wo steht eigentlich der/die CO-Server?
das kannst du via traceroute herausfinden ;)
nobody
01.02.2011, 00:29
Hm Düsseldorf oder Amsterdam...
Schätze also auf Düsseldorf.
LG Klaus
magician4
01.02.2011, 04:33
Danke fuer die viele arbeit dir ihr hier reinsteckt!
gruss
ingo
CO-Mertens
01.02.2011, 08:38
Hm Düsseldorf oder Amsterdam...
Schätze also auf Düsseldorf.
LG Klaus
und ich dachte immer Karlsruhe ;)
nobody
01.02.2011, 08:46
tracert lieferte mir nur 3 Städtenamen.. Frankfurt, Amsterdam und Düsseldorf.
Aber solang der Chef es weiss, ists gut :D
Nicht dass die Server von jemand anderm repariert wurden und hier die Meinzel(Mainzel?)männchen am Werk waren :D:D
LG und danke nochmal!
freechemist
01.02.2011, 16:28
Zitat CO-Mertens: Auf diesen Server haben wir nun ein Backup installiert, welches wir am 21.12.2010 extern gespeichert haben.Zum Glück wurde das Richtige, nämlich das Speichern externer Backups, in der Vergangenheit nicht unterlassen. Nach meinen bescheidenen EDV-Erfahrungen ist diese Strategie ausbaufähig, indem externe, zeitlich begrenzte Teil-Backups in kürzeren zeitlichen Abständen gespeichert und laufend mit den aktuellen Daten im gegebenen Zeitraum synchronisiert werden.
Zitat CO-Mertens: Für das Forum bedeutet dies, dass alle Beiträge, Themen, Anmeldungen, Abmeldungen, Private Nachrichten usw. die nach dem 21.12.2010 geschrieben worden sind, nicht mehr existieren.Das ist natürlich schade, sind doch gerade diese wegen ihrer Aktualität für den Grossteil der Forumuser am wichtigsten.
Gruss, freechemist
jag
01.02.2011, 18:32
Verwirrend empfinde ich, dass CO seit dem Neustart der Zeit um 3 Minuten voraus ist.
Gruß
jag
magician4
01.02.2011, 20:06
der server liegt in der zukunft: bei problemen in der realzeit hat man dann drei minuten, um den datenbestand sicherheitshalber abzukoppeln :D
gruss
ingo
nobody
02.02.2011, 00:00
Nach meinen bescheidenen EDV-Erfahrungen ist diese Strategie ausbaufähig, indem externe, zeitlich begrenzte Teil-Backups in kürzeren zeitlichen Abständen gespeichert und laufend mit den aktuellen Daten im gegebenen Zeitraum synchronisiert werden.
Das wäre natülich perfekt (Von mir sind 305 Beiträge flöten gegangen).
In einem Elektronikforum, wo ich früher unterwegs war, wurde täglich um 4 Uhr früh statt des Forums eine Meldung angezeigt, dass die Seite eben ca. 10min nicht erreichbar ist wegen Backup.
10min täglich... bei annähernd gleichem Neudaten-Aufkommen wie bei CO.
Also sicher nur Backup der neu angefallenen Daten.
LG Klaus
teefix
02.02.2011, 22:31
Die Lösung für solche Probleme lautet RAID 5!
LG
Bitti
03.02.2011, 01:12
Genau... :rolleyes:
ich zitiere mal Wikipedia:
Bei RAID 5 ist die Datenintegrität des Arrays beim Ausfall von maximal einer Platte gewährleistet.
Ausgefallen sind aber gleich zwei Festplatten.
Was wirklich "Besserungen" bzw. mehr schutz bieten würde, wäre Raid 6 bzw Raid (n,m) mit m>1 und n>m
Außerdem wohl häufigere externe Backups, bei denen ja nur Änderungen gespeichert werden müssten.
Aber dafür gibt es ja unsere Admins, die sicher mehr Ahnung haben als wir...
Nochmal danke, dass CO so schnell wieder online war.
Gruß,
Daniel
LordVader
11.02.2011, 00:42
Entschuldigt bitte, dass ich jetzt erst dazu komme, nachzutreten :rolleyes:, aber das Ausmaß des Schadens bei einem so geschäftigen Forum wundert mich dann doch.
Zuerst einmal weiß ich den Aufwand der Sicherung, der Wiederherstellung und den entstandenen Schaden einzuschätzen und möchte die Admins nicht beklugscheißern. Aber wie sagt unser Admin immer so schön: "ein RAID ersetzt kein Backup"...
Aufgrund einiger alter Beiträge
Wir machen seit ein paar Wochen 2x am Tag ein Backup.
aber durch die häufigen Backups, dürften dies dann nur eine handvoll Themen und Beiträge sein. Die Backups liegen für den Fall eines Festplattenschadens natürlich nicht auf dem gleichen Server.
bin ich eigentlich davon ausgegangen, dass die Backups auf jeden Fall (zumindest zusätzlich) extern gespeichert würden. Ich dachte da an einen zweiten Server bei einem Hoster bzw. noch eher daran, dass die Daten täglich per mittlerweile recht fixem DSL auf Backuprechner bei den Admins gezogen würden (was zumindest bei den inkrementellen Backups und einer (1)6000er Leitung schnell erledigt sein dürfte). Aufgrund dieser Aussage
Auf diesen Server haben wir nun ein Backup installiert, welches wir am 21.12.2010 extern gespeichert haben.
muss ich allerdings davon ausgehen, dass sich die damals beschriebene Sicherungsstrategie leider zugunsten einer auf nur einer Hardwareplattform lokalisierten verschoben hat.
Was die Integrität der Sicherung angeht, scheint es auch hier noch Raum für Verbesserungen zu geben. Es müßte doch die Möglichkeit bestehen, die gesicherten Daten zu verifzieren, was die fehlerhaften Archive aufgedeckt hätte. Andernfalls würde ich zu einem anderen Programm wechseln bzw. eines anschaffen, sofern dies bisher über das Forensystem gehandhabt wurde. Ich denke, dass es hierfür auch bestimmt ausgereifte freie Software gibt (selbst wenn der Server nicht unter einem Unix-Derivat laufen sollte).
Tiefflieger
11.02.2011, 07:52
Verwirrend empfinde ich, dass CO seit dem Neustart der Zeit um 3 Minuten voraus ist.
Das ist Absicht, irgendwie muss die ausgefallene Zeit ja wieder eingeholt werden.
...(Von mir sind 305 Beiträge flöten gegangen)...Oh, da wird genaue Buchführung betrieben.
Entschuldigt bitte, dass ich jetzt erst dazu komme, nachzutreten :rolleyes:, aber das Ausmaß des Schadens bei einem so geschäftigen Forum wundert mich dann doch....
Das war doch nur ein Testlauf für den digitalen Radiergummi. Hier auf CO auch ohne monatliche Gebühren für den Nutzer. Wie man sieht, konnte recht viel rekonstruiert werden, es besteht also noch einiges an Optimierungsaufwand.
nobody
11.02.2011, 08:38
Zitat: Zitat von Lutetium ...(Von mir sind 305 Beiträge flöten gegangen)...
Oh, da wird genaue Buchführung betrieben.
Nicht ganz, aber ich schaue jeden Tag nach, wo ich mal wieder überall meinen Senf dazu gegeben habe. In dem Moment wo ich diesen Satz schreibe, wüsste ich die Anzahl meiner Beiträge nicht ;)
Die Tatsache, dass hier keine "Ränge" bei bestimmter Punktzahl vergeben werden, verhindert ja gsd das egal-was-eingekritzel, nur um höher zu kommen.
LG Klaus
LordVader
11.02.2011, 18:09
Das war doch nur ein Testlauf für den digitalen Radiergummi.Also doch nur der plumpe Versuch, die großangelegte Zensur zu verschleiern... :eek: