Analytik NEWS
Das Online-Labormagazin
13.09.2024

16.11.2006

Gefahren digitaler Langzeitarchivierung: Technik veraltet, Daten verschwinde

Teilen:


Mit der langfristigen Sicherung von elektronisch gespeicherten Daten befasst sich das Lehrgebiet Multimedia und Internetanwendungen der FernUniversität in Hagen. Denn digitale Inhalte sind gefährdet: In immer kürzeren Abständen wird eine (Speicher-)Technologie durch eine neuere abgelöst, viele Datenträger sind nicht dauerhaft haltbar. Da unwiederbringliche Dateien zunehmend digital abgespeichert oder umkopiert werden, ist ein großer Teil des Wissens der Menschheit gefährdet: wissenschaftliche Roh- und Experimentaldaten, Unterlagen von Behörden, Unternehmen, Archiven, Bibliotheken, Museen etc. Und nicht zuletzt private Dateien. Zusammen mit renommierten Partnern arbeiten die Wissenschaftler der FernUniversität in Hagen daran, für die Europäische Kommission Grundlagen für entsprechende Forschungsempfehlungen zu entwickeln.

Allen Vorteilen zum Trotz: Einige Nachteile haben die Neuen Medien gegenüber den herkömmlichen, z. B. bei der Haltbarkeit. Größtes Problem einer dauerhaften digitalen Archivierung von Inhalten dürfte sein, dass in immer kürzeren Abständen eine Technologie durch eine neuere abgelöst wird. Doch sind auch viele Datenträger nicht so lange haltbar, wie man meinen könnte. Andererseits werden unwiederbringliche Dateien - etwa wissenschaftliche Roh- und Experimentaldaten - zunehmend digital abgespeichert oder umkopiert. Ein großer Teil des Wissens der Menschheit ist gefährdet, nicht zuletzt wissenschaftliche Erkenntnisse.

Damit das digitale Wissen nicht einfach verschwindet, müssen die Daten rechtzeitig auf andere Datenträger umkopiert werden, und zwar nach allgemein gültigen Standards. Das Lehrgebiet Multimedia und Internetanwendungen an der FernUniversität in Hagen ist an verschiedenen Projekten beteiligt, die eine sichere und möglichst effiziente Sicherung elektronischer Daten zum Ziel haben. Hierfür müssen bestimmte Strukturen aufgebaut werden.

Dies kann u. a. durch das 7. Forschungs-Rahmenprogramm der Europäischen Kommission geschehen, das ab Anfang 2007 für mehrere Jahre Ziele in Forschung und Entwicklung vorgibt. Hierfür werden die Arbeiten des Projekts Digital Preservation Europe (DPE) Grundlagen liefern. Das FernUni-Lehrgebiet Multimedia und Internetanwendungen von Univ.-Prof. Dr. Matthias L. Hemmje ist hieran für den Bereich Deutschland zusammen mit der Deutschen Nationalbibliothek (DNB), der Staats- und Universitätsbibliothek Göttingen (SUB) sowie der Humbold-Universität in Berlin (HUB) federführend beteiligt.

In Bibliotheken, Archiven und Museen, in Behörden, medizinischen Einrichtungen etc. gibt es Beauftragte, die die wertvollen Dokumente umkopieren. In vielen Unternehmen aber nicht. In immer mehr Firmen wird die gesamte Eingangspost gescannt und nur noch elektronisch bearbeitet. Nun müsste regelmäßig geprüft werden, ob die Lesetechnik auf absehbare Zeit zur Verfügung steht: "Was passiert, wenn PDF-Dokumente nicht mehr geöffnet werden können?" fragt Hemmje mit Hinweis auf den Vorgänger "PostScript" Ende der 1980-iger Jahre: "Irgendwann wird der Support für jede Soft- und Hardware eingestellt, sind Dokumente wegen fehlender Kompatibilität nicht mehr zu öffnen."

Dagegen gibt es zwei Strategien. Das Projekt Digital Preservation Europe (DPE) soll Empfehlungen zu zukünftigen Forschungs- und Entwicklungsarbeiten auf dem Weg zu einheitlichen Standards erarbeiten, um z.B. in jeder Datei Meta-Informationen über die zur Erstellung und damit auch zur langfristigen Sicherung und Archivierung notwendigen Prozesse und Werkzeuge zu speichern. Gibt ein Hersteller dann z.B. bekannt, dass er den Support für ein Produkt einstellen wird, kann der gesamte Bestand z. B. einer Festplatte gescannt und die gefährdeten Dateien zielgerichtet umkopiert werden. Von der Handhabung her könnte dies so einfach sein, wie das Anwenden einer Suchfunktion im Windows-Explorer. Noch einfacher ginge es mit einer Funktion wie dem automatischen Windows-Update: Über das Internet werden Rechner nach den entsprechenden Dateiformaten untersucht und die gefundenen Dokumente (halb-)automatisch umkopiert.

Beim DPE-Projekt hat das Lehrgebiet die Koordination von Beiträgen zu Forschungsempfehlungen auf Europa-Ebene übernommen, um Bibliotheken, Archive und Museen ("Gedächtnis-Institutionen") zu verknüpfen. Ziel ist es, sich gemeinsam auf Standards und Methoden zu einigen, um Datenverluste effektiv zu vermeiden. Die Ergebnisse sollen ins 7. Rahmenprogramm der Europäischen Kommission ab 2007 einfließen, die Forschungsempfehlungen können ihre Projektförderungen in den folgenden 3 bis 5 Jahren maßgeblich beeinflussen. Die "Roadmaps" (Themenvorschläge) bereitet das DPE-Projekt vor. Hierfür muss das gesamte Hintergrundmaterial zu den Forschungen bzgl. Digitaler Langzeit-Archivierung der letzten drei Jahre aufgearbeitet werden.

In Deutschland wird dieser Themenkatalog über das NESTOR-Netzwerk mit Experten aus den Gedächtnisinstitutionen wie aus der Informatik überprüft und weiterentwickelt. Die Ergebnisse werden im November auf europäischer Ebene zusammengeführt. Nationale Organisatoren sind Prof. Hemmje und sein Team, wiederum in Zusammenarbeit mit den Kollegen an der DNB, der SUB und der HUB. Bei NESTOR II - in dem das FernUni-Lehrgebiet von Prof. Hemmje als Partner und das FernUni-Lehrgebiet Rechnerarchitektur von Prof. Dr. Wolfram Schiffmann als Unterauftragnehmer mitwirken - dreht sich alles um aktuelle und zukünftige Forschungs- und Entwicklungsthemen bei der Digitalen Langzeitarchivierung (LZA).

Bei der Erstellung einer LZA-Strategie erhebt sich allerdings mindestens die Frage, ob wirklich alle Informationen kopiert werden. Konvertiert man z. B. Schallplatten-Musik zu MP3-Dateien, geht ein großer Teil der Informationen verloren (auch wenn man dies nicht unbedingt hört). Keinen Verlust gibt es, wenn man eine andere Strategie verfolgt und die notwendigen Werkzeuge zum Auslesen von Informationen auf Dauer aufbewahrt.

Quelle: idw / FernUniversität Hagen