Das Internet vergisst nichts! Von wegen, die durchschnittliche Lebensdauer einer Webseite beträgt laut Internet Archive nur 77 Tage [1] Die Flüchtigkeit digitaler Informationen bereitet vor allem den Archiven Kopfzerbrechen, die zunehmend mit Hilfe dynamischer Webanwendungen publizieren. Stadt-, Regional- und Kommunalarchive sind nach den Archivgesetzen der Länder verpflichtet ihre Daten zu speichern, aber auch Instituts- oder Unternehmensarchive möchten solche Inhalte aufbewahren. Es reicht längst nicht mehr aus, einfache Backups der Internetpräsenz auf zukunftssicheren Medien zu speichern – in nur 20 Jahren dürfte selbst ein geschickter Admin ein heute zeitgemäßes Contentmanagement-System kaum installieren können.
Viele Archive behelfen sich, indem sie einzelne relevante Seiten in Handarbeit als PDF-Dateien sichern [2] Ein solches Vorgehen kann jedoch nicht mehr als eine Notlösung sein. Abhilfe versprechen auf Langzeitarchivierung spezialisierte Tools. Neben sehr teuren kommerziellen Lösungen werben auch einige Open-Source-Vertreter um die Gunst der Archivare. Httrack [3], die Netarchive Suite [4] und das Web Curator Tool [5] zeigen in dieser Bitparade unter Ubuntu 12.10 und auf einem Cloud-Linux (Amazon, basierend auf RHEL 5), wie sie digitale Informationen aufbewahren.
Seite 46
mit Heike Jurzik