Archiv mit Zukunft
Sind Webseiten historisch relevant? Ja, sagt das Stadt- und Stiftsarchiv Aschaffenburgs.
Das Internet vergisst nichts. Oder doch? Die digitale Webseiten-Archivierung ist ein völlig neues Feld im Archivwesen. Das Aschaffenburger Stadt- und Stiftsarchiv hat Pionierarbeit geleistet und ist damit international auf Interesse gestoßen. Johannes Schuck ist dort der Mann für die digitale Erhaltung digitaler Daten. Als einer der wenigen Archivare für Informationsmanagement in Deutschland kümmert sich der 36-Jährige um die Speicherung von Twitter, Facebook, Instagram und bald 42 Webauftritten der Stadt Aschaffenburg im digitalen Websitenarchiv. Im November ging das Archiv live. Ein Gespräch über die Suche nach dem besten Start Up, rechtliche Grauzonen und persönliche Lehren aus der Vorreiterrolle.
Foto: privat
Warum ist die Archivierung von Websiten von historischem Wert?
Da muss man ein wenig in die Geschichte zurückgehen. Das Internet wurde 1969 erfunden, immer mehr Informationen wurden mit der Zeit ausgetauscht. Anfang der 1990er Jahre hat man geschafft, mehr Daten und Dateien zu speichern und auf diese über Webadressen zuzugreifen. Damit war der Siegeszug des Internets nicht mehr aufzuhalten, und zunehmend mehr Privatleute nutzten das Internet. So hat in den vergangenen 30 Jahren eine schnelllebige Entwicklung und neue Art der Kommunikation stattgefunden, bei der in Echtzeit Informationen, Content und Dateien ausgetauscht werden können.
Mit dem Internet bespielt die Stadt Aschaffenburg einen für ihre Verhältnisse immer noch vergleichsweise neuen Kanal zur Information der Stadtbevölkerung. Wir als Archiv sagen, dass dort Informationen veröffentlicht werden, die es nur dort gibt, und dass diese Informationen damit derart historisch relevant sind, dass wir als Stadt- und Stiftsarchiv unserem Auftrag, die Stadtgeschichte zu archivieren, auch im Internet nachkommen müssen.
Seit 2019 haben wir überlegt, wie man dieses Projekt umsetzen könnte, seit kurzem ist es online einsehbar.
Welche Informationen sind von so großem Wert, dass man sie sichern muss?
Es gibt aus archivischer Sicht mehrere Ansätze. Man könnte sagen: Allein schon das Medium ist archivierungswürdig. Aus meiner Sicht ist es allein schon wichtig zu dokumentieren, auf welchem Kanal in welcher Form und zu welchem Zeitpunkt die Stadt Aschaffenburg mit ihren Bürgerinnen und Bürgern kommuniziert hat. Hier war uns wichtig zu zeigen, ab wann es die erste Webpräsenz gab, welche Vielzahl an Webseiten heute eine Stadt hat. Heute bewegen sich zudem immer mehr Bürger auf Facebook, Twitter und Instagram, und damit auch die Stadt Aschaffenburg, weil sie ihre Bürger dort erreichen will.
Es ist natürlich ein schmaler Grat zu sagen, was historisch relevant an Inhalt ist. Das wäre der zweite Punkt. Inhalte im Netz stellen eine Datenflut dar, die mittlerweile schwer zu beherrschen ist.
Wir mussten uns davon lösen, eine tägliche Archivierung vorzunehmen. Diese ist mit Kosten verbunden, und mit der Archivierung generieren ja wieder wir neue Daten. Wenn man davon ausgeht, dass sich der Inhalt einer Webseite etwa alle 75 Tage grundlegend ändert, müsste man theoretisch in diesem Turnus archivieren. Das können wir allein schon finanziell gar nicht leisten.
Deshalb haben wir uns dafür entschieden, Webseiten zwei bis vier Mal im Jahr zu spiegeln. Befindet sich zwischen diesen Stichtagen ein archivierungswürdiger Inhalt, den man nicht verlieren möchte, könnten wir jederzeit eine zusätzliche Archivierung vornehmen. Die Social Media-Kanäle werden hingegen in Gänze archiviert.
Grundsätzlich wäre die Archivierung auch täglich möglich. Das ist aber nicht nötig, weil sich die Informationen auf einer kommunalen Homepage in der Regel nicht derart schnell ändern, dass eine tägliche Archivierung notwendig wäre. Uns war es wichtiger zu zeigen, wie der Internetauftritt der Stadt in einem bestimmten Rhythmus aussah, wie die Struktur war.
Man könnte ja sagen, wir ziehen einfach Screenshots und haben das damit dokumentiert. Sie haben sich aber für einen anderen Weg entschieden.
Wir haben eine Digitalstrategie entwickelt und uns überlegt, wie wir uns die Webseitenarchivierung vorstellen – wie wollen wir die archivierten Webseiten für Nutzer veröffentlichen, wollen wir das überhaupt, soll die Webseite interaktiv sein oder reichen uns Screenshots? Von letzterem sind wir relativ zügig abgerückt, weil wir das technische Erlebnis im Archivwesen darstellen wollten, also zeigen wollten, wie die Webseite tatsächlich online aussah. Dann war uns wichtig, dass sie bis zu jedweder Subseite archiviert wird, ebenso Bilder und verlinkte Filme. Und: eine rechtsichere digitale Signatur, Langzeitarchivierung, ein schneller Zugriff auf die archivierten Daten.
Woran merkt der Nutzer, dass er sich in einem online-Archiv befindet?
Erstmal gar nicht. Es gibt einen Reiter am oberen Rand der archivierten Webseite, der darauf hinweist. Und er merkt es natürlich durch den Inhalt. Das ist genau das, was wir erreichen wollten.
Es war nicht ganz einfach, eine Firma zu finden, die das technisch umsetzen kann, richtig?
Das war die größte Herausforderung. Wir hatten unseren internen Anforderungskatalog. Wir haben zunächst geschaut, wie das größere kommunale Archive lösen. Wir sind zügig auf nichts gestoßen. Entweder wurde das Thema noch nicht als historische Quelle angesehen oder der Aufwand wurde als zu hoch eingeschätzt für das, was man zurückbekommt. Denn natürlich haben auch Wissenschaftler und Historiker diese Informationen als Quelle noch nicht auf dem Schirm.
Wir sind dann zunächst an die Software-Abteilung der Stadt Aschaffenburg herangetreten, die aber abgewiegelt hat. Auch Landes- und Bundesarchive hatten keine Lösung, die wir gerne übernommen hätten.
Deshalb haben wir europaweit Firmen kontaktiert, weil es auch in Deutschland nur ein oder zwei Firmen gibt, die technisch überhaupt die Möglichkeit haben, Webseiten zu archivieren. So sind wir letztlich bei der englischen Firma Mirrorweb in Manchester gelandet. Diese baut uns ein Tool, das die Webseite so archiviert, wie wir das wollen. Als wir mit Mirrorweb gestartet sind, war die Firma noch ein kleines Start Up, das ein Pilotprojekt am British National Museum hatte. Wir wurden dann das deutsche Pilotprojekt und haben gemeinsam mit der Firma die Software weiterentwickelt.
Es war ein langer Weg, auch ein steiniger, es hätte auch schiefgehen können, da muss ich ehrlich sein. Wir haben aber einen guten Partner gefunden.
Das klingt, als hätten Sie gegenseitig den Jackpot gezogen.
Ja, also ich glaube, es ist für beide eine Win-Win-Situation.
Warum haben Historiker diese Quellen noch nicht auf dem Schirm?
Es gibt Professoren, die sich mit dieser Thematik auseinandersetzen. Aber da es kaum Archivmaterial gibt, gibt es aktuell noch nicht die Möglichkeit dieses auch auszuwerten. Bei uns hätten Wissenschaftler überhaupt jetzt erst drei, vier Jahre, die sie auswerten können. Es fehlt einfach noch an Input seitens der Archive. Wir haben versucht durch unser Projekt einen Anfang zu machen trotz kleinerer Kinderkrankheiten und nicht noch mehrere Jahre auf vielleicht einfachere technische Lösungen zu warten, damit wir nicht zu viel an archivwürdigem Material verlieren.
Unser Projekt stößt aber national und international auf großes Interesse: Ich schreibe aktuell schon den dritten Fachartikel für bundesweit erscheinende Fachmagazine seit Veröffentlichung des Webseitenarchivs im November und habe auf internationalen Kongressen gesprochen.
Was läuft denn noch nicht so gut?
Es gibt noch kleinere technische Probleme, manchmal gibt es Probleme mit dem Zugriff und gerade von Privatunternehmen wie Facebook mussten wir erst einmal eine Genehmigung bekommen, dass wir unsere Auftritte auf Facebook, Instagram oder LinkedIn überhaupt archivieren dürfen. Diese ist jetzt erteilt, so dass wir von diesem Jahr an auch diese Kanäle mitnehmen.
Was genau wird dort mitgenommen? In den sozialen Medien wird ja auch viel kommentiert.
Wir archivieren alles, was unser Dienstherr, die Stadt Aschaffenburg postet – Posts, Videos, Fotos. Damit kommen wir unserem Sammlungsauftrag nach. Technisch wäre es möglich, auch die Kommentare mitzunehmen. Rechtlich bewegen wir uns hier aber in einer Grauzone, sowohl vom Archivrecht, als auch dem Persönlichkeitsrecht her. Häufig ist ja die Identität vieler Nutzer nicht klar. Es gibt aktuell keine Rechtsprechung, dass ein Kommentar ohnehin öffentlich ist und damit archiviert werden darf. Diese wollen wir erst einmal abwarten. Technisch wäre es möglich, Kommentare im Backend zu speichern, sie aber dem Archivnutzer nicht zugänglich zu machen.
Es ist technisch nur möglich – oder machen Sie es auch?
Wir haben es für dieses Jahr für Instagram und Facebook ins Auge gefasst. Es ist aber noch nicht entschieden.
Die Bildrechte sind ein ähnliches Thema. Auch hier müssen wir auf der sicheren Seite sein, dass wir berechtigt sind, diese zu archivieren.
Wie kann der Nutzer denn das Archiv nun einsehen?
Die Veröffentlichungsstrategie war uns sehr wichtig. Manche Archive halten ihre Datensätze komplett unter Verschluss. Andere machen sie vor Ort zugänglich. Oder – und diesen Weg sind wir gegangen – man geht eine völlige Open Source-Politik. Wir haben einen digitalen Zugang geschaffen, über den jeder zu jeder Zeit von überall her auf das Archiv zugreifen. Völlig losgelöst vom klassischen Archiv. Wir haben keine Kontrolle darüber, wer wie häufig darauf zugreift. Wir sehen lediglich die Klickzahlen, wissen aber nicht, was der Nutzer sich angeschaut und was er mit dem Inhalt gemacht hat. Das ist für ein Archiv kein üblicher Weg, denn es findet keine Betreuung des Nutzers statt.
Als würde man ein Buch kaufen.
Ja, das ist im Grunde so. Wir haben es außerdem so bauen lassen, dass man die archivierten Seiten per Schlagwortesuche durchsuchen kann. Sie können also sehr gezielt nach Themen suchen und sich so sehr gezielt informieren. Das macht unser Angebot für Nutzer einfach zu handhaben und interessant.
Das klingt alles sehr aufwendig und teuer.
Das ist in der Tat so. Der Stadtrat der Stadt Aschaffenburg hat die Finanzierung aber langfristig gesichert. Das erste Jahr war das teuerste, denn in diesem Jahr hat Mirrorweb das Backend gebaut, in dem wir Archivare uns nun bewegen. Je häufiger man archiviert, desto teurer wird es. Eine Archivierung kostet einen festen Betrag, dazu kommen Storage-Kosten für den Speicherplatz. Diese Kosten wachsen natürlich exponentiell, je mehr online-Inhalte archiviert werden.
Über welche Summen reden wir denn?
Bei einer kleinen Webseite reden wir über einmalige Kosten von 400 bis 500 Euro brutto. Bei größeren landet man schnell bei bis zu 15.000 Euro pro Jahr. Pro Webseite.
Was haben Sie denn persönlich aus dem Projekt gelernt?
Ich habe gelernt, dass man sich neuen Themen öffnen muss und sich das Berufsbild eines Archivars ändert. Ich besetze eine ganz neue Stelle, den Archivar für Informationsmanagement. Ich habe den Bleistift gegen den Laptop getauscht und verwalte nur noch digitale Bestände.
Wir haben uns damit auseinandergesetzt, obwohl es keine Erfahrungswerte gab. Dass wir uns nicht davon nicht haben abschrecken lassen, dass wir Überzeugungsarbeit leisten konnten für die Finanzierung, das lerne ich daraus. Dass man nicht zu früh aufgibt.