"Digitale Bibliothek", Zukunft des digitalen Erbes?

Schriftgröße: 
Die Dark Ages des World Wide Web verhindern - Anforderungen an gelingende Webarchivierung
Jens Crueger

Zuletzt geändert: 2017-03-16

Abstract


Wenn wir uns Gedanken über die Anforderungen an einen modernen und zukunftsfähigen Online-Wissensspeicher machen, dann müssen in einem solchen Speicher zwingend auch jene Artefakte ihren Platz finden, die genuin digital im World Wide Web (WWW) entstanden sind. Bedenkt man, dass Webseiten nur eine durchschnittliche Bestandsdauer von kaum mehr als 100 Tagen haben, dass   dynamische  Webinhalte  wie  beispielsweise   Nachrichtenseiten  sogar  im   Minutentakt aktualisiert werden, so ist die Notwendigkeit der planvollen und systematischen Bewahrung jener Webinhalte eine offensichtliche Notwendigkeit. Andernfalls drohen die Dark Ages des World Wide Web weiter um sich zu greifen, wie sie für die 1990er Jahre bereits jetzt zu beklagen sind.

Daher stellt sich die Frage, wie ein solches Archivierungsvorhaben organisatorisch und technisch umgesetzt werden kann angesichts der besonderen Herausforderungen des WWW. Die enorme und stetig wachsende Datenmenge des World Wide Web bietet für die historische Erkenntnis ungeahnte  Möglichkeiten, die aber durch eine entsprechende Archivierungsstrategie gesichert werden müssen. Dies erfordert ein ganz neues Konzept der Sammlung und Erschließung, um der verfügbaren Datenmenge, ihrer Dynamik, technischen Eigenarten und der Breite an greifbaren lebensweltlichen Phänomenen gerecht zu werden. Die Eigenlogik genuin digitaler Artefakte ist in vielen  sammlungsrelevanten  Aspekten  neuartig  und  muss  sich  in  der  Sammlungsstrategie widerspiegeln.  Es  muss  deshalb  ein  Archivierungskonzept  entwickelt  werden,  das  dem  Ziel gerecht wird, das WWW in seiner ganzen thematischen Breite zu erfassen. Denn nur so kann künftigen Historikern die Möglichkeit einer möglichst ganzheitlichen und plastischen Annäherung an das heutige WWW eröffnet werden. Bereiche wie das Online-Shopping oder Social Media sind deshalb ebenso sammlungsrelevant wie Nachrichtenseiten oder die Webseiten von staatlichen Institutionen.  Bisher  wird  aber  leider  solchen  privaten  Lebenswelten  innerhalb  des  WWW staatlicherseits   wenig   Beachtung   geschenkt,   obwohl   das   historische   Erkenntnispotential unbestritten ist.

Eine Sammlungsstrategie, die das WWW möglichst ganzheitlich erfasst, muss daher thematisch breit angelegt sein und organisatorisch auf der Kooperation möglichst vieler Akteure gründen. Länder-  oder  Sprachgrenzen  dürfen  dabei  ebenso  wenig  eine  Rolle  spielen,  wie  die  Frage staatlicher oder privater Trägerschaft der beteiligten Archive. Ein internationales Netzwerk von Webarchiven, die methodisch nach möglichst einheitlichen Standards arbeiten, erscheint aufgrund der großen Datenmenge und der spezifischen Herausforderungen bei der Archivierung einzelner Dokumenttypen am vielversprechendsten.

Um dem Problem der Datenmenge zu begegnen, wird eine Kooperation mehrerer Webarchive indes nicht ausreichen. Wie auch schon im analogen Zeitalter bedarf es in Zeiten der genuin digitalen Quellen einer bewussten Unterscheidung zwischen „Abfall“ und „kostbarer Information“. Diese  Unterscheidung  entlang  von  Quellentypologien  digitaler  Dokumente  zu  vollziehen  ist hinsichtlich der Zukunftsfestigkeit dieser Zuschreibungen sehr gewagt. Angesichts der Dynamik von Webinhalten, dem schnellen Entstehen und Vergehen von immer neuen Dokumenttypen und der stetigen Transformation des WWW in veränderte kulturelle Kontexte und Praktiken (aktuell erlebbar etwa am Übergang vom stationären zum mobilen Web) sind Prognosen über künftiges historisches Erkenntnisinteresse heikel. Dieser Umstand und das bereits erläuterte Ziel eines möglichst ganzheitlichen Sammlungsansatzes erzwingen neue Denkweisen in der Auswahl von digitalem Archivgut. So ist beispielsweise ein randomisiertes Sammlungsverfahren bedenkenswert, das aus der Gesamtmenge der greifbaren Webdokumente einen gewissen Prozentsatz nach rein zufälligem Kriterium auswählt. Dies würde allerdings bedeuten, dass Algorithmen getrieben vom Prinzip statistischer Wahrscheinlichkeit in Zukunft über Abfall und Information richten. Ein für Archivare wie Historiker zunächst befremdlicher Denkansatz, aber vielleicht bedarf die digitale Revolution des Archivwesens ja gerade solcher Brüche im Denken und Handeln.

In meinem Vortrag werde ich die Anforderungen an gelingende Webarchivierung beschreiben und Gedanken entwickeln, wie dies technisch und organisatorisch umgesetzt werden kann, um die drohenden Dark Ages des World Wide Web zu verhindern.

PRÄSENTATION:

Die Dark Ages des World Wide Web verhindern Anforderungen an gelingende Webarchivierung. (.pdf)

 Jens Crueger