Ein biographisches Lexikon als Speicher kulturellen Wissens und seine Transformation in eine digitale Forschungsinfrastruktur

"Digitale Bibliothek", Zukunft des digitalen Erbes?

Christine Gruber, Maximilian Kaiser, Ágoston Zénó Bernád, Katalin Lejtovicz, Matthias Schlögl

Zuletzt geändert: 2017-03-16

Abstract

Das Österreichische Biographische Lexikon (ÖBL) ist das einzige enzyklopädische Werk in Mitteleuropa, das supranational und unter Zugrundelegung einheitlicher Kriterien Lebens- und Karriereverläufe verdienter bzw. erwähnenswerter Persönlichkeiten, die zwischen 1815 und 1950 auf dem jeweiligen österreichischen Staatsgebiet gelebt und gewirkt haben, erfasst. Die über 18.000 publizierten und bereits digital verfügbaren Biographien werden im Rahmen des Forschungsprojekts „Mapping historical Networks: Building the new Austrian Prosopographical | Biographical Information System (APIS)“ in eine neue digitale Infrastruktur transformiert. Durch den Einsatz unterschiedlicher Methoden der Computerlinguistik, moderner IT-Umgebung sowie des Semantic Web wird das ÖBL maschinenlesbar, semantisch angereichert, in der Linked Open Data Cloud publiziert und an internationale Normdateien (GND, VIAF) angebunden. Der Informationsgehalt der Biographien wird somit als gespeichertes kulturelles Wissen in einer Form zugänglich, die im Kontext der Geistes-, Sozial- und Kulturwissenschaften komplexe Fragestellungen und innovative Lösungsansätze ermöglicht und unterstützt.

Der Workshop gliedert sich in zwei Sitzungen von jeweils 60 Minuten und richtet sich an alle jene Personen, die einerseits im Bereich der Digital Humanities bereits tätig sind oder den Beginn eines ähnlichen Projekts planen. Andererseits werden auch jene an der Biographik interessierte Forscherinnen und Forscher angesprochen, die die Möglichkeiten der Transformierung und Nutzbarmachung eines in traditioneller Manier erschienenen Druckwerks sowie die daraus resultierenden Potentiale via Methoden der Digital Humanities kennenlernen möchten.

Der Einführungsvortrag bietet einen kurzen Überblick über die Entwicklungsschritte der Arbeitstechniken des ÖBL von der Karteikarte zum biographischen Informationsmanagementsystem hin zum Austrian Prosopographical | Biographical Information System (APIS) mit einer kurzen Vorstellung der damit verbundenen Projektvoraussetzungen und Zielsetzungen. (Gruber)

Die darauf folgende Präsentation der APIS-Webapplikation fokussiert in erster Linie auf die Vorstellung des Datenmodells und der Funktionalitäten der Datenbank. Zunächst werden die grundsätzlichen Leitmotive hinter der Entwicklung des Online-Tools dargelegt. Mit dem forcierten hybriden Ansatz erfolgt sowohl eine Harmonisierung verschiedener schon existierender LOD-Ressourcen mit den APIS-Daten, als auch eine Zusammenführung der Ergebnisse aus (semi)automatischen Tools und manueller Forschungsarbeit in dem System. Nach einer theoretischen Einführung in das verwendete Datenmodell werden das System und ein typischer Workflow live vorgeführt. Abschließend werden die Exportfunktionen (API, Visualisierungen, Formate) gezeigt. (Schlögl)

Der zweite Teil des technischen Vortrags widmet sich den verschiedenen Ansätzen und Möglichkeiten, strukturierte Informationen aus unstrukturierten Texten zu gewinnen. So werden z. B. Natural Language Processing-Methoden vorgestellt, mit deren Hilfe Personen-, Orts- und Institutionsnamen erkannt werden (Named Entity Recognition). Dadurch bietet sich

einerseits die Möglichkeit der Verknüpfung zu Ressourcen aus der Linked Open Data-Cloud (Entity Linking), andererseits können Relationen zwischen den Entitäten automatisch erkannt und bestimmt werden (Relation Extraction). Weiters wird darauf eingegangen inwieweit computerlinguistische Verfahren genutzt bzw. welche Problemstellungen damit gelöst werden. Es wird aber auch aufgezeigt, wo die Grenzen bzw. Herausforderungen solcher Systeme liegen sowie mit welchen Fehlern und Fehler-Typen gerechnet werden muss. (Lejtovicz)

Anschließend wird an Fallbeispielen demonstriert, wie die APIS-Datenbank bzw. ihre Funktionalitäten im Bereich der biographischen Forschung angewandt werden können. Ausgehend von den Berufsgruppen wie z.B. Medizin, bildende Kunst, Unterrichtswesen und Geisteswissenschaften wird gezeigt wie aus der Fülle an Biographien ein repräsentatives Sample gebildet werden kann. An diesem Sample werden die notwendigen Arbeitsschritte von der textlichen Beschreibung, über die Annotation individueller Karrierewege, bis hin zu deren Analyse (Diagramme, Karten und Netzwerke) erklärt. (Kaiser)

Schließlich wird anhand von Pressenetzwerken des 19. Jahrhunderts eine Untersuchung präsentiert, die neben den Person–Person- und Person–Institution-Relationen in erster Linie auf die Institution–Institution-Beziehungen fokussiert, um so die gegenseitige Einflussnahme der Bereiche Medien und Politik in Wien und Budapest, den zwei großen Zentren der Doppelmonarchie, aus der Perspektive der historischen Netzwerkforschung zu beleuchten. (Bernád)

Der zweite Teil des Workshops ist interaktiv konzipiert und bietet sowohl den an technischen, als auch den an inhaltlichen Fragen interessierten Teilnehmerinnen und Teilnehmern die Möglichkeit, gemeinsam mit den Vortragenden in kleineren Gruppen mit und in der APISDatenbank, zu arbeiten. Es werden Zugänge zu einer Instanz des APIS-Systems bereitgestellt, die das Testen von verschiedenen Funktionalitäten (Suchfunktion, Annotation von Karriereverläufen, Import aus GND/GeoNames, NLP/automatische Annotation via Stanbol oder den Datenexport) ermöglichen.

Die Teilnehmer können für die gemeinsame Arbeit gerne ihre eigenen Laptops mitbringen.

Christine Gruber, Maximilian Kaiser, Ágoston Zénó Bernád, Katalin Lejtovicz, Matthias Schlögl