Einführung
Die Berlin-Brandenburgische Akademie der Wissenschaften (BBAW) ist die größte außeruniversitäre Forschungs­einrichtung der Region. Im Jahr 2002 wurde hier „Telota" (The Electronic Life Of The Academy), eine Initiative für akademisch angewandte Informationstechnologie, ins Leben gerufen. Diese unterstützt die Akademienvorhaben durch die Entwicklung informationstechnischer Lösungen für die Forschungs­arbeit und digitale Publikation.


Mit dem DFG-Projekt „Aufbau eines Repositoriums für biografische Daten historischer Personen des 19. Jahrhunderts“ – kurz: Personendaten-Repositorium – werden bisherige Ansätze der Daten­vernetzung und elektronischen Biografik weiterentwickelt. Es erforscht anhand von Personen­informationen des „langen 19. Jahrhunderts“ (Hobsbawm), 1789–1914, wie sich heterogene Daten­bestände miteinander verbinden und präsentieren lassen. Ziel des Projektes ist die Bereitstellung eines dezentralen Software­systems, welches Lehr- und Forschungs­einrichtungen, Archiven und Bibliotheken ermöglicht, biografische Informationen aus verschiedenen Beständen über einen gemeinsamen Zugang zu nutzen.


Das Projekt gliedert sich in drei Teile: 1) Der Entwurf eines geeigneten Datenmodells, welches unterschiedlichen Perspektiven und Forschungsmethoden gerecht wird, 2) der Datenaustausch mit Kooperations­partnern im In- und Ausland und 3) die Entwicklung einer Software-Lösung auf der Basis eines zu evaluierenden Framework. Das Projekt wurde von Telota bei der DFG beantragt und für zwei Jahre bewilligt. Im Juli 2009 wurde die Arbeit mit drei wissenschaftlichen Mitarbeitern und drei studentischen Hilfskräften aufgenommen.

Projektdarstellung
Quellendiversität offenbart Polysemie und Kontingenz

Datenmodellierung

Zur Strukturierung heterogener biografischer Daten verfolgt das Projekt einen neuartigen Ansatz, der bereits in einem Vortrag  auf dem Workshop „Personendateien – Elektronisches Publizieren“ im September 2009 in Leipzig vorgestellt wurde. Eine Person wird darin nicht als einzelner Datensatz definiert, sondern vielmehr als die Menge aller Aussagen, die zu ihr getroffen werden. Damit ist es möglich, sowohl sich ergänzende als auch sich widersprechende Aussagen nebeneinander abzubilden, was grundlegenden Problemen biografischen Arbeitens Rechnung trägt.


In dem erwähnten Vortrag von Niels-Oliver Walkowski hieß es: „Biografisches Arbeiten, verstanden als Erzeugung von identifizierenden Narrationen, vollzieht semantische Konstruktionsleistungen, zu denen ein Mensch den Anlass gab, der aber nicht mit ihm zusammenfällt. Eine Folge sind konkurrierende Narrationen, Polysemie und Kontingenz, die nicht Ausdruck mangelnder Kenntnis, sondern den Voraussetzungen biografischen Arbeitens an sich geschuldet sind." Gerade also, um verschiedenen Forschungsansätzen und Perspektiven gerecht zu werden, ist die kleinste Dateneinheit des Personendaten-Repositoriums nicht eine Person, sondern eine einzelne Aussage zu einer Person, die in dem Datenmodell „Aspekt“ genannt wird. Ein Aspekt bündelt Bezüge zu Personen, Orten, Daten und einer Quelle. Dadurch wird es möglich sein, durch eine entsprechende Abfrage weitere Narrationen zu erzeugen, bei denen nicht unbedingt eine einzelne Person, sondern auch ein Zeitraum oder ein Ort die erste Dimension bilden könnte. Daraus gewonnene Erkenntnisse erweitern wiederum das Personenwissen.

 

Zudem werden die Aspekte einerseits mit den jeweiligen Quellen, andererseits mit geläufigen Identifikations­systemen, etwa mit PND und LCCN, verknüpft. Dadurch bleibt die wissenschaftliche Transparenz und die Kompatibilität mit bestehenden und zukünftigen Systemen gewährleistet.

Projektdarstellung
Open Access Initiative

Kooperationen

Da das „Personendaten-Repositorium” die Daten über seine Partner bezieht und sich selbst auf die Organisation der Daten konzentriert, anstatt eigene Datenbestände zu erarbeiten, ist Zusammenarbeit ein essenzieller Bestandteil des Projektes. Von richtungweisender Bedeutung sind dabei die Ziele der Berlin Declaration on Open Access to Knowledge in the Sciences and Humanities , die auch von der Berlin-Brandenburgischen Akademie der Wissenschaften unterzeichnet wurde und welche den wissenschaftlichen Austausch durch digitale Technik unter Gewährleistung von Quellen- und Autorentransparenz befördert.


Zunächst wurden einige Vorhaben der Berlin-Brandenburgischen Akademie der Wissenschaften dazu eingeladen, ihre Daten auf der zukünftigen Repositorien-Plattform verfügbar und verknüpfbar zu machen. Damit liegen bereits Daten zu über 100.000 Personen vor. Parallel dazu werden externe Institutionen als Partner herangezogen. Die Kooperationsmöglichkeiten reichen von der Übernahme unstrukturierter Datenbestände bis hin zum Austausch mit anderen Repositorien. So sind bereits Kontakte mit mehreren Editionsprojekten, Bilddatenbanken und Verbund-Datenbanken geknüpft worden, die im weiteren Verlauf des Projektes zu vertiefen sind. Die Grundlage für Austausch und Veröffentlichung der Personendaten schafft im besten Falle eine Vereinbarung im Sinne des Open Access, wobei auch individuell davon abweichende Verabredungen getroffen werden können.


Da beabsichtigt ist, nicht nur die Daten, sondern auch die Infrastruktur des Personendaten-Repositoriums zur Verfügung zu stellen, ist das Projekt auch für solche Vorhaben interessant, deren historischer Rahmen das 19. Jahrhundert nicht berührt. In diesem Fall kann eine Abmachung über die Einrichtung einer gleichartigen Infrastruktur mit selbst bestimmbaren Inhalten, also eine Art „Schwester-Repositorium“, geschlossen werden.

Projektdarstellung
Der Archiv-Editor der TELOTA-Initiative

Entwicklung

Im Rahmen der Vorbereitungen für die praktische Umsetzung des Personendaten-Repositoriums wurde eine Liste etablierter Software-Pakete erstellt. Eine Evaluation zeigt, welches die Kern­komponente der Datenhaltung des PDR bildet. Da die Software auch anderen Projekten zur Verfügung steht, gehören Dokumentation, Konfigurierbarkeit, Skalierbarkeit, Erweiterbarkeit und Schnitt­stellen zu den wesentlichen Anforderungen der Evaluation.


Als bereits längerfristig genutzte Software zur Erfassung von Personendaten existiert bereits innerhalb der BBAW der von der TELOTA-Initiative entwickelte Archiv-Editor . Dieser wird im Rahmen des PDR eine zentrale Rolle als Werkzeug für die Eingabe von Personendaten spielen und wird entsprechend der veränderten Anforderungen weiterentwickelt.


Neben der Arbeit an der Repositorien- und Archivsoftware fällt auch die Konvertierung von Daten­beständen in den Entwicklungsbereich. Dabei werden sowohl manuelle als auch automatische Verfahren eingesetzt. Die Zerlegung der Biogramme in Einzelaspekte erfolgt zunächst anhand einer einfachen Syntaxanalyse, wird dann über Abkürzungs-, Orts- und Personen­verzeichnisse tiefstrukturiert und zum Abschluss manuell korrigiert.

Ausblick

Da unser Projekt in großem Maße auf Kooperationen setzt, ist es unser Wunsch, mit interessierten Projekten aus allen denkbaren Fachgebieten ins Gespräch zu kommen und Partnerschaften zu schließen. Ebenso freuen wir uns auf Fragen, Hinweise und Anregungen sowie auf den Austausch von theoretischen und technischen Lösungsansätzen.

Kontakt
Alexander Czmiel
Leitung
TELOTA - IT/DH
Tel.: +49 (0)30 20370 276
czmiel@bbaw.de 
Jägerstraße 22/23
10117 Berlin
© 2021 Berlin-Brandenburgische Akademie der Wissenschaften