Das NFDI-Konsortium Text+ verfolgt den Aufbau einer auf Text- und Sprachdaten ausgerichteten Forschungsdaten­infrastruktur für die Geisteswissenschaften und für weitere sprach- und textbezogene Forschungsdisziplinen, speziell für Sprachwissenschaften, Literaturwissenschaften, Philosophie, Klassische Philologie, Anthropologie, außer­europäische Kulturen und Sprachen sowie sprach- und textbasierte Forschung der Sozial-, Wirtschafts-, Politik-, und Geschichtswissenschaften. Durch qualitativ hochwertige und breit genutzte Infrastruktur­angebote sollen Wissenschaft und Forschung langfristig unterstützt werden.

 

Dem Verbund Text+ gehören 34 Partner aus Hochschulen, außeruniversitären Forschungseinrichtungen, Wissenschaftlichen Bibliotheken und Datenzentren der Digital Humanities an. Die Förderung erfolgt für die Dauer von fünf Jahren durch die Deutsche Forschungsgemeinschaft im Rahmen der Bund-Länder-Förderung der Nationalen Forschungsdateninfrastruktur.

 

Text+ gliedert sich in die Datendomänen „Sprach- und textbasierte Sammlungen“, „Lexikalische Ressourcen“ und „Editionen“ sowie den Bereich „Infrastruktur / Betrieb“. Als Mitantragsteller von Text+ ist der Präsident der BBAW Teil des Institutional Boards. Die BBAW koordiniert die Datendomäne „Lexikalische Ressourcen“ und stellt den Co-Sprecher. Darüber hinaus ist sie mit dem Zentrum Sprache an der Datendomäne „Sprach- und textbasierte Sammlungen“ sowie mit TELOTA – IT/DH an „Editionen“ beteiligt.

Sprach- und textbasierte Sammlungen

Digitale Sammlungen enthalten Daten, deren Auswertung im Zentrum sprach- und textorientierter geisteswissen­schaftlicher Forschungsdisziplinen steht. Die BBAW hat mit der Korpusanalyseplattform Deutsches Textarchiv (DTA) bereits seit rund 15 Jahren Erfahrungen im Bereich der besonders herausfordernden Erhebung, Aufbereitung und Analyse historischer Forschungsdaten. Das DTA stellt eine disziplinen- und gattungsübergreifende Sammlung deutschsprachiger Texte des 16. bis frühen 20. Jahrhunderts bereit, welcher in ihrem Umfang und ihrer Zusammen­setzung eine herausragende Bedeutung für die Erforschung des historischen Neuhochdeutschen, seiner Entwicklung und der im dokumentierten Zeitraum relevanten Genres und Sachbereiche beigemessen werden kann. Zudem wurde das DTA in ganz verschiedenen Kontexten kontinuierlich um weitere Ressourcen erweitert.
In Text+ werden nun regelmäßige Korpuskurationen hinzukommen, welche die Datengrundlage des DTA für die Erforschung der neuhochdeutschen Sprachstufe weiter wesentlich bereichern. Für alle im Basisformat des DTA (DTABf) kodierten Texte, Sammlungen und Korpora gilt, dass auf Basis der Metadaten und des Datenformats eine Vergleich­barkeit hinsichtlich der Transkription und Annotation ermöglicht wird. Thematisch ist die Text+-Datendomäne Digitale Sammlungen in drei Clustern organisiert: Zeitgenössische Sprache, Historische Texte und Unstrukturierte Texte.
Mit dem DTA bringt die BBAW im Cluster Historische Texte ihre langjährige Expertise im Bereich der nachhaltigen Bereitstellung und Analyse von standardisierten Forschungsdaten ein.

Übersicht der digitalen (Text-)Sammlungen der BBAW:
https://www.bbaw.de/bbaw-digital/digital-humanities/digitale-sammlungen

Lexikalische Ressourcen

An der BBAW und insbesondere beim Zentrum Sprache sind seit Langem verschiedene Wörterbuchprojekte beheimatet, unter anderem das »Digitale Wörterbuch der deutschen Sprache« und das »Zentrum digitale Lexikographie«. Die Expertise des Zentrums Sprache umfasst sowohl die Digitalisierung, Kuration und Erschließung von ursprünglich nur gedruckt vorliegenden Wörterbüchern als auch die Erstellung moderner gegenwartssprachlicher lexikalischer Ressourcen sowie den Betrieb des Wortinformationssystems www.dwds.de .
Das Zentrum Sprache der BBAW ist Gesamtkoordinator der Task Area Lexikalische Ressourcen. In diesem Rahmen wird sich das Hauptaugenmerk darauf richten, BBAW-eigene lexikalische Ressourcen mit Ressourcen weiterer beteiligter Partnerinstitutionen in einer gemeinsamen Umgebung für die wissenschaftliche Öffentlichkeit nutzbar zu machen. Dazu werden Verfahren entwickelt, lexikalische Daten interoperabel aufeinander abzubilden, sie übergreifend abzufragen und durch vielfältige Verknüpfungen umfassend zu erschließen. Die Domäne der lexikalischen Ressourcen ist in drei thematische Cluster gegliedert: Deutschsprachige Wörterbücher im europäischen Kontext, Digitale Wörterbuch­ressourcen und Wörterbücher in nicht-lateinischer Schrift. Dadurch wird ein weitestmögliches Spektrum an lexikalischen Daten abgedeckt, die entsprechend für eine Vielzahl wissenschaftlicher Fragestellungen genutzt werden können.

Übersicht der digitalen Wörterbücher der BBAW:
https://www.bbaw.de/bbaw-digital/digital-humanities/digitale-woerterbuecher

Editionen

Editionen als erschließende Wiedergabe historischer Dokumente sind seit jeher zentral für die geisteswissenschaftliche (Grundlagen-)Forschung und digitale Editionen ein wichtiger Baustein der digitalen Geisteswissenschaften. Die BBAW begleitet den digitalen Wandel in der Editorik bereits seit rund 20 Jahren. Die Digital Humanities-Abteilung TELOTA – IT/DH kooperiert mit den Vorhaben der BBAW in allen Schritten im ‚digital lifecycle‘ einer Edition: Konzeption, Entwicklung, Publikation und Langzeitverfügbarkeit und -archivierung. Ein Schwerpunkt TELOTAs liegt dabei auf der Entwicklung von nutzerfreundlicher und standardbasierter Forschungssoftware. In der Text+-Datendomäne „Editionen“ bringt die BBAW mit TELOTA langjährige praktische und methodische Expertise ein und beteiligt sich u.a. an Aktivitäten in den Bereichen Qualitätssicherung, Standardisierung, Forschungssoftware und Community.

Übersicht der digitalen Editionen der BBAW:
https://www.bbaw.de/bbaw-digital/digital-humanities/digitale-editionen

Kontakt Sammlungen
Marius Hug
Wissenschaftlicher Mitarbeiter
NFDI-Konsortium Text+
Tel.: +49 (0)30 20370 363
marius.hug@bbaw.de 
Jägerstraße 22/23
10117 Berlin
Kontakt Lexikalische Ressourcen
Axel Herold
Wissenschaftl. Mitarbeiter
Aufbau des Zentrums für digitale Lexikographie der deutschen Sprache
Tel.: +49 (0)30 20370 249
herold@bbaw.de 
Jägerstraße 22/23
10117 Berlin
Kontakt Editionen
Dr. Frederike Neuber-Martucci
Wissenschaftl. Mitarbeiterin
TELOTA - Digital Humanities
Tel.: +49 (0)30 20370 395
frederike.neuber@bbaw.de 
Jägerstraße 22/23
10117 Berlin
© 2022 Berlin-Brandenburgische Akademie der Wissenschaften