„eScience is about global collaboration in key areas of science and the next generation of infrastructure that will enable it“ (John Taylor, Director General of the Research Councils
Office of Science and Technology, UK)


D-SPIN ist der deutsche Beitrag zum europäischen CLARIN-Projekt  (Common Language Resources and Technology Infrastructure). Antragsteller des Projekts sind Ludwig Eichinger (IDS-Mannheim), Erhard Hinrichs (Universität Tübingen), Wolfgang Klein (BBAW) und Peter Wittenburg (MPI Nijmegen). Weitere Projektpartner sind das DFKI in Saarbrücken sowie die Universitäten Frankfurt, Gießen, Leipzig und Stuttgart. Das Projekt wird von der Universität Tübingen koordiniert.


Das Projekt hat zum Ziel, auf nationaler Ebene eine Sprachressourcen-Infrastruktur als Beitrag für den geisteswissenschaftlichen Arbeitsplatz der Zukunft zu schaffen. Unter Sprachressourcen verstehen wir sowohl statische Daten wie z.B. Texte, Wörterbücher und andere Nachschlagewerke als auch sprachtechnologische Werkzeuge für die Erstellung, Verarbeitung und Analyse statischer Daten. Sprachressourcen und Werkzeuge sind an vielen Orten in Deutschland verfügbar, sie sind aber zum Teil nur schwer zugänglich. Ziel von D-SPIN und CLARIN ist es, diese Ressourcen über ein Portal und webbasierte Services verfügbar zu machen. Um dies zu erreichen, müssen die rechtlichen, technischen und organisatorischen Voraussetzungen geschaffen werden. Dies soll in D-SPIN auf nationaler Ebene erreicht werden.


Die angebotenen Daten und Dienste werden durch starke und vernetzte Datenzentren vermittelt. Die BBAW wird eines dieser Datenzentren sein. So wird es in Zukunft auch für die verschiedenen Projekte und Vorhaben an der BBAW möglich sein, in Deutschland und Europa nach Ressourcen zu suchen und auf diese zuzugreifen, wenn dies nach Rechtelage möglich ist.


Rechtlicher Aspekt
Rechtliche und ethische Aspekte der Benutzung von Sprachressourcen werden untersucht und Lösungen erarbeitet, die den Zugang auf und den Umgang mit Sprachressourcen für den Endnutzer vereinfachen. Es werden verschiedene Lizenzmodelle geprüft und den Ressourcen- und Werkzeuganbietern vorgeschlagen. Auf europäischer Ebene wurde der rechtliche Rahmen für eine Föderation von serviceanbietenden Zentren geschaffen.


Technischer Aspekt

Im Rahmen der ersten Projektphase sollen die Infrastruktur und die darin zu integrierenden Dienste spezifiziert und prototypisch umgesetzt werden. Bestehende Normen und Referenzmodelle werden dabei berücksichtigt.


Ressourcenaspekt

In der ersten Projektphase sollen so viele Ressourceninhaber wie möglich in den Prozess der Infrastrukturentwicklung einbezogen werden, damit auf nationaler Ebene eine möglichst gute Abdeckung der verschiedenen Ressourcentypen erreicht werden kann.


Benutzeraspekt

Die Bedürfnisse und Anforderungen empirisch arbeitender Geistes- und Sozialwissenschaftler sollen ermittelt werden, damit das Angebot auf sie zugeschnitten werden kann. Nachwuchsforscher sollen durch ein entsprechendes Angebot in der universitären Lehre und durch Beratung frühzeitig mit den Möglichkeiten einer Sprachressourceninfrastruktur vertraut gemacht werden.


Das Projekt gliedert sich in die folgenden Arbeitspakete, die die genannten Aspekte abdecken:

  • AP1: Management
  • AP2: Technische Infrastruktur
  • AP 3: Ressourcen- und Anwendungsplanung im Hinblick auf geisteswissenschaftliche Anwender
  • AP4: Verbindung mit nationalen und europäischen Initiativen
  • AP5: Anpassung und Integration der Ressourcen und Tools
  • AP6: Training und Ausbildung
  • AP7: Urheberrecht und ethische Fragen der Verwendung von Sprachressourcen, Lizenzmodelle

 

Die BBAW ist an den Arbeitspaketen 1,2,3,5 und 7 beteiligt und leitet das Arbeitspaket 3. Sie ist Mitglied einer ersten Föderation von Servicezentren, an der außerdem das MPI in Nijmegen, das Institut für Deutsche Sprache in Mannheim und das CSC in Helsinki beteiligt sind. Die BBAW bringt Ressourcen des „Zentrums Sprache” in den Verbund ein und entwickelt im Rahmen des Projektes existierende sprachtechnologische Werkzeuge zu Webservices weiter. Diese werden in eine von den Universitäten Tübingen, Stuttgart und Leipzig entwickelte Oberfläche eingebunden. Die BBAW beteiligt sich über D-SPIN an nationalen und internationalen Initiativen zur Normierung von Sprachdaten und Metadaten (ISO und DIN, TEI).

Weiterführende Informationen

www.clarin.eu  
www.tc37sc4.org 
 

Kontakt
PD Dr. Alexander Geyken
Arbeitsstellenleiter
Digitales Wörterbuch der deutschen Sprache
Tel.: +49 (0)30 20370 390
geyken(at)bbaw.de 
Jägerstraße 22/23
10117 Berlin
© 2020 Berlin-Brandenburgische Akademie der Wissenschaften