Vierter DTA-Workshop. Aufbau historischer Sprachressourcen: Arbeiten mit den Angeboten des Deutschen Textarchivs

Workshop

07. Juli 2014

Akademiegebäude am Gendarmenmarkt, Einstein-Saal, Jägerstrasse 22/23, 10117 Berlin

Der Workshop wendet sich an Nutzerinnen und Nutzer des DTA ebenso wie an Interessierte, die die Angebote des DTA kennenlernen möchten. Es werden bewährte und zum Teil neu im DTA entwickelte Methoden und Hilfsmittel zum Aufbau und zur Analyse von Korpora vorgestellt und deren Anwendung im Rahmen praktischer Übungen eingeübt.

Am 7. Juli 2014 veranstaltet das DTA einen Workshop zum Thema „Aufbau historischer Sprachressourcen: Arbeiten mit den Angeboten des Deutschen Textarchivs“. Der Workshop wendet sich an Nutzerinnen und Nutzer des DTA ebenso wie an Interessierte, die die Angebote des DTA kennenlernen möchten. Es werden bewährte und zum Teil neu im DTA entwickelte Methoden und Hilfsmittel zum Aufbau und zur Analyse von Korpora vorgestellt und deren Anwendung im Rahmen praktischer Übungen eingeübt.


In zwei Themenblöcken werden die Aufbereitung von Ressourcen entsprechend den DTA-Richtlinien einerseits sowie die Arbeit mit den bestehenden DTA-Korpora andererseits näher beleuchtet.


Im Rahmen des ersten Themenblocks werden verschiedene Schritte der TEI/P5-kompatiblen Aufbereitung von Ressourcen gezeigt. Grundlage bilden dabei die im DTA-Basisformat (DTABf) zusammengefassten DTA-Richtlinien zur Transkription und zur Annotation historischer Texte. Ausgehend von verschiedenen Szenarien der Textaufbereitung (bestehende Transkriptionen aus unterschiedlichen Formaten; neue Transkriptionsvorhaben) werden Hinweise zur Zuverlässigkeit von Bildvorlagen und Transkription gegeben, Möglichkeiten der halbautomatischen Konvertierung in das DTA-Basisformat vorgeführt und anhand praktischen Übungen vermittelt; die DTABf-kompatible Textaufbereitung mithilfe des DTA-oXygen-Frameworks DTAoX wird erprobt. Darüber hinaus wird gezeigt, wie mithilfe des DTAE-Metadatenformulars ein TEI-Header mit ausführlichen Metadaten zu einem historischen Dokument erstellt werden kann. Schließlich werden Methoden der Kontrolle und Überarbeitung abgeschlossener XML-Textausgaben innerhalb der Qualitätssicherungsplattform DTAQ (Ticket-System, integrierte XML-/Text-Editoren) vorgestellt.


Der zweite Themenblock widmet sich den Inhalten der linguistischen Analyse im DTA und den Möglichkeiten der wissenschaftlichen Auswertung der DTA-Korpora. Die Teilnehmerinnen und Teilnehmer erhalten Einblicke in die Nutzung der im DTA verwendeten Suchmaschine DDC, welche die Auswertung des DTA-Gesamtkorpus sowie ausgewählter Teilkorpora in Hinblick auf bestimmte linguistische oder textstrukturelle Merkmale erlaubt. Über die im DTA verfügbaren Möglichkeiten der Visualisierung linguistischer Phänomene wird schließlich gezeigt, welche zusätzlichen Möglichkeiten die Integration der Korpustexten in die CLARIN-D-Infrastruktur bietet.
 

Weitere Informationen


Eine Anmeldung bis zum 1. Juli unter dta@bbaw.de ist erforderlich.

Der Eintritt ist frei. Eine Anmeldung ist nicht erforderlich.

© 2024 Berlin-Brandenburgische Akademie der Wissenschaften