Das DFG-Projekt "Deutsches Textarchiv" (DTA) stellt einen disziplinübergreifenden Kernbestand deutschsprachiger Werke aus der Zeit von ca. 1650 bis 1900 im Volltext und als digitale Faksimiles bereit. Die elektronischen Volltexte werden linguistisch erschlossen (d.h. tokenisiert, lemmatisiert und hinsichtlich der Wortarten annotiert) und sind darüber hinaus orthographieübergreifend abfragbar.
Das von der Deutschen Forschungsgemeinschaft geförderte Projekt ist Teil des Zentrums Sprache der Berlin-Brandenburgischen Akademie der Wissenschaften.
Zum Abschluss der ersten Arbeitsphase (2007–2010) laden wir Sie herzlich zum Workshop „Das Deutsche Textarchiv: Vernetzung und Nachnutzung“ ein. Die von der DFG geförderte Veranstaltung findet am 11. und 12. Oktober 2010 im Einstein-Saal der Berlin-Brandenburgischen Akademie der Wissenschaften statt.
Ausgehend vom DTA, aber mit Blick auf verwandte Projekte und mögliche Kooperationen, sollen zunächst Möglichkeiten des Austauschs von Objekt- und Metadaten sowie Bemühungen um verbindliche Standards beleuchtet werden. Darauf aufbauend werden Perspektiven für die Bereitstellung von Schnittstellen zur Anbindung an Repositorien sowie die Vernetzung mit anderen Projekten vorgestellt und diskutiert. Zudem wird es um Fragen der linguistischen Textaufbereitung innerhalb historischer Korpora gehen.
Zentral wird die Nutzerperspektive auf das Korpus sein, die Nachnutzung der Texte sowie die geplante Erweiterung des DTA zu einem aktiven Archiv. Wir wollen das DTA als ‚Treffpunkt‘ verschiedener Nutzergruppen betrachten: Linguisten, Literaturwissenschaftler, Editoren, Informationswissenschaftler sowie fachspezifisch Interessierte sind eingeladen, ihre jeweiligen Erfahrungen und Perspektiven in Bezug auf historische Korpora im digitalen Medium einzubringen.