EVIDENCE: Computerunterstützte interaktive Extraktion guter Wörterbuchbeispiele aus großen Korpora

- abgeschlossen -

Bewertung der Korpusbelege für das Wort „Lampe“

Das DFG-Projekt hatte das folgendes zentrales lexikographisches Problem lösen: Die Identifizierung und Extraktion guter Wörterbuchbeispiele aus einer großen Anzahl von Korpusbeispielen.

In vielen Wörterbüchern unterstützen Korpusbelege die lexikographische Beschreibung eines Wortes. Dabei ist die Auswahl passender Korpusbelege eine Herausforderung. Da die Messwerte „Qualität“ und „Angemessenheit“ von Korpusbelegen nicht klar definiert sind, wird unter professionellen Lexikographinnen und Lexikographen im Einzelfall nicht immer ein einstimmiges Urteil darüber erzielt, welcher Beleg am besten in die Beschreibung eines Lemmas passt.

Daher wurde ein interaktives Lernverfahren entwickelt, um ein individuelles Bewertungsmodell für gute Satzbelege zu trainieren. Damit kann das System aus dem Korpusbestand für jedes Stichwort eine Reihe von möglichst passenden Beispielen vorschlagen. Das System kann die Vorschläge weiter filtern, sodass Belege mit verschiedenen Facetten und Nuancen des Wortgebrauchs angezeigt werden. Insgesamt ermöglicht das System die Suche nach guten und vielfältigen Satzbelegen. Das System steht auch externen Nutzerinnen und Nutzer unter https://evidence.bbaw.de zur Verfügung.

Kontakt

Abteilung Forschung
forschung@bbaw.de
Jägerstraße 22/23
10117 Berlin