Das DFG-Projekt möchte ein zentrales lexikographisches Problem lösen: Die Identifizierung und Extraktion guter Wörterbuchbeispiele aus einer großen Anzahl von Korpusbeispielen
In vielen Wörterbüchern unterstützen Korpusbelege die lexikographische Beschreibung eines Wortes. Dabei ist die Auswahl passender Korpusbelege eine Herausforderung. Da die Messwerte „Qualität“ und „Angemessenheit“ von Korpusbelegen nicht klar definiert sind, wird unter professionellen Lexikographinnen und Lexikographen im Einzelfall nicht immer ein einstimmiges Urteil darüber erzielt, welcher Beleg am besten in die Beschreibung eines Lemmas passt. Der Einsatz von interaktiven Lernverfahren kann sie dabei unterstützen.
Im Rahmen dieses Projektes wird ein System zur Extraktion, Klassifizierung und Bewertung von Korpusbelegen entwickelt und in das lexikalische Informationssystem des „Digitalen Wörterbuchs der deutschen Sprache“ (DWDS) integriert. Das System wird die tägliche lexikographische Arbeit erleichtern. Es schlägt für jedes Stichwort eine Reihe von möglichst passenden Beispielen vor, die insgesamt ausreichend vielfältig sind, um die verschiedenen Facetten und Nuancen des Wortgebrauchs zu veranschaulichen. Darüber hinaus wird ein Mehrwert für die externen Nutzerinnen und Nutzer des lexikalischen Informationssystems erzielt, da auch für Wörter, die noch nicht vollständig lexikographisch behandelt worden sind, gute Korpusbelege extrahiert und angezeigt werden.
Es ist zu erwarten, dass diese Anwendung auch für andere Wörterbuchprojekte hilfreich sein wird, da das System sprachunabhängig arbeitet und einfach in existierende und zukünftige korpusbasierte lexikographische Informationssysteme zu integrieren ist.