strong overlay

Ausrichtung & Zielsetzungen

Langfristiges Ziel des Projekts „FrameNet des Deutschen“ ist es, (a) konzeptuelle Bedeutungsstrukturen im Grundwortschatz des Deutschen, einschließlich fester Mehrworteinheiten, möglichst vollständig zu erfassen, (b) sie frame-semantisch zu beschreiben und (c) sie einer semantischen Ordnungsstruktur folgend in einem Repositorium zu dokumentieren. Zielgröße sind zunächst Wörter, genauer: valenziell analysierbare Wort-Bedeutungspaare (Lexikalische Einheiten, kurz: LE), insbesondere Verben, Adjektive, Präpositionen und nicht-sortale Nomen, aber auch Mehrworteinheiten wie Funktionsverbgefüge (z.B. Bekanntschaft machen) oder feste Wortverbindungen (z.B. ab und zu). Für sortale Nomen wird zusätzlich auf Kollokationsstrukturen zurückgegriffen.

Aktuell umfasst das FrameNet des Deutschen ungefähr 1.220 Frames des Berkeleyer FrameNet (Version 1.7). Die Frames wurden übersetzt, manuell korrigiert und fürs Deutsche aufbereitet. Jeder Frame-Eintrag enthält auch Informationen darüber, welche Beziehungen er zu anderen Frames unterhält; ein Tool namens FrameGrapher hilft bei der Visualisierung der Netzwerkstruktur.

Hinzu kommen etwa 9.000 Beispielbelegstellen in den Definitionen der Frames und der Frame-Elemente; diese wurden ebenfalls übersetzt sowie manuell korrigiert und angepasst. Sie werden in Kürze nach und nach in die Datenbank integriert; sie dienen insbesondere zur Illustration des Frames und seiner Frame-Elemente.

Die zukunftigen Arbeitsschritte richten sich auf die Erweiterung der Datenbank um authentische Sprachbelege, auf deren Basis weitere Frames erstellt bzw. bestehende Frames adaptiert und ergänzt werden. Allmählich soll zudem ein Inventar an Lexikalischen Einheiten, einschließlich der Dokumentation von Valenzmustern und Angaben der syntaktischen Realisierung von Frame-Elementen, aufgebaut werden.

Als Quellen fungieren insbesondere Belegstellen des Digitalen Wörterbuchs der Deutschen Sprache (DWDS) sowie des Deutsche Referenzkorpus (DeReKo) verwendet. Zusätzlich werden Annotationen aus dem elektronischen Valenzwörterbuch E-VALBU (Institut für Deutsche Sprache) für die Integration in das Deutsche FrameNet aufbereitet und mit frame-semantischen Annotationen erweitert. Auch die Integration der im Saarbrückener SALSA-Projekt annotierten Daten, einschließlich der auf dieser Basis erstellten Frames, ist geplant.