strong overlay

Teilprojekte

FrameNet

Teilprojekt I: Von Valenzeinträgen zu Frames: Integration von E-VALBU-Daten in das deutsche FrameNet

Das digitale Valenzwörterbuch E-VALBU ist mit insgesamt 638 Verben des Deutschen die derzeit umfassendste valenzgrammatische Ressource. Die in E-VALBU dokumentierte semantischen und syntaktischen Verbvalenzen bildet den empirischen Ausgangspunkt für die systematische Erweiterung des deutschen FrameNet. Ziel ist es, (a) allen in E-VALBU erfassten Verblesarten (Bedeutungsvarianten) entsprechende Frames zuzuweisen, (b) in allen über 20.000 Belegsätze die jeweils realisierten Frame-Elemente zu annotieren, um so (c) das bestehende FrameNet-Repositorium zu erweitern und – wenn nötig – zu modifizieren.

Teilprojekt II: Von Proto-Frames zu Frames: Erweiterung des deutschen FrameNet durch SALSA

Das „Saarbrücken Lexical Semantics Acquisition„-Projekt (SALSA) hat für den Aufbau eines frame-basierten Lexikons Pionierarbeit geleistet. Die aufgebaute Ressource besteht aus 1028 Lexikalischen Einheiten zu Frames des Berkeleyer FrameNet (BFN), 68 modifizierten BFN-Frames sowie 730 neuen Frame-Kandidaten (Proto-Frames). Basierend auf diesem Datensatz erweitern und modifizieren wir das FrameNet des Deutschen mit dem Ziel, eine möglichst breite Abdeckung des Grundwortschatzes des Deutschen zu erreichen.

Teilprojekt III: Konzeptuelle Metaphern als Frames: Aufbau eines KoMetNet und Integration in das deutsche FrameNet

Ziel des Teilprojektes ist es, (a) konzeptuelle Metaphern des Deutschen systematisch zu identifizieren, (b) als eigenständige Frames auszuweisen, (c) ihre Beziehungen untereinander in Gestalt eines Konzeptuellen-Metaphern-Netzes (KoMetNet) zu dokumentieren und (d) sie in das deutsche FrameNet zu integrieren. Ausgangspunkt bilden 685 im Berkeleyer MetaNet-Projekt erfasste konzeptuelle Metaphern. Leitend ist die Annahme, dass jede konzeptuelle Metapher die Struktur eines Frames aufweist, deren Frame-Elemente aus einem Quell- und Ziel-Frame stammen. Ausgehend von der Isomorphie zwischen Konzeptuellen Metaphern und Frames wird jede Metapher wie ein eigenständiger Frame behandelt und hinsichtlich seiner Verschränkung mit einem Quell- und Ziel-Frame erfasst.

Konstruktikon

Teilprojekt IV: Construction Mining: induktive Identifizierung und konstruktikographische Dokumentation von Konstruktionskandidatinnen

In diesem Teilprojekt werden durch statistische Verfahren unter Einbezug neuronaler Netzwerke grammatische Konstruktionen variierender Komplexität, Schematizität und Idiomatizität induktiv identifiziert und evaluiert (vgl. Barteld/Ziem 2021). Auf der Grundlage großer Textkorpora werden Experimente durchgeführt, um neue Verfahren des Data-Mining zu entwickeln und so zu operationalisieren und zu implementieren, dass signifikante Teile des Lexikon-Grammatik-Kontinuums exemplarisch beschrieben werden können. Die im Construction-Mining-Prozess validierten Konstruktionskandidatinnen dienen als Ausgangspunkte für konstruktikographische Analysen und die Erstellung neuer Konstruktionseinträge im Konstruktikon (siehe Teilprojekt V).

Teilprojekt V: Konstruktikographische Analysen: von Konstruktionskandidatinnen zu Konstruktionseinträgen

Die übergreifende Aufgabe des dritten Teilprojektes besteht darin, die identifizierten Konstruktionskandidatinnen im Detail konstruktikographisch zu analysieren und die dabei erzielten Ergebnisse in Form von Konstruktionseinträgen im Konstruktikon zu dokumentieren. In einer ersten Phase wurden zunächst umfangreiche Pilotstudien zu ausgewählten Konstruktionsfamilien (Exklamativ-Konstruktionen, negationsinduzierende Konnektoren, Vergleichskonstruktionen, Reduplikationskonstruktionen) durchgeführt. In enger Kooperation mit der Projektgruppe Construction-Mining liegt der Arbeitsschwerpunkt aktuell auf der Erfassung einer großen Vielzahl von induktiv identifizierten Konstruktionen. Der Arbeitsprozess folgt einem festgelegten konstruktikgraphischen Workflow.

Wissenstransfer: Erklärvideos

Teilprojekt VI: Was ein Konstruktikon ist und woraus es besteht: Erklärvideos

Mit fortschreitender Entwicklung und Implementierung des Konstruktikons und FrameNets wächst nicht nur die Komplexität des Projektes, sondern auch die Notwendigkeit, die theoretisch-methodischen Grundlagen, die Ausgangspunkte und die sich weiter ausdifferenzierenden Teilbereiche des Projekts in knapper Form der interessierten Öffentlichkeit zu erläutern. Zusätzlich zur Dokumentation von Frames und Konstruktionen auf der Projektwebsite erstellen wir aktuell Erklärvideos, die zentrale Aspekte des Projektes vorstellen und in zugänglicher Weise erklären. Die Videos richten sich ebenso an Studierende und LinguistInnen wie an interessierte Laien.

Technische Infrastruktur

Teilprojekt VII: Technische Implementierung & computationelle Unterstützung der Konstruktikon-Entwicklung

Das Konstruktikon des Deutschen kann nur so gut sein, wie die technische Infrastruktur ist, auf der es beruht. Die computationellen Anforderungen sind hoch, weil lexikalische und grammatische Konstruktionen in ihren vielfältigen Zusammenhängen abgebildet und in strukturierter Form zugänglich gemacht werden sollen. Darüber hinaus bilden das FrameNet und KoMetNet ein nicht minder komplexes Repositorium, das als semantische Ressource zur Beschreibung von Konstruktions-Bedeutungen fungiert. Vor diesem Hintergrund gehört es zu den Kernaufgaben dieses Teilprojekts, die technische Infrastruktur weiterzuentwickeln und zu implementieren sowie geeignete Datenbanken für die Repositorien aufzubauen und die Konstruktikon-Entwicklung mit Hilfe von Softwarelösungen zu unterstützen, einschließlich der Konzeption von Formaten zur Visualisierung von Daten und der Weiterentwicklung des AnnotationTools, das wir zur Bewältigung der spezifischen Anforderungen entwickelt haben. Derzeit liegt der Fokus auf (a) der Integration von Construction-Mining-Verfahren in den konstruktikographischen Workflow und (b) der Verarbeitung von E-VALBU-, SALSA- und MetaNet-Daten mit dem Ziel, diese in das deutsche FrameNet zu integrieren.