Interaktive Konstruktionsanalyse
Um eine qualitativ hochwertige, kontextsensitive Analyse unseres gesamten Korpus zu gew?hrleisten, die zudem die Dynamik der (historischen) Grammatikalit?t grunds?tzlich berücksichtigt, entwickeln wir ein interaktives Verfahren. Wir verfolgen einen Human-in-the-loop-Ansatz, der Methoden des Maschinellen Lernens mit Expertenfeedback kombiniert. In diesem Ansatz werden die folgenden zwei Phasen iterativ durchlaufen, bis eine zufriedenstellende Analyse des Korpus erreicht ist.
- Phase 1: Auf der Grundlage einer partiellen, unsicheren Annotation soll das System grammatische Muster und m?gliche Grammatikregeln induzieren. Muster und Regeln haben dabei zun?chst rein hypothetischen Charakter, und der Unsicherheit der Annotation soll durch eine ad?quate Repr?sentation der Unsicherheit der induzierten Regeln Rechnung getragen werden.
- Phase 2: Dem/der Experten/in wird die M?glichkeit gegeben, einzelne Vorschl?ge des Systems zu best?tigen oder zu verwerfen (oder unkommentiert und somit offen zu lassen). Auf diese Weise wird die bestehende Annotation erweitert und verbessert.
Durch den Einsatz von Methoden des Maschinellen Lernens erreichen wir einen Analysefortschritt: Das Versehen eines Korpus mit Annotationen ist für Menschen eine anstrengende und zeitintensive Arbeit. Durch das Vorschlagen automatisch generierter Annotationen wollen wir die Annotierenden in ihrer Arbeit unterstützen und erhoffen uns zudem eine Zeitersparnis.
Um eine solche interaktive Konstruktionsanalyse zu realisieren, ben?tigen wir ein geeignetes Werkzeug. Das Annotationstool CorA hat sich bereits für die Annotation historischer Texte bew?hrt. Aufgrund des Projektzieles, die Dynamik sprachlicher Entwicklungen zu fassen, nehmen wir Erweiterungen vor, die es erlauben
- Ambiguit?t,
- Gradienz und
- Annotatorunsicherheit
zu erfassen.