SPP 1527 - Bayessches Lernen einer hierarchischen Repr?sentation von Sprache aus gesprochener Eingabe (Teilprojekt)

?berblick

Das Ziel dieses Projekts ist das Erlernen einer hierarchischen Repr?sentation von Sprache alleine aus dem akustischen Sprachsignal. Auf der untersten Ebene werden die akustischen Elementareinheiten, d.h. Phoneme oder ?hnliche Wortuntereinheiten, entdeckt und Modelle dafür trainiert, w?hrend auf der n?chsten Ebene die lexikalischen Einheiten, d.h. die W?rter, segmentiert und Wahrscheinlichkeiten für sie gelernt werden sollen. Schlie?lich sollen semantisch interpretierbare Wortkategorien gefunden werden. Besondere Aufmerksamkeit wird darauf gelegt, dass der Wortschatz im Prinzip unbegrenzt ist und dass gesprochene Sprache eine extreme Variabilit?t besitzt. Beiden Umst?nden wird durch Verwendung eines Bayesschen Ansatzes Rechnung getragen. Um zu erm?glichen, dass das Vokabular mit der Menge der Eingangssprache wachsen kann, werden nichtparametrische Bayes'sche Methoden verwendet, insbesondere solche, die auf Dirichlet und Pitman-Yor Prozessen basieren, bei denen die Anzahl der Parameter vorab nicht festgelegt werden muss sondern mit der Menge der zur Verfügung stehenden Daten wachsen kann. Die Variabilit?t der gesprochenen Eingabe führt zu Mehrdeutigkeiten und Fehlern bei der Entdeckung der Wortuntereinheiten. Diesen wird dadurch begegnet, dass vorschnelle Entscheidungen über die Phonemidentit?t vermieden werden und Phonem- und Worterkennung in einem gemeinsamen probabilistischen Modell erfolgen, für das effiziente Inferenzverfahren entwickelt werden sollen. Neben Anwendungen in der Sprachverarbeitung sind die zu entwickelnden Methoden auch für andere Lernprobleme aus sequentiellen, hochvariablen Sensordaten mit einer unbekannten Anzahl von zu lernenden Modellen von Interesse.

DFG-Verfahren Schwerpunktprogramme

Teilprojekt zu SPP 1527: Autonomes Lernen

Key Facts

Grant Number:
260050394
Laufzeit:
01/2014 - 12/2018
Gef?rdert durch:
DFG
Website:
DFG-Datenbank gepris

Detailinformationen

Projektleitung

contact-box image

Prof. Dr. Reinhold H?b-Umbach

Nachrichtentechnik (NT) / Heinz Nixdorf Institut

Zur Person