SPP 1527 - Methoden des Spracherwerbs basierend auf sp?rlicher Kodierung (Teilprojekt)

Overview

Ziel dieses Projektes ist die Entwicklung eines Systems zum Lernen von Referenzmustern für das unüberwachte Erlernen einer Sprache. Die Maschine soll wiederkehrende Muster in dem kontinuierlich gesprochenen Eingangssprachsignal entdecken und ein Inventar von Einheiten erlernen, und zwar auf zwei verschiedenen Abstraktionsebenen: zum Einen auf der Ebene der Laute und zum Anderen auf der Ebene der W?rter. Es sollen Verfahren aus dem Gebiet der sp?rlichen Kodierung eingesetzt werden, um eine Repr?sentation des Sprachsignals zu finden, bei der die Darstellung des Sprachsignals im Kurzzeit-Spektralbereich durch eine Linearkombination von Basisvektoren angen?hert wird. W?hrend nichtnegative Matrixfaktorisierung (NMF) auf Sprache bereits eingesetzt worden ist, gibt es andere Verfahren, welche nicht die Nichtnegativit?t der Matrixelemente voraussetzen, so dass sie besser geeignet sind, um sie auf die üblichen Parametrisierungen von Sprachsignalen, etwa die Mel-Frequenz Cepstralen Koeffizienten, anzuwenden. Ein vielversprechendes Verfahren ist die k-Singul?rwertzerlegung (k-SVD), die bisher vornehmlich im Computersehen eingesetzt worden ist. Alle diese Lernverfahren müssen jedoch erweitert werden, damit sie, zus?tzlich zu dem Erlernen der typischen spektralen Muster, auch die zeitliche Korrelation von Sprachsignalen erfassen k?nnen. Dazu sollen Ans?tze aus dem Bereich der dynamischen Zeitanpassung und der ”hidden” Markovmodell-basierten Spracherkennung verwendet werden. Auf der ersten, unteren Stufe der Dekomposition des Eingangssprachsignals sollen wiederkehrende Lauteinheiten entdeckt werden. Auf der zweiten, h?heren Abstraktionsebene werden mit ?hnlichen Verfahren wie auf der ersten Ebene Wort- oder Phraseneinheiten erlernt, basierend auf einer Beschreibung der unteren Ebene mit Hilfe von n-Grammen, d.h. von H?ufigkeiten von Lautfolgen. Die untere Ebene soll dabei Posteriorwahrscheinlichkeiten an die obere Ebene weitergeben, um eine vorzeitige definitive Entscheidung über Laute zu vermeiden.

DFG-Verfahren Schwerpunktprogramme

Teilprojekt zu SPP 1527: Autonomes Lernen

Key Facts

Grant Number:
200293401
Project duration:
01/2011 - 12/2016
Funded by:
DFG
Website:
DFG-Datenbank gepris

More Information

Principal Investigators

contact-box image

Prof. Dr. Reinhold H?b-Umbach

Communications Engineering / Heinz Nixdorf Institute

About the person