Unbekannte Wörter in der automatischen Spracherkennung

In diesem Buch werden die mathematischen Grundlagen der wahrscheinlichkeitsorientierten Spracherkennung sowie der Aufbau und die Funktionsweise eines aktuellen Spracherkenners beschrieben. Ein intrinsisches Problem der automatischen Spracherkennung stellen Wörter dar, die nicht im Vokabular des Spracherkenners enthalten sind. Diese werden als unbekannte Wörter oder Out-of-Vocabulary Wörter (OOVs) bezeichnet. Bestehende Ansätze zur Detektion von unbekannten Wörtern werden vorgestellt. Ausgehend von diesen wird ein kombinierter Ansatz entwickelt, der die automatische Detektion, semantische Kategorisierung und Generierung einer Transkriptionshypothese von unbekannten Wörtern durch den Spracherkenner ermöglicht. Dieser sieht die Integration von Subsprachmodellen in Kategorien des Wort-Sprachmodells mit einer hohen Wahrscheinlichkeit für das Auftreten eines unbekannten Wortes vor. Wissensbasierte und datengetriebene Ansätze zur Optimierung des in den Subsprachmodellen eingesetzten Vokabulars werden vorgestellt. Die Detektionsrate und Präzision des neuen Ansatzes werden mit denen bestehender Ansätze verglichen.

Sebastian Siegl: Studium der Informatik an der Friedrich-Alexander-Universität Erlangen-Nürnberg. Diplomarbeit: Evaluation of Model-Driven Test Case Generation based on Markov-Chain Usage Models in the Automotive Domain

Verwandte Artikel

Download
PDF