Segmentierung von Audiodaten

Die automatische Strukturierung von Audiodatenströmen, also deren Unterteilung in Abschnitte, welche jeweils in einer sinnvollen Weise Einheiten bilden, stellt in einigen Bereichen, wie zum Beispiel der automatischen Spracherkennung oder Erstellung von Audiozusammenfassungen, einen wichtigen, entscheidenden Vorverarbeitungsschritt dar. Eine gute Segmentierung kann aber auch bei der Navigation durch längere Audiodatenströme oder deren Visualisierung von großem Nutzen sein. Diese Arbeit enthält einen Überblick über existierende Ansätze und stellt drei Methoden näher vor und gegenüber, von welchen sich je eine eines unüberwachten, halbüberwachten und überwachten maschinellen Lernverfahrens bedient. Die Fähigkeit zur Anpassung an verschiedene Aufgabenstellungen und Audioquellen der datengestützten Verfahren war dabei von grundlegender Bedeutung.

Alexander Daxenberger, Diplominformatiker: Ausbildung zum Kommunikationselektroniker. Diplominformatikstudium an der Universität Dortmund, Nebenfach Elektrotechnik. Software-Ingenieur bei der Deutschen Flugsicherung.

Verwandte Artikel

Download
PDF
Segmentierung von Audiodaten Alexander Daxenberger

49,00 €*