Studium, Ausbildung und Beruf

web uni-protokolle.de
 powered by
NachrichtenLexikonProtokolleBücherForenMittwoch, 20. August 2014 

Sprachtechnologie: TV-Sendungen werden automatisch zu Text und durchsuchbar

27.10.2009 - (idw) European Media Laboratory GmbH

Kooperation zwischen Bayerischem Rundfunk und European Media Laboratory - Automatische Verschriftung von Sendungen des "BR-Alpha Forums" Heidelberg/München. Die automatische Umwandlung von gesprochener Sprache in Text, die Transkription, hat in den letzten Jahren große Fortschritte erzielt. Gründe dafür liegen in den kontinuierlich verbesserten Erkennungsalgorithmen, der wachsenden Rechnerleistung und der Möglichkeit, riesige Datenmengen zu verarbeiten. So haben beispielsweise die Sprachtechnologen des European Media Laboratory (EML) ein Transkriptionssystem entwickelt, mit dem Fernsehsendungen automatisch verschriftet werden können. Um dieses System aber auch in der Praxis nutzen zu können, muss es auf den jeweiligen Bereich, die sogenannte Sprachdomäne, angepasst werden.

In einem neuen Projekt gemeinsam mit dem Bayerischen Rundfunk (BR) wird das Transkriptionssystem an die Sendung "BR Alpha Forum" angepasst. "BR Alpha Forum" ist eine tägliche Sendung, in der Persönlichkeiten aus Politik und Wirtschaft, Wissenschaft und Gesellschaft, Religion und Kultur in 45 Minuten ausführlich zu Wort kommen. Im Forschungsprojekt wird das Transkriptionssystem mit bereits ausgestrahlten Sendungen von BR Alpha Forum gefüttert. Es "lernt" wie ein Schüler anhand der Manuskripte das Vokabular, das in dieser Sendung verwendet wird. Außerdem "hört" es den Sprechern genau zu und trainiert so die akustische Spracherkennung.

"Es handelt sich hier nicht um Künstliche Intelligenz, sondern um intelligente Sprachtechnologie", erklärt EML-Forschungs- und Entwicklungsleiter Dr. Siegfried Kunzmann. "Wir trainieren die Spracherkennungssysteme mit vielen Texten und gesprochenen Aufnahmen der entsprechenden Domäne." Erkennungsfehler werden mit grammatikalischer Analyse und Korrektur verbessert und "nicht-gesprochene" Satzzeichen eingefügt. Damit erreichen die Forscher eine verbesserte Textdarstellung und -strukturierung. Als Ergebnis der automatischen Transkription liegen dann sowohl der gesprochene Text mit Zeichensetzung als auch die Zeitzuordnung für jedes Wort vor.

Das Pilotprojekt von EML und Bayerischem Rundfunk hat zum Ziel, die BR Alpha Forum-Gespräche automatisch zu transkribieren und in Vortragsmanuskripte umzuwandeln. "Außerdem soll die Suche und Wiedergabe von Sendungen im Video-Archiv über freie Suchbegriffe möglich werden", so Herbert Tillmann, Direktor Produktion und Technik beim Bayerischen Rundfunk. Und zuletzt soll es möglich sein, die Sendung und den transkribierten Text innerhalb eines Internet-Browsers oder auch als Videosendung mit eingeblendeter Text-Informationen zu zeigen.
Das Projekt wurde von der gemeinnützigen Klaus Tschira Stiftung als Maßnahme zum Technologietransfer in Auftrag gegeben und wird sechs Monate dauern.

Für weitere Informationen wenden Sie sich bitte an:

Dr. Peter Saueressig
Presse- und Öffentlichkeitsarbeit
European Media Laboratory GmbH
Tel.: +49-(0)6221-533245
Peter.Saueressig@eml.org

Rudolf Küffner
BR-Pressestelle
Bayerischer Rundfunk
Tel.: +49-(0) 89-5900-2176
rudolf.kueffner@brnet.de
Weitere Informationen: http://www.eml-development.de/deutsch/presse/presseberichte.php?we_objectID=369 Pressemitteilung des EML
uniprotokolle > Nachrichten > Sprachtechnologie: TV-Sendungen werden automatisch zu Text und durchsuchbar
ImpressumLesezeichen setzenSeite versendenDruckansicht

HTML-Code zum Verweis auf diese Seite:
<a href="http://www.uni-protokolle.de/nachrichten/id/186679/">Sprachtechnologie: TV-Sendungen werden automatisch zu Text und durchsuchbar </a>