F R A U N H O F E R - I N S T I T U T F Ü R D I G I TA L E M E D I E N T E C H N O L O G I E I D M T 1 1 Sprachverständlichkeit wird häufig durch Umgebungslärm und Nachhall gestört, zum Beispiel bei Bahnhofsdurchsagen oder in Mobiltele 1 ADAPT DRC Echtzeit-Optimierung von Sprachverständlichkeit fonen. Die Softwarelösung AdaptDRC analysiert und optimiert die Sprachverständlichkeit auf Die Sprachwiedergabe von Kommunikations Empfängerseite in Echtzeit. Bild: MEV Verlag systemen ist oft von Hall und Umgebungs Near-end listening enhancement – geräuschen überlagert. Mit AdaptDRC bie Signalanpassung bei Störgeräuschen tet das Fraunhofer IDMT eine patentierte auf Empfängerseite Softwarelösung, die die Sprachverständlich keit auch in Hörsituationen mit unbekann Über ein Mikrofon – zum Beispiel auf der ten, variablen Störgeräuschen automatisch Rückseite von Mobiltelefonen –, wird die Fraunhofer-Institut für und in Echtzeit verbessert. Durch Berück akustische Situation auf Empfängerseite er Digitale Medientechnologie IDMT sichtigung aktueller Erkenntnisse aus der fasst und die Verständlichkeit des Sprach Hörforschung erreicht AdaptDRC auch bei signals in der aktuellen Hörsituation analy Projektgruppe bandbegrenzten Signalen und für Menschen siert. Anhand dieser Analyse optimieren Hör-, Sprach- und Audiotechnologie mit Hörbeeinträchtigung einen hohen modell-basierte Signalverarbeitungsverfah Haus des Hörens Hörkomfort. ren die Sprachverständlichkeit in Echtzeit. Marie-Curie-Straße 2 26129 Oldenburg Anwendungsgebiete Telefon +49 441 2172-400 •• Durchsagesyssteme (Public Address Sendesystem Empfänger AdaptDRC Mikrofon Systems) Ansprechpartner •• Mobiltelefone Dr. Jan Rennies-Hochmuth •• Kopfhörer und Headsets [email protected] •• Konferenzsysteme 2 •• In-Car-Kommunikationssysteme www.idmt.fraunhofer.de\hsa •• Infotainment im Flugzeug (Inflight- 2 Die aktuelle akustische Situation auf Empfänger- Entertainment) seite ist Grundlage der AdaptDRC-Signalverarbei- •• Tour-Guide-Systeme tung. Abbildung: Fraunhofer IDMT •• Hörgeräte 2 100 2 Je nach Umgebungsgeräuschen kann mit Cafeteria Hörmodell-basierte Signalverarbeitung Richtig verstandene Wörter / % 80 lichkeit von 30 bis 80 Prozent erreicht werden. 60 AdaptDRC nutzt Modelle der menschlichen 40 Hörwahrnehmung, um die Verständlichkeit 20 eines Sprachsignals zu bewerten und zu 0 100 AdaptDRC, eine Verbesserung der Sprachverständ- Sprachrauschen 80 Bild: MEV-Verlag verbessern. Der Algorithmus schätzt dabei dass das Signal nur dann bearbeitet wird, kontinuierlich die aktuelle Verständlichkeit wenn die Sprachverständlichkeit beein basierend auf dem Sprachverständlichkeits trächtigt ist. index SII. Sinkt die Verständlichkeit, zum 60 Beispiel durch zunehmende Störgeräusche, 40 Anwendungsspezifische Anpassung wird die Signalverarbeitung aktiviert. Ge 20 zielt werden einzelne Frequenzbänder ver Mit AdaptDRC ist eine Verbesserung der stärkt und die Dynamik des Signals kompri Sprachverständlichkeit in unterschiedlichen miert. So kann auch ohne Anheben der technischen Systemen möglich – von her 80 Lautstärke eine Verbesserung der Sprach kömmlicher Telefonübertragung bis zu voller 60 verständlichkeit von 30 bis 80 Prozent Bandbreite bei hochwertigen Multimedia 40 erreicht werden. Wissenschaftliche Studien anwendungen. Aufgrund der eingesetzten 20 mit normal- und schwerhörenden Proban Dynamikkompression ist eine Verbesserung den haben gezeigt, dass auch Menschen der Sprachverständlichkeit auch in schwie mit Hörminderung von der Signalverarbei rigen akustischen Umgebungen möglich. tung profitieren und Sprachsignale besser Der Algorithmus liegt als plattform-unab und mit weniger Höranstrengung verste ängige C-Implementierung vor, und kann 1 Wissenschaftliche Evaluationen mit normal- und hen. Zum Hörkomfort und einer natürlich an anwendungsspezifische Szenarien und schwerhörenden Probanden zeigen, dass AdaptDRC klingenden Sprachwiedergabe trägt bei, technische Bedingungen angepasst werden. 0 100 Fahrzeuginnenraum Unverarbeitet Verarbeitet mit AdaptDRC 0 -28 -24 -20 -16 -12 -8 -4 0 +4 Signal−zu−Rausch−Abstand/dB 1 eine deutliche Verbesserung der Sprachverständlichkeit in verschiedenen akustischen Szenarien ermöglicht – zum Beispiel in einer Cafeteria, bei 12000 Stimmengewirr oder in einem Fahrzeug. Abbildung: H. Schepker et al. (2013), Proc. Interspeech 2013, Lyon, Frankreich, Seiten 3577 – 3581. H. Schepker et al. (2015), Speech-in-noise enhance ment using amplification and dynamic range Frequenz/Hz Publikationen Frequenz/Hz 10000 Fraunhofer IDMT 8000 6000 10000 8000 6000 4000 4000 2000 2000 0 0,25 0,5 0,75 Verarbeitet mit AdaptDRC 12000 Unverarbeitet 1,0 1,25 1,5 Zeit/s 1,75 2,0 0 0,25 0,5 0,75 1,0 1,25 1,5 1,75 2,0 Zeit/s compression controlled by the speech intelligibility index, Journal of the Acoustical Society of America 3 Zeit-Frequenz-Darstellung eines gestörten Sprachsignals: links unverarbeitet und rechts mit AdaptDRC 138, S. 2692-2706. verarbeitet. Abbildung: Fraunhofer IDMT 3
© Copyright 2024 ExpyDoc