AdaptDRC - Fraunhofer IDMT

F R A U N H O F E R - I N S T I T U T F Ü R D I G I TA L E M E D I E N T E C H N O L O G I E I D M T
1
1 Sprachverständlichkeit wird häufig durch
Um­gebungslärm und Nachhall gestört, zum Beispiel bei Bahnhofsdurchsagen oder in Mobiltele­
1
ADAPT DRC
Echtzeit-Optimierung von Sprachverständlichkeit
fonen. Die Softwarelösung AdaptDRC analysiert
und optimiert die Sprachverständlichkeit auf
Die Sprachwiedergabe von Kommunika­tions­
Empfängerseite in Echtzeit. Bild: MEV Verlag
systemen ist oft von Hall und Umgebungs­
Near-end listening enhancement –
geräuschen überlagert. Mit AdaptDRC bie­
Signalanpassung bei Störgeräuschen
tet das Fraunhofer IDMT eine patentierte
auf Empfängerseite
Softwarelösung, die die Sprachverständlich­
keit auch in Hörsituationen mit unbekann­
Über ein Mikrofon – zum Beispiel auf der
ten, variablen Störgeräuschen automatisch
Rückseite von Mobiltelefonen –, wird die
Fraunhofer-Institut für
und in Echtzeit verbessert. Durch Berück­
akustische Situation auf Empfängerseite er­
Digitale Medientechnologie IDMT
sichtigung aktueller Erkenntnisse aus der
fasst und die Verständlichkeit des Sprach­
Hörforschung erreicht AdaptDRC auch bei
signals in der aktuellen Hörsituation analy­
Projektgruppe
bandbegrenzten Signalen und für Menschen
siert. Anhand dieser Analyse optimieren
Hör-, Sprach- und Audiotechnologie
mit Hörbeeinträchtigung einen hohen
modell-basierte Signalverarbeitungsverfah­
Haus des Hörens
Hörkomfort.
ren die Sprachverständlichkeit in Echtzeit.
Marie-Curie-Straße 2
26129 Oldenburg
Anwendungsgebiete
Telefon +49 441 2172-400
•• Durchsagesyssteme (Public Address
Sendesystem
Empfänger
AdaptDRC
Mikrofon
Systems)
Ansprechpartner
•• Mobiltelefone
Dr. Jan Rennies-Hochmuth
•• Kopfhörer und Headsets
[email protected]
•• Konferenzsysteme
2
•• In-Car-Kommunikationssysteme
www.idmt.fraunhofer.de\hsa
•• Infotainment im Flugzeug (Inflight-
2 Die aktuelle akustische Situation auf Empfänger-
Entertainment)
seite ist Grundlage der AdaptDRC-Signalverarbei-
•• Tour-Guide-Systeme
tung. Abbildung: Fraunhofer IDMT
•• Hörgeräte
2
100
2 Je nach Umgebungsgeräuschen kann mit
Cafeteria
Hörmodell-basierte Signalverarbeitung
Richtig verstandene Wörter / %
80
lichkeit von 30 bis 80 Prozent erreicht werden.
60
AdaptDRC nutzt Modelle der menschlichen
40
Hörwahrnehmung, um die Verständlichkeit
20
eines Sprachsignals zu bewerten und zu
0
100
AdaptDRC, eine Verbesserung der Sprachverständ-
Sprachrauschen
80
Bild: MEV-Verlag
verbessern. Der Algorithmus schätzt dabei
dass das Signal nur dann bearbeitet wird,
kontinuierlich die aktuelle Verständlichkeit
wenn die Sprachverständlichkeit beein­
basierend auf dem Sprachverständlichkeits­
trächtigt ist.
index SII. Sinkt die Verständlichkeit, zum
60
Beispiel durch zunehmende Störgeräusche,
40
Anwendungsspezifische Anpassung
wird die Signalverarbeitung aktiviert. Ge­
20
zielt werden einzelne Frequenzbänder ver­
Mit AdaptDRC ist eine Verbesserung der
stärkt und die Dynamik des Signals kompri­
Sprachverständlichkeit in unterschiedlichen
miert. So kann auch ohne Anheben der
technischen Systemen möglich – von her­
80
Lautstärke eine Verbesserung der Sprach­
kömmlicher Telefonübertragung bis zu voller
60
verständlichkeit von 30 bis 80 Prozent
Bandbreite bei hochwertigen Multi­media­­
40
erreicht werden. Wissenschaftliche Studien
anwendungen. Aufgrund der eingesetzten
20
mit normal- und schwerhörenden Proban­
Dynamikkom­pression ist eine Verbesserung
den haben gezeigt, dass auch Menschen
der Sprach­verständlichkeit auch in schwie­
mit Hörminderung von der Signalverarbei­
rigen akustischen Umgebungen möglich.
tung profitieren und Sprachsignale besser
Der Algorithmus liegt als plattform-unab­
und mit weniger Höranstrengung verste­
ängige C-Implementierung vor, und kann
1 Wissenschaftliche Evaluationen mit normal- und
hen. Zum Hörkomfort und einer natürlich
an anwendungsspezifische Szenarien und
schwerhörenden Probanden zeigen, dass AdaptDRC
klingenden Sprachwiedergabe trägt bei,
technische Bedingungen angepasst werden.
0
100
Fahrzeuginnenraum
Unverarbeitet
Verarbeitet mit AdaptDRC
0
-28
-24
-20
-16
-12
-8
-4
0
+4
Signal−zu−Rausch−Abstand/dB
1
eine deutliche Verbesserung der Sprachverständlichkeit in verschiedenen akustischen Szenarien
ermöglicht – zum Beispiel in einer Cafeteria, bei
12000
Stimmengewirr oder in einem Fahrzeug. Abbildung:
H. Schepker et al. (2013), Proc. Interspeech 2013,
Lyon, Frankreich, Seiten 3577 – 3581.
H. Schepker et al. (2015), Speech-in-noise enhance­
ment using amplification and dynamic range
Frequenz/Hz
Publikationen
Frequenz/Hz
10000
Fraunhofer IDMT
8000
6000
10000
8000
6000
4000
4000
2000
2000
0
0,25
0,5
0,75
Verarbeitet mit AdaptDRC
12000
Unverarbeitet
1,0
1,25
1,5
Zeit/s
1,75
2,0
0
0,25
0,5
0,75
1,0
1,25
1,5
1,75
2,0
Zeit/s
compression controlled by the speech intelligibility
index, Journal of the Acoustical Society of America
3 Zeit-Frequenz-Darstellung eines gestörten Sprachsignals: links unverarbeitet und rechts mit AdaptDRC
138, S. 2692-2706.
verarbeitet. Abbildung: Fraunhofer IDMT
3