100 dBの騒音下でも高品質な通話や音声認識を可能とする 小型

100 dBの騒音下でも高品質な通話や音声認識を可能とする
小型インテリジェントマイクを開発
NTTは,1₀₀dBの騒音下(工場内や電車通過中のガー
ド下など)でも,高品質な通話や高精度な音声認識を
■開発の背景
これまで,工場内や工事現場等の機械騒音下や高速道
可能とする「小型インテリジェントマイク」を開発しま
路で走行中の自動車内など高騒音下では,音声認識率が
した.
著しく低下してしまったり,通話音声が劣化してしまっ
小型インテリジェントマイクとは,安価な汎用のマイ
ク素子 2 ~ 3 個と,目的とする音声とそれ以外の雑音を
高精度に推定して分離する「音響信号処理技術」を組み
たりしました.
■技術のポイント
小型インテリジェントマイクでは,音の到来方向,周
合わせることで,高騒音環境下でも,話者の音声を明瞭
波数特性,時間的な変動特性を最大限に活用し,目的と
に収音できるものです(図).
する音声とそれ以外の雑音を高精度に推定して分離する
本マイクを活用することで,これまで実現が困難で
ことを可能としました.
あった大きな騒音下,例えば,工場内や工事現場等の機
これにより,従来の技術では実現が困難であった「小
械騒音下や,高速道路を走行中の自動車内などにおいて
型」かつ「 2 ~ 3 個のマイクロホン素子」でも,目的音
も,高品質な通話(明瞭なハンズフリー通話)や高精度
声をほとんど劣化させることなく,周囲雑音のパワーを
な音声認識が可能になります.
約1₀₀₀₀分 の 1 ま で 低 減 さ せ る こ と が 可 能 と な り,1₀₀
dBといった超高騒音下において,高精度な音声認識や
騒音下でも
「インテリジェントマイク」でクリアに収音
clipart by illpop.com
clipart by illpop.com
図 利用イメージ
82
NTT技術ジャーナル 2015.1
高品質な通話を実現します.
(3) 雑音の時間変動特性を利用
(1) ビームフォーミングとスペクトルフィルタ処理
のハイブリッド構成
雑音には,エアコンの音のように方向性がなく,定常性
の強い雑音もあります.この場合には,時間変動特性に応
目的音声の到来方向に指向性を向け,その音を強調す
るビームフォーミング処理に加え,雑音成分を推定し
じた方法で,雑音の周波数スペクトルを高精度に推定し
ます.
て,周波数スペクトル領域で抑圧するスペクトルフィル
タ処理を組み合わせる構成としました.
少数のマイクで形成するビームフォーミングでは鋭い
指向性を形成することができず,十分に目的音声を強調
することができませんでした.後段のスペクトルフィル
タ処理の性能を向上することで,雑音抑圧性能を飛躍的
に高めることができました.
◆問い合わせ先
NTTサービスイノベーション総合研究所
企画部広報担当
TEL 046-859-2032
E-mail randd lab.ntt.co.jp
URL http://www.ntt.co.jp/news2014/1409/140924a.html
(2) 雑音の空間分布推定
複数のビームフォーミングを用いることにより,目的
とする音声だけでなく,それ以外の方向から到来する雑
音のスペクトルを推定します.
コミュニケーションの円滑化を目指して,研究に邁進
小林 和則
/丹羽 健太
/川瀬 智子
NTTメディアインテリジェンス研究所
研究者
研究者
紹介
紹介
音声言語メディアプロジェクト 音環境情報処理グループ
2014年4月に「遠くの音をクリアに収音するためのズームアップマイク技術」
に関して報道発表しました.その発表をきっかけとして,欲しい音をクリアに収音
したいシーンが多数あることをさまざまな業界からヒアリングすることができまし
た.今回のニュースリリースでは,そういった声の1つを具現化した技術を紹介し
ています.実用化に近い技術になるほど,2〜3個程度のマイクロホンしか使えない,
計算量は低く抑えないといけないなどの制約が多くあるため,聴覚的に効果のある
雑音抑圧技術をいかに単純な処理で実装するのかが鍵になります.今回の研究開発
を通じて,これまで培ってきたノウハウを進化させ,さらに若い世代に技術伝承す
ることにつながりました.今後も引き続き,さまざまな方とコラボレーションし,
(左から)川瀬智子/丹羽健太/小林和則
実用に資する技術開発につなげていきたいと思います.
NTT技術ジャーナル 2015.1
83