3 - Q - 6 二次の射影法とスペクトルサブトラクションを用いた音響エコー抑圧 大久保 俊也 滝口 哲也 研究背景 ・ 研究目的 有木 康雄 (神戸大学工学部) エコーキャンセラとスペクトルサブトラクションの結合 音響エコー抑圧処理後, 更に定常雑音と定常雑音に埋もれた音響エコーの抑圧 研究背景 音響エコーとは? エコーキャンセラとスペクトルサブトラクション(SS)による 音響エコーと定常雑音の同時除去 [O.Ichikawa,M.Nishimura(2005)] system sound speaker Acoustic Echo interactive system Acoustic Echo Canceller + Spectral Subtraction x(t) microphone (ex. car navigation) x(t) talker speech スピーカより発生した音がシステム自身のマイクロフォン により観測 音声認識精度の低下,システム誤動作の恐れ DFT adaptive filter Wω(T) 音響エコーキャンセラ Nω’(T) Yω’(T) - - + Mω(T) Eω(T) DFT e(t) + s(t) n(t) 周波数上で適応フィルタとSS係数を同時に適応することで 音響エコーと定常雑音を効果的に除去 時間領域において二次の射影法により音響エコーの抑圧 周波数領域において音響エコーと定常雑音の同時抑圧 echo path h(t) m(t) y(t) micro phone s(t) n(t) x(t) = [x(t),x(t-1),…,x(t-L+1)]T , w’(t) = [w1’ (t),w2’ (t),…,wL’ (t)]T 擬似エコー: y’(t) = w’(t)T x(t) 誤差信号 : e(t) = y(t) - y’(t) → 0 となるようフィルタw’(t)を更新 音響エコー発生経路の伝達系を適応フィルタにより推定 擬似エコーを作成し観測信号から引くことで音響エコーを除去 主な適応アルゴリズム NLMS(Normalized Least-Mean Square;学習同定法) αe(t) w’(t+1) = w’(t) + x(t) T x (t) x(t) + β ・過去1つの入出力関係を満足するようにフィルタ係数を更新 ・計算量が少なく簡易であるがフィルタ係数の収束が遅い 二次の射影法 micro phone y(t) 評価実験 adaptive filter w(t) - m(t) 処理の結合 適応フィルタによる音響エコーキャンセラ Acoustic Echo Canceller speaker x(t) x(t) y’(t) echo path h(t) Xω(T) 研究目的 システムの音声認識精度を高めるための音響エコー除去 speaker -1 e(t) x(t)T x(t) x(t)T x(t-1) w’(t+1) = w’(t) + x(t) x(t-1) x(t-1)T x(t) x(t-1)T x(t-1) (1-μ)e(t-1) ・過去2つの入出力関係を満足するようにフィルタ係数を更新 ・NLMSに比べ計算量は多いがフィルタ係数の収束が速い 問題点 音響エコー以外の雑音成分の存在 エコーキャンセラでは定常雑音が除去できない 適応フィルタによる音響エコー伝達系の推定精度の劣化 実験条件 音響エコーの作成 RWCP 実環境音声・音響データベース内のインパルス応答 (無響,120ms,300ms)と音楽データを畳み込んで作成 音響エコー + 目的音声に対して白色雑音をSNR10[db]で重畳 各種パラメータ サンプリング:16000[Hz],16[bit] 時間領域: タップ数L:256,ステップサイズα:1.0 周波数領域: フレーム幅:128[ms],シフト幅,64[ms] フレームタップ数:10,ステップサイズ:0.1 実験結果 SN比による比較 (単位:dB) 残響時間 無響 120[ms] 300[ms] 無処理 1.02 1.38 -0.79 時間領域処理 7.74 7.79 5.11 + 周波数領域処理 8.70 8.79 4.69 まとめ 時間領域と周波数領域の両処理で音響エコーと定常雑音を抑圧 現状にて,時間領域処理のみに比べ,SN比を約1[dB]改善 今後の方針 周波数領域での二次の射影法を用いたエコーキャンセラの検討 時間領域での処理と周波数領域での処理のより効果的な結合
© Copyright 2024 ExpyDoc