スライド 1

3 - Q - 6 二次の射影法とスペクトルサブトラクションを用いた音響エコー抑圧
大久保 俊也
滝口 哲也
研究背景 ・ 研究目的
有木 康雄
(神戸大学工学部)
エコーキャンセラとスペクトルサブトラクションの結合
 音響エコー抑圧処理後,
更に定常雑音と定常雑音に埋もれた音響エコーの抑圧
研究背景
 音響エコーとは?
 エコーキャンセラとスペクトルサブトラクション(SS)による
音響エコーと定常雑音の同時除去 [O.Ichikawa,M.Nishimura(2005)]
system sound
speaker
Acoustic
Echo
interactive
system
Acoustic Echo Canceller
+ Spectral Subtraction
x(t)
microphone
(ex. car navigation)
x(t)
talker
speech
 スピーカより発生した音がシステム自身のマイクロフォン
により観測
音声認識精度の低下,システム誤動作の恐れ
DFT
adaptive filter
Wω(T)
音響エコーキャンセラ
Nω’(T)
Yω’(T) -
-
+ Mω(T)
Eω(T)
DFT
e(t)
+
s(t)
n(t)
 周波数上で適応フィルタとSS係数を同時に適応することで
音響エコーと定常雑音を効果的に除去
 時間領域において二次の射影法により音響エコーの抑圧
 周波数領域において音響エコーと定常雑音の同時抑圧
echo path
h(t)
m(t)
y(t)
micro
phone
s(t)
n(t)
x(t) = [x(t),x(t-1),…,x(t-L+1)]T , w’(t) = [w1’ (t),w2’ (t),…,wL’ (t)]T
擬似エコー: y’(t) = w’(t)T x(t)
誤差信号 : e(t) = y(t) - y’(t) → 0
となるようフィルタw’(t)を更新
 音響エコー発生経路の伝達系を適応フィルタにより推定
 擬似エコーを作成し観測信号から引くことで音響エコーを除去
 主な適応アルゴリズム
 NLMS(Normalized Least-Mean Square;学習同定法)
αe(t)
w’(t+1) = w’(t) +
x(t)
T
x (t) x(t) + β
・過去1つの入出力関係を満足するようにフィルタ係数を更新
・計算量が少なく簡易であるがフィルタ係数の収束が遅い
 二次の射影法
micro
phone
y(t)
評価実験
adaptive filter
w(t)
-
m(t)
処理の結合
 適応フィルタによる音響エコーキャンセラ
Acoustic Echo
Canceller
speaker x(t)
x(t)
y’(t)
echo path
h(t)
Xω(T)
研究目的
システムの音声認識精度を高めるための音響エコー除去
speaker
-1
e(t)
x(t)T x(t)
x(t)T x(t-1)
w’(t+1) = w’(t) + x(t) x(t-1)
x(t-1)T x(t) x(t-1)T x(t-1) (1-μ)e(t-1)
・過去2つの入出力関係を満足するようにフィルタ係数を更新
・NLMSに比べ計算量は多いがフィルタ係数の収束が速い
問題点
 音響エコー以外の雑音成分の存在
 エコーキャンセラでは定常雑音が除去できない
 適応フィルタによる音響エコー伝達系の推定精度の劣化
実験条件
 音響エコーの作成
RWCP 実環境音声・音響データベース内のインパルス応答
(無響,120ms,300ms)と音楽データを畳み込んで作成
 音響エコー + 目的音声に対して白色雑音をSNR10[db]で重畳
 各種パラメータ
 サンプリング:16000[Hz],16[bit]
 時間領域: タップ数L:256,ステップサイズα:1.0
 周波数領域: フレーム幅:128[ms],シフト幅,64[ms]
フレームタップ数:10,ステップサイズ:0.1
実験結果
 SN比による比較 (単位:dB)
残響時間
無響
120[ms]
300[ms]
無処理
1.02
1.38
-0.79
時間領域処理
7.74
7.79
5.11
+ 周波数領域処理
8.70
8.79
4.69
まとめ
 時間領域と周波数領域の両処理で音響エコーと定常雑音を抑圧
 現状にて,時間領域処理のみに比べ,SN比を約1[dB]改善
今後の方針
 周波数領域での二次の射影法を用いたエコーキャンセラの検討
 時間領域での処理と周波数領域での処理のより効果的な結合