風雑音除去アルゴリズム

風雑音除去アルゴリズム
徳島大学工学部知能情報工学科
A1 グループ
学部4年 森陽司
研究の背景と目的

ホームビデオ等野外撮影機器の普及


⇒ 野外での録音機会の増加
野外録音における問題

⇒ 風雑音の影響
観測信号から風雑音の除去を行う
従来手法

ハードウェアによる雑音混入の防止


風防,マイクの形状
問題点


風雑音の混入を防ぐのみ
雑音混入の防止をしているものの,風雑音の
影響を受けてしまう
提案手法

ソフトウェアによる風雑音除去

⇒観測信号に風雑音が混入しても,
風雑音を除去し,希望信号を取り出すことが可能
風雑音について

風雑音のパワースペクトル
雑音除去手法


雑音特性により,最適な手法は異なる
風雑音はその形状特徴より,
SS(Spectral Subtraction)法を用いる
Spectral Subtraction

観測信号は雑音と信号の和と考える
y (t )  s (t )  n(t )
y (t ) : 観測信号, s (t ) : シグナル , n(t ) :ノイズ
Spectral Subtraction

観測信号のSTFT(short-time Fourier
transform)を以下のように定義する
jΦy (ω)
Y (k ,ω) | Y (k ,ω) | e
 S (k ,ω)  N (k ,ω)
S (k ,ω)  Y (k ,ω)  N (k ,ω)
Spectral Subtraction

フーリエ空間上で雑音の
振幅スペクトルの減算としてSSを定義
| Sˆ (k ,ω) || Y (k ,ω) | α| N (ω) |
Sˆ (k ,ω) : シグナルの予測スペク トル
N (ω) : 雑音の平均スペクトル
α: 定数
Spectral Subtractionの問題点

雑音の減算を行う際に雑音の平均を
用いている

⇒雑音の引きすぎ,消し残りが起こる
| Sˆ (k ,ω) || Y (k ,ω) | α| N (ω) |

この問題を解決するための研究が
現在もさかんに行われている
提案手法1

フレーム毎に雑音レベルの推定を行い,
推定レベルに応じて雑音を引き去る

⇒雑音の引き過ぎ,消し残りを防ぐ
| Sˆ (k ,ω) || Y (k ,ω) | α| N (ω) |
| Sˆ (k ,ω) || Y (k ,ω) | α(k ) | N (ω) |
α(k)の導出

観測信号において音声の影響の少ない
低域を利用しα(k)を導出する
 min  min{

 min :  (k )
(|
Y
(
k
,

)
|


|
N
(

)
|
)
}
i
i
i 0
l
2
予備実験1

観測信号から単に雑音の平均スペクトル
を引き去る

⇒(通常のSS)
| Sˆ (k ,ω) || Y (k ,ω) | α| N (ω) |

音声認識を用いて評価
予備実験1 実験結果


雑音除去後も雑音が残っていた
認識率の大きな低下の理由

⇒通常の音響モデルを使用
data
原音声
原音声+雑音
雑音除去後
Accuracy(%)
87.56
71.95
24.13
予備実験2

観測信号から既知の雑音を
フーリエ空間で引き去る

⇒(SSの上限)
| Y ( k ,ω) |  | N ( k ,ω) |
予備実験2 実験結果

雑音除去後も少量の雑音が残っていた


⇒SSを行う際の位相のずれが原因?
認識率は多少低下
data
Accuracy(%)
現音声
87.56
雑音除去後
81.88
提案手法1 実験結果

予備実験1よりも原音声に近いものの,
雑音除去後も雑音が消し残っていた
| Sˆ ( k ,ω) || Y ( k ,ω) | α| N (ω) |
| Sˆ ( k ,ω) || Y ( k ,ω) | α( k ) | N (ω) |

フレーム毎の雑音の振幅スペクトルを
雑音の平均の振幅スペクトルで
近似できない
| N (k ,  ) |  | N ( ) |
形状の異なる振幅スペクトル


26.28dB
33.10dB
提案手法2

風雑音のパワー毎に振幅スペクトルの
形状が異なると仮定


⇒仮定に基づき提案手法2を考案
提案手法1と異なり,複数の雑音モデル
を用意
提案手法2
1.
2.
3.
4.
5.
風雑音をパワーにより4状態(小,中,大,特大)に
大別する
各状態毎に平均の振幅スペクトルを算出し
雑音モデルを作成
観測信号より風雑音のパワー推定
パワーの推定値より雑音モデルを選択
α(k)を算出し,SS法を用いて雑音除去
| N low ( ) |, | N middle ( ) |, | N large ( ) |, | N very large ( ) |
風雑音パワー推定
1.
2.
観測信号において音声の影響が少ない
低域のパワースペクトルの和を算出
P.a.bとPの回帰直線を導出し観測信号か
ら風雑音のパワーを推定
P.a.b 
P 

|
Y
(
k
,

)
|
i
i a
b
 | N (k , 
i
i
)|
2
2
回帰直線導出過程

相関係数
rxy 

S xy
S xx S yy
⇒ x : P.a.b y : P
S xy : x, yの共分散 S xx : xの分散 S yy : yの分散
回帰直線導出過程

P.a.bとPの相関係数
Data
Noise
Noise+Signal
P0.2
0.995322 0.991081
P.03
0.999707 0.992129
P1.2
0.987963 0.967047
P1.3
0.991269 0.966876
回帰直線導出過程

回帰直線
y 

⇒
S xy
S xx
(x  x)  y
x : P.a.b y : P
S xy : x, yの共分散 x : xの平均 y : yの平均
回帰直線導出

導出した回帰直線
P.0.3より y  0.976253x  1069892170.7
P.1.2より y  1.219466 x  7543929480.6

この二つの回帰直線を利用し,
観測信号から風雑音のパワーを推定
提案手法2の実験結果


雑音除去後の音声データを比較すると
提案手法1の実験結果とあまり差は
なかった
風雑音のスペクトル形状はパワーに依存
しないことが分かった
現状,今後の予定


風雑音の分析を詳しく行っている
客観的評価の導入



板倉,斉藤距離
風雑音の調査のためのVQの
プログラムを作成
風雑音のみのデータに対し,
風雑音除去手法の確立を目指す