風雑音除去アルゴリズム 徳島大学工学部知能情報工学科 A1 グループ 学部4年 森陽司 研究の背景と目的 ホームビデオ等野外撮影機器の普及 ⇒ 野外での録音機会の増加 野外録音における問題 ⇒ 風雑音の影響 観測信号から風雑音の除去を行う 従来手法 ハードウェアによる雑音混入の防止 風防,マイクの形状 問題点 風雑音の混入を防ぐのみ 雑音混入の防止をしているものの,風雑音の 影響を受けてしまう 提案手法 ソフトウェアによる風雑音除去 ⇒観測信号に風雑音が混入しても, 風雑音を除去し,希望信号を取り出すことが可能 風雑音について 風雑音のパワースペクトル 雑音除去手法 雑音特性により,最適な手法は異なる 風雑音はその形状特徴より, SS(Spectral Subtraction)法を用いる Spectral Subtraction 観測信号は雑音と信号の和と考える y (t ) s (t ) n(t ) y (t ) : 観測信号, s (t ) : シグナル , n(t ) :ノイズ Spectral Subtraction 観測信号のSTFT(short-time Fourier transform)を以下のように定義する jΦy (ω) Y (k ,ω) | Y (k ,ω) | e S (k ,ω) N (k ,ω) S (k ,ω) Y (k ,ω) N (k ,ω) Spectral Subtraction フーリエ空間上で雑音の 振幅スペクトルの減算としてSSを定義 | Sˆ (k ,ω) || Y (k ,ω) | α| N (ω) | Sˆ (k ,ω) : シグナルの予測スペク トル N (ω) : 雑音の平均スペクトル α: 定数 Spectral Subtractionの問題点 雑音の減算を行う際に雑音の平均を 用いている ⇒雑音の引きすぎ,消し残りが起こる | Sˆ (k ,ω) || Y (k ,ω) | α| N (ω) | この問題を解決するための研究が 現在もさかんに行われている 提案手法1 フレーム毎に雑音レベルの推定を行い, 推定レベルに応じて雑音を引き去る ⇒雑音の引き過ぎ,消し残りを防ぐ | Sˆ (k ,ω) || Y (k ,ω) | α| N (ω) | | Sˆ (k ,ω) || Y (k ,ω) | α(k ) | N (ω) | α(k)の導出 観測信号において音声の影響の少ない 低域を利用しα(k)を導出する min min{ min : (k ) (| Y ( k , ) | | N ( ) | ) } i i i 0 l 2 予備実験1 観測信号から単に雑音の平均スペクトル を引き去る ⇒(通常のSS) | Sˆ (k ,ω) || Y (k ,ω) | α| N (ω) | 音声認識を用いて評価 予備実験1 実験結果 雑音除去後も雑音が残っていた 認識率の大きな低下の理由 ⇒通常の音響モデルを使用 data 原音声 原音声+雑音 雑音除去後 Accuracy(%) 87.56 71.95 24.13 予備実験2 観測信号から既知の雑音を フーリエ空間で引き去る ⇒(SSの上限) | Y ( k ,ω) | | N ( k ,ω) | 予備実験2 実験結果 雑音除去後も少量の雑音が残っていた ⇒SSを行う際の位相のずれが原因? 認識率は多少低下 data Accuracy(%) 現音声 87.56 雑音除去後 81.88 提案手法1 実験結果 予備実験1よりも原音声に近いものの, 雑音除去後も雑音が消し残っていた | Sˆ ( k ,ω) || Y ( k ,ω) | α| N (ω) | | Sˆ ( k ,ω) || Y ( k ,ω) | α( k ) | N (ω) | フレーム毎の雑音の振幅スペクトルを 雑音の平均の振幅スペクトルで 近似できない | N (k , ) | | N ( ) | 形状の異なる振幅スペクトル 26.28dB 33.10dB 提案手法2 風雑音のパワー毎に振幅スペクトルの 形状が異なると仮定 ⇒仮定に基づき提案手法2を考案 提案手法1と異なり,複数の雑音モデル を用意 提案手法2 1. 2. 3. 4. 5. 風雑音をパワーにより4状態(小,中,大,特大)に 大別する 各状態毎に平均の振幅スペクトルを算出し 雑音モデルを作成 観測信号より風雑音のパワー推定 パワーの推定値より雑音モデルを選択 α(k)を算出し,SS法を用いて雑音除去 | N low ( ) |, | N middle ( ) |, | N large ( ) |, | N very large ( ) | 風雑音パワー推定 1. 2. 観測信号において音声の影響が少ない 低域のパワースペクトルの和を算出 P.a.bとPの回帰直線を導出し観測信号か ら風雑音のパワーを推定 P.a.b P | Y ( k , ) | i i a b | N (k , i i )| 2 2 回帰直線導出過程 相関係数 rxy S xy S xx S yy ⇒ x : P.a.b y : P S xy : x, yの共分散 S xx : xの分散 S yy : yの分散 回帰直線導出過程 P.a.bとPの相関係数 Data Noise Noise+Signal P0.2 0.995322 0.991081 P.03 0.999707 0.992129 P1.2 0.987963 0.967047 P1.3 0.991269 0.966876 回帰直線導出過程 回帰直線 y ⇒ S xy S xx (x x) y x : P.a.b y : P S xy : x, yの共分散 x : xの平均 y : yの平均 回帰直線導出 導出した回帰直線 P.0.3より y 0.976253x 1069892170.7 P.1.2より y 1.219466 x 7543929480.6 この二つの回帰直線を利用し, 観測信号から風雑音のパワーを推定 提案手法2の実験結果 雑音除去後の音声データを比較すると 提案手法1の実験結果とあまり差は なかった 風雑音のスペクトル形状はパワーに依存 しないことが分かった 現状,今後の予定 風雑音の分析を詳しく行っている 客観的評価の導入 板倉,斉藤距離 風雑音の調査のためのVQの プログラムを作成 風雑音のみのデータに対し, 風雑音除去手法の確立を目指す
© Copyright 2024 ExpyDoc