音声信号処理全集 ご購入はこちら 適応処理時代の ダウンロード・データあります ノイズ・キャンセル実験室 新連載 第 周波数領域ノイズ除去の基本中の基本… 川村 新 1 回 スペクトル・サブトラクション 20 瞬間的な値は予測できない 0.05 0 -0.05 -0.1 0 時刻 n 100 000 図 1 マイクで録音した静かな部屋の音の波形 10log10 X(k)2 ( x n) 0.1 0 ノイズの平均振幅はほぼ一定 静かな部屋では主となる音はマイクのノイズになる.各時刻の音を正確 に推定することは困難 -20 本連載では音声のノイズ除去に注目し,さまざまな 方式や,それらを実現するプログラムを紹介していき ます. 今回は,最も基本的な周波数領域のノイズ除去手法 で あ る ス ペ ク ト ル・ サ ブ ト ラ ク シ ョ ン(Spectral Subtraction)です. 原理 ノ イ ズ が 含 ま れ る 音 声 を F F T( F a s t F o u r i e r Transform;高速フーリエ変換)すると,音声とノイ ズの和のスペクトルが得られます.そこで,あらかじ め計算しておいたノイズ・スペクトルを減算すること で,ノイズを除去します. ● 音声にノイズがのった信号が観測されている 時刻 n における音声を s(n),ノイズを d(n)とし, 観測信号 x(n)を, x(n)= s(n)+ d(n) と定義します.ノイズは,環境ノイズに加え,マイク ロホン自体の機器ノイズも含まれることとします. 図 1 は,筆者のノート PC に内蔵されているマイク ロホンで,ボリュームを最大にし,環境音を録音した 波形です.部屋が静かだったので,主となる音はマイ クのノイズです.つまり, x(n)= d(n) です.図 1 から想像できるように,各時刻でノイズの 「波形」を正確に推定し,除去することは困難です. 104 0 300 周波数番号k 図 2 ノイズの平均対数パワー・スペクトル 見やすいように,平均の│X(k ) │を対数パワー・スペクトルに変換している ● ノイズのスペクトルはほとんど変化しない 観測信号 x(n)を短い時間間隔(フレームと呼ぶ)で FFT し,スペクトル X(k)を調べます.k はスペクト ル番号です.X(k)は複素数なので, X(k)= │X(k)│exp( j ∠ X(k)) と書けます. こ こ で,j = -1 で す.│ │ は 絶 対 値 で,│X(k)│ は 振 幅 ス ペ ク ト ル と 呼 ば れ ま す. ∠ { } は 偏 角 で, ∠ X(k)は位相スペクトルと呼ばれます. 今回は,振幅スペクトル │X(k)│ のみを調べます. 1 フレームを 32ms として,図 1 の x(n)に対して順次 FFT を実行し,得られた振幅スペクトル │X(k)│ を平 均した結果を図 2 に示します. ● 観測信号からノイズの推定値を減算する ノイズだけの観測信号から,あらかじめ平均的な振 幅スペクトル │X(k)│ を取得しておき,これをノイズ 推定値 │D(k)│ とします.音声とノイズが混在する観 測信号から │D(k)│ を減算すれば,ノイズを除去でき ます.この方法をスペクトル・サブトラクションと呼 びます. k 番目のスペクトル X(k)に対するスペクトル・サブ (1)では,さ 関連特集:本誌 2016 年 6 月号「体感! 全集 CD 付き! 音声信号処理」 まざまな音声処理の方式と,それらを実現するプログラムを紹介しています. 2016 年 10 月号
© Copyright 2024 ExpyDoc