ノイズ・キャンセル実験室

音声信号処理全集
ご購入はこちら
適応処理時代の
ダウンロード・データあります
ノイズ・キャンセル実験室
新連載
第
周波数領域ノイズ除去の基本中の基本…
川村 新
1 回 スペクトル・サブトラクション
20
瞬間的な値は予測できない
0.05
0
-0.05
-0.1
0
時刻 n
100 000
図 1 マイクで録音した静かな部屋の音の波形
10log10 X(k)2
(
x n)
0.1
0
ノイズの平均振幅はほぼ一定
静かな部屋では主となる音はマイクのノイズになる.各時刻の音を正確
に推定することは困難
-20
本連載では音声のノイズ除去に注目し,さまざまな
方式や,それらを実現するプログラムを紹介していき
ます.
今回は,最も基本的な周波数領域のノイズ除去手法
で あ る ス ペ ク ト ル・ サ ブ ト ラ ク シ ョ ン(Spectral
Subtraction)です.
原理
ノ イ ズ が 含 ま れ る 音 声 を F F T( F a s t F o u r i e r
Transform;高速フーリエ変換)すると,音声とノイ
ズの和のスペクトルが得られます.そこで,あらかじ
め計算しておいたノイズ・スペクトルを減算すること
で,ノイズを除去します.
● 音声にノイズがのった信号が観測されている
時刻 n における音声を s(n),ノイズを d(n)とし,
観測信号 x(n)を,
x(n)= s(n)+ d(n)
と定義します.ノイズは,環境ノイズに加え,マイク
ロホン自体の機器ノイズも含まれることとします.
図 1 は,筆者のノート PC に内蔵されているマイク
ロホンで,ボリュームを最大にし,環境音を録音した
波形です.部屋が静かだったので,主となる音はマイ
クのノイズです.つまり,
x(n)= d(n)
です.図 1 から想像できるように,各時刻でノイズの
「波形」を正確に推定し,除去することは困難です.
104
0
300
周波数番号k
図 2 ノイズの平均対数パワー・スペクトル
見やすいように,平均の│X(k )
│を対数パワー・スペクトルに変換している
● ノイズのスペクトルはほとんど変化しない
観測信号 x(n)を短い時間間隔(フレームと呼ぶ)で
FFT し,スペクトル X(k)を調べます.k はスペクト
ル番号です.X(k)は複素数なので,
X(k)= │X(k)│exp( j ∠ X(k))
と書けます.
こ こ で,j = -1 で す.│ │ は 絶 対 値 で,│X(k)│
は 振 幅 ス ペ ク ト ル と 呼 ば れ ま す. ∠ { } は 偏 角 で,
∠ X(k)は位相スペクトルと呼ばれます.
今回は,振幅スペクトル │X(k)│ のみを調べます.
1 フレームを 32ms として,図 1 の x(n)に対して順次
FFT を実行し,得られた振幅スペクトル │X(k)│ を平
均した結果を図 2 に示します.
● 観測信号からノイズの推定値を減算する
ノイズだけの観測信号から,あらかじめ平均的な振
幅スペクトル │X(k)│ を取得しておき,これをノイズ
推定値 │D(k)│ とします.音声とノイズが混在する観
測信号から │D(k)│ を減算すれば,ノイズを除去でき
ます.この方法をスペクトル・サブトラクションと呼
びます.
k 番目のスペクトル X(k)に対するスペクトル・サブ
(1)では,さ
関連特集:本誌 2016 年 6 月号「体感! 全集 CD 付き! 音声信号処理」
まざまな音声処理の方式と,それらを実現するプログラムを紹介しています.
2016 年 10 月号