近傍周波数一括処理 ICA によるブラインド音源分離の 後 - FICH-UNL

sinc(i) Research Center for Signals, Systems and Computational Intelligence (fich.unl.edu.ar/sinc)
Tadashige Noguchi, Kenko Ohta, L. Di Persia & Masuzo Yanagida; "Effects of Wiener Filter on Blind Source Separation by processing on sequentially connected bins"
IEICE, No. 240, 2007.
社団法人 電子情報通信学会
THE INSTITUTE OF ELECTRONICS,
INFORMATION AND COMMUNICATION ENGINEERS
信学技報
TECHNICAL REPORT OF IEICE
近傍周波数一括処理 ICA によるブラインド音源分離の
後処理としての Wiener フィルタの効果
野口
忠繁† 大田 健紘† レアンドロ・ディ・ペルシア‡
柳田 益造†
†同志社大学工学部 〒610-0321 京都府京田辺市多々羅都谷 1-3
‡エントレリオス国立大学 アルゼンチン
E-mail:
†(dtg0731,etf1704,myanagid)@mail.doshisha.ac.jp
パラナー市
‡[email protected],
従来の周波数領域 ICA では,周波数ビン毎に分離を行っており,周波数ビンの入れ替わりが発生する.
これはパーミュテーション問題と呼ばれ,分離実行後に音源について並べ替えを行う必要がある.この問題を避け
るために,全周波数ビンを連結して1本のベクトルと考えて分離を行う Permutation Free-ICA(PF-ICA)が提案さ
れている.この手法では周波数ビンの入れ替わりが生じない利点があるものの,分離行列を周波数ビン毎に考慮す
ることができないという欠点がある.本報告では,ICA の後処理として時間周波数領域で Wiener フィルタを適用
することによってこの欠点を克服し,周波数毎の特性を考慮できるようにしている.Wiener フィルタの適用によ
る効果はセグメンタル SNR・PESQ の2つの評価指標で評価している.
ブラインド音源分離,独立成分分析,パーミュテーション問題,Wiener フィルタ
Effects of Wiener Filter on Blind Source Separation
by processing on sequentially connected bins
Tadashige NOGUCHI†
Kenko OTA†
Leandro Di Persia‡
and Masuzo YANAGIDA†
†Faculty of Engineering, Doshisha University 1-3 Tatara-Miyakodani, Kyotanabe, Kyoto, 610-0321 Japan
‡Universidad Nacional de Entre Ríos, Paraná, Argentina
E-mail:
†(dtg0731,etf1704, myanagid)@mail.doshisha.ac.jp
‡[email protected]
Permutation-Free ICA is a method that can avoid so-callled “Permutation problem” that appears in
conventional frequency-domain ICA due to indeterminicity among source identity in each frequency bin.
Permutation-Free ICA carries out separation on a set of long vectors consisting of connected temporal changes
of frequency components of the received signal. The separation matrix obtained in Permutation-Free ICA,
however, has common directivity for all frequency bins. Applying Wiener Filter on a resultant signal of Blind
Source Separation, frequency characteristics of the separation matrix are thought to be taken into account. In
this paper, effects of applying Wiener Filter after Blind Source Separation are evaluated using segmental SNR
and PESQ as evaluation indeces.
Blind Source Separation, Independent Component Analysis, Permutation Problem, Wiener Filter
sinc(i) Research Center for Signals, Systems and Computational Intelligence (fich.unl.edu.ar/sinc)
Tadashige Noguchi, Kenko Ohta, L. Di Persia & Masuzo Yanagida; "Effects of Wiener Filter on Blind Source Separation by processing on sequentially connected bins"
IEICE, No. 240, 2007.
1.
近 年 , ブ ラ イ ン ド 音 源 分 離 ( BSS : Blind
Source Separation) に つ い て の 研 究 が 盛 ん に
行 わ れ て い る .ブ ラ イ ン ド 音 源 分 離 は ,音 源 信
号や混合過程に関する情報が未知であるとい
う 状 況 に お い て ,マ イ ク ロ ホ ン で 観 測 し た 複 数
の信号を分離して音源信号を推定する技術で
あ る . 独 立 成 分 分 析 ( ICA : Independent
Component Analysis) は , BSS を 実 現 す る 手
法 の 一 つ で あ り ,瞬 時 混 合 の 問 題 に 対 し て は 十
分 な 分 離 性 能 が 得 ら れ て い る [1].し か し ,実 環
境では壁や床などによる反射の影響を受ける
た め ,混 合 過 程 が 瞬 時 混 合 で な く 畳 み 込 み 混 合
に な っ て し ま う .そ こ で ,一 般 に は 信 号 を 時 間
領 域 か ら 周 波 数 領 域 に 変 換 し て ,分 離 処 理 を 実
行 す る 周 波 数 領 域 ICA に よ っ て ,残 響 に 対 処 し
て い る [2][3].
し か し , BSS に 周 波 数 領 域 ICA を 適 用 し た
場合,周波数ビン毎に分離を行うことになり,
周波数ビン間で分離した信号の入れ替わりが
発 生 す る 可 能 性 が あ る .こ れ が パ ー ミ ュ テ ー シ
ョ ン 問 題 と 呼 ば れ る も の で あ る .そ こ で ,各 チ
ャネルの周波数ビンの入れ替わりを正しく並
び 替 え る 必 要 が あ り ,こ れ ま で に 様 々 な 解 決 策
が 提 案 さ れ て い る [2][4]. ま た , パ ー ミ ュ テ ー
シ ョ ン 問 題 を 回 避 す る 手 法 と し て は Kim et
al .[5]に よ る も の が あ る . こ の 手 法 は , 分 離 行
列を学習するためのコスト関数を多変量関数
に 拡 張 す る こ と に よ り ,パ ー ミ ュ テ ー シ ョ ン 問
題を回避している.
Di Persia ら は , パ ー ミ ュ テ ー シ ョ ン 問 題 を
避 け る た め に ,全 周 波 数 ビ ン を 連 結 し て 1 本 の
ベ ク ト ル と 考 え て 分 離 を 行 う Permutation
-Free ICA( PF-ICA) を 提 案 し て い る [6][7].
し か し ,こ の 手 法 で は 求 ま る 分 離 行 列 が す べ て
の周波数ビンについて共通のもの 1 つだけにな
る の で ,分 離 行 列 の 周 波 数 特 性 を 考 慮 す る こ と
ができないという欠点があった.本研究では,
PF-ICA の 後 処 理 と し て , 時 間 周 波 数 領 域 で 周
波数ビン毎,あるいは時間フレーム毎に
Wiener フ ィ ル タ を 適 用 す る こ と に よ っ て ,
PF-ICA で は 考 慮 で き な か っ た 周 波 数 特 性 を い
くらか救済する手法を提案する.
周 波 数 領 域 ICA は M 個 の マ イ ク ロ ホ ン で の
観 測 信 号 x(t) = [x 1 (t),x 2 (t),… ,x M (t)] T の 第 k フ レ
ームの短時間フーリエ変換により得られた観
測 信 号 の ベ ク ト ル X(f,k)=[X 1 (f,k),X 2 (f,k), … ,
X M (f,k)] T に 対 し て , 周 波 数 ビ ン f に お い て 学 習
さ れ た 分 離 行 列 W(f)を 用 い て 分 離 を 行 う .分 離
行 列 を 得 る 方 法 に は 様 々 な も の が あ る が ,本 研
究 で は JADE( Joint Approximate Diagonaliz-
ation of Eigenmatrices)を 用 い る [8].こ こ で ,
Y(f,k)を 分 離 さ れ た 信 号 の ベ ク ト ル と す る と 分
離過程は,
Y(f,k)= W(f) X(f,k)
(1)
と表される.
周 波 数 領 域 ICA で は 音 源 信 号 が 互 い に 独 立
で あ る と い う 仮 定 に 基 づ き ,各 周 波 数 ビ ン 毎 に
分離後の信号がそれぞれ独立となるように分
離 行 列 W(f)を 最 適 化 す る .そ の た め ,W(f)の 行
が 入 れ 替 わ っ て も ,Y(f,k)の 各 行 の 独 立 性 は 保 た
れ る の で ,あ る 周 波 数 f n と f n+1 に お い て ,Y(f n ,k)
と Y(f n+1 ,k)の 各 行 が 必 ず し も 同 じ 音 源 に 対 応 し
て い る と は 限 ら ず ,本 来 対 応 す る は ず の 音 源 が
別の音源のものと入れ替わっている可能性が
あ る .パ ー ミ ュ テ ー シ ョ ン 問 題 と は ,周 波 数 ビ
ンによって入れ替わった分離信号の音源番号
を整列させる問題である.従来の周波数領域
ICA で は 分 離 後 に 必 ず パ ー ミ ュ テ ー シ ョ ン 問
題 を 解 決 し な け れ ば な ら ず ,こ れ に 対 し て 多 様
な 手 法 が 提 案 さ れ て い る [2][4]. し か し , こ の
問 題 は 完 全 に は 解 決 さ れ て お ら ず ,本 質 的 に 並
び替えに失敗する可能性がある.
(
)
Di Persia ら は , パ ー ミ ュ テ ー シ ョ ン 問 題 を
避 け る た め に ,周 波 数 ビ ン の 入 れ 替 わ り が 本 質
的 に 発 生 し な い PF-ICA を 提 案 し た [6][7]. こ
の 手 法 で は ,分 離 行 列 を 生 成 す る 際 に 発 生 す る
パ ー ミ ュ テ ー シ ョ ン 問 題 を 避 け る た め ,分 離 行
列生成過程の前後でパーミュテーションの発
生 を 避 け る 処 理 を 行 っ て い る .具 体 的 に は ,時
間 -周 波 数 領 域 に お け る 観 測 信 号 の 各 周 波 数 ビ
ン を f 1 , f 2 ,… , f n ,… , f N の 順 に 連 結 し て ,全 周 波 数
ビ ン を 一 本 の ベ ク ト ル と し て 扱 い ,分 離 の 際 に
使 用 す る 観 測 行 列 X PF を 以 下 の よ う に 作 成 す る .
X P F =[ X 1 P F , X 2 P F ,… ,X m P F ,… , X M P F ] T
(2)
た だ し , X m P F =[ X m (f 1 ), X m (f 2 ),… ,X m (f N )] T
X m (f n ) =[ X m (f n ,1), X m (f n ,2),… , X m (f n ,K) ]
こ こ で , K は 全 フ レ ー ム 数 , X m (f n )は m 番 目 の
マ イ ク ロ ホ ン で 観 測 し た 周 波 数 ビ ン fn の フ レ ー
ム 時 系 列 , X mPF は X m (f 1 ),X m (f 2 ) ,… ,X m (f N )を 連 結
したベクトルを表している.
こ の 処 理 を 図 1 に 示 す .図 1 の 左 図 は ,時 間
-周 波 数 領 域 上 で の 各 周 波 数 ビ ン を 表 し て お り ,
各 周 波 数 ビ ン を 連 結 し ,右 の よ う に マ イ ク ロ ホ
ン毎に1本のベクトルを生成する.
そ し て ,M 本 の ベ ク ト ル に 対 し て 分 離 を 実 行
し , 次 の よ う に 分 離 信 号 Y PF を 求 め る .
sinc(i) Research Center for Signals, Systems and Computational Intelligence (fich.unl.edu.ar/sinc)
Tadashige Noguchi, Kenko Ohta, L. Di Persia & Masuzo Yanagida; "Effects of Wiener Filter on Blind Source Separation by processing on sequentially connected bins"
IEICE, No. 240, 2007.
Y PF = W X PF
(3)
但 し ,W は PF-ICA で 用 い ら れ る 分 離 行 列 で
あ り ,全 て の 周 波 数 で 同 じ W を 用 い る .こ の よ
うにして求められた l 番目の音源ベクトル
Y lPF =[Y lPF (1),Y lPF (2),… ,Y lPF (NK)]を 各 周 波 数 ビ ン
Y l (f 1 ),Y l (f 2 ),… ,Y l (f n ),… , Y l (f N )に 分 割 し ,信 号 を 時
間 -周 波 数 領 域 に 戻 す .
Y l (f 1 )=[Y l P F (1), Y l P F (2),… , Y lP F (K)]
Y l (f 2 )=[Y l P F (K+1), Y l P F (K+2),… , Y l P F (2K)]
(4)
:
Y l (f n )=[Y l P F ((n-1)K+1),Y lP F ((n-1)K+2),… ,Y lP F (nK)]
:
Y l (f N )=[Y l P F ((N-1)K+1),Y lP F ((N-1)K+2),… ,Y lP F (NK)]
こ の 手 法 で は ,全 て の 周 波 数 ビ ン を 一 括 し て
処 理 す る た め ,各 周 波 数 ビ ン に お い て 音 源 番 号
を 並 べ 替 え る 必 要 が な く な る .つ ま り ,パ ー ミ
ュ テ ー シ ョ ン 問 題 を 回 避 し た こ と に な る .し か
し ,こ の 手 法 で は 全 て の 周 波 数 に お い て 同 じ 分
離行列 W を用いて分離を行うことになるため,
壁からの反射などによって生じる周波数毎の
特 性 を 考 慮 す る こ と が で き ず ,必 ず し も 最 適 な
分離結果が得られるとは限らない.なぜなら,
PF-ICA で は (音 源 数 )×(マ イ ク ロ ホ ン 数 )の サ
イズの分離行列を 1 つ推定するだけであるから
である.
誤 差 En ( f , k ) を ス ペ ク ト ル 表 示 す る と 以 下 の よ
うになる.
Es ( f , k ) = H ( f , k )S ( f , k ) − S ( f , k )
(5)
= (H ( f , k ) - 1)S ( f , k )
En ( f , k ) = N ( f , k )H ( f , k )
(6)
こ れ ら の パ ワ ー ス ペ ク ト ル を PEs ( f , k ) ,
PEn ( f , k ) と す る と ,入 力 信 号 s (t)と 出 力 信 号 sˆ (t)
の 誤 差 e(t)の 2 乗 平 均 は , Parseval の 等 式 か ら
パワースペクトル密度を全周波数で積分した
ものに比例する.
e 2 (t ) = ∫
∞
−∞
[ {H ( f , k ) − 1}{H ∗ ( f , k ) − 1} Ps ( f , k )
+ H ( f , k ) H ∗ ( f , k ) Pn ( f , k ) ]df
(7)
こ の 値 を 最 小 に す る H(f,k)を 考 え る と , ∫ 内 を
H で微分して 0 とおくことにより,
H ( f , k) =
Ps ( f , k )
Ps ( f , k ) + Pn ( f , k )
(8)
と な る . こ れ を Wiener フ ィ ル タ と い う .
図 2. Wiener フ ィ ル タ
図 1. 1 本 の マ イ ク ロ ホ ン の 観 測 信 号 に つ い て ,
時 間 周 波 数 領 域 の 信 号 か ら PF-ICA の 分
離で用いるベクトルへの変換
雑音の中にある信号をできるだけ正確に選
び 出 す フ ィ ル タ 特 性 H を 考 え る (図 2). 入 力 信
号 の パ ワ ー ス ペ ク ト ル Ps ( f , k ) と 存 在 し て い る
雑 音 の パ ワ ー ス ペ ク ト ル Pn ( f , k ) は 既 知 の も の
と す る .こ こ で 信 号 自 体 か ら 生 ず る 誤 差 E s ( f , k )
と 雑 音 n(t)の ス ペ ク ト ル N ( f , k ) に よ り 発 生 す る
こ こ で ,PF-ICA の 後 処 理 と し て ,時 間 -周 波
数 領 域 で Wiener フ ィ ル タ を 適 用 す る こ と を 提
案 す る .こ の フ ィ ル タ を 適 用 す る こ と に よ っ て ,
PF-ICA の 周 波 数 特 性 を 考 慮 で き な か っ た 欠 点
を 補 う .こ こ で 簡 単 化 の た め ,音 源・マ イ ク ロ
ホンの数をそれぞれ 2 とする.
Wiener フ ィ ル タ を 用 い る 場 合 , 本 来 は 目 的
信号と雑音信号のパワースペクトルが既知で
な く て は な ら な い が ,BSS に お い て は ,目 的 ・
雑音信号に関する事前情報は一切未知である.
そ こ で ,PF-ICA に よ っ て 得 ら れ た 分 離 信 号 Y 1 ,
Y 2 は 完 全 で は な い が あ る 程 度 目 的・雑 音 信 号 に
近 い と 考 え て ,分 離 信 号 Y 1 ,Y 2 の パ ワ ー ス ペ ク
ト ル PY1 ( f , k ) と PY2 ( f , k ) を 目 的 ・ 雑 音 信 号 の パ ワ
ー ス ペ ク ト ル Ps ( f , k ) , Pn ( f , k ) と し て 用 い て ,
Wiener フ ィ ル タ を
sinc(i) Research Center for Signals, Systems and Computational Intelligence (fich.unl.edu.ar/sinc)
Tadashige Noguchi, Kenko Ohta, L. Di Persia & Masuzo Yanagida; "Effects of Wiener Filter on Blind Source Separation by processing on sequentially connected bins"
IEICE, No. 240, 2007.
H W1 ( f , k ) =
H W2 ( f , k ) =
PY1 ( f , k )
(9)
PY1 ( f , k ) + CPY2 ( f , k )
PY2 ( f , k )
(10)
PY2 ( f , k ) + CPY1 ( f , k )
の よ う に 設 計 す る .こ こ で ,分 離 結 果 の 一 方 を
目的音,他方を雑音としてフィルタを設計し,
次に目的音と雑音を入れ替えてフィルタを設
計 す る .BSS に よ る 分 離 が 不 十 分 な 場 合 ,分 離
処 理 に よ っ て 推 定 し た 信 号 Y1 と Y2 に お い て ,
雑音信号の中にも目的信号が含まれているた
め ,過 度 の 減 算 を 行 っ て し ま う 場 合 が あ る .こ
れ を 避 け る た め に ,式 (9)(10)の フ ィ ル タ を 設 計
す る 際 に ,次 の よ う な 分 離 信 号 の 相 関 C を 用 い
ている.
音 声 の 収 録 は ,一 般 家 庭 の リ ビ ン グ ル ー ム を
想 定 し た 部 屋 (幅 230cm×奥 行 き 380cm×高 さ
218cm)で 行 っ た . Time Stretched Pulse を 用
い て 測 定 し た 部 屋 の 残 響 時 間 は 370ms で あ る .
音 源( ス ピ ー カ )と 観 測 点( マ イ ク ロ ホ ン )の
配 置 を 図 4 に 示 す .観 測 点 は 固 定 し ,音 源 の 配
置 は 観 測 点 を 中 心 に -30°,0°,60°(時 計 回 り
を 正 )と な る よ う に し ,そ れ ぞ れ の 配 置 を L,M,
R と す る .ま た ,マ イ ク ロ ホ ン の 間 隔 は 5cm と
し た . 今 回 使 用 し た 音 源 デ ー タ を 表 1, 音 響 分
析条件を表 2 に示す.
表1
音源データ
3
5
3
2
300
C( f ) =
Y1 ( f , k ) ・Y 2 ( f , k )
3
(11)
(M-L,M-R,L-R)
Y1 ( f , k ) Y2 ( f , k )
1.25
PF-ICA の 後 処 理 と し て Wiener フ ィ ル タ を
適用する提案法全体の処理の流れを図 3 に示す.
表2
音響分析条件
16ksamples/sec
16bits
1024
512
図 3. 提 案 法 全 体 の 処 理 の 流 れ
式 (9)(10)で は Wiener フ ィ ル タ を 適 用 す る 際
に ,周 波 数 毎 に フ ィ ル タ を 設 計 し て い る .し か
し ,一 般 的 に ア レ イ 処 理 で は 低 周 波 領 域 で の 分
離 精 度 が 悪 い た め ,周 波 数 毎 に フ ィ ル タ を 設 計
す る よ り も ,低 周 波 領 域・高 周 波 領 域 を そ れ ぞ
れ別の方法でフィルタを設計する方が効果的
で あ る と 考 え ら れ る .そ こ で ,低 周 波 領 域 で は ,
式 (9)(10)を 用 い て 設 計 し た Wiener フ ィ ル タ を
そ の ま ま 適 用 せ ず に ,高 周 波 領 域 で 求 め た フ ィ
ル タ を 利 用 し て ,次 の よ う に 低 周 波 領 域 の フ ィ
ル タ を 設 計 す る .あ る 周 波 数 f H 以 上 の フ ィ ル タ
係 数 H Wj ( f n ) を 利 用 し て ,あ る 周 波 数 f L 以 下 の フ
(単 位 : cm)
図 4. 収 録 環 境
ィ ル タ H Wj ( f L ) を 次 の よ う に 設 計 す る .
N
1
H Wj ( f L , k ) =
H Wj ( f n , k )
∑
N − H + 1 n= H
j=1,2
(12)
こ こ で , f L+1 以 上 の 周 波 数 に つ い て は , 式
(9)(10) に よ っ て 周 波 数 毎 に 設 計 し た フ ィ ル タ
H Wj ( f n ) を 用 い る .
評 価 指 標 に は ,セ グ メ ン タ ル SNR (Signal to
Noise Ratio)と PESQ (Perceptual Evaluation
of Speech Quality)を 用 い た [10].
セ グ メ ン タ ル SNR は , 等 間 隔 の 周 波 数 軸 上
で目的信号に対する雑音信号のパワーの比を
表 し て お り , 式 (13)の よ う に 定 義 さ れ て い る .
sinc(i) Research Center for Signals, Systems and Computational Intelligence (fich.unl.edu.ar/sinc)
Tadashige Noguchi, Kenko Ohta, L. Di Persia & Masuzo Yanagida; "Effects of Wiener Filter on Blind Source Separation by processing on sequentially connected bins"
IEICE, No. 240, 2007.
SNR(k ) =
∫ S( f , k)
∫
2
df
2
(13)
S ( f , k ) − Z ( f , k ) df
こ こ で S ( f , k ), Z ( f , k ) は そ れ ぞ れ 音 源 信 号 s (t ) と 評
価 対 象 信 号 z (t ) の フ ー リ エ 変 換 で あ る . 評 価 対
象 は , X , Y , Yˆ で あ る .
PESQ
は , ITU-T(Telecommunication
Standardization Sector of the International
Telecommunication Union)で 勧 告 さ れ て い る
規 格 で あ り ,信 号 に 対 し て 人 間 の 知 覚 特 性 を 考
慮 し た 処 理 を 施 し て お り ,被 験 者 が 音 を 聞 い て
評 価 す る 主 観 音 質 評 価 の 1 つ で あ る , MOS
( Mean Opinion Score)と 高 い 相 関 が あ る .こ
こ で , MOS 値 は 1(悪 い )∼ 5(良 い )の 値 を と り ,
PESQ 値 は -0.5∼ 4.5 の 値 を と る .PESQ を 用 い
て 評 価 す る こ と は ,客 観 音 質 評 価 に よ っ て ,人
が知覚した時の主観評価に近い結果が得られ
る と い う こ と で あ る .こ こ で ,PESQ で は ,以
下 の 処 理 を 行 う こ と に よ っ て ,人 間 の 知 覚 特 性
を考慮している.
・ 高 域・低 域 の 周 波 数 分 解 能 の 違 い に 対 応
するために,間隔が非線形な周波数軸
(バ ー ク ス ケ ー ル )に 変 換 す る
・ スペクトル強度のスケールを人間が感
じ る 音 の 強 さ (ラ ウ ド ネ ス ス ケ ー ル )の 感
度に変換する
図 7. SNR に よ る 比 較 (男 女 別 組 み 合 わ せ )
図 8. PESQ に よ る 比 較 (男 女 別 組 み 合 わ せ )
PF-ICA の 後 処 理 と し て , 式 (9)(10)を 用 い て
周 波 数 毎 に Wiener フ ィ ル タ を 設 計 す る 方 法 を
提 案 法 1 と し , 低 周 波 領 域 に 式 (12) を 用 い て
Wiener フ ィ ル タ を 設 計 す る 方 法 を 提 案 法 2 と
す る . こ こ で , f L =2000Hz, f H =4000Hz と し ,
2000Hz 以 下 の 周 波 数 を 低 周 波 領 域 , 4000Hz
以 上 の 周 波 数 を 高 周 波 領 域 と し て Wiener フ ィ
ルタを適用した.
図 5. SNR に よ る 比 較
図 6. PESQ に よ る 比 較
混 合 音 声 と 混 合 音 声 に PF-ICA, 提 案 法 1 ,
提案法2それぞれを適用した時の分離信号の
セ グ メ ン タ ル SNR,PESQ の 各 配 置 に お け る 結
果 の 平 均 を そ れ ぞ れ 図 5,6 に 示 す . ま た , 男 女
別 の 組 み 合 わ せ に つ い て の 結 果 の 平 均 を 図 7,8
に示す.
図 5 の 結 果 よ り L-R の 配 置 で は , SNR の 改
善 が ほ と ん ど な い が ,M-L・M-R の 配 置 で は 提
案 法 に よ っ て SNR・PESQ が 改 善 さ れ て い る こ
と が わ か る . M-R の 配 置 で , PF-ICA と 提 案 法
1 の SNR を 比 較 す る と 0.6dB 程 度 , 提 案 法 2
と 比 較 す る と 1.3dB 程 度 改 善 さ れ て い る .さ ら
sinc(i) Research Center for Signals, Systems and Computational Intelligence (fich.unl.edu.ar/sinc)
Tadashige Noguchi, Kenko Ohta, L. Di Persia & Masuzo Yanagida; "Effects of Wiener Filter on Blind Source Separation by processing on sequentially connected bins"
IEICE, No. 240, 2007.
に ,図 7 か ら 同 じ 配 置 で 男 女 の 組 み 合 わ せ に よ
る SNR の 改 善 の 傾 向 は ほ と ん ど 同 じ で あ っ た .
ま た ,図 5,6 の 結 果 よ り M-L,M-R の 配 置 で
は , PESQ と SNR は 同 じ よ う な 傾 向 に な っ て
い る こ と が わ か る . PF-ICA と 提 案 法 の PESQ
値 を 比 較 す る と , わ ず か 0.06∼ 0.15 程 度 で あ
る が , 有 意 水 準 5% で の t 検 定 の 結 果 , 有 意 に
改 善 し て い る こ と が わ か っ た .さ ら に ,図 8 よ
り ど の よ う な 男 女 の 組 み 合 わ せ で も , PF-ICA
と 提 案 法 に お い て PESQ 値 が 改 善 し て い る こ
とがわかる.
図 5∼ 8 よ り ,PF-ICA の 後 処 理 に Wiener フ
ィ ル タ を 適 用 す る と ,分 離 精 度 が 向 上 す る こ と
が わ か っ た .さ ら に ,信 号 と 雑 音 の 比 の み で 評
価 す る SNR だ け で な く , 人 間 の 知 覚 特 性 を 考
慮 し て 評 価 を 行 う PESQ 値 も t 検 定 で 有 意 な 差
があり,わずかだが向上していると言える.
また,男女の組み合わせによる比較では,
SNR は 男 女 の 組 み 合 わ せ に 関 係 な く 同 じ よ う
な 傾 向 に な っ て い る の に 対 し て ,PESQ で は 男
-男 の 組 み 合 わ せ が 聞 こ え や す い と い う 結 果 に
なった.
さらに,提案法1のように周波数毎に
Wiener フ ィ ル タ を 設 計 す る よ り も , 提 案 法 2
のように高周波領域のフィルタを利用して低
周 波 領 域 の フ ィ ル タ を 設 計 し た 方 が ,フ ィ ル タ
の 効 果 が 高 く な っ た . こ れ よ り , Wiener フ ィ
ル タ を 適 用 す る 際 に ,大 き く 高 周 波 領 域 と 低 周
波領域に分けてフィルタ係数の設計するだけ
で十分効果的であることがわかる.
低 周 波 領 域 で Wiener フ ィ ル タ を 適 用 す る 際
に ,高 周 波 領 域 で の フ ィ ル タ 係 数 を 用 い る と 効
果 的 で あ る こ と が わ か っ た . 本 稿 で は 4000Hz
以上の高周波領域のフィルタについての平均
を 2000Hz 以 下 の 低 周 波 領 域 の フ ィ ル タ と し た
だ け で あ っ た .そ こ で ,境 界 周 波 数 を ど の よ う
に 設 定 す る か な ど , 低 周 波 領 域 で の Wiener フ
ィルタの設計方法をさらに検討する必要があ
る.さらに,本稿は周波数毎に時間方向に
Wiener フ ィ ル タ を 適 用 し た だ け で あ っ た が ,
フ レ ー ム 毎 に 周 波 数 方 向 に も Wiener フ ィ ル タ
を適用することも検討したい.
ま た , Wiener フ ィ ル タ を 適 用 す る 際 に 入 力
信 号・雑 音 信 号 を PF-ICA の 分 離 結 果 と 仮 定 し
た た め , PF-ICA の 分 離 精 度 が 悪 い と Wiener
フィルタの効果が小さいと考えられる.
PF-ICA の 分 離 精 度 を 向 上 さ せ れ ば ,Wiener フ
ィ ル タ 設 計 に 利 用 す る 信 号 は 本 来 の 入 力・雑 音
信 号 に 近 づ き , Wiener フ ィ ル タ の 効 果 も 大 き
く な る は ず で あ る . PF-ICA で は 全 周 波 数 を 一
括 で 処 理 し て い る が ,音 声 信 号 は 低 周 波 領 域 の
パ ワ ー が 強 い た め ,分 離 行 列 が ほ と ん ど 低 周 波
数の情報によって決定されるため,今後は
PF-ICA の 前 処 理 と し て , ハ イ パ ス フ ィ ル タ を
適 用 す る な ど の 処 理 を 行 い , PF-ICA 自 体 の 分
離精度を向上させる手法を検討したい.
本研究の一部は同志社大学学術フロン
テ ィ ア 事 業「 人 間 と 生 物 の 賢 さ の 解 明 と そ の 応
用」の援助を受けた.
[1] T.W.Lee: “Independent Component Analysis”,
Kluewer, 1998.
[2] S.Ikeda, and N.Murata:
“A method of ICA in time-frequency domain”,
Proc WS on Independent Component Analysis and
Blind Signal Separation (ICA ’ 99), pp.365-371,
Aussios, France, Jan. , 1999.
[3] A.Hyvärinen, J.Karhunen, and E.Oja:
“Independent Component Analysis”, John Wiley,
New York, 2001.
[4] 澤 田 宏 , 向 井 良 , 荒 木 章 子 , 牧 野 昭 二 : “ 周 波 数 領 域
ブ ラ イ ン ド 音 源 分 離 に お け る permutation 問 題
の 解 法 ”, 音 響 学 会 講 演 論 文 集 , pp. 541-542, Sep,
2002.
[5] T.Kim, H.Attias, S-Y.Lee, and T-W.Lee:
“Blind source separation exploiting higher–order
frequency dependencies”, IEEE Transactions on
Speech and Audio Processing Vol.15 No.1, 2007
[6] レ ア ン ド ロ ・ デ ィ ・ ペ ル シ ア , 大 田 健 紘 , 柳 田 益
造 : “ICA に お け る パ ー ミ ュ テ ー シ ョ ン 問 題 の 解
決 法 の 提 案 ”, 信 学 技 報 Vol.105 No.686,pp.
53-58, Mar, 2006.
[7] レ ア ン ド ロ ・ デ ィ ・ ペ ル シ ア , 野 口 忠 繁 , 大 田 健
紘 , 柳 田 益 造 : “ パ ー ミ ュ テ ー シ ョ ン フ リ ー ICA
の 動 作 解 析 ”, 信 学 技 報 Vol.106 No.78,pp. 1-6,
May, 2006.
[8] J.F.Cardoso, and A.Souloumiac:
“Blind beamforming for non Gaussian signals”,
IEEE Proceeding-F, vol. 140, no 6, pp.362-370,
Dec, 1993.
[9] 谷 口 慶 二 : “ 信 号 処 理 の 基 礎 ”, 共 立 出 版 株 式 会
社 , pp.43-44.
[10] “Perceptual Evaluation of Speech Quality, an
objective method for end-to-end speech quality
assessment of narrowband telephone networks and
speech codecs ”, ITU-T Recommendation P 862,
Feb,2001