1-Q-40 絶対値の観測のみを用いた 2 つの複素信号の相関係数推定∗ ○宮部滋樹 (筑波大), 小野順貴 (NII/総研大), 牧野昭二 (筑波大) 1 はじめに 本稿では,以上のような絶対値 Yi , i = 1, 2 のみが ウィーナーフィルタやスペクトル減算といった雑音 除去,線形アレー信号処理のポストフィルタやエコー 抑圧,近年では非負値行列分解を用いた音源分離な ど,本来複素数値で観測される時間周波数領域の信 観測される条件で相関係数 |ρ| を求める問題について 議論する。ここで,言うまでもなく分散 σi2 , i = 1, 2 の推定は標本平均で求めることができる。 [ ] 2 σi2 ← E yi (n) (8) 号の振幅のみを用いる非線形な信号処理が求められ ることがある。振幅の処理が用いられる理由は,線形 ここで yi (n), n = 1, · · · , N は確率変数 Yi の N 個の 処理よりも強力な雑音抑圧が求められる場合のほか, 標本を表し,以下では確率変数を大文字で,標本を標 位相の信頼性が低い場合など様々である。このよう 本インデックス n を引数とする小文字で表すものと な非線形な信号処理の多くは統計的な分析に基づい する。しかし相互相関については絶対値観測の相互 ており,相互相関などの統計量の推定が重要となる。 相関に一致しない。 このような統計量は,振幅の統計量が求められる場 E [Y1 Y2 ] ̸= σ1 σ2 |ρ| 合だけでなく,元の複素数信号の統計量が求められる (9) 場合もある。しかし,信頼できる位相の観測ができな そのため以下のような絶対値の積の平均は相関係数 い場合などでは,振幅の観測のみを用いて複素数の |ρ| の良い推定を与えない。 相互相関を推定するのは難しい。本稿では,位相情報 を隠れ変数と見なした確率モデルによって,振幅の観 |ρ| ← 測のみから複素相関を推定する手法について述べる。 2 N 1 ∑ y1 (n) y2 (n) N n=1 σ1 σ2 (10) 従って,複素変数の相関係数を絶対値のみから推定す 問題設定 る問題は自明ではない。 いま,相関のある 2 つの零平均複素確率変数 Xi ∈ C, i = 1, 2 があるものとする。また,2つの確率変 3 数はそれぞれ以下のような統計量を持つものとする。 3.1 E [Xi ] = 0 [ ] E Xi2 = 0 [ ] 2 E |Xi | = σi2 E [X1 X2∗ ] = σ1 σ2 ρ (1) (2) (3) (4) ∗ ここで {·} は複素共役を,E [·] は期待値を表す。ま た式 (2) は,Xi の偏角 Θi の周辺確率密度分布が一様 分布であることを示す。 Θi = ∠Xi 1 pΘi (θi ) = , − π ≤ θi < π 2π 複素正規分布を仮定した相関推定 確率モデル 本稿では,確率変数 xi , i = 1, 2 が式 (1)–(4) を満 たす単純な仮定として,以下のような零平均 2 変量 複素正規分布に従うと仮定した確率モデルについて 議論する。 ( ) σ22 |x1 |2 +σ12 |x2 |2 −2σ1 σ2 Re[ρ∗ x1 x∗ 2] exp − σ12 σ22 (1−|ρ|2 ) ( ) pX1 ,X2 (x1 , x2 ; ρ) = 2 π 2 σ12 σ22 1 − |ρ| (11) ここで (5) (6) しかし複素変数 Xi , i = 1, 2 は観測されず,代わりに xR i = Re [xi ] (12) xIi = Im [xi ] (13) として,極座標系への変数変換 その絶対値 Yi のみが観測されるものとする。 Yi = |Xi | (7) I R I dxR 1 dx1 dx2 dx2 = y1 y2 dy1 dy2 dθ1 dθ2 (14) これは偏角 Θi が失われて観測されることに相当する。 ∗ Estimation of correlation coefficient between to complex signals only with observation of absolute values. by MIYABE, Shigeki (University of Tsukuba), ONO, Nobutaka (NII/Sokendai), MAKINO, Shoji (University of Tsukuba) 日本音響学会講演論文集 - 735 - 2014年9月 により,観測される絶対値 Yi と観測されない偏角 Θi また,完全データ {Y1 , Y2 , Θ} の同時確率密度関数が の同時確率密度が以下のように与えられる。 以下のように与えられる。 pY1 ,Y2 ,Θ1 ,Θ2 (y1 , y2 , θ1 , θ2 ; ρ) ( ) σ22 y12 +σ12 y22 −2σ1 σ2 |ρ|y1 y2 cos(θ1 −θ2 −∠ρ) y1 y2 exp − σ12 σ22 (1−|ρ|2 ) ( ) = 2 π 2 σ12 σ22 1 − |ρ| pY1 ,Y2 ,Θ (y1 , y2 , θ; ρ) = pΘ|Y1 ,Y2 (θ|y1 , y2 ; ρ) pY1 ,Y2 (y1 , y2 ; |ρ|) ( ) σ 2 y 2 +σ 2 y 2 −2σ σ2 y1 y2 cos(θ−∠ρ) 2y1 y2 exp − 2 1 1 2σ2 σ2 11−|ρ| 2 ) 1 2( ( ) = 2 2 2 πσ1 σ2 1 − |ρ| (15) これを偏角 θ1 , θ2 で周辺化することにより,観測され (19) る絶対値 Y1 , Y2 の尤度が以下のような 2 変量レイリー 以上のように求められた事後密度と同時密度を用 分布 [1] として求められる。 いると,尤度を繰り返し計算で最適化する EM アル pY1 ,Y2 (y1 , y2 ; |ρ|) ∫ π ∫ π pY1 ,Y2 ,Θ1 ,Θ2 (y1 , y2 , θ1 , θ2 ; ρ) dθ1 dθ2 = −π −π 4y1 y2 2 |ρ| y y ( ) I0 ( 1 2 ) = 2 2 σ12 σ22 1 − |ρ| σ1 σ2 1 − |ρ| 2 2 2 2 y + y σ σ 1 2 ) · exp − 2 1( (16) 2 2 2 σ1 σ2 1 − |ρ| ここで Iν (·) は次数 ν ∈ R の第 1 種変形ベッセル関数 である。相互相関パラメタ ρ は尤度の中では絶対値 を取った相関係数 |ρ| の形で現れ、確率が共分散の偏 角に依存しないことがわかる。従ってこの確率モデル を用いた最尤法により,相関係数 |ρ| を推定すること ができる。しかしこの最尤推定は解析的に解くこと ができない。 3.2 EM アルゴリズムによる最尤推定 ゴリズムのための Q 関数は以下のように求めること ができる。 Q (|ρ| ; |¯ ρ|) ∫ π = pΘ|Y1 ,Y2 (θ|y1 , y2 ; ρ¯) log pY1 ,Y2 ,Θ (y1 , y2 , θ; ρ) −π σ22 y12 =− + σ12 y22 − 2σ1 σ2 y1 y2 λ ) ( 2 σ12 σ22 1 − |ρ| ( ) 2 − log 1 − |ρ| + const. (20) ここで λ は以下のように求められる |¯ ρ| を固定した条 件での cos(θ − ∠ρ) の期待値積分を表す。 ∫ π λ= cos (θ − ∠ρ) pΘ|Y1 ,Y2 (θ|y1 , y2 ) dθ −π ( ) ¯ 1 y2 I1 σ σ2|ρ|y ¯ 2) 1 2 (1−|ρ| ) = ( (21) 2|ρ|y ¯ 1 y2 I0 σ σ 1−|ρ| 2 ¯ ) 1 2( 観測できない偏角 θ1 (n), θ2 (n) と観測 y1 (n), y2 (n) また,|¯ ρ| を固定した条件で Q 関数を最大化するパラ を併せて完全データとして扱うことにより,式 (16) メタ推定 |ρ| は,以下の偏微分を用いた極大点の推定 の最尤推定を繰り返し最適化により求める EM アル により得られる。 ∂Q (|ρ| ; |¯ ρ|) =0 ∂ |ρ| ゴリズムを導出する。 まず,以下のように定義される θ を隠れ変数として 扱うこととする。 これを式 (8) の σi2 , i = 1, 2 の推定を用いて解くと, Θ = Θ 1 − Θ2 (17) 最適な |ρ| の推定は以下のようになる。 |ρ| = 式 (6) の,θi の周辺分布が一様であるという仮定を用 いると,隠れ変数 θ の事後確率密度 p(θ|y1 , y2 ) が以 下のように求められる。 (23) 以上より,EM アルゴリズムによる相関係数 |ρ| の を与え,E ステップの更新 ) ( 1 (n)y2 (n) I1 2|ρ|y σ1 σ2 (1−|ρ|2 ) ) λ (n) ← ( 2|ρ|y1 (n)y2 (n) I0 σ σ 1−|ρ|2 ) 1 2( = pΘ|Θ2 ,Y1 ,Y2 (θ + θ2 |θ2 , y1 , y2 ; ρ) pY1 ,Y2 ,Θ1 ,Θ2 (y1 , y2 , θ + θ2 , θ2 ; ρ) pΘ2 (θ2 ) pY1 ,Y2 (y1 , y2 ; |ρ|) ( ) 1 y2 cos(θ−∠ρ) exp 2|ρ|y σ1 σ2 (1−|ρ|2 ) ( ) = 1 y2 2πI0 σ σ2|ρ|y 2 1 2 (1−|ρ| ) y1 y2 λ σ1 σ2 推定は以下のようになる。最初に |ρ| に適当な初期値 pΘ1 |Y1 ,Y2 (θ|y1 , y2 ; ρ) = 日本音響学会講演論文集 (22) (18) (24) と M ステップの更新 |ρ| = - 736 - E [y1 (n) y2 (n) λ (n)] σ1 σ2 (25) 2014年9月 1 Estimated correlation coefficient Estimated correlation coefficient 1 0.8 0.6 0.4 0.2 0 0 Estimation with angle Absolute correlation Proposed 0.2 0.4 0.6 0.8 True correlation coefficient 0.8 0.6 0.4 0.2 Estimation with angle Absolute correlation Proposed 0 0 1 0.2 0.4 0.6 0.8 True correlation coefficient 1 Fig. 1 Estimation results of correlation coefficients between two pseudo random variables of complex Fig. 2 Estimation results of correlation coefficients of the non-Gaussian data generated from pseudo normal distribution. random variables following complex generalized normal distributions. を繰り返すことにより,|ρ| の推定は局所最適解に収 束する。ここで式 (24) の E ステップの更新において, て生成した。ここではまず 2 つの複素一般化正規分 第 1 種変形ベッセル関数は引数が大きい場合に浮動 布に従う疑似乱数 [2] を生成し,次にそれらの線形混 小数点例外 Inf を生じてしまうため、このような場合 合によって相関を持たせたデータを生成した。相関係 には以下の漸近近似で置き換える必要がある。 ( ) 2|ρ|y1 (n)y2 (n) I1 σ σ 1−|ρ|2 ) 1 2( 2 |ρ| y1 (n) y2 (n) ( ( ) ≫0 ) ≈ 1 for 2 1 (n)y2 (n) σ1 σ2 1 − |ρ| I0 2|ρ|y σ1 σ2 (1−|ρ|2 ) (26) 数の大きさは混合比によって変化させた。複素一般化 正規分布の密度関数は以下で与えられる。 ( )c ci exp − |xσi | ( )i pXi (xi ) = 2πσi2 Γ c2i (27) ここで形状母数 ci > 0 は 2 つの変数で異なったも 数値シミュレーション 4 4.1 のを用い,c1 = 0.5, c2 = 0.8 とした。また σi2 は, 2 変量正規分布の相関係数推定 2 変量複素正規分布の疑似乱数に対する相関係数推 定の数値シミュレーションを行う。ここで各次元の分 散の推定は自明であるため、各次元の分散が 1 の複 素ガウス変数の相互相関の絶対値を 0 から 1 まで変 えて、近似最尤推定と EM アルゴリズムによる推定 を比較した。各トライアルの標本数は 100、EM アル ゴリズムは式 (10) の絶対値の相関を初期値としての E[|Xi |2 ] = 1 となるように調整した。これらの形状 母数は,以下のように与えられる複素カートシス [3] がおよそ 7.4, 2.3 の場合に相当し,ガウス性の面では 音声の短時間フーリエ分析と類似したものとなって いる。 [ ] 4 2 E |x| |E [x]| ( [ 2 ])2 E |x| −2 Kurt[x] = ( [ ])2 − 2 E |x| イタレーション 20 回で学習した。 = シミュレーション結果を図 1 に示す。EM アルゴリ Γ (2/c) Γ (6/c) 2 Γ (4/c) −2 (28) ズムの結果は高い精度であることがわかる。近似最尤 実験結果を Fig. 2 に示す。正規乱数に対する結果 推定の結果は、低い相関のもとでは推定精度が低い と同様に真の相関係数の周辺に推定地が分布してい ことがわかる。また EM アルゴリズムの結果は、や るため,非ガウス性によるモデルミスマッチの影響は や分散が大きくなるものの,真の相関係数の周辺に 大きくないことがわかる。 推定地が分布している。 4.2 4.3 正規分布に従わない確率変数の相関係数推定 音響データの時間周波数領域の相関係数推定 次に、マイクロホンアレーで観測した音声混合の 次に,正規分布を仮定したモデルのミスマッチを評 短時間フーリエ分析の振幅スペクトルに対する相関 価するため,非ガウス的なデータを疑似乱数を用い 係数の推定を行う。観測信号のサンプリング周波数 日本音響学会講演論文集 - 737 - 2014年9月 Estimated correlation coefficient 1 [2] M. Novey, T. Adali and A. Roy, “A Complex Generalized Gaussian Distribution— 0.8 Characterization, Generation, and Estimation,” IEEE Trans. Signal Processing, 58(3), 2010. 0.6 0.4 [3] S. Javidi, D. P. Mandic, C. C. Took, and A. Cichocki,“ Kurtosis-based blind source extraction of complex non-circular signals with application 0.2 in EEG artifact removal in real-time, ”Frontiers in Neuroscience, vol.5, no.105, 25 pages, 2011. 0 0 Amplitude correlation Proposed 0.2 0.4 0.6 0.8 Correlation coefficient estimated with angle doi:10.3389/fnins.2011.00105 1 Fig. 3 Estimation results of correlation coefficients between two channels of speech mixture. は 48 kHz、窓幅は 4096 サンプル、フレームシフトは 2048 サンプル、フレーム数は 80、EM アルゴリズム は近似最尤推定を初期値としてのイタレーション 20 回で学習した。 シミュレーション結果を図 3 に示す。厳密に定常な 分布に従う疑似乱数の場合と違い、EM アルゴリズム の推定精度は低下していることがわかる。これは非 定常性などの,さまざまな要因が関係していると思 われるが,更なる原因究明が必要である。 5 おわりに 本稿では,複素変数の絶対値のみの観測から,EM アルゴリズムを用いて元の複素変数の相関係数を求 める手法を提案した。元の複素変数は 2 変量複素正 規分布に従うと仮定し,偏角の差を隠れ変数として 扱うことにより,EM アルゴリズムに基づく最尤推定 を定式化した。数値シミュレーションの結果,提案手 法は観測データが正規分布に従わない場合にも相関 係数をある程度の精度で推定できることを確認した。 しかし,実際の音声の観測では相関推定の精度が低 下することがわかった。原因としては観測の非定常性 などが考えられるが,更なる検討が必要である。 参考文献 [1] F. J. Lopez-Martinez, D. Morales-Jimenez, E. Martos- Naya, J. F. Paris, “On the bivariate Nakagami-m cumulative distribution function: closed-form expression and applications,” IEEE Trans. Commun., vol. 61, no. 4, pp. 1404.1414, 2013. 日本音響学会講演論文集 - 738 - 2014年9月
© Copyright 2025 ExpyDoc