1 PCAからICAへ? 狩野裕+清水昌平 (大阪大学人間科学部) 日本行動計量学会:東京大学 平成12年10月 2 ICAとは (1) • Independent Component Analysis (独立成分分析) • Jutten-Herault(1991):2つの音声を分離 • 情報検索によると 日本 海外 ICA:PCA=1:8(日本) ICA:PCA=1:4(海外) ICA 23 2877 PCA 日本行動計量学会:東京大学 平成12年10月 176 11514 3 ICAとは (2) • 成分が独立な多次元信号sを線型混合した 観測値 v から,s を再生するための方法 v(t ) A s(t ) (t 1,2, ) s(t ) [ s1 (t ),, s n (t )]T v (t ) [v1 (t ), , vm (t )]T A : m n 混合行列 • v からAを推定し,s を再生する 日本行動計量学会:東京大学 平成12年10月 4 BSS と ICA 独立 • BSS – Blind Source Separation v(t ) A s(t ) 音源S1 (t 1,2, ) 音源Sn aij s(t ) [ s1 (t ),, s n (t )]T v (t ) [v1 (t ), , vm (t )]T A : m n 混合行列 観測V1 日本行動計量学会:東京大学 平成12年10月 観測Vm 5 カクテルパーティー効果 周りの雑音に関係なく、会話できる。 ♪ ♪ ♪ 日本行動計量学会:東京大学 平成12年10月 6 カクテルパーティー効果とICA • 音源の物理的な位置・音響 路の差異などの特性が違う • 観測される信号の重なり方 が左右の耳で違う • その違いから,ふたつの 信号を復元する • ICAでは独立性を利用 障害物 音源1 日本行動計量学会:東京大学 平成12年10月 音源2 左 耳 人間 右 耳 7 実際のカクテルパーティー効果は • 選択的注意 – ある情報を選択的に自覚した意識状態 • 話のコンテックスト • 欠落音の補完 – 音の冗長性を利用 – 断片情報から全体を復元 日本行動計量学会:東京大学 平成12年10月 8 ICAの仮定 • 正規分布に従う独立成分は高々1つ – s が正規分布だと分離不可能 – 非正規性に依拠する方法 • m≧n – 観測変数の次元の方が大きい – そうでないモデルもある • 混合行列 A は full column rank • その他 – E(s) = 0, V(s) = In, モーメント存在の条件 これらの下で A を一意に決定できる 日本行動計量学会:東京大学 平成12年10月 9 主成分の回転 V ( v) V ( As) AAT AAT から Aを決定することはでき ない(回転の自由度) • PCA....分散の大きな成分を抽出 • ICA....非正規性を最大にする成分を抽出 • ICAは高次統計量を用いた因子回転の一種 • なぜ,独立成分の抽出と非正規性最大化が 対応するのか? 日本行動計量学会:東京大学 平成12年10月 観測変数を球状化 by PCA 10 非独 正立 尖度の最大化 max kurt(w T Mv ) max kurt(w T MAs) 規 成 w: w 1 w: w 1 性分 m 最 の T 4 max kurt(z s) max z i kurt( si ) 抽 z: z 1 z: z 1 大 i 1 化出 kurt( s1 ) ... kurt( s m )とすると と T 最大化はz [1,0,..., 0] で達せられる.即ち V ( Mv ) MAAT M T I n max kurt(w T Mv ) s1 w: w 1 日本行動計量学会:東京大学 平成12年10月 11 独立成分の抽出と射影追跡 • 尖度の最大化 => 非正規独立成分の同定 max{ kurt( s1 ), kurt( s2 )} 2max 2 kurt( z s z s ) z1 z 2 1 4 1 1 4 2 2 • 独立成分の和は非正規性を小さくする • この同値性が独立成分抽出と非正規性 最大化を結ぶ • ICAとPP(射影追跡)を結ぶ 日本行動計量学会:東京大学 平成12年10月 12 射影追跡(PP) • データの興味深さ・面白さ (interestingness)を表す軸(超平面 wTv)を 同定 • Interestingness を非正規性として捉える • Freedman の指標・Hallの指標が有名 • 岩崎(1991)を参照 日本行動計量学会:東京大学 平成12年10月 13 ICAのプロセス • ICAでは,非正規性の尺度を定めると, それを最大化する wTMv によって独立 成分を同定することができる • 2番目の独立成分は,s を取り除いてから 同プロセスを繰り返す Mx ws1 MAs MAe1s1 MA[0, s2 ,..., sm ]T 日本行動計量学会:東京大学 平成12年10月 14 非正規性の尺度 • 尖度や高次キュムラント – 外れ値に弱い • Entropy 最小化 • Mutual Information 最小化 • PPで提案されている非正規性の尺度 日本行動計量学会:東京大学 平成12年10月 15 Entropy 最小化 y w T Mv w 1 pdf of y ..... f ( y ) z~N (0,1) entropyof y ..... H ( y ) f ( y ) log f ( y )dy negentropyof y ..... J ( y ) H ( z ) H ( y ) max J ( y ) w 日本行動計量学会:東京大学 平成12年10月 0 16 Negentropy の近似 Jones Sibson(1987) 1 1 3 2 2 J ( y) E[ y ] kurt( y ) 12 48 Hyvarinen( 1998) p J ( y) k i E[Gi ( y )] E[Gi ( z )] i 1 日本行動計量学会:東京大学 平成12年10月 2 17 Mutual Information 最小化 y W Mv, W O(m) MutualInformation : m I (y ) i 1 H ( yi ) H (y ) f (y ) log m i 1 f (y ) m const f i ( yi ) J(y ) i i 1 min I (y ) W 日本行動計量学会:東京大学 平成12年10月 dy 0 18 Noisy ICA (IFA) • 測定に誤差が伴う場合 v(t ) A s(t ) u(t ) (t 1,2, ) s(t ) [ s1 (t ),, s n (t )]T v(t ) [v1 (t ),, vm (t )]T u(t ) [u1 (t ),, u m (t )]T A : m n 混合行列 日本行動計量学会:東京大学 平成12年10月 19 セミパラメトリックモデル • Amari-Cardoso(1997), 川鍋-村田(2000) v(t ) A s(t ) u(t ) (t 1,2,) si (t )~ i ( si ) u(t )~N (0, ) m (s )ds f ( v | A, , i ) N ( v | As, ) i i 1 日本行動計量学会:東京大学 平成12年10月 i 20 モデル間の関係 noisy モデル v = As+u 非正規データ 高次統計量 正規データ 2次統計量 noisy ICA IFA FA noise-free モデル PP v = As noise-free ICA 川鍋-村田(1999)より 日本行動計量学会:東京大学 平成12年10月 PCA 21 ICA と PP • 両者とも観測変数の線型結合の中で 非正規性を最大にするものを探す • ICAにおける指標とPPにおける指標は 相互乗入れ可能と思われる • データが独立な信号(潜在変数)の線型和 ならば,ICAやPPは独立成分を同定.そう でない場合は,興味ある軸を同定 • ICAはPPの一つの特徴づけ 日本行動計量学会:東京大学 平成12年10月 22 例1.一様分布 PPがICAになる場合 V2 S2 S1 V1 球状化した観測変数の分布 ICA or PPによって変換した 変数の分布 日本行動計量学会:東京大学 平成12年10月 23 例2.混合正規分布 PPがICAにならない場合 V2 S2 V1 球状化した観測変数の分布 S1 ICA or PPによって変換した 変数の分布 b b 2 b b 2 a a 0 2 N , 1 N , 2 N , 1 N , 0 2 a a 0 0 2 b 日本行動計量学会:東京大学 平成12年10月 0 0 2b 2 24 応用 • BSS • 脳磁図・脳電図の分析 • いままでPCAないしはFAで分析していた 対象をICAで分析してみたという例が多い • 社会科学への応用は今から 日本行動計量学会:東京大学 平成12年10月 25 まとめ • (noise-free or noisy) ICAは軸の変換である – PCAは分散が大きくなるよう軸を変換 – ICAは独立成分を同定するよう軸を変換 • 独立成分同定 ⇔ 非正規性最大化 – ICA ⇔ PP – ICA・PPは独立成分が隠れているとそれを同定 • FAとの関連では,ICAは新しい直交回転解を 与える – 独立性が一番大きくなるように回転 日本行動計量学会:東京大学 平成12年10月 26 PCAからICAへ? • PCAとICAはまったく異なり,一方が他方を 凌駕するというものではない – 目的によって使い分ける – 分散最大化 vs 非正規性最大化(独立成分の同定) – 2次統計量 vs 高次統計量 • 方法論の研究に関しては,ICAが“燃えている” • ICAの社会科学での適用可能性は未知 日本行動計量学会:東京大学 平成12年10月
© Copyright 2025 ExpyDoc