多変量解析とその行方 - 大阪大学 大学院基礎

基礎工学部創立40周年記念談話会
(数理科学分野)
日時:2001年10月16日(火)
場所:シグマホール
多変量解析とその行方
狩野 裕
大阪大学人間科学部
http://koko15.hus.osaka-u.ac.jp/~kano/
[email protected]
designed by
Yukari
Azuma
1
自己紹介
専門:行動計量学,多変量解析
• 大阪大学理学部数学科卒業
基礎工学研究科数理系専攻修士課程修了
工学博士(大阪大学 1986年)
• 海技大学校教養科(運輸省)
• 大阪大学基礎工学部数理教室
– UCLA 心理学科訪問研究員(1989.4~1990.3)
• 大阪府立大学工学部数理工学科
• 筑波大学数学系情報数学
• 大阪大学人間科学部行動計量学
2
3
Agenda
• 基礎工と人科
• 談話会案内より
• 研究紹介
– 応用研究
– SEFA
– ICA
• 多変量解析の行方
4
基礎工と人科
• 基礎工学部
– 理学と工学の間
– 数理系・数理科学分野
• 最も理念に近い専攻
• 人間科学部
– 理系と文系の間
• 理科系的研究
– 人間(動物)や社会を「観察・調査・実験」などによって理解する
• 文科系的研究
– 社会哲学・人類学・ボランティア人間科学...
5
人間科学部
行動学
社会学
人間学
方法論
ボランティア
人間科学
教育学
6
談話会案内より
•
•
•
•
40代の若手
学んだことと現在の仕事との関連
学生さんへの人生のヒント
旧交を温め合う
7
学んだことと
現在の仕事との関連
• M論・D論
– 因子分析モデルについての理論研究
• 現在
– 因子分析モデルについての理論研究
– SEM(構造方程式モデリング)
• 理論研究......数学的アプローチ
• 応用研究......モデル構築
• ユーザー教育...応用研究者との接点
– ICA,GM
8
学生さんへの人生のヒント
• 学生・院生時代の勉強・研究は生涯の
基礎
• 時代のニーズに合わせて,基礎を発展
させることが重要
• 数理科学
– 理論と応用の両者を見据える
• 「不言実行」より「有言実行」
研究歴
基礎
識別性
一致性
SEMの理論と応用
FA・SEMの変数選択
楕
円
分
1990
布
論 推測の頑健性(SEM)
非反復推定法
(FA)
因子の
不確定性(FA)
1983 博士課程進学
不
適
解
の
問
題
SEM
ICA・IFAの研究
漸超
近高
理次
論の
9
2001
入
門
臨床
10
研究室紹介
• 学 部:行動計量学
– 応用研究
– 行動を計量するための方法論
• 大学院:行動データ科学
– 行動を計量するための方法論
11
キャッチコピー
科学はデータをとることから始まります。データは、
眺めているだけでは単に数値や記号の集まりにし
かすぎません。しかし、データは語りたいのです。
「マイクロフォン」を近づけると、一見無機的な数
値・記号が暖かい心を語りはじめます。私たちは
その語りを正確に無駄なく汲み取る「耳」を準備す
ることになります。私の研究テーマは、高性能なマ
イクロフォンを作成すること、そして、皆さんの耳を
立派にすることです。(人科紹介パンフより)
12
研究例:スポーツ心理学
e1
犯
罪
心
理
学
13
e2
親の監督
.73
親の愛着
犯罪類似行動全体
.70
親の養育態度
-.25
e7
-.14
カイ2乗(df)=28.277
(28)
犯罪類似行動
(高校)
.06
P値=0.45
-.47
GFI=0.970
AGFI=0.940
RMSEA=0.007
犯罪類似行動
(過去1年間)
e8
.19
d1
低セルフコントロール
.48
.41
.24
.47
.40
e10
.30
.42
.37
衝動性
危険を求める
自己中心性
かんしゃく
e3
e4
e5
e6
.42
機会
(高校)
.51
機会
(過去1年間)
e9
14
縦断的データの分析
Q01
Q08
Q09
Q10
Q11
Q19
Q20
Q21
Q22
Q03
Q05
Q07
Q12
Q14
Q15
Q02
Q04
Q06
Q13
Q16
Q17
しんぱいで いらいらして おちつかない
ねむれなかったり とちゅうで めがさめる
じしんのゆめや こわいゆめを みる
ふいに じしんを おもいだす
テレビや しんぶんを みると こわい
こわくない じぶんは へいきだ(逆転項目)
ちいさな おとに びっくりする
いつも ゆれているような きがする
また じしんがくるのが しんぱいだ
わけもなく かなしくて なにもしたくない
あじや いたさを かんじなくなった
ひとりぼっちに なったような きがする
じぶんの せいだと おもう
だれとも はなしたくない
じしんあそびを する
むしゃくしゃして らんぼうになり すぐかっとするように なった
テレビゲームや どくしょなどに ねっちゅうする
べんきょうが つまらなくなった
すぐわすれたり おもいだせない
あたまいたや おなかいたなど からだのぐあいが わるい
かんたんなことが できなくなった
1回目
不安 うつ 混乱
.34 .66
.51
.51
.72 .37
1.32
.85 .26 -.30
-.67
.55
.85
.30
.70
.47
1.11
.77
.57
.85
.16 .54
.50
.30
.21 .69
-.54 1.12
.92
1.00
.49 .30
.80
15
縦
断
的
デ
ー
タ
の
分
析
SEX
GRADE
0.516*
‐0.111
0 に固定
‐0.213
‐0.588*
Constant
1
d
1
1
Time1
d
0.168
Time2
d
1a
log(1+0.167)
log(1+0.5)
log(1+3)
log(1+1) log(1+2)
1
1
Time3
d
1a
Linear
d
Time4
d
1 a
Time5
d
1 a
1 a
Q Q …Q Q Q …Q Q Q …Q Q Q …Q Q Q …Q
17 2 4
17 2 4
17 2 4
17
2 4 GFI170.912
2 4
467.02
χ^2値
df
299
P値 <0.001
ACFI
0.930
RESEA 0.042
A
A
A
A
対応する項目間に誤差相関あり
16
因子分析における変数選択
• 理論の開発
– Kano-Harada(2000). Stepwise variable selection
procedure in factor analysis. Psychometrika, 65, 7-22.
• Web-based program...SEFA+SCoFA
SCoFA
2
 231
(0.05)  267.45
17
18
Independent Component
Analysis (ICA)
PCA ⇒ ICA?
FA ⇒ IFA?
19
ICAとは
• Independent Component Analysis
(独立成分分析)
• Jutten-Herault(1991):2つの音声を分離
• 情報検索によると
日本 海外
ICA:PCA=1:8(日本)
ICA:PCA=1:4(海外) ICA
23 2877
PCA
176 11514
20
BSS と ICA
独立
• BSS
– Blind Source Separation
v(t )  A s(t )
音源S1
(t  1,2, )

音源Sn
aij
 s(t )  [ s1 (t ),, s n (t )]T
 v (t )  [v1 (t ), , vm (t )]T
 A : m  n 混合行列
観測V1

観測Vm
21
カクテルパーティー効果
周りの雑音に関係なく、会話できる。
♪
♪
♪
22
カクテルパーティー効果とICA
• 音源の物理的な位置・音響
路の差異などの特性が違う
• 観測される信号の重なり方
が左右の耳で違う
• その違いから,ふたつの
信号を復元する
• ICAでは独立性を利用
障害物
音源1
音源2
左
耳
人間
右
耳
23
実際のカクテルパーティー効果は
• 選択的注意
– ある情報を選択的に自覚した意識状態
• 話のコンテックスト
• 欠落音の補完
– 音の冗長性を利用
– 断片情報から全体を復元
24
主成分の回転
V ( v)  V ( As)  AAT
AAT から Aを決定することはでき
ない(回転の自由度)
• PCA....分散の大きな成分を抽出
• ICA....非正規性を最大にする成分を抽出
– 非正規性 ⇔ 独立性
– PP(射影追跡)とICAとは類似点あり
• ICAは高次統計量を用いた因子回転の一種
25
独立因子分析(IFA)
• ICAで誤差をモデルに入れるとIFAになる
• IFAは誤差を取り除いた後に独立成分を同
定するように因子回転すること
v  As  e
26
計量心理学の分野では
• Ab Mooijaartは1985年にIFAと同等の
モデルを提案している
– 3次モーメントを利用すると因子回転が不要
• BSSでのように独立成分を同定するという
方向へ発展しなかった
27
私たちの思い
• PCAやFAは統計学者・心理学者によって発展さ
せられてきた
• ICAやIFAは数理工学者によって発見され発展さ
せられてきた
• なぜ我々はその発展に寄与できなかったのか?
• ICA・IFAの社会科学における適用可能性の研究.
そのための新しい ICA・IFAの開発
28
多変量解析の行方
--- これからのサイエンス ---
29
20世紀の科学
• 学問の分化が進んだ
– e.g., 数学と物理学
– 新しい学問分野の創生
• 研究者養成が制度化された
– 少数貴族のお遊戯ではなくなった
– だれでも研究者になる可能性がある
30
数理科学と統計学
• 数理科学(or 工学)
– 科学・工学における数学的方法論を提供
– 数学もこの範疇に入るのではないか
• 統計学
– データ解析のための方法論を提供
– 文科系学問も対象
31
数理科学と統計学の将来
• 分科会で完結する時代は終わった
• 方法論としての原点に回帰すべき
– 20世紀に学問の一領域として確立
• 応用領域からの独立
– 21世紀では再び接近を図るべき
• ユーザーとの接点を増加させる
– 共同研究
– 新しい数理科学的方法論の提供
• 院生・教官を対象とした講義
32
多変量解析の利用
• 多変量解析が最も利用されている分野
– 心理学・行動学・医学・保健学
• 約30%の研究論文にPCA・FAが利用
– 心理学研究・教育心理学研究
33
多変量解析の将来
• ユーザーは多変量解析を大いに必要と
している
– 必要性は高まるばかり
– 方法論者はその需要を捉えきれていない
– ユーザー教育を提供できる人材が不足
• 応用研究者との密接なコミュニケーション
が必要
34
ユーザー教育について
• ユーザー教育は(より大きな)産業になりえる
– ユーザーは無数の分析方法が利用可能
• 計算機・プログラムの発展による
– 自習は不可能
– 人材不足は否めない
• 統計学教育ではない
– e.g., 自動車の教習所
– 統計学教育もそれなりに必要だが
35
研究キーワード
• 線形から非線形へ
– 理論は既に移行
– 非線形モデルから有益な情報をどのように
抽出するか
– 定型から定型外へ(i.e.,自由なモデリング)
• 小標本から超特大標本へ
• 静的から動的なデータへ
• 確率論ベースから記述ベースへ?
36
おわりに
•
•
•
•
40周年記念
講演の機会
Σの原点に
益々の発展