PowerPoint プレゼンテーション

平成14年2月8日
卒業研究報告
相関行列に基づく非計量多次元尺度法
に関する研究
原 康暢
畜産経営管理講座
(統計研究室)
1
1.はじめに

MDS:多次元尺度構成法
類似度データ
非類似度データ

背後の構造を視覚化
MDSの特徴
似ているものは近く
似てないものは遠く
2
MDSの種類

計量MDS



データが間隔尺度・比尺度の場合
トーガソンの方法
非計量MDS


データが順位尺度の場合
クラスカルの方法
3
研究目的
非計量MDS
適
用
可
能
非類似度
類似度
研究目的
変量間
類似度
相関行列で定義
クラスカルの方法
・適用 ・分析
有効性?
4
2.クラスカルの方法
対象i,j間の類似度  ij (データの値)とn次元空間上の距
離 の順位を適合させる。
d ij
単調回帰法



類似度
非類似度

d ij
 ij と単調関係
f(  )
f ( ij )
単調減少関数
単調増加関数
空間上の距離と単調変換の値の誤差を
d ij  d ij  eij

d ij
単調変換
=

空間上の距離
eij とする
(a)
5
ストレス(Stress)
すべての誤差
eijの二乗和
データと、空間上の距離の
適合度
S


(
d

d
)
ij
ij
i j

d
i j
2
(1)
2
ij
この値が最も小さくなるような
単調関数と対象の布置を求める。
6
3.モンテカルロシミュレーション実験
変量1・2・3
変量4・5
第1ブロック
第2ブロック
変量6・7・8
変量9~13
変量14~20
第3ブロック
第4ブロック
第5ブロック
となるよう相関係数を定め
乱数を用いそれぞれを
1000組発生させる。
変量間の相関行列を算出
相関行列を入力データとし、
クラスカルの方法へ適用
7
実験結果
1.4

2次元選択
VAR4
VAR5
1.0
(Stress;0.183)
VAR3
VAR1
VAR11
VAR2
0.6
VAR8
視覚的に見やす
いことを前提
次元 2
VAR6 VAR7
0.2
-0.2
VAR20
VAR18
VAR19
VAR15
VAR14
VAR16
VAR17
-0.6
Stressの値
高いが無視
-1.0
-1.2
VAR13
-0.8
-0.4
VAR12
VAR10
VAR9
0.0
0.4
0.8
1.2
次元 1
(図3)最終布置 2D散布図
5個のブロックを形成
相関行列で定義された類似度
クラスカルの方法適用
相関行列を正確に反映
有効な分析可能!
8
4.実際のデータへの適用
中学生166人の12教科の評点
12教科の相関行列を算出
(表2)中学2年生166人 2学期 12教科の評点
生徒番号
国語
社会
数学
理科
音楽
美術
体育
技家
英語
小4配当漢字
小5配当漢字
小6配当漢字
1
32
41
50
64
64
66
37
43
22
62
68
52
2
38
23
46
60
69
72
54
66
12
48
46
32
3
30
30
25
59
68
72
36
54
10
28
36
42
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
・・・
166
60
85
88
82
59
78
85
47
83
79
84
74
9
(表3)12教科の相関行列
国語
社会
数学
・
・
・
小5配当
小6配当
国語
1
0.7825
0.735
・
・
・
0.7819
0.7595
社会
0.7825
1
0.7873
・
・
・
0.6757
0.696
数学
0.735
0.7873
1
・
・
・
0.6076
0.5651
・・・
・・・
・・・
・・・
・・・
・・・
小5配当
0.7819
0.6757
0.6076
・
・
・
1
0.8842
小6配当
0.7595
0.696
0.5651
・
・
・
0.8842
1
入力データとしクラスカルの方法
へ適用・分析
10
分析結果
2次元選択
(Stress;0.0113)

0.2
小4配当 小6配当
小5配当
0.1
次元 2
0.0
他のすべての教科と
国語
美術
英語
社会
数学
音楽
理科
体育
相関の低い体育
-0.1
2次元最終布置退化
-0.2
-0.3
-4
技家
-3
-2
-1
次元 1
(図4)最終布置 2次元選択 中学生 成績
0
1
3次元を選択し、計算
をやり直す。
11

3次元選択
(Stress;0.023)
散布図中の科目間距離 科目の組 と
単調関数
4.0
f(  )
3.5
3.0
.
2.5
2.0
.
1.5
d ij
=
単調関数は右下がり
・ (i, j)
.
eij
1.0

0.5
.
d ij
0.0
-0.5
0.0
相関係数は類似度
0.2
0.4
.
0.6
0.8
1.0
ij データ(相関係数)
(図5)シェパード・ダイアグラム
シェパード・ダイアグラム
単調関数と科目の組を比較
データ  ij と散布図中の距離 d ij の当てはまりの良さを示す。
12
3次元選択した場合の最終布
置
美術 音楽
数学理科
次
元
3
・小6配当
生徒の持つ体力
小5配当
社会
・ 手先の器用さ
英語
体育
国語
小4配当
・ 感性の強さ に左右される。
感
性
技家
次元2 器用
次元1 体力
(図6)最終布置 3次元選択 中学生 成績
解釈
中学2年生の12教科の成績の評点
13
5.おわりに
結論
相関行列により定義されたの変量間の類似度を、クラスカル
の方法へ適用する分析方法は、データの特性を知るうえでた
いへん有効であることがわかった。

応用分野
経営
管理
経営
診断
生物学
MDSと相関ルールの関連性
心理学
14
スーパーの経営管理
コスメ
タバコ
お菓子
お茶
弁当
パン
牛乳
雑誌
つまみ
酒
パンツ
MDS による(仮想的)商品配置図
15
酪農経営 経営診断
16
主成分分析の結果
因子負荷量 , 因子 1 vs 因子 2 vs 因子 3
回転法: バリマックス 法
抽出法: 主成分分析
小6配当
小
5配当
小4配
当
国語
美術 音楽
英語 社会
数学理科
技家
体育
17