MDS 多次元尺度構成法

1
MDS
多次元尺度構成法
狩野 裕
2
多次元尺度構成法とは
• いくつかの対象間の(非)類似度データ
(対称・正方行列)から,対象を低次元空間に
布置する方法
– 各対象に座標を与えること
• 軸の解釈も可能
– 回転の自由度がある
札幌
東京
金沢
大阪
福岡
札幌
832
806
1079
1417
東京
299
429
1092
金沢
260
689
大阪
福岡
D
1.0 +
|
i
m
e
|
0.5 +
|
n
s
|
0.0 +
i
o
|
|
* TOKYO
* OSAKA
* KANAZAWA
n -0.5 +
| * FUKUOKA
2
481
* SAPPORO
|
-1.0 +
--+--------+--------+--------+--------+--------+--------+--------+---
-
--1.8
-0.9
0.0
0.9
1.8
2.7
3.6
4.5
3
cf. 多次元展開法
• 被験者×対象の矩形行列データから,
被験者と対象を同じ空間に配置する方法
足立(2001)講義資料より
A
B
C
D
E
F
G
H
I
J
国
5
8
4
1
3
1
4
8
3
9
数 英 理 社
5 1 5 3
1 8 5 6
2 7 5 9
11 11 11 1
10 7 2 1
11 7 2 2
11 3 11 1
11 11 7 4
9 5 8 3
7 6 9 1
2.0
理科
1.5
国語
1.0
EF
C
B
.5
D
0.0
-.5
I社会
A
数学
G
J
-1.0
-1.5
-2.0
-2.5
H
英語
-2.0
-1.5
-1.0
-.5
0.0
.5
1.0
1.5
2.0
4
次元の決め方
• 2が最もよく用いられる
– 最も視覚に訴えやすい
• 色々試してみて
– 解釈が最もクリアな次元
– Stress が十分小さくなる次元の中で最小のもの
– Scree 法
• Stressの値の減少の割合が少なくなったとき
5
ストレス(Stress)
• 全てのデータの誤差 eij の二乗和のこと
– データを変換した値と対象間の距離がどの程度一致
しているかを表す
raw stress
S *  i  j d ij  sij 
2
 d  s 
d
2
normalizedstress S 
i j
ij
ij
2
ij
6
Stress と適合度(by Kruskal,1964)
Stress goodness-of-fit
0.200
poor
0.100
fair
0.050
good
0.025
excellent
0.000
perfect
7
Stressの欠点
• Klahr(1969)による数値実験
– ノイズのデータ
• 対象の個数に依存
• 次元に依存
• Kruskalの基準は絶対という
わけではない
8
非計量MDSの功罪
• dij 対象間の距離.与えられる座標間の距離
• sij 非類似度を適当に単調変換したもの
– 順位さえ保っておればどんな変換も可能
 d  s 
d
2
S
i j
ij
ij
2
ij
• 順位しか用いないので,ある意味でロバストな解法?
• Stress が小さくなるような変換にどのような意味が
あるか?ご都合主義?