1 MDS 多次元尺度構成法 狩野 裕 2 多次元尺度構成法とは • いくつかの対象間の(非)類似度データ (対称・正方行列)から,対象を低次元空間に 布置する方法 – 各対象に座標を与えること • 軸の解釈も可能 – 回転の自由度がある 札幌 東京 金沢 大阪 福岡 札幌 832 806 1079 1417 東京 299 429 1092 金沢 260 689 大阪 福岡 D 1.0 + | i m e | 0.5 + | n s | 0.0 + i o | | * TOKYO * OSAKA * KANAZAWA n -0.5 + | * FUKUOKA 2 481 * SAPPORO | -1.0 + --+--------+--------+--------+--------+--------+--------+--------+--- - --1.8 -0.9 0.0 0.9 1.8 2.7 3.6 4.5 3 cf. 多次元展開法 • 被験者×対象の矩形行列データから, 被験者と対象を同じ空間に配置する方法 足立(2001)講義資料より A B C D E F G H I J 国 5 8 4 1 3 1 4 8 3 9 数 英 理 社 5 1 5 3 1 8 5 6 2 7 5 9 11 11 11 1 10 7 2 1 11 7 2 2 11 3 11 1 11 11 7 4 9 5 8 3 7 6 9 1 2.0 理科 1.5 国語 1.0 EF C B .5 D 0.0 -.5 I社会 A 数学 G J -1.0 -1.5 -2.0 -2.5 H 英語 -2.0 -1.5 -1.0 -.5 0.0 .5 1.0 1.5 2.0 4 次元の決め方 • 2が最もよく用いられる – 最も視覚に訴えやすい • 色々試してみて – 解釈が最もクリアな次元 – Stress が十分小さくなる次元の中で最小のもの – Scree 法 • Stressの値の減少の割合が少なくなったとき 5 ストレス(Stress) • 全てのデータの誤差 eij の二乗和のこと – データを変換した値と対象間の距離がどの程度一致 しているかを表す raw stress S * i j d ij sij 2 d s d 2 normalizedstress S i j ij ij 2 ij 6 Stress と適合度(by Kruskal,1964) Stress goodness-of-fit 0.200 poor 0.100 fair 0.050 good 0.025 excellent 0.000 perfect 7 Stressの欠点 • Klahr(1969)による数値実験 – ノイズのデータ • 対象の個数に依存 • 次元に依存 • Kruskalの基準は絶対という わけではない 8 非計量MDSの功罪 • dij 対象間の距離.与えられる座標間の距離 • sij 非類似度を適当に単調変換したもの – 順位さえ保っておればどんな変換も可能 d s d 2 S i j ij ij 2 ij • 順位しか用いないので,ある意味でロバストな解法? • Stress が小さくなるような変換にどのような意味が あるか?ご都合主義?
© Copyright 2024 ExpyDoc