平成14年2月8日 卒業研究報告 相関行列に基づく非計量多次元尺度法 に関する研究 原 康暢 畜産経営管理講座 (統計研究室) 1 1.はじめに MDS:多次元尺度構成法 類似度データ 非類似度データ 背後の構造を視覚化 MDSの特徴 似ているものは近く 似てないものは遠く 2 MDSの種類 計量MDS データが間隔尺度・比尺度の場合 トーガソンの方法 非計量MDS データが順位尺度の場合 クラスカルの方法 3 研究目的 非計量MDS 適 用 可 能 非類似度 類似度 研究目的 変量間 類似度 相関行列で定義 クラスカルの方法 ・適用 ・分析 有効性? 4 2.クラスカルの方法 対象i,j間の類似度 ij (データの値)とn次元空間上の距 離 の順位を適合させる。 d ij 単調回帰法 類似度 非類似度 d ij ij と単調関係 f( ) f ( ij ) 単調減少関数 単調増加関数 空間上の距離と単調変換の値の誤差を d ij d ij eij d ij 単調変換 = 空間上の距離 eij とする (a) 5 ストレス(Stress) すべての誤差 eijの二乗和 データと、空間上の距離の 適合度 S ( d d ) ij ij i j d i j 2 (1) 2 ij この値が最も小さくなるような 単調関数と対象の布置を求める。 6 3.モンテカルロシミュレーション実験 変量1・2・3 変量4・5 第1ブロック 第2ブロック 変量6・7・8 変量9~13 変量14~20 第3ブロック 第4ブロック 第5ブロック となるよう相関係数を定め 乱数を用いそれぞれを 1000組発生させる。 変量間の相関行列を算出 相関行列を入力データとし、 クラスカルの方法へ適用 7 実験結果 1.4 2次元選択 VAR4 VAR5 1.0 (Stress;0.183) VAR3 VAR1 VAR11 VAR2 0.6 VAR8 視覚的に見やす いことを前提 次元 2 VAR6 VAR7 0.2 -0.2 VAR20 VAR18 VAR19 VAR15 VAR14 VAR16 VAR17 -0.6 Stressの値 高いが無視 -1.0 -1.2 VAR13 -0.8 -0.4 VAR12 VAR10 VAR9 0.0 0.4 0.8 1.2 次元 1 (図3)最終布置 2D散布図 5個のブロックを形成 相関行列で定義された類似度 クラスカルの方法適用 相関行列を正確に反映 有効な分析可能! 8 4.実際のデータへの適用 中学生166人の12教科の評点 12教科の相関行列を算出 (表2)中学2年生166人 2学期 12教科の評点 生徒番号 国語 社会 数学 理科 音楽 美術 体育 技家 英語 小4配当漢字 小5配当漢字 小6配当漢字 1 32 41 50 64 64 66 37 43 22 62 68 52 2 38 23 46 60 69 72 54 66 12 48 46 32 3 30 30 25 59 68 72 36 54 10 28 36 42 ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ 166 60 85 88 82 59 78 85 47 83 79 84 74 9 (表3)12教科の相関行列 国語 社会 数学 ・ ・ ・ 小5配当 小6配当 国語 1 0.7825 0.735 ・ ・ ・ 0.7819 0.7595 社会 0.7825 1 0.7873 ・ ・ ・ 0.6757 0.696 数学 0.735 0.7873 1 ・ ・ ・ 0.6076 0.5651 ・・・ ・・・ ・・・ ・・・ ・・・ ・・・ 小5配当 0.7819 0.6757 0.6076 ・ ・ ・ 1 0.8842 小6配当 0.7595 0.696 0.5651 ・ ・ ・ 0.8842 1 入力データとしクラスカルの方法 へ適用・分析 10 分析結果 2次元選択 (Stress;0.0113) 0.2 小4配当 小6配当 小5配当 0.1 次元 2 0.0 他のすべての教科と 国語 美術 英語 社会 数学 音楽 理科 体育 相関の低い体育 -0.1 2次元最終布置退化 -0.2 -0.3 -4 技家 -3 -2 -1 次元 1 (図4)最終布置 2次元選択 中学生 成績 0 1 3次元を選択し、計算 をやり直す。 11 3次元選択 (Stress;0.023) 散布図中の科目間距離 科目の組 と 単調関数 4.0 f( ) 3.5 3.0 . 2.5 2.0 . 1.5 d ij = 単調関数は右下がり ・ (i, j) . eij 1.0 0.5 . d ij 0.0 -0.5 0.0 相関係数は類似度 0.2 0.4 . 0.6 0.8 1.0 ij データ(相関係数) (図5)シェパード・ダイアグラム シェパード・ダイアグラム 単調関数と科目の組を比較 データ ij と散布図中の距離 d ij の当てはまりの良さを示す。 12 3次元選択した場合の最終布 置 美術 音楽 数学理科 次 元 3 ・小6配当 生徒の持つ体力 小5配当 社会 ・ 手先の器用さ 英語 体育 国語 小4配当 ・ 感性の強さ に左右される。 感 性 技家 次元2 器用 次元1 体力 (図6)最終布置 3次元選択 中学生 成績 解釈 中学2年生の12教科の成績の評点 13 5.おわりに 結論 相関行列により定義されたの変量間の類似度を、クラスカル の方法へ適用する分析方法は、データの特性を知るうえでた いへん有効であることがわかった。 応用分野 経営 管理 経営 診断 生物学 MDSと相関ルールの関連性 心理学 14 スーパーの経営管理 コスメ タバコ お菓子 お茶 弁当 パン 牛乳 雑誌 つまみ 酒 パンツ MDS による(仮想的)商品配置図 15 酪農経営 経営診断 16 主成分分析の結果 因子負荷量 , 因子 1 vs 因子 2 vs 因子 3 回転法: バリマックス 法 抽出法: 主成分分析 小6配当 小 5配当 小4配 当 国語 美術 音楽 英語 社会 数学理科 技家 体育 17
© Copyright 2024 ExpyDoc