1997.11.20 行動談話会 因子分析と共分散構造分析 ----- 最尤法のススメ ----狩野 裕 (行動工学・行動計量学) http://koko15.hus.osaka-u.ac.jp/~kano/ 1 自己紹介 専門:方法論,数理統計学・行動計量学 • 大阪大学理学部数学科卒業, 基礎工学研究科数理系専攻修了 • • • • • 海技大学校教養科 (運輸省) 大阪大学基礎工学部数理教室 大阪府立大学工学部数理工学科 筑波大学数学系情報数学 大阪大学人間科学部行動計量学 2 FACULTY OF HUMAN SCIENCES 行動学専修 行動 工学 社会学専修 教育学専修 心理学実験:講座紹介 3 FACULTY OF HUMAN SCIENCES 行動学専修 ボラン ティア 社会学専修 教育学専修 心理学実験:講座紹介 4 関連学会など 日本心理学会 Ⅰ Ⅱ Ⅲ Ⅳ Ⅴ 知覚 生理 思考 学習 発達 教育 臨床 人格 犯罪 矯正 社会 産業 文化 方法 原理 歴史 一般 日本 米国 行動計量学会 Psychometric Society 600(22) 913 ASA 統計学会 15,000(??) 1,367 APA 心理学会 ???(??) 5,500 5 Methodologist の仕事 • 方法論の研究 – 最適性,体系化,特長付,何をしているか • 新しい統計解析法 – 開発・普及・ソフトウェア化 • 既存の統計解析法 – 評価・改良 • Do,or Don’t Do!! – ガイドライン,使い分け,限界 • 応用研究(方法論を第一目的としない) 6 History of Academic Activities 1997 漸超 近高 理次 論の 不 適 解 の 問 題 楕 円 分 布 論 入共 門分 散 構 造 分 析 1990 推測の頑健性(CSA) 基礎 識別性 一致性 因子の 不確定性(FA) 非反復推定法 (FA) 臨床 1983 博士課程進学 7 本日のメニュー • 因子分析モデルと因子抽出法 – 主成分分析 ・ 主因子法 ・ 最尤法 • 2組のデータの因子分析 – “ある”データ ・ 読解力のデータ • なぜ最尤法か • 検証的因子分析 • まとめ 8 因子分析モデルとは 観測変数間の内部相関(共分散)を 潜在変数からの影響の結果として 説明する統計モデル 9 イメージでの理解 10 因子分析の実行プロセス • • • • • • • • データの吟味:2値データ,カテゴリカルデータ,偏りのあるデータ 主成分分析 vs 因子分析 相関行列 vs 分散共分散行列 因子抽出法:主因子法,最尤法,共通性の推定値は? 因子数の選定:1より大きい固有値数,スクリー法,適合度検定 因子抽出時の問題:共通性が1を超えました.反復が収束しません. 回転方法+直交軸か斜交軸か 結果の解釈 11 因子分析の因子抽出法 ------ 探索的因子分析の推定方法 ------ • • • • • • • 主成分分析(PCA) 主因子法,主軸法(PFA,PAF) 反復主因子法(PFA,PAF) 最尤法(ML) 最小2乗法(ULS,LS) 一般化最小2乗法(GLS) その他たくさん 12 簡便因子抽出法 非反復 ソフトウェア SAS 反復 共通性 共通性 共通性 共通性 1 SMC 1 SMC 主成分分析 主因子法 反復主因子法 反復主因子法 M=PRIN M=PRIN PRIORS =SMC M=PRINIT 主成分分析 主成分分析 主因子法 SPSS /EXTRACTION PCA Statistica 主成分分析 /EXTRACTION PAF /CRITERIA ITERATE(1) 共通性=SMC PAF: Principal Axis Factoring /DIAGONAL (1,1,....,1) /EXTRACTION PAF M=PRINIT PRIORS =SMC 主因子法 /EXTRACTION PAF 主軸法 13 二組のデータの因子分析 ---- 因子抽出法の比較 ---• データ:“ある”データ,読解力のデータ • 分析方法:主成分分析,主因子法, 反復主因子法,最尤法 14 “ある”データの分析(N=100) X1 X1 1.000 X2 0.088 X3 0.024 X4 -0.089 X5 0.076 X6 0.095 X7 -0.099 X8 -0.110 X9 -0.028 X10 -0.006 X2 X3 X4 X5 X6 1.000 0.057 -0.096 0.073 0.009 -0.030 0.082 0.072 -0.183 1.000 -0.024 0.046 0.014 0.147 -0.023 0.066 0.006 1.000 -0.018 -0.126 -0.154 0.034 -0.020 -0.026 1.000 0.114 0.099 0.179 0.076 -0.047 1.000 0.020 -0.104 -0.108 0.176 X7 X8 X9 X10 1.000 -0.101 1.000 -0.230 0.161 1.000 -0.091 0.190 0.037 1.000 15 主成分分析+回転(バリマックス法) 回転後の空間の成分プロット 回転後の成分行列 1.0 成分 2 .386 .504 .347 -.511 .567 .386 .262 .100 .107 -.083 x5 x2 .5 x7 x6 x1 x3 x9x8 0.0 x10 x4 -.5 2 1 X1 -.069 X2 .175 X3 -.063 X4 .186 X5 .228 X6 -.215 X7 -.559 X8 .682 X9 .661 X10 .258 因子抽出法: 主成分分析 の 成 分 -1.0 -1.0 -.5 0.0 .5 1.0 1 の成分 16 主因子法+回転(バリマックス法) 回転後の因子行列 回転後の因子空間の因子プロット 回転後の因子空間の因子プロット a 1.0 因子 1 X1 -.035 X2 .095 X3 -.037 X4 .098 X5 .143 X6 -.108 X7 -.358 X8 .445 X9 .401 X10 .191 因子抽出法: 主因子法 2 .194 .257 .184 -.289 .332 .246 .204 .052 .022 -.037 .5 x7 x6 x1 x3 x5 x2 x10 0.0 x9x8 x4 -.5 2 因 子 -1.0 -1.0 -.5 0.0 .5 1.0 因子1 17 反復主因子法+回転(バリマックス法) 回転後の因子空間の因子プロット 回転後の因子空間の因子プロット 回転後の因子行列 1.0 因子 2 .110 .198 .192 -.263 .415 .187 .339 .077 -.032 -.057 .5 x5 x7 x6 x3 x2 x1 x10 0.0 x8 x9 x4 -.5 因 子 2 1 X1 -.036 X2 .108 X3 -.024 X4 .087 X5 .207 X6 -.101 X7 -.345 X8 .516 X9 .414 X10 .148 因子抽出法=主因子法 反復回数=15 -1.0 -1.0 -.5 0.0 .5 1.0 因子1 18 最尤法+回転(バリマックス法) 共通性 初期の X1 .060 X2 .078 X3 .039 X4 .063 X5 .094 X6 .103 X7 .147 X8 .145 X9 .107 X10 .134 因子抽出法: 最大尤度 因子抽出 .024 .007 .022 .024 .046 .011 .999 .999 .072 .041 1.0より大きい1つまた は複数の共通性推定 値が反復間に発生し ました。 結果の解を解 釈する時は注意してく ださい。 19 最尤法+回転(バリマックス法) 回転後の因子空間の因子プロット 回転後の因子行列a 1.0 因子 .5 x5 x9 x10 x2 x4 x3 x1 x6 0.0 x7 -.5 因 子 2 1 2 X1 -.099 -.120 X2 -.030 .079 X3 .147 -.009 X4 -.154 .019 X5 .100 .190 X6 .020 -.103 X7 .999 -.004 X8 -.097 .995 X9 -.230 .139 X10 -.090 .182 因子抽出法: 最尤法 回転法: Kaiser の正規化を伴うバリマッ クス法 a. 3回の反復で回転が収束しま した。 -1.0 -1.0 -.5 0.0 .5 1.0 因子1 20 “ある”データの解析のまとめ • • • • 主成分分析:解釈可能な解 主因子法:解釈しにくい解 反復主因子法:解釈しにくい解 最尤法:解釈できない不適切な解 (共通性>1) 21 スクリープロット 因子のスクリー プロット 1.6 1.4 1.2 1.0 .8 固 有 値 .6 .4 1 2 3 4 5 6 7 8 9 10 因子の番号 22 読解力のデータ(Davis) X1 語彙に関する知識 X2 与えられた状況に合致するように単語の意味を選択する力 X3 文章の構成を把握し,起こった事柄を識別する力 X4 文章の主題を捉える力 X5 文章中で正確に答えられている質問に答えられる力 X6 文章中とは異なった表現で問われた質問に答えられる力 X7 文章から内容に関して推論する力 X8 文学的表現を理解し,雰囲気を捉える力 X9 著者の意図を見抜く力 23 読解力のデータ: 相関行列(N=421) X1 X2 X3 X4 X5 X6 X7 X8 X9 X1 X2 X3 X4 X5 X6 X7 X8 1 0.72 0.41 0.28 0.52 0.71 0.68 0.51 0.68 1 0.34 0.36 0.53 0.71 0.68 0.52 0.68 1 0.16 0.34 0.43 0.42 0.28 0.41 1 0.30 0.36 0.35 0.29 0.36 1 0.64 1 0.55 0.76 1 0.45 0.57 0.59 1 0.55 0.76 0.68 0.58 X9 1 24 スクリープロット 因子のスクリー プロット 6 5 4 3 2 固 有 値 1 0 1 2 3 4 5 6 7 8 9 成分番号 25 因子分析(1因子) 変数 主成分分析 反復主因子法 最尤法 X1 0.83 0.81 0.81 X2 0.84 0.81 0.81 度 X3 0.53 0.47 0.48 X4 0.47 0.41 0.41 由 2 i X5 0.72 0.67 0.67 X6 0.89 0.89 0.89 X7 0.86 0.84 0.84 X8 0.71 0.66 0.66 X9 0.86 0.84 0.84 26 ---- 2因子分析 ---主成分分析+回転(バリマックス法) 回転後の成分行列 a 回転後の空間の成分プロット 1.0 成分 1 2 .116 .277 -.338 .858 .201 .219 .213 .275 .234 .5 x8 x2 x7x6 x5 x9 x1 0.0 x3 -.5 2 X1 .834 X2 .789 X3 .657 X4 .237 X5 .694 X6 .868 X7 .832 X8 .660 X9 .824 因子抽出法: 主成分分析 x4 の 成 分 -1.0 -1.0 -.5 0.0 .5 1.0 1 の成分 27 主因子法+回転(バリマックス法) 回転後の因子空間の因子プロット 回転後の成分行列 1.0 因子 1 X1 .712 X2 .620 X3 .447 X4 .189 X5 .470 X6 .665 X7 .625 X8 .417 X9 .612 因子抽出法: 主因子法 2 .414 .523 .212 .409 .484 .586 .557 .525 .568 .5 x4 x7x6 x8x5 x9 x2 x1 x3 0.0 -.5 2 因 子 -1.0 -1.0 -.5 0.0 .5 1.0 因子1 28 反復主因子法+回転(バリマックス法) 因子行列 a 2個の因子の抽出が試みられました。反復 100 で変数の共通性が1.0を超えました。 抽出が終了しました。 29 最尤法+回転(バリマックス法) 回転後の因子行列 a 因子 1 X1 .380 X2 .616 X3 .380 X4 .408 X5 .608 X6 .784 X7 .713 X8 .587 X9 .710 因子抽出法: 最尤法 回転後の因子空間の因子プロット 共通性 2 .924 .526 .287 .135 .312 .445 .442 .310 .443 .999 .655 .227 .185 .467 .813 .704 .441 .701 x2 .5 x9 x6 x7 x5 x8 x3 x4 0.0 -.5 因 子 2 1.0より大きい1つまたは複 の共通性推定値が反復間に 数 発生しました。 結果の解を解 釈する時は注意してください。 x1 1.0 -1.0 -1.0 -.5 0.0 .5 1.0 因子1 30 読解力のデータの解析のまとめ • 主成分分析:解釈できるかもしれない解 • 主因子法:解釈しにくい解 • 反復主因子法:解釈できない不適切な解 (共通性>1) • 最尤法:解釈できない不適切な解 (共通性>1) 31 二組のデータの因子分析のまとめ ---- 解釈可能性 ---読解力の “ある”データ データ 主成分分析 ○ ○ 主因子法 △ △ 反復主因子法 △ 共通性>1 最尤法 共通性>1 共通性>1 32 種明かし • “ある”データ:互いに独立に分布する 10変数の相関行列 • 読解力のデータ:通常の因子分析では 適切に分析できないデータ(識別性の 問題) 33 共通性が1を超えるのは悪いことか? ---- 解析に対する警告 ---へんなデータ きちんとしたデータ 不適切なモデル きちんとしたモデル 主成分分析 意味ありげな 安定 主因子法 結果 反復主因子法 警告(遅い)※ 安定(遅い)※ 最尤法 警告 ふつうは安定 ※ 収束判定基準を厳しくし(e.g., convergence=0.00001), 最大反復回数を十分大きく取る(e.g., iteration=500) 34 Methodologist からの提言 へんなデータに対しても意味ありげな解を 与える主成分分析・主因子法や 判定が遅い反復主因子法よりも 厳しい警告を瞬時に発する最尤法を利用 したい. 35 読解力のデータ: 検証的因子分析結果 変数 V1 V2 V3 V4 V5 V6 V7 V8 V9 語彙力 0.85 0.85 0 0 0 0 0 0 0 読解力 0 0 0.48 0.41 0.68 0.90 0.84 0.66 0.84 36 モデルの適合度 指標 検証的因子分析 カイ2乗値 36.412 df 26 p-value 0.08435 AIC -15.58827 GFI AGFI CFI 0.982 0.969 0.995 1因子モデル 54.952 27 0.00116 0.95169 0.973 0.955 0.987 37 読解力のデータ:因子分析の吟味 ---- なぜ通常の因子分析はうまくいかないのか ---- 答:二つの変数にしか関連しない因子がある ときは,通常の因子分析は不可能 * * 因子パタ ーンが 0 0 * * * * である と き , 通常の因子分析は不可能. 38 証明 と なる . こ こ で, 因子モデルのパラ メ ータ が以下のよ う である と する . 11 11 21 21 Cov(x) 0 2 0 2 0 0 証明のポイ ント は, 因子負荷量などのパラ メ ータ が から 一意に決定さ れないこ と . つま り から パラ メ ータ が識別 でき ないこ と を示す. * 1 1 11 11 11 1222 21 , *21 21 11 1222 21 11 21 * 1/ 2 1/ 2 2 0 1222 222 因子相関行列 は正定値であり , = 11 12 と 分割する と , 21 22 T a a b b Cov(x) 0 *2 0 *2 0 0 * 1 11 a2 2 *21 b2 3 p と なって, 識別可能でないこ と が証明さ れる . T 1 1/ 2 1 1/ 2 = 11 122221 1222 11 122221 1222 1/ 2 1/ 2 0 22 0 22 と かける . こ のこ と に注意する と , T * * 11 11 * * 21 21 0 *2 0 *2 0 0 0 である . さ て, a, bを ab 1121なる 任意の実数と する と T 39 WISC-R データの 因子分析 40 現在主流の分析方法 固有値による 因子数選定 + 主因子法 最尤因子分析 + 適合度の評価 検証的因子分析 + 適合度の評価 因子分析不可 41 まとめにかえて ---- 因子分析の手順 ---- • 分析の当初は主因子法などを行なってもよいが,論 文として出版するには最尤法(ML)による分析が要 求されるであろう. • MLで共通性が1を超えたり(不適解),反復が収束 しないときは,検証的因子分析の適用を考える. • 検証的因子分析では適合度の吟味が重要である. • 因子分析的接近が成功しないデータもある. • 従来の因子分析プログラムに加えて,共分散構造 分析のプログラムが必要な場合がある. 42 最近の興味 • 探索的因子分析のコンテックストにおける, 不適解(共通性が1を超える解)の原因と 処理 (紀要論文) • (本来の)共分散構造分析とその効果的な 適用法 • Bootstrap法とその利用方法:多変量解 析でBootstrap法は有効か 43 共分散構造分析とは 直接観測できない潜在変数を導入し,その 潜在変数と観測変数との間の因果関係を同 定することにより社会現象や自然現象を理 解するための統計的アプローチ.基本的に 非実験多変量データの分析方法で,因子分 析と多重回帰分析(パス解析)の拡張. 44 参考文献 • 狩野(1997). AMOS EQS LISREL によるグラフィカル 多変量解析 --- 目で見る共分散構造分析 --- 現代数学 社. • 狩野(1996.2~1997.3). 共分散構造分析とソフトウェア.B ASIC数学連載記事.現代数学社. • 狩野(1997).不適解の原因と処理:探索的因子分析.大 阪大学人間科学部紀要. 45
© Copyright 2025 ExpyDoc