因子数決定法,斜交回転法, 階層因子分析 香川大学経済学部 堀 啓造 2004.2.14 好み研 女子栄養大学 v.2 1 因子分析の歴史 • 1904 Spearman の論文 • The proof and measurement of association between two things. American Journal of Psychology, 15, 72-101 • General intelligence, objectively determined and measured. American Journal of Psychology, 15, 201-293 • ->因子分析100年 2 1901 Pearson 主成分分析(Burtによって言及,論文への 言及は1947 Thurstone) 1904 Spearman 因子分析。一般因子(gは1914に命名)2 因子(一般因子と独自因子) 四価差法で求める 1920s Burt Pearsonへの言及し,Spearman はたいしたこ とがない。 Thompson 数学 >>不定性 1920-50 知能に関する論争活発 1932 Thurstone 多因子説,単純構造, 主軸法,共通性 1933, 35 Hotelling 主成分分析を精錬 1935 Thurstone “Vectors of mind”.セントロイド法 1937 Holzinger bi-factor モデル 1941 Holzinger & Harman "Factor analysis" Thurstone & Thurstone 斜交回転 電算機使用 1944 Thurstone 2次因子 1947 Thurstone "Multiple-factor analysis" 3 1949 Burt 階層因子説、1950 Vernon 階層因子説 1954 Guttman 因子数の下限(対角1 ,対角SMC) 1958 Kaiser Varimax 回転 1959 Guilford (秋重監訳)『精神測定法』 セントロイド法 1960 Harman "Modern factor analysis“ Kaiser 基準 1962 三好稔(編)『心理学と因子分析』 1963 Lawley & Maxwell 最尤法 1965 Horn 平行分析(因子数決定法) 1967 Joreskog 最尤法の計算 1969 Joreskog 確証的最尤法 1972 芝祐順 『因子分析法』東京大学出版会(1979 2版) Mulaik "The foundations of factor analysis" 1976 Burt(1883-1971)の知能データねつ造発覚 Harman "Modern factor analysis(3rd ed.)" 1983 Gorsuch "Factor analysis(2nd ed.)" (初版 1974) 1989 Bollen SEM本 4 歴史文献 • Cowles, M. (2001). Statistics in psychology: An historical perspective.(2nd ed.). LEA. • Mulaik, S. A. (1987). A brief history of the philosophical foundations of exploratory factor analysis. Multivariate Behavioral Research, 22, 267-305. – ギリシャ時代の哲学から近代哲学までの因子分析的考え。 Pearson からの因子分析に関する論争をまとめる。g因 子,因子分析の不定性の問題など。 • Thurstone, L.L. (1940) Current issues in factor analysis. Psychological Bulletin, 37, 189-236. • Lovie 5 (2)因子分析の前に (a)サンプル数と相関係数の誤差 心理データの信頼性 0.6-0.7 人間の意識の場合200人以上必要 個人の信頼性は低いが構造は安定 ・・・SD法 (b)変数サンプリング Gorsuch ランダム、系統 偏りがあると問題 (c)因子当たりの項目数 5以上ある (d)因子分析をするのに適切であるか? 正規分布・歪み・外れ値 外れ値には敏感である必要がある。 極端な歪みがある場合も要注意->自尊心データ 順序尺度・間隔尺度・2値データ KaiserのMSA(KMO) Measuremsnt of Sampling Adequecy 6 相関係数95%信頼区間 7 自尊心データヒストグラム(n=207) 20 0.1 1 2 3 4 T2001 5 0.0 6 2 3 4 T2002 5 0.0 6 0.2 20 0.1 1 2 3 4 T2005 5 Count 40 0.0 6 40 0.2 20 0.1 0 0 1 2 3 4 T2003 5 0.0 6 0.4 60 0.3 40 0.2 20 0.1 1 2 3 4 T2006 5 0.0 6 60 0.3 40 0.2 20 0.1 1 2 3 4 T2004 5 0.0 6 100 80 0.4 60 0.3 40 0.2 20 0.1 0 0 0.4 0 0 100 80 0 0 0.3 80 1 2 3 4 T2007 5 0.0 6 80 0.4 60 0.3 40 0.2 20 0.1 0 0 1 2 3 4 T2008 5 Proportion per Bar 0.3 60 Proportion per Bar Count 1 Proportion per Bar 60 Proportion per Bar 0.4 0.0 6 100 60 0.3 40 0.2 20 0.1 1 2 3 4 T2009 5 0.0 6 80 0.4 60 0.3 40 0.2 20 0.1 0 0 1 2 3 4 T2010 5 0.0 6 Proportion per Bar 0.4 Proportion per Bar 80 Count 100 Count 0.1 100 80 0 0 20 0 0 100 0 0 0.2 Count 0 0 40 0.4 Count 0.2 0.3 80 Count 40 60 Count 0.3 0.4 Proportion per Bar 60 80 100 Proportion per Bar 0.4 100 Proportion per Bar 80 Count 100 Proportion per Bar Count 100 分布がゆがんでいる 8 豊田外向性データ(n=434)3値データ 0.2 0.1 0.1 0.0 3 0 0 1 A 2 0.2 1 2 0.0 3 0 0 1 2 0.0 3 0 0 1 2 Count Count 0.3 100 0.2 0 0 1 2 300 200 0.4 0.3 100 0.2 0.1 0.0 3 0 0 1 2 0.0 3 0 0 1 2 0.2 0.1 0.0 3 Count Count 100 0.4 0.3 100 0.2 0.1 0 0 1 2 Q 0.0 3 200 0.4 0.3 100 0.2 0.1 0 0 1 2 R 0.0 3 Count 0.5 200 0.4 0.3 100 0.2 9 0.1 0 0 0.0 3 1 2 S 0.0 3 0.1 0 0 1 2 T 0.0 3 Proportion per Bar 0.2 200 2 0.6 Proportion per Bar 0.5 Proportion per Bar 0.5 Proportion per Bar 0.5 Proportion per Bar 0.5 0.3 1 300 0.6 0.3 0.2 0.1 0 0 300 0.6 0.4 0.3 O 0.6 200 0.4 100 0.0 3 0.6 0.4 0.5 200 N 300 0.0 3 0.6 0.1 M 300 2 Proportion per Bar 0.4 0.1 0.0 3 1 300 Proportion per Bar 200 Proportion per Bar Proportion per Bar 0.2 0.2 0.1 0 0 300 0.5 100 0.3 100 J 0.5 0.3 0.4 I 0.5 0.4 0.5 200 0.0 3 0.5 200 0.6 0.1 0.6 Proportion per Bar Count 0.2 0.1 L Count 100 300 K 2 0.3 H 0.1 100 0.4 0.6 0.2 200 200 Count Count Count Count 100 0.0 3 300 0.6 0.3 P 0.3 2 Proportion per Bar 0 0 1 E 0.6 0.4 1 0.4 0.1 0.0 3 0 0 Proportion per Bar 0.2 200 Proportion per Bar 100 Proportion per Bar 0.3 0.2 D 0.5 0.4 0.3 0.1 0.0 3 0.5 300 2 2 0.5 300 1 1 0.5 200 0.4 100 300 G 100 0 0 300 F 200 0.0 3 0.6 Proportion per Bar 2 2 0.6 0.2 1 1 C 0.1 0 0 0 0 0.5 200 0.1 0.6 0.3 100 0.2 0.6 0.4 0 0 0.0 3 300 200 100 0.1 B 300 0 0 0.2 0.3 Count 2 100 0.4 Count 1 0.3 200 Count 100 0.4 Count 0.3 200 Count 0.4 Count Count 0.2 200 0.6 Proportion per Bar 0.5 Proportion per Bar 0.5 Proportion per Bar 0.5 Proportion per Bar 0.5 0.3 0 0 300 0.6 0.4 100 300 0.6 Proportion per Bar 200 300 0.6 Count 300 0.6 Count 300 (3)因子分析 (a)抽出法 (b)因子数を決めないと分析できない (c)回転 (d)階層因子分析・高次因子分析 10 (a)因子抽出法 • 共通性を反復推定しないときはおおきな問題 だった。SMC、最大相関(絶対値) • • • • 何を最小にするのか->適合度 主因子法(主軸法、主因子法) 最小2乗法 最尤法 11 適合度関数 F • χ2値を求める前の距離(乖離度)つまり適合度関数(F)を Loehlin(1998)に従って示す。 1 F trace((S C)V )2 ・・・ (1) 2 • S は測定されたデータの相関行列(R)または共分散行 列(S) ここではS C は推測されたモデルから再生された相関行列または 共分散行列 Σ,Σ(θ^)などと表される。 12 復元相関行列 C • ここでは簡単のため相関行列で考える。 因子分析の因子パタン行列をAとすると • 復元相関行列 C=(AA’の対角に1を入れる) ……(2) • ('は転置を示す SPSSではT) 13 重みづけ V • 最小2乗法 OLS のときは V=I …(3) • 重み付き最小2乗法 GLS のときは V=S-1 …(4) • 最尤法 ML のときは V=C-1 …(5) 14 • (1)式により3つの方法を統一して理解できることを 示している。S-Cつまり残差行列に重みをつける付 け方が、OLS,GLS、mlによって違う。OLSは単位行 列をかけているのでそのまま。そのtrace なので、 残差行列の非対角要素の2乗和÷2つまり、下三角 の非対角要素の2乗和となる。GLSは標本相関行 列によって重みをつけている。(5)の方法はRLS (Reweighted Least Squares)と呼ばれている。 MLの場合実際は F=ln|C|-ln|S|+trace(SV-1) …(6) • 。(1)式は独立モデルのときに使われる。また、(1)の 式と(6)式は値は多少異なるが、比例関係にある。 • 適合度が変化しなくなれば収束したとする。 15 χ2値 • χ2=F*(N-1) …(7) N=サンプルサイズ としてχ2値が求められる。 • 共通性を代入してもF値が一定以上変化しな ければ収束 16 各抽出法の特徴 • 最尤法ー統計学からみていい性質、いろんな 適合度指標をもっている。多変量正規分布を 仮定している。ただし、正規分布に関して多 少頑健。不適解が起こりやすい。これは短所 でもあり長所でもある。 • 最小2乗法ー正規分布の仮定がない。ゆが んだデータにもいいfit をする。収束が速い。 • 主因子法ー不適解になりにくい。収束が遅い。 17 抽出法の選択 狩野さんの発言を追いかければ (1)最尤法と最小2乗法をやってみる。 (2)同じ結果なら最尤法を採用 (3)気になるほど異なる結果なら最小2乗法を採用 (4)初心者は反復主因子解のほうがいいかもしれ ない。不適解が少ない。 (5)ただし,解が収束すれば,最小2乗法と反復主 因子法とは同じ ((5)は日心での服部さんのfprワークショップ) ということになる。 18 (b)因子数決定 • 因子数を決めないと分析できない ・固有値1以上 基準がよく使われる。 ・スクリー法 ・寄与率 ・因子に有効な項目数2以上 ・MAP ・平行分析 PA 95% ・解釈可能性 1因子の決定が難しい。両極性問題 少なすぎる因子数、多すぎる因子数の問題 19 推奨する因子数決定法 • MAPを最小因子数、対角SMC平行分析 95%(PA-SMC95)を最大因子数とし、解釈可 能性を軸としながら因子数を決定する。 • Holzinger and Swineford(1939)の知能デー タ は両方とも4となり、4因子に確定する。 • Thurstone & Thurstone 60変数の知能デー タはMAP 8, PA-SMC95 10。8~10 20 固有値1以上の基準 • Kaiser 基準、Guttman-Kaiser 基準 • 相関行列の固有値が1以上となる数が因子 数である。 • Guttman は「因子数の下限」 • Kaiser の1960,1970の論文などから広く用い られている。-> 因子分析の自動処理 • 主成分分析において、1変数分以上の寄与を する。信頼性との関連も語られている。 21 Kaiser 基準の問題(1) • 平行分析の論文 Horn(1965) • カイザー基準は母相関行列に対してあてはま るが、標本相関行列では誤差によって固有値 が変動する。乱数の相関行列の固有値よりも 大きくて、固有値としての意味をもつ。 • =>因子数を多目に推論してしまう。 22 Kaiser 基準の問題(2) • 平行分析への批判から • 一つ目の固有値に関しては意味のある結果がでて いるが、因子間に相関がある、第1固有値が大きい と第2固有値以降は小さくても意味のある因子であ る。 • =>因子数を少な目に推測してしまう。 • 両方あわせると、カイザー基準では因子数を 多くも、少なくとも、正しくも推測することがあ る。 • =>カイザー基準は大雑把。 23 スクリー基準 • • • • Cattell (1966) 簡単にわかる ->機械的処理への試み SE-scree 24 因子のス ク リ ー フ ゚ ロ ッ ト 8 6 判断は簡単 固 有4 値 2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 因子の番号 25 共通性wide マイナー因子あり MacCallum et al. (1999) 26 因子のス ク リ ー フ ゚ ロ ッ ト 8 Thurstone and Thurstone(1941)の知能データ 6 判断が難しい例 固 有4 値 2 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 因子の番号 27 説明された分散の合計 回転後の 初期の固有値 抽出後の負荷量平方和 負荷量平 因子 合計 分散の % 累積 % 合計 分散の % 累積 % 合計a 方和 1 7.366 35.078 35.078 6.798 32.374 32.374 4.615 2 2.378 11.323 46.401 2.127 10.129 42.503 3.038 3 1.571 7.480 53.881 1.265 6.023 48.526 2.935 4 1.256 5.983 59.865 .919 4.378 52.905 4.168 5 1.182 5.631 65.495 .685 3.263 56.168 4.697 6 .941 4.479 69.974 .621 2.955 59.123 2.819 7 .852 4.057 74.031 .445 2.120 61.243 2.994 8 .711 3.385 77.416 9 .593 2.824 80.240 10 .495 2.356 82.596 11 .482 2.293 84.889 12 .462 2.201 87.090 13 .429 2.041 89.131 14 .379 1.806 90.938 15 .365 1.738 92.676 16 .327 1.556 94.232 17 .318 1.515 95.747 18 .300 1.427 97.174 19 .259 1.233 98.406 20 .189 .901 99.307 21 .145 .693 100.000 因子抽出法: 最尤法 a. 因子が相関する場合は、負荷量平方和を加算しても総分散を得ることはできません。 28 大きさに注目 平行分析(parallel analysis) Horn, J. L. (1965). A rationale and test of the number of factors in factor analysis. Psychometrika, 30, 179-185 • 同じ変数の数、同じサンプルの数の正規乱数行列 の相関行列の固有値を推定し、対応する固有値を 比較し、乱数データの相関行列の固有値のほうが 大きくなる前の因子までをとることを提案した。 • 乱数の相関行列を多数生成し、それぞれの第1固 有値の平均と、対象相関行列の第1固有値とを比 較する。次に第2固有値、第3固有値と比較していく。 Spss、SASのマクロや服部さんのプログラムがある。 29 Holzinger & Swineford(1939) data 平行分析の例1 対角1 30 平行分析2 • 対角SMCの相関行列の固有値を求める。 • 固有値の平均値の95%上限を採用する • Humphreys and Ilgen(1969)において、対角1のPAに加え、対 角にSMC、最大相関を入れるPAと最尤法のχ2テストとの関係 を調べている。最大相関のPAはよくない。対角SMCのPAの結 果が最尤法のχ2の結果とよく一致することを示した。 Humphreys and Montanelli(1975) では対角SMCのPA がML のχ2よりも優れていることを示した。最尤法の基準だと、小サン プルで低共通性のときに必ず過小推定してしまう。サンプル数 が増えるにつれ、過大推定をしてしまう。PA は共通性が広い範 囲であっても、狭い範囲であっても正しく因子数を推定する。た だし、単一の心理データと単一のランダムデータから推定すると、 過大、過小推定とも起こりうる。また、共通因子モデルがデータ への適合が貧弱な場合は、過大推定しやすい。 31 平行分析の例2 対角SMC 32 対角要素1の相関行列の固有値のスクリー・プロットと平行分析(対角1平均値) 8.0 7.0 Thurstone and Thurstone(1941)の 知能データ 6.0 固有値 5.0 4.0 3.0 2.0 1.0 0.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 2033 21 対角要素SMCの相関行列の固有値のスクリー・プロットと平行分析(95%) 8.0 7.0 Thurstone and Thurstone(1941)の知能データ 6.0 固有値 5.0 4.0 3.0 2.0 1.0 0.0 -1.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 34 MAP (minimum average partial) • Velicer, W. F. (1976). Determining the number of components from the matrix of partial correlations. Psychometrika, 41, 321-327. • 主成分を統制変数とする観測変数間の偏相 関係数を求める.そして,その2 乗平均を最 小とする主成分の数を抽出因子数とする. (服部, 2002) 35 • 主成分を統制したときの偏相関係数行列 R∗は次式によって定義される. 1 2 R* D R AAD D diagR AA Rは相関行列 Aは因子パタン 1 2 36 因子数決定法の評価 • Zwick and Velicer(1986)の人工データによ る実験。 • MAP がよい。次に平行分析(PA-M) • MAP はごくまれに少なく推定することがある。 • 平行分析は多目に推定することがある。 37 • 最尤法のχ2テストーサンプルがある程度大き くなると過大因子数 • AICーサンプルが大きくなると過大因子数。 • BICーサンプルが少ないと過小因子数。 • 最小2乗法での適合度指標は当てにならな い。 38 (1) MAPは常に正しいか、少ない因子数を推定 する。 (2) PA-SMC95 は正しいか、多い因子数を推 定する。 (3) MAP、PA-SMC95は安定した推定数をだ す(堀, 2003) 以上から、MAPとPA-SMC95の推定因子数の 間に正しい因子数があると考える。 39 MAPがうまくいかない場合 • Thurstone & Thurstone(1941)の60変数 データ、21変数データ 40 Thurstone & Thurstone 60変数 41 42 43 44 対角要素1の相関行列の固有値のスクリー・プロットと平行分析(対角1平均値) 16.0 14.0 12.0 8.0 6.0 4.0 2.0 58 55 52 49 46 43 40 37 34 31 28 25 22 19 16 13 10 7 4 0.0 1 固有値 10.0 45 対角要素SMCの相関行列の固有値のスクリー・プロットと平行分析(95%) 16.0 14.0 12.0 8.0 6.0 4.0 2.0 58 55 52 49 46 43 40 37 34 31 28 25 22 19 16 13 7 10 -2.0 4 0.0 1 固有値 10.0 46 Thurstone & Thurstone 21変数 47 48 49 対角要素1の相関行列の固有値のスクリー・プロットと平行分析(対角1平均値) 8.0 7.0 6.0 固有値 5.0 4.0 3.0 2.0 1.0 0.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 50 対角要素SMCの相関行列の固有値のスクリー・プロットと平行分析(95%) 8.0 7.0 6.0 固有値 5.0 4.0 3.0 2.0 1.0 0.0 -1.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 51 マイナー因子の影響 • 因子分析においてマイナー因子の影響は重 要である。平行分析においてランダム効果に ついては考慮しているが、マイナー因子につ いては考慮していない。マイナー因子の問題 を検討したのはTucker et al.(1969)である。 MacCallum et al.(2001) はTucker らの相関 行列作成法から母相関行列を作成し、その 行列を公開している。この行列を利用して因 子数決定法の検討をする。 52 MacCallumらデータ (1)因子決定性 (1因子あたりの項目数。20項目、3因子or 7因子) (2)共通性の大きさ ( high (.6 to .8),low (.2 to .4), wide(.2to .8)) (3)マイナー因子の大きさ (RMSEAの大きさ, 0.065, 0.090, 0.020) このうち(1)の操作には問題がある。20項目7因子の複数の場 合に7因子を再現できなかった。つまり、7因子の場合に一つの 因子に1項目しか負荷しないことが複数生じた。3因子の場合は このようなことがなかったので3因子の母相関行列を分析するこ とにする。 300ケースのデータとして処理する。 53 54 55 • PA-SMC95はマイナー因子の影響に弱い。 • MAPはマイナー因子の影響はない。逆にマ イナー因子がほとんどないRMSEA =0.025 の低共通性のときに因子数を少なく見積もっ ている。 56 過大、過小因子数 • どちらのほうが問題が大きいか? 57 少ない因子数の例 58 59 5因子解 60 4因子解 61 3因子解 62 2因子解 63 1因子解 64 1次元であること • • • • • 確定された方式はない。 最低限MAPにおいて1次元となる。 2因子であっても因子間相関が高い 階層因子分析で一般因子の寄与が高い 第1固有値が飛び抜けて高い • などが考えられる。 65 豊田外向性データ au1 色々な人と知り合いになるのが楽し い bu2 (逆)知らない人と話すときはかたくな る cu3 (逆)こちらから進んで友達を作ること が少ない du4 (逆)人目に立つようなことは好まな い eu5 (逆)異性(男なら女)の友達はほとん どできない fu6 人と広くつきあうのが好きである gu7 誰とでもよく話す hu8 (逆)新しい友達はなかなかできない iu9 (逆)無口である ju10 人中にでてもまごつかない ku11 話し好きである lu12 人と広く付き合うほうだ mu13 (逆)無口である nu14 自分はわりと人気者だ ou15 生き生きしていると人に言われる pu16 陽気である qu17 初対面のひとは自分ほうから話し かける ru18 よく人から相談を持ちかけられる su19 話題には事欠かないほうだ tu20 誰とでも気さくに話せる 66 スクリープロット 対角要素1の相関行列の固有値のスクリー・プロットと平行分析(対角1平均値) 8.0 7.0 6.0 固有値 5.0 4.0 3.0 2.0 1.0 0.0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 67 20 68 69 70 全変数4因子解 71 20変数の相関行列 72 3因子解の順序->崩れている 73 変数削除 • iu9 (逆)無口である ---X • mu13 (逆)無口である • tu20 誰とでも気さくに話せる---X • gu7 誰とでもよく話す • 2変数を落として再分析 74 18変数 75 76 18変数4因子解 77 因子間相関 78 18変数1因子解 79 1因子解と信頼性分析 • ju10 人中にでてもまごつかない • du4 (逆)人目に立つようなことは好まない • 信頼性分析から落ちる。項目を削除した時の クロンバックのα係数が同じかよくなる。 80 両極性問題 • 性格や感情語の反対語が同一次元にならば ないということが頻繁に起こる。 • これについて2次元であるとする考えと1次元 であるとする考えが対立している。 • SEMを使う必要がある。 81 (c)因子の回転法 • 回転法は大きく分けて、直交回転と斜交回転 がある。 • 直交回転はVarimax 回転が広く行われてい る。 • 斜交回転にも様々ある。代表的なのが – 直接オブリミン – プロマックス – Harris-Kaiser (ORTHOBLIQUE) 82 単純構造 (Thurstone) (1)回転後の因子行列の各行には,0の因子負荷量が 少なくとも1つは含まれていること (2)回転後の因子行列の各列には,0の因子負荷量が r個含まれていること (3)回転後の因子行列から,2列ずつを対にしてとりだ したとき,一方の列では0であるが,他方では0でな い変数がr個含まれていること (4)共通因子の数が4~5個以上の場合には,2列ず つ対にした両列において,因子負荷量が0であるテ ストがかなり多く含まれていること (5)2列ずつとりだした対の両列において,因子負荷量 83 がかなり大きいテストは少数であること 直接オブリミン • 間接オブリミン Carroll(1960) • 直接オブリミン Jennrich and Sampson (1966) – ->Harman 命名? • • • • • • • 間接オブリミン(γ), 直接オブリミン(δ-Harman) δ<0 小さい因子間相関 直交解に近くなる δ=0 中程度の相関 (direct quartimin) δ>0 大きい相関 (1=direct covarimin) Systat のヘルプ(訳が間違っていてわからない) Harman δ=0, -5, 0.1, 0.2, … 0.5 までをチェックする Gorsuch δ=1~-4 システマティックに変化させる。 84 δ 2 2 F (P) (b b bjp bjq ) n j1 j1 pq1 j 1 m n n n 2 2 jp jq • • • • F(P)を最小化する。bjpは因子パタン n 変数の数 m 因子数 δ=0 の時は直接quartimin 85 プロマックス • Hendrickson, A. E. and White, P.O. (1964) • Varimax 回転解をもとに回転する。 • Varimax回転の因子負荷量を2乗、3乗、4乗とする。 偶数乗のときは符号をつける。 • これをターゲット行列として回転させる。 • 計算が速い。かならず収束する。 • 因子間相関は高い。 • k=3,k=4が一般に使われる。k=4のほうが因子 間相関が高い • 理論モデルを正しく再現できない。 86 Harris-Kaiser (1964) • 独立解(power=0)と比例解(power=0.5)があ る。 • 独立解は高い因子間相関 • 比例解は直交に近い • 比例解は単純なモデルを再現できないことが ある。 • SASしかサポートしていない。But 小笠原さ んのfortran program 87 自尊心データ • Rosenbergの翻訳(山本真理子ほか) • 10項目 88 89 90 自尊心 初期解の プロット (2因子解) 91 varimax回転解 92 プロマックス 回転解(k=3) r=-0.493 93 プロマックス 回転解(k=4) r=-0.539 94 直接オブリミン 回転解(δ=0) r=-0.186 95 ハリス・カイザー回転 解 (power= 0 独立解) r=-0.497 96 ハリス・カイ ザー回転解 (power= 0.5 proportional 解)(2因子解) r=-0.234 97 斜交回転の評価 • どれを使っても因子パタンはそれほど変わら ない。ただし、因子間相関は変わる。 • 実用性ではpromax が優れている。 • 理論的には直接オブリミン • ハリス・カイザーはSASだけだという欠点があ る。しかし、限界値がはっきりしているのでわ かりやすい。 98 (d)階層因子分析 (1)Spearman(1904) のg因子 (2)Thurstone の単純構造(1931)->斜交解 知能のg因子説と多因子説のデータ分析による論争 (3)Holzinger, J.J(1937)または(1939) bi-factor モデル Spearman のみ名前を挙げている。 (4)Thurstone の2次因子(1944)->高次因子 (5)Burt(1949), Vernon(1950)の知能の階層因子説 (6)Schmidt and Leiman(1957)の階層因子解(特に Vernon に影響される。Holzinger も挙げる) 99 (7)Gorsuch, R. L. (1983). Factor analysis (2nd ed.). Hillsdale, NJ: Lawrence Erlbaum.行列による説明 (8)Wherry, R. J. (1984). Contributions to correlational analysis. New York: Academic Press. fortran progam list付き (9)Mulaik, S. and Quartetti, D.A. (1997). First order or higher order genreral factor? Structural Equation Modeling, 4, 193-211. ->同じ? この論文ではhigher order のほうを hierarchical factors, g から直接項目に負荷するモデ ルを nested factor model と呼んでいる。 100 プログラム (1)Statistica のプログラム (2)Johnson, W. L., & Johnson, A. M. (2000). Using spss/pc for higher order factoring. Educational & Psychological Measurement, 60(4), 648-649 (3)堀 啓造 SPSS ときど記(132) 2003/03/18 因子分析 拡張因子分析・高次因子分析 extension script http://www.ec.kagawau.ac.jp/~hori/spss/tokidoki13.html#132 101 階層因子モデル 102 高次因子モデル 103 高次因子の例 104 直交解 • 主因子法 因子行列 1 2 共通性 T2001 .740 .173 .578 T2002 .690 .421 .654 T2003 -.454 .447 .406 T2004 .563 .185 .351 T2005 -.674 -.142 .475 T2006 .609 .111 .384 T2007 .540 .061 .295 T2008 .082 .215 .053 T2009 -.626 .625 .782 T2010 -.803 .178 .676 • バリマックス回転 因子負荷量 1 2 T2001 .719 -.247 T2002 .808 -.010 T2003 -.146 .620 T2004 .575 -.143 T2005 -.646 .238 T2006 .575 -.230 T2007 .489 -.235 T2008 .184 .138 T2009 -.198 .862 T2010 -.585 .578 • 2乗和 • 2乗和 3.707 0.946 2.926 1.727 105 1次因子・2次因子 • プロマックス法 因子パタン行列 1 2 T2001 .718 -.078 T2002 .891 .210 T2003 .032 .652 T2004 .591 -.002 T2005 -.641 .089 T2006 .564 -.099 T2007 .468 -.129 T2008 .247 .205 T2009 .050 .908 T2010 -.467 .484 • 2乗和 2.891 1.611 • 因子間相関 1 1 1.000 2 -.493 2 -.493 1.000 • 主因子法 因子行列 • F1 F2 1 共通性 -.702 .493 .702 .493 106 階層因子分析 因子パタン • 階層因子分析 因子パタン • HO 1 F1 F2 T2001 -.678 .512 -.176 T2002 -.575 .575 -.007 T2003 .538 -.104 .441 T2004 -.504 .409 -.102 T2005 .621 -.460 .170 T2006 -.565 .409 -.164 T2007 -.509 .348 -.168 T2008 -.032 .131 .099 T2009 .745 -.141 .614 T2010 .817 -.417 .411 • 2乗和 3.522 1.482 .875 • プロマックス法 因子パタン行列 1 2 T2001 .718 -.078 T2002 .891 .210 T2003 .032 .652 T2004 .591 -.002 T2005 -.641 .089 T2006 .564 -.099 T2007 .468 -.129 T2008 .247 .205 T2009 .050 .908 T2010 -.467 .484 • 2乗和 2.891 1.611 107 AMOSによる高次因子 108 AMOSの標準化総合効果- 109 110 Amos による階層因子分析=nested factor model 標準化直接効果 111 階層因子分析の評価 • 尺度をつくるときはたいてい一般因子を想定した尺 度を作っている。その下位尺度を因子分析の結果と してある。bi-factor – ただし、性格検査など通常、直交解を想定している。 • 高次因子分析のように相関だけではわかりにくい。 モデル的把握は高次因子分析のほうがいい。 • 3次以上の複雑なモデルになるとSEMで行った方 がいいだろう。 112 プログラム • ○FACCON.EXE 服部環氏@筑波大学 http://www.human.tsukuba.ac.jp/~hattori/faccon/f accon.html • ○ excel vba program for faccon.exe コバンザメア プリ (愛称:忍者ハットリ君)堀 啓造@香川大学 http://www.ec.kagawau.ac.jp/~hori/delphistat/hattori.html • ○階層因子分析 macro & script • http://www.ec.kagawau.ac.jp/~hori/spss/spss.html#hfactor 113 参考サイト • 調査データ分析 http://www.ec.kagawa-u.ac.jp/~hori/chosadata/index.html • parallel analysis (因子分析の因子決定法)(2001/8/31) http://www.ec.kagawa-u.ac.jp/~hori/yomimono/pa.html • 因子数決定法の検討-Holzinger and Swineford(1939)の知能データをもとにして (2003/3/23) http://www.ec.kagawa-u.ac.jp/~hori/yomimono/pa2.html • 因子分析練習帳1 Gorsuch(1983)変数サンプリング http://www.ec.kagawa-u.ac.jp/~hori/yomimono/fanote1.html • 因子数決定におけるマイナー因子の影響の検討 http://www.ec.kagawa-u.ac.jp/~hori/yomimono/MacCallum.html • 日心2000ワークショップ 心理学の基礎(6) 因子分析の基本問題(2000/11/11) http://www.ec.kagawa-u.ac.jp/~hori/spss/pwork.html • 探索的因子分析リンク集(日本語中心) http://www.ec.kagawa-u.ac.jp/~hori/spss/factorlink.html 114 データ • Thurstone 知能データ – L.L. Thurstone(1887-1955) のPrimary Mental Abilities – http://www.ec.kagawau.ac.jp/~hori/yomimono/Thurstone.html • 自尊心データ – http://www.ec.kagawau.ac.jp/~hori/chosadata/fashion02.sav • 外向性データ – 豊田秀樹『項目反応理論[入門編]』朝倉書店 115
© Copyright 2025 ExpyDoc