コメント 狩野裕 (大阪大学 人間科学研究科) 1 ここでの疑問 ①適合度、共通性、因子の負荷量、 最初にどれを指標にして項目選択を すべき? ②適合度指標は色々あるけど、 どれを 参考にすればいいのか? 2 次の疑問・・・ ③適合度はどこまで上げればいいのか? ④今回は2因子解から始めて、項目選 択をしたけど他にも方法はあるか? (因子の数を多いと、一項目の増減で他の項目がうろつ く場合がある。それを避けるための方法はあるのか?) ⑤どうしても外したくない項目(因子の代表 項目と考えているもの)外せと言ってくるんで すがどうすればいいのでしょうか? 3 適合度 • 適合度評価の考え方 – データの相関行列とモデルによる相関行列の食違いの 程度を評価...S-Σ^ – 多次元量を1次元に縮約するため多種多様な方法 • 一般的なコンセンサスはない – 開発者は自分が開発した指標を薦める – 回帰分析におけるR2においても百家争鳴 – 査読者に求められたら,素直に報告する • どの指標においても,そこそこの適合が得られて いることが必要 4 いくつかの「側面」 • ベース – SとΣ^の食い違いを評価 – cf. 回帰モデルの場合は,y-y^ • 相対評価 vs 絶対評価 – 最小モデルを導入する – 独立モデル,ゼロモデル • 自由度を考慮するか – けちの原理(parsimony) – 自由度にくらべてどの程度の適合かをみる 5 好ましい性質 • nに依存しないことが望ましい • 自由度を考慮した方がよい? – 自由度dが小さい(パラメータが多い)モデルは 適合が良いのはあたりまえ – しかし,回帰分析でもR2が活きている • 最小モデルの導入については両論ある – 回帰分析では「一般平均のみ」の最小モデルを 導入している – 指標が最小モデルの選択に依存する 6 比較 自由度による調整 なし 比 差 絶対評価 カイ RMSEA F0, mk 2乗値 AIC 相対評価 B O GFI AGFI B D NFI IFI NNFI RFI CFI 7 補足:指標の定義 絶対評価 なし 2 nF BO F BO B F NFI D BD B F IFI D BD d / n B O GFI B D 自由度による調整 比 差 RMSEA F / d 1 / n F 0 F d / n, mk e 1 / 2 ( F d / n ) ( AIC nF 2d ) B /d F /d AGFI O O BO / d O B d D / n F d / n B /d F /d NNFI D D CFI D BD / d D 1 / n BD d D / n B /d F /d RFI D D BD / d D 2 1 F log | ˆ | log | S | tr[ˆ 1 ( S ˆ )], tr S ˆ ˆ 1 , d p( p 1) / 2 q 2 1 1 2 ˆ ˆ BD log | Diag(S ) | log | S |, tr S D , d D p( p 1) / 2 p p( p 1) / 2 2 2 1 8 BO tr Sˆ 1 , d O p( p 1) / 2 2 カイ2乗検定について • 統計的検定にもとづく方法論 – 統計的モデル評価の基本 – H0: モデルが正しい H1: モデルが正しくない • 専門家の意見 – Do not rely only on the chi-square test Bollen & Long (1993). Testing Structural Equation Models. Sage: CA (page.8) 9 最後の疑問 今回SEFAをやってみて、項目を削れば 削るほど適合度は上がるという感覚が ある。 それゆえ、適合度だけを考えれば、 項目をどんどん削ってしまいたくなる。 しかし、尺度の妥当性や信頼性係数な どのことを考えるとできるだけ項目数 を減らしたくないという思いもある。 10 今回は、二因子から始めた項目数の多 いモデルと、一因子から始めた項目数 の少ないモデルとの間にそれほどの違 いは見られなかったが、そこら辺の バランスをどのようにとればいいの か? 数理統計的な側面から項目数が多い 場合のモデルと少ない場合のモデル、 双方の特徴と考慮すべき点について お聞かせください。 11 仮想抑うつ尺度の作成の例 (平井2001より) • 以下の6つの項目からなる尺度を構成 ◆食欲不振 ◆不眠 ◆うつ気分 ◆意欲減退 ◆焦燥感 ◆希死念慮 について「当てはまる」〜「当てはまらない」の 5件法で回答 12 抑うつ尺度の仮想データ 対象者:300人 食欲 不眠 うつ気分 意欲減退 焦燥感 希死念慮 食欲 1.00 0.38 0.12 0.57 0.14 0.01 不眠 . 1.00 0.60 0.59 0.46 0.33 うつ気分 意欲減退 焦燥感 希死念慮 . . . . . . . . 1.00 . . . 0.42 1.00 . . 0.35 0.40 1.00 . 0.24 0.23 0.24 1.00 13 「食欲不振」が適合度 を下げている! 14 Just fit! α=0.73 15 そこで • 食欲不振をはずした5項目で「抑うつ尺度」 を構成し、投稿する • 仮想「抑うつ尺度」 – 適合度は高い – 信頼性も十分 – 項目が少なく、利便性高い 16 仮想査読者のお言葉 「食欲不振は抑うつの診断において欠かす ことのできない指標。よって、この項目を 削除することは、この尺度の内容的な妥 当性を著しく損なうことになる!」 17 2つのモデル α=0.86 α=0.76 18 どちらのモデル(尺度)を採用? • 大きなモデル – 尺度項目が多く,α係数が高いが,適合度の 低いモデル • 小さなモデル – 1つの尺度項目を落とし,α係数がやや低い が,適合度は高いモデル • 第三の道を探る!! 19 再分析!! 信頼性=0.77 α=0.86 信頼性=0.68 α=0.86 20 補遺:信頼性の公式 2 信頼性 i V (e ) 2 Cov(e , e ) 2 i i i j i j p V ( X i ) 1 p 1 V ( X ) 21 適合度が低いモデルは? • 適合度が低いモデルを採用するのは避けたい – 推定値(因子負荷量)が不正確 – 信頼性が正しく評価できない,α係数が不正確 • ストラテジー – モデルに合わない変数を落とす – 因子モデルからのズレをモデル化する • 誤差共分散の導入 • 解釈できることが重要 22 比較 信頼性=0.77 α=0.76 信頼性=0.68 α=0.86 23 結論 • 内容的妥当性のためどうしても「食欲不振」を 尺度に含めるなければならない,ということであ れば,それは可能 – ただし,信頼性の低下を甘受しなければならない – α係数は不正確 • 統計的分析からわかること – 「食欲不振」と「意欲減退」には予定外の重複があり, それは,(おそらく)尺度には不必要で,信頼性を低下 させる原因となっている – 次スライド 24 補足 • 「食欲」は,意欲減退を除いた 他の項目との相関が低すぎる 食欲 不眠 うつ気分 意欲減退 焦燥感 希死念慮 食欲 1.00 0.38 0.12 0.57 0.14 0.01 不眠 . 1.00 0.60 0.59 0.46 0.33 うつ気分 意欲減退 焦燥感 希死念慮 . . . . . . . . 1.00 . . . 0.42 1.00 . . 0.35 0.40 1.00 . 0.24 0.23 0.24 1.00 25 STERA • STEpwise Reliablity Analysis • SEFAの類型 – 誤差共分散を設定して適合度を改善するモデ リングを支援するプログラム 26
© Copyright 2025 ExpyDoc