SEFA-WS03コメント

コメント
狩野裕
(大阪大学 人間科学研究科)
1
ここでの疑問
①適合度、共通性、因子の負荷量、
最初にどれを指標にして項目選択を
すべき?
②適合度指標は色々あるけど、
どれを 参考にすればいいのか?
2
次の疑問・・・
③適合度はどこまで上げればいいのか?
④今回は2因子解から始めて、項目選
択をしたけど他にも方法はあるか?
(因子の数を多いと、一項目の増減で他の項目がうろつ
く場合がある。それを避けるための方法はあるのか?)
⑤どうしても外したくない項目(因子の代表
項目と考えているもの)外せと言ってくるんで
すがどうすればいいのでしょうか?
3
適合度
• 適合度評価の考え方
– データの相関行列とモデルによる相関行列の食違いの
程度を評価...S-Σ^
– 多次元量を1次元に縮約するため多種多様な方法
• 一般的なコンセンサスはない
– 開発者は自分が開発した指標を薦める
– 回帰分析におけるR2においても百家争鳴
– 査読者に求められたら,素直に報告する
• どの指標においても,そこそこの適合が得られて
いることが必要
4
いくつかの「側面」
• ベース
– SとΣ^の食い違いを評価
– cf. 回帰モデルの場合は,y-y^
• 相対評価 vs 絶対評価
– 最小モデルを導入する
– 独立モデル,ゼロモデル
• 自由度を考慮するか
– けちの原理(parsimony)
– 自由度にくらべてどの程度の適合かをみる
5
好ましい性質
• nに依存しないことが望ましい
• 自由度を考慮した方がよい?
– 自由度dが小さい(パラメータが多い)モデルは
適合が良いのはあたりまえ
– しかし,回帰分析でもR2が活きている
• 最小モデルの導入については両論ある
– 回帰分析では「一般平均のみ」の最小モデルを
導入している
– 指標が最小モデルの選択に依存する
6
比較
自由度による調整
なし
比
差
絶対評価 カイ
RMSEA F0, mk
2乗値
AIC
相対評価
 B  O GFI
AGFI
B  D
NFI
IFI
NNFI
RFI
CFI
7
補足:指標の定義
絶対評価
なし
 2  nF
BO  F
BO
B F
NFI  D
BD
B F
IFI  D
BD  d / n
B  O
GFI 
B  D
自由度による調整
比
差
RMSEA  F / d  1 / n F 0  F  d / n, mk  e 1 / 2 ( F  d / n )
( AIC  nF  2d )
B /d  F /d
AGFI  O O
BO / d O
B  d D / n   F  d / n 
B /d  F /d
NNFI  D D
CFI  D
BD / d D  1 / n
BD  d D / n
B /d  F /d
RFI  D D
BD / d D

 
2
1
F  log | ˆ |  log | S |  tr[ˆ 1 ( S  ˆ )], tr S  ˆ ˆ 1 , d  p( p  1) / 2  q
2
1 
1 2 
ˆ
ˆ
BD  log | Diag(S ) |  log | S |, tr S  D 
, d D  p( p  1) / 2  p  p( p  1) / 2




2
2
1
8
BO  tr Sˆ 1 , d O  p( p  1) / 2
2



 
カイ2乗検定について
• 統計的検定にもとづく方法論
– 統計的モデル評価の基本
– H0: モデルが正しい H1: モデルが正しくない
• 専門家の意見
– Do not rely only on the chi-square test
Bollen & Long (1993). Testing Structural
Equation
Models. Sage: CA (page.8)
9
最後の疑問
今回SEFAをやってみて、項目を削れば
削るほど適合度は上がるという感覚が
ある。
それゆえ、適合度だけを考えれば、
項目をどんどん削ってしまいたくなる。
しかし、尺度の妥当性や信頼性係数な
どのことを考えるとできるだけ項目数
を減らしたくないという思いもある。
10
今回は、二因子から始めた項目数の多
いモデルと、一因子から始めた項目数
の少ないモデルとの間にそれほどの違
いは見られなかったが、そこら辺の
バランスをどのようにとればいいの
か?
数理統計的な側面から項目数が多い
場合のモデルと少ない場合のモデル、
双方の特徴と考慮すべき点について
お聞かせください。
11
仮想抑うつ尺度の作成の例
(平井2001より)
• 以下の6つの項目からなる尺度を構成
◆食欲不振
◆不眠
◆うつ気分
◆意欲減退
◆焦燥感
◆希死念慮
について「当てはまる」〜「当てはまらない」の
5件法で回答
12
抑うつ尺度の仮想データ
対象者:300人
食欲
不眠
うつ気分
意欲減退
焦燥感
希死念慮
食欲
1.00
0.38
0.12
0.57
0.14
0.01
不眠
.
1.00
0.60
0.59
0.46
0.33
うつ気分 意欲減退 焦燥感 希死念慮
.
.
.
.
.
.
.
.
1.00
.
.
.
0.42
1.00
.
.
0.35
0.40
1.00
.
0.24
0.23
0.24
1.00
13
「食欲不振」が適合度
を下げている!
14
Just fit!
α=0.73
15
そこで
• 食欲不振をはずした5項目で「抑うつ尺度」
を構成し、投稿する
• 仮想「抑うつ尺度」
– 適合度は高い
– 信頼性も十分
– 項目が少なく、利便性高い
16
仮想査読者のお言葉
「食欲不振は抑うつの診断において欠かす
ことのできない指標。よって、この項目を
削除することは、この尺度の内容的な妥
当性を著しく損なうことになる!」
17
2つのモデル
α=0.86
α=0.76
18
どちらのモデル(尺度)を採用?
• 大きなモデル
– 尺度項目が多く,α係数が高いが,適合度の
低いモデル
• 小さなモデル
– 1つの尺度項目を落とし,α係数がやや低い
が,適合度は高いモデル
• 第三の道を探る!!
19
再分析!!
信頼性=0.77
α=0.86
信頼性=0.68
α=0.86
20
補遺:信頼性の公式
  
2
信頼性 
i
    V (e )  2 Cov(e , e )
2
i
i
i j
i
j
p   V ( X i ) 

1

p 1 
V ( X ) 
21
適合度が低いモデルは?
• 適合度が低いモデルを採用するのは避けたい
– 推定値(因子負荷量)が不正確
– 信頼性が正しく評価できない,α係数が不正確
• ストラテジー
– モデルに合わない変数を落とす
– 因子モデルからのズレをモデル化する
• 誤差共分散の導入
• 解釈できることが重要
22
比較
信頼性=0.77
α=0.76
信頼性=0.68
α=0.86
23
結論
• 内容的妥当性のためどうしても「食欲不振」を
尺度に含めるなければならない,ということであ
れば,それは可能
– ただし,信頼性の低下を甘受しなければならない
– α係数は不正確
• 統計的分析からわかること
– 「食欲不振」と「意欲減退」には予定外の重複があり,
それは,(おそらく)尺度には不必要で,信頼性を低下
させる原因となっている
– 次スライド
24
補足
• 「食欲」は,意欲減退を除いた
他の項目との相関が低すぎる
食欲
不眠
うつ気分
意欲減退
焦燥感
希死念慮
食欲
1.00
0.38
0.12
0.57
0.14
0.01
不眠
.
1.00
0.60
0.59
0.46
0.33
うつ気分 意欲減退 焦燥感 希死念慮
.
.
.
.
.
.
.
.
1.00
.
.
.
0.42
1.00
.
.
0.35
0.40
1.00
.
0.24
0.23
0.24
1.00
25
STERA
• STEpwise Reliablity Analysis
• SEFAの類型
– 誤差共分散を設定して適合度を改善するモデ
リングを支援するプログラム
26