SEMFAQ：共分散構造分析に関する10の質問

1
ＳＥＭＦＡＱ：
共分散構造分析に関する10の質問
三浦麻子×狩野裕
（大阪大学大学院人間科学研究科）
配布資料
日本ＧＤ学会
第５０回大会＠京都
2
１．SEMによるパス解析は
“must”なのか？
 重回帰分析の繰り返しによるパス解析をした
論文を投稿したのですが，査読者から「SEMによ
るパス解析をやり直せ」と言われました
 なんとか実行はできたのですが，適合度が低く，と
てもじゃないですが論文に載せられたもんじゃあり
ません
 こんなとき，私はどうすればいいのでしょう?
論文取り下げ&もう一度データ取り直しなんでしょ
うか?
3
１．回答
 Yes. “must”である
 不適合の理由を特定し，モデルを改善する

モデルが不適切
直接効果の欠落
 未観測の剰余変数の存在
 層別を示唆（交互作用の存在）


偏相関が説明できていない

誤差共分散
4
誤差共分散の設定
 誤差間に共分散を設定する
5
２．標準化尺度のEFA・CFA
 質問紙調査の場合，既存の標準化された尺度を
使うことがよくあります
 このような場合にも，先行研究の構造が再現され
るかどうかを確認するために探索的因子分析をし
ていたのですが，なんだか変な気がします
 まず検証的因子分析をして構造を確認してから，
場合によっては探索的にやりなおす方がよいので
しょうか?
6
２．回答
 Yes and No
 Establishされている尺度については
ＥＦＡ・ＣＦＡを行う必要はない



理屈上
日本でもestablishしているか
ＥＦＡやＣＦＡによってサンプルの妥当性を
チェック
7
EFA versus CFA
 CFAではより厳しいチェックが行われる

CFAをやるべきかどうかは，どこまで「厳しさ」を
要求するか，に依存
 尺度を吟味したあと


SEMへ移行するなら，ＣＦＡが必須
古典的方法を利用するなら，EFAでもよいので
はないか

合計得点を算出して分析するなど
8
しかし
 信頼性が不十分のとき

尺度分析の結果
 誤差の制御が必要

多重指標を利用したSEMで分析する必要
 尺度解析においてもCFAが必要に
9
３．適合度が悪いモデルは
「ダメダメ」なの?
 仮説モデルにしたがってSEMをすると，適合度が
いまいちよくありません．全然ダメなら捨てるので
すが，どうも微妙なラインなんです
 試行錯誤すると，どうやら仮説にやや合わないモ
デルの適合度が高いようです
 こんなとき，私はどちらのモデルを選べばよいの
でしょう? 本心を言えば，前者を選びたいのです
が…
10
３．回答
 気持ちはよくわかる
 仮説モデルの適合度を向上させるために
あらゆる手段を講じる
 このような事態はSEMに限ったことではない



e.g., 回帰分析で重要な変数の効果が非有意
統計解析における共通の悩み
それゆえ，分析は自動化できない
11
あらゆる手段

適合度を低めている部分の同定








モデルの部分評価
粗データの吟味
誤差相関
層別（交互作用）
未観測交絡変数
観測変数の選択
parceling
SEMの専門家に訊く
12
コメント
 適合度の小さいな違いは実質的な意味はない


適合度の良いモデルが複数個ある場合は，分析者の
責任において最終モデルを選択
ランダムな現象を扱うことの限界
 研究分野によって基準は異なる



各分野のコンセンサス
先行研究の適合度を参考にする
研究が積み重ねられている分野


More confirmatory nature．より厳しい基準
新しい研究分野

Less confirmatory nature．やや緩い基準
13
４．欠損値のあるデータの
処理方法
 いくつか欠損値が含まれたデータを用いてSEMを
やりたいと思っています
 欠損値の処理方法には場合によっていくつかある
ようですが，明らかに実施時に特殊な事情がある
場合以外はどうしたらいいのでしょう?
 また，欠損値の処理方法を論文に明記すべきで
しょうか? そこまで書いている論文を見たことが
（まだ）ありません
14
４．回答
 欠測が1割程度ならばLD
 相当数の欠測がある場合はFIMLを
用いる


欠測のプロセスに関してMARを仮定
ＭＡＲの仮定が崩れていても，共分散構造分析
においては，そこそこ使える

経験則だが
 LD，FIMLは明示する必要あり
15
LDとFIML
 Listwise Deletion (LD)


一つでも欠測のあるobservationは，分析から外して
分析する
捨てられるデータがもったいない



統計的推測の精度が低くなる
欠測が多いと分析できないことがある
MCARである必要
 Full Information Maximum Likelihood (FIML)



観測されたデータにもとづく最尤法
AMOSなどSEMの代表的なプログラムで利用可
MARでよい
16
統計理論から
 Missing Completely At Random (MCAR)


どの値が欠測するかは完全にランダムである
LD, PDは，このときのみ使える
 Missing At Random (MAR)


どの値が欠測するかはデータに依存してもよいが，
欠測値には依存しない
FIMLの適用が薦められる
 Nonignorable Missing


どの値が欠測するかが欠測した値に依存する
欠測のメカニズムにモデリングが必要
17
５．調査データでの
「因果関係の同定」
 調査データの多くは，一時点で採取された認知
データであり，本来は因果関係は論ずることがで
きないことはよくわかっています
 しかし私たちはそれを知りつつも，SEMを使って因
果関係があるかのように議論を進めています
 こんなことをしていいのか?という根本的な疑問が
ふと頭をかすめることがあるのですが…
18
５．回答
 SEMは強力な因果推論の道具


交絡変数がないという前提
パス図が正しいという前提
 調査データにもとづく因果推論の限界

未観測交絡（剰余）変数の存在を否定できない
 因果の大きさ（因果関係のあるなし）


パス係数の推定と検定
第三変数のモデル化が容易
 因果の方向


適合度にもとづくモデル比較により，因果の方向を決定
当該モデルの適合と逆方向のモデルの不適合
19
実例
 「スマートさ」から「うつくしさ」への影響が強い
20
対応策
 十分な検討の下で，正確なパス図を作成

大幅なモデル探索はしない
 強い結論を主張しない

．．．という関係が示唆された
 縦断的データを取るデザインを考える
 調査データの分析は積み重ねることが大事
21
６．双方向因果モデル
（にわとりたまご）
 よくテキストで見るパスモデルは，因果の方
向が一定であることが多いようですが，双
方向の因果モデルというのはSEMでうまくモ
デリングできるのでしょうか? いわゆる鶏と
卵の関係のようなモデルです
22
６．回答
 YES
 縦断的データの場合

パス解析
 横断的データの場合

双方向因果モデル
 しかしながら

調査データにもとづく因果方向の決定は難しい
23
縦断的データの利用
 ２時点でデータをとり，時間差を利用する

民主主義⇒経済発展 or 経済発展⇒民主主義
24
双方向因果モデル
25
政治的社会化モデル
出典：Asher(1976). Causal Modeling. Sage
26
７．「不適解」地獄から
抜け出したい!!
 突然ですが，不適解に泣かされています
 データの打ち込みや読み込み，あるいはモ
デルの記述などつまらない原因はすべて探
りましたが，どれも問題ないようです
 こんなとき不適でない解を導き出す努力とし
て，私たちには一体何ができるのでしょう?
27
７．回答
 不適解とは(improper solutions)



誤差Eや撹乱項Dの分散が０または負の値に推定
相関の推定値が，絶対値1以下でない
基本的には，これらを最終解として報告してはな
らない
 原因を切り分けてから対応する
28
原因と対応
 不適解は何らかの不適切性を表す
1.
2.
3.
4.
単純ミスなど
モデルが不適切(model misspecification)
潜在変数モデル固有の問題
サンプル変動
1. この場合のみ，V(e)≧０などとして解を報告する
5. その他・不明
29
4. サンプル変動
 サンプル変動によって不運にも偶然
不適解となってしまった

残念！！
 不適解がサンプル変動によることが確定し
た場合は，V(e)=0 とおいた解を報告できる
場合がある
30
サンプル変動のための条件
 サンプル変動による不適解と判断できるためには




さらなるモデルの改良が考えられない
絶対値が大きすぎない．少しマイナス
V(e)±２SEが原点を含んでいる
測定モデルで不適解が生じた場合は，因子を合計得点で
置き換えてみて，推定値などが大きく変化しないことを確
かめる
 上記の条件が満たされていても，モデルが小さいと，
論文を出版するのは認められにくい
31
８．よりどりみどりすぎる
適合度指標
 AMOS（EQS，CALIS）を使っていますが，プログラ
ムを走らせると，大量の適合度指標が出てきます
 残念ながらすべての適合度指標を載せるだけの
紙幅は論文にありません
 私たちが主張したいことはこのモデルが正しいと
いうことに尽きるのですが，一体どの指標（たち）
を記述すれば必要かつ十分でしょうか?
32
８．回答
 適合度指標にはいくつかの側面がある

同じ性質を持つ指標を複数報告しない
 側面を代表する指標を報告する


カイ２乗値
ＧＦＩ，ＣＦＩ，ＲＭＳＥＡ
 モデル局所評価も必要



適合度はモデルの全体的評価
パスの有意性
Ｒ^2の大きさ
33
使い方
 カイ2乗値

大標本のときは見ない
 ＧＦＩ，ＣＦＩ


一般に，0.90 or 0.95 以上を要求する
see Bentler & Bonnet (1980), Hu (1999)
 RMSEA



0.05以下⇒ＯＫ
0.10以上⇒不適
see Browne & Cudeck (1993)
34
Reference
 Hu, Li-tze and Bentler, P. M. (1999). Cutoff criteria for fit
indexes in covariance structure analysis: Conventional
criteria versus new alternatives. Structural Equation
Modeling, 6(1), 1-55.
 Bentler, P.M. & Bonnet, D.G. (1980). Significance tests
and goodness of fit in the analysis of covariance
structures. Psychological Bulletin, 107, 238-246
 Browne, M.W. & Cudeck, R. (1993) Alternative ways of
assessing model fit. In K.A. Bollen & J.S. Long [Eds.]
Testing Structural Equation Models. Beverley Hills, CA:
Sage, 132-162
35
９．適合度指標の
検定ってないの?
 私は今，SEMを使って書かれた論文の査読を依
頼されています
 あるモデルが「適合度が高い」とされているのです
が，その根拠として示されている適合度指標が本
当に高いのかどうかわかりません．論文によって
基準とする値にもばらつきがあるように思えてなり
ません
 適合度指標が本当に高いことを示せる検定など
はないのですか?
36
９．回答
 カイ２乗値による検定がそれにあたる
 歴史的には

カイ２乗検定の限界が指摘され，その代替と
して適合度指標が提案されてきた
37
RMSEA
 RMSEAは，点推定値だけでなく信頼上限と
下限を出力する（信頼率90%）
 信頼上限が0.10以下かどうかという判断
基準もよく用いられる
 以下の検定もできる


H0:RMSEA＝0
(exact fit)
H0:RMSEA≦0.05 (close fit)
38
１0．ＳＥＭ論文の
「正しい」書き方
 さて，試行錯誤の艱難辛苦を乗り越えて，SEMを
おこなったモデリング結果を論文に書こうと思いま
す
 「すべてを丁寧に書く」のがベストなのは分かり
切っていますが，それだけの紙幅はありません
 論文を読む人のことを考えた場合にどのような情
報が必要かを，できれば優先順位つきで教えてく
ださい
39
10．回答
 必須項目


心理学・行動学の知見にもとづく初期（仮説）
モデルの記述
最終モデルの記述
適合度，パス係数の有意性
 読者がduplicateできるようにする


初期モデルと最終モデルとの違いを説明

モデルの変遷や経過を全て記述する必要はない
40
オプション
 直接効果なし

パスを引いても非有意
 因果の方向

対立モデルが適合しない
 男女差なし

多母集団同時分析
41
重要FAQ：詳細解説編
SEMによるパス解析が“must”な理
由
双方向因果モデルの構築
さまざまな適合度指標の特徴と適切
な使い方
42
FAQ1
SEMによるパス解析が“must”な理由
43
詳細：直接効果の欠落
 LM検定や適合度指標で改善のための
指針を得ることができる
44
未観測の剰余変数の存在
f1
f2
45
層別を示唆（交互作用の存在）
A＋B：
適合度×
0.5
0.5
集団A：
適合度○
0.4
0.5
集団B：
適合度○
0.6
0.5
46
補足交互作用と交絡_1
A+B：
適合度○
A+B：
適合度×
47
補足交互作用と交絡_2
X21
X21
B
B r=0.4
r=0.6
0.4
A
r=0.4
X11
0.3
A
r=0.4
X11
48
誤差共分散_1
 誤差間に共分散を設定する
49
誤差共分散_解説
 パスの意味

直接効果を表現したもの
誤差共分散を置くことが多い
 偏相関が残ることが多いから


交絡要因として導入したもの
測定モデル
 誤差共分散なしが一般的

50
FAQ６
双方向因果モデル
（にわとりたまご）
51
相関係数から因果の方向は決まらない
---同値モデルの問題--相関構造
X
Y
X
1
r
Y
r
1
 データから区別できないモデルを同値モデルという
 「区別できない」とは適合度が同一であることをいう
52
因果の方向を決める：
操作変数法（Instrumental variable method）
相関構造
X
Y
Z
X
1
Y
b12
1
相関構造
Z
b13
0
1
X
Y
Z
X
1
Y
b21
1
Z
b13
b21b13
1
53
因果の方向を決める：適合度との関係
適合度が低い
適合度が高い
Ｘ→Ｙの因果関係が示唆される
54
双方向因果モデル
（非逐次モデル）
55
政治的社会化モデル
出典：Asher(1976). Causal Modeling. Sage
56
交絡変数はこわい
盛山(1986，行動計量
57
因果方向決定にも影響
X
Y
Z
X
1
Y
*
1
Z
*
0
1
誤ってＹ→Ｘと結論
してしまう
58
まとめ
 双方向の因果関係を同定するモデリングがある


縦断的データに対するパス解析
横断的データに対する非逐次モデル



“→”と“←”のモデルが同値にならないようなモデリング
推定可能なモデルを作成するには操作変数法が有効
欠点



交絡変数の影響を無視し得ない
操作変数となるための条件が満足されているか
成功例が少ない
 縦断的データに基づくモデリングの方が説得性が
高いと考えられている
59
FAQ８
さまざまな適合度指標の
意味と使い分け
60
詳細：考え方
 適合度評価の考え方


データの相関行列とモデルによる相関行列の食違いの
程度を評価．．．Ｓ-Σ^
多次元量を1次元に縮約するため多種多様な方法
 一般的なコンセンサスはない



開発者は自分が開発した指標を薦める
回帰分析におけるＲ2においても百家争鳴
査読者に求められたら，素直に報告する
 どの指標においても，そこそこの適合が得られて
いることが必要
61
いくつかの「側面」
 ベース


ＳとΣ^の食い違いを評価
cf. 回帰モデルの場合は，y-y^
 相対評価 vs 絶対評価


最小モデルを導入する
独立モデル，ゼロモデル
 自由度を考慮するか


けちの原理（parsimony）
自由度にくらべてどの程度の適合かをみる
62
好ましい性質
 ｎに依存しないことが望ましい
 自由度を考慮した方がよい？


自由度dが小さい（パラメータが多い）モデルは
適合が良いのはあたりまえ
しかし，回帰分析でもＲ2が活きている
 最小モデルの導入については両論ある


回帰分析では「一般平均のみ」の最小モデルを
導入している
指標が最小モデルの選択に依存する
63
比較
自由度による調整
なし
比
差
絶対評価カイ
RMSEA F0, mk
2乗値
AIC
相対評価
 B  O GFI
AGFI
B  D
NFI
IFI
NNFI
RFI
CFI
64
補足：指標の定義
絶対評価
なし
 2  nF
BO  F
BO
B F
NFI  D
BD
B F
IFI  D
BD  d / n
B  O
GFI 
B  D
自由度による調整
比
差
RMSEA  F / d  1 / n F 0  F  d / n, mk  e 1 / 2 ( F  d / n )
( AIC  nF  2d )
B /d  F /d
AGFI  O O
BO / d O
B  d D / n   F  d / n 
B /d  F /d
NNFI  D D
CFI  D
BD / d D  1 / n
BD  d D / n
B /d  F /d
RFI  D D
BD / d D

 
2
1
F  log | ˆ |  log | S |  tr[ˆ 1 ( S  ˆ )], tr S  ˆ ˆ 1 , d  p( p  1) / 2  q
2
1 
1 2 
ˆ
ˆ
BD  log | Diag(S ) |  log | S |, tr S  D 
, d D  p( p  1) / 2  p  p( p  1) / 2




2
2
1
BO  tr Sˆ 1 , d O  p( p  1) / 2
2



 
65
カイ2乗検定について
 統計的検定にもとづく方法論


統計的モデル評価の基本
Ｈ0: モデルが正しい H1: モデルが正しくない
 専門家の意見

Do not rely only on the chi-square test
Bollen & Long (1993). Testing Structural Equation
Models. Sage: CA (page.8)
66
カイ2乗検定の問題点
 検定力がｎに依存する


第二種の過誤を評価していない
第一種の過誤を問題とする通常の検定と逆
 統計モデルは厳密にはデータの発生機構を
表さない
 データ分布に関する基礎仮定が厳しい
 nが小さいときはカイ2乗近似が正しくなく，大きい
ときは殆ど確実にモデルを棄却する

Download Report