Structural Equation Models that are Nonlinear in

1
潜在変数に交互作用がある
構造方程式モデル(共分散構造モデル):
二段階最小二乗推定値
Kenneth A. Bollen
University of North Carolina at Chapel Hill
本講演のテクニカルな内容は以下の論文を参照されたい
Bollen(1995). Structural Equation Models that are Nonlinear in
Latent Variables: A least Squares Approach, In Sociological
Methodology (P.M. Marsden ed.).
問題
• 非線型な関係
– 収入と工業化は,逆U字形の関係
– 生活満足度は,収入×健康度に影響される
– 収入は,年齢の非線型関数
• 回帰モデルはこれらを扱うことができる
2次関数的関係
y
2
 1   11x1   12 x1
 1
積による交互作用
y  1   11x1   12 x2   13 x1x2  1
2
• 暗に(独立変数に)測定誤差がないことが仮定さ
れている
– たとえ誤差がランダムであったとしてもOLS(通常の
最小二乗推定値)に偏りを生じさせる
• どのようにして測定誤差を許すモデルを導入す
るか
1 Busemeyer-Jones(1983):信頼性係数を既知とした
単一指標のモデル
2 Kenny-Judd(1984):多重指標モデル+非線型制約
• 欠点
a. 有意性検定ができない
b. 推定値などの分布が分からない
c. コンピュータプログラムの作成が難しい
3
4
本講演の目的
1.潜在変数や観測変数の非線型関数をモデル
に含めるための一般的な枠組みを与える
2.Bollen(1995)による二段階最小二乗推定値
(2SLS)の利用
a. 簡単で使いやすい
b. 漸近的な分布の性質が分かっている
c. 正規性の仮定に依存しない
3.適用例
5
先行研究
• Busemeyer-Jones(1983)
y1  11 L1  12 L2  13 L1 L2  1
(3)
y1  観測変数
L1,L2  潜在変数
1  撹乱変数(誤差項)
y2  L1  2
y3  L2   3
( 4)
(5)
L1,L2 ,2 ,3,1:正規分布
平均からの偏差で解析(i. e. 中心化してから解析)
y2 とy3の信頼性係数既知
y1,L1,L2 ,L1 L2 の共分散行列を推定
11,12 ,13の一致推定値
限界(Limitations)
1.一つの潜在変数に対して一つの指標(観測
変数)しかない
2.誤差分散が既知でないといけない
3.有意性検定ができない
4.切片項の推定ができない
5.正規性の仮定が必要
6.ロバストネス(頑健性)が未知
改良の試み:
Feucht(1989), Fuller(1980) は上記3と5を議論
しかし,結果は数値実験によるものであり魅力的ではない
6
7
先行研究(続)
Kenny-Judd(1984)の方法
1.多重指標(複数個の観測変数)が扱える
y1  11 L1  12 L2  13 L1 L2  1
(6)
y1  観測変数
L1,L2  潜在変数
1  撹乱変数(誤差項)
y2  L1  2
y3  L2  3
y4  41 L1  4
y5  52 L2  5
L1,L2 ,2 ,3, 4 ,5,1:正規分布
( 7)
(8)
( 9)
(10)
8
Kenny-Judd(1984)の方法(続)
L1 L2 の指標を 構成する
y2 y3  L1 L2  L13  L22  23
y2 y5  52 L1 L2  L15  52 L22  25
(12)
y4 y3  41 L1 L2  L24  41 L13  34
(13)
y4 y5  4152 L1 L2  41 L15  52 L24  45
(14)
(11)
線形・非線型制約を置いて推定値を求めることが必要
e.g., (12)式では,L1 L2 と L2 2の因子負荷が( 52 に)等しい
e.g., (14)式では,L1 L2 係数に非線型制約が入る.また
Var( L1L2 )  Var( L1)Var( L2 )  [Cov( L1, L2 )]2
9
限界(Liminations)
1.正規性が崩れたときに何が起こるか,(潜
在変数が)独立でないとき何が起こるかが
不明
2.積の項をつくることで変数が増大する
3.生データではなく中心化したデータ
(deviation scores)を扱っている
新しいモデルと推定値
L   L  B1L  B2 f(L)  
10
(15)
L  m  1 潜在変数からなるベクトル
 L  m  1 切片項からなるベクトル
B1  m  m LからLへの影響の大きさを表す係数行列
f(L)  n  1 Lの非線型関数
B2  m  n f(L) からLへの影響の大きさを表す係数行列
  m  1 撹乱項(誤差項)のベクトル
測定モデル
y   y  1L   2 f(L)  
y  p  1 観測変数からなるベクトル
 y  p  1 切片項からなるベクトル
1, 2  p  m,p  n 影響の大きさを表す係数行列
  p  1 測定誤差項からなるベクトル
(16)
11
それぞれの潜在変数は尺度を決めるための指標をもつ
yi  Li  i
(17)
観測変数 y を尺度決定指標 y1(
m  1)
と
その他 y 2 (( p  m)  1) に分割する.つまり
 y1 
y 
y2 
ここで
y1  L  1
そして
L  y1  1
潜在変数の方程式(
15)
に代入すると
y1   L  B1y1  B2 f ( y1  1 )  1  B11  
潜在変数Lを消去して測定モデル(
16)
を書き換えると
y   y  1y1   2 f ( y1  1 )  11  
潜在変数モデルの第 i 番目の方程式は
yi   Li  B1i y1  B2i f ( y1  1 )  B1i 1  i  i
yi  (
潜在変数の)
スケールを定める指標
i  行列やベクトルの第 i 行を表す添字.例えば,
B1i は B1の第 i 行,i はベクトル 1 の第 i 要素
観測変数のモデルをつくる
誤差項が,他の変数と相関している
Bollen(1995) による二段階最小二乗法 (2SLS) の
適用を考える
12
操作変数 (IV, Instrumental Variables) が必要:
vi が操作変数 (IV) かどうかをチェックするには
(1) Cov (vi , ui ) をつくる
(2) vi へ reduced form を代入する
13
『reduced formとは』
y の定義式などを
代入することで
u や v を独立変数で
表すこと
(3) ui の各要素へ (
reduced form を)
代入する
(4) Cov (vi , ui )  0を確認する
操作変数をつくる:
観測変数の非線型関数
1.指標の尺度を定めない観測変数(
y2 )
の積は
しばしば操作変数になる.
2.(a ) 積の項の中のそれぞれの観測変数を全ての
操作変数(
IVs)
の上に回帰する
(b) 予測値を計算する(
e. g., y1,y2 )
(c) 積 y1 y2 を作ると,これが操作変数になる
Kenny-Judd の例による説明
y1  11 L1  12 L2  13 L1 L2   1
y2  L1   2
y3  L2   3
y4  41 L1   4
y5  52 L2   5
L1,L2 を( y2   2 )  L1と( y3   3 )  L2 で置き換える:
y1  11 y2  12 y3  13 y2 y3  u1
u1   11 2  12 3  13 y2 3  13 y3 2  13 2 3   1
操作変数(IV): y4,y5,y4 y5,yˆ 2 yˆ 3
二段階最小二乗法 (2S LS )を適用する
14
図1.積の項による交互作用
(測定モデル)
英語版をご覧ください
15
16
積の項による交互作用
(測定モデル)
0 
 y1   0   1
 0 
1 
 y    





0
0

2
y
21
2
  
 
  L1   
 2
 y3    y3   31 32     33 [ L1 L2 ]  3 
  
 
  L2   
 
 y4   y4   0 42 
 0 
4 
 y5   0   0
 0 
5 
1 
y1 (
y1 はL1の尺度を定める観測変数)
に関する方程式を y2
に代入すると
y2   y2  21 y1  211  2
(41)
操作変数:
y3,y4 ,y5 ( y1と相関あるが誤差項とは無相関 )
二段階最小二乗法(2SLS)
を適用する
y3 を次のように書き直す:
y3   y3  31 y1  32 y5  33 y1 y5  u3
(42)
ここで
u3   311  325  33 ( y15  y51  15 )  3
操作変数:
y2 ,y4 ,y2 y4 ,y1 y5
二段階最小二乗法(2SLS)
を適用する
(43)
17
18
図2.2乗の項を持つ
潜在変数モデル
英語版をご覧ください
2乗の項を持つ潜在変数モデル
L3   L3  31 L1  32 L12  3
尺度を決める方程式が
y1  L1  1, y3  L3  3
であるとすると,上記の方程式は
y3   L3  31 y1  32 y12  u3
ここで u3   311  2 32 y11  3212  3  3
E (u3 )  32Var (1 ) は切片項の推定値
(  L3  32Var (1 ) )
が偏っていること(
biased)
を示す
操作変数(IVs)
:
y2 ,y2 の2乗
二段階最小二乗法 (2SLS) を適用する
19
操作変数の評価
1.方程式の右辺の変数と同数の操作変数
(IVs)が必要
• 方程式の識別問題に関連する
2.操作変数(IVs)がよりたくさんあれば,操
作変数の適切性を検定できる
• ある操作変数(IVs)が誤差項と相関している
かどうかの検定
3.操作変数(IVs)がどの程度,従属変数を
予測できるかを測ることができる
• 第一段階の推定から得られるR2
• R2が低ければ,IVsのクオリティは低い
20
表1.ブッシュ大統領に対する
好感度(feeling)のモデル(N=1944)
21
潜在変数
L1=回答者の経済状態の自己知覚
L2=民主党との一体感
L3=L2*y1
L4=ブッシュ大統領に対する好感度
観測変数
y1=教育年数
y2=1 男性 0 女性
次スライドへ
続く
y3=1 アフリカ系アメリカ人 0 その他
y4=log(1991年の家族の税込み総収入)
y5=1 やむを得ず購入を延期したことがある 0 ない
y6=1 やむを得ず通院を延期したことがある 0 ない
y7=1 やむを得ずお金を借りたことがある 0 ない
y8=1 やむを得ず貯金に手を付けたことがある 0 ない
y9=1 やむを得ずより多く働こうとした 0 していない
y10=1 貯金がまったくできない 0 できる
y11=1 家賃の支払いが遅れたことがある 0 ない
y12=民主党との一体感の程度
y13=民主党への好感度(0~10)
y14=昨年と比べたときの現在の経済状態の自己評価
y15=生活費と収入の変化の関係の自己評価
y16=ブッシュ大統領への好感度(0~10)
全ての変数は,1992年国政選挙研究からのもの
(ICPSRから入手可能)
22
23
補足スライド:ICPSRとは
• 全ての変数は,1992年国政選挙研究からの
もの(ICPSRから入手可能)
• ICPSR とは次の略語:The Inter-university
Consortium for Political and Social Research
• http://www.icpsr.umich.edu/
cgi/ab.prl?file=6230
図3.ブッシュ大統領に対する
好感度のモデル:積による交互作用の導入
24
英語版をご覧ください
画質が悪いので
英語版スライドか
元論文 Bollen 1995
243頁をご覧ください
実データの解析:ブッシュ大統領への好感度
L4 ( ブッシュ大統領への感情 ) の潜在変数モデル:
L4   L4  41 L1  42 L2  43 L2 y1  44 y1  45 y3  4
尺度を定める指標 y12 ,y14 ,y16 を上記方程式に代入
すると,観測変数に関する方程式を得る:
y16   L4  41 y14  42 y12  43 y12 y1  44 y1  45 y3  u4
ここで u4   4114  4212  4312 y1  16  4
操作変数:y1~y11,y13,y15,y13 y1,y12 y1
R 2 : 0.39 ( y14 ) ,0.44 ( y12 ) ,0.45 ( y12 y1 )
二段階最小二乗推定値(2SLS)
L4  9.206  0.599 L1  0166
. L2  0.034 L2 y1  0.009 y1  0.362 y3
(12.04)( 7.37) ( .88)
( 2.54)
( .16)
( 2.11)
25
SAS 入力ファイル:
Data two;
set one;
proc reg;
model y12=y1--y11 y13 y15 y13y1
output out=three p=y12hat;
data four;
set three;
次スライドへ
y12haty1=y12hat*y1;
続く
proc syslin 2sls;
endogenous y16 y14 y12 y12y1;
instruments y1--y11 y13 y15 y13y1 y12haty1;
model y16=y14 y12 y12y1 y1 y3;
26
27
SAS 入力ファイル(続)
*データ名を “one.” と指定してからSASプロ
グラムを走らせる.最後の4行が,2SLSによ
る推定値をもとめるための鍵ステートメントで
ある.
結論
• 非線型潜在変数をもつモデルを推定する
新しい方法を提案した
• 望ましい性質
一致推定量
推定量の漸近分布が既知
非正規分布への対応
有意性検定が可能
SASなどの2SLS法をサポートするソフトウェア
が利用可能
28
29
表2.潜在変数の非線型関数へ
の方法の比較:
Kenny-Judd (1988) versus 2SLS
次スライドへ
次スライドへ
続く
Kenny-Judd(1988) versus 2SLS
Kenny-Judd(1984)
30
2SLS
1.潜在変数の 2 乗と積だ
YES
NO
けを扱う方法か?
2.推定の方法は?
完全情報法
制限情報法
3.潜在変数と誤差項の積
YES
NO
を導入するか?
4.観測変数の積を作る必
YES
YES
(指標として使うため) (IVs として使うため)
要があるか?
5.積の指標に対する測定
方程式を付加しなければな
YES
NO
らないか?
6.非線型制約を置く必要
YES
NO
があるか?
7.切片項が推定でき,そ
NO
YES
の有意性検定ができるか?
8.積でない項に正規性を
YES
NO
仮定しないといけないか
9.中小標本に対する統計
NO
NO
的性質が分かっているか?