Advanced Topics in Economics I

パネル分析について
中村さやか
復習: データの種類
横断面データ (cross-sectional data)
 1つの観測対象(人、世帯、企業、地域等)につき1時点だけ
で集めたデータ
経時横断面データ (pooled cross sections)
 複数時点で無作為抽出を繰り返したデータ
 1時点の横断面データとほぼ同じ方法で分析可能
パネルデータ (panel data) / 縦断的データ (longitudinal data)
 同じ観察対象に対して複数時点で集めたデータ
 例)21世紀出生児縦断調査: 2001年に生まれた子を無作
為抽出し,毎年追跡調査
線形単回帰モデル
y=β0+β1x+u
重要な仮定
1.E(u)=0
• 一般性を失うことなく仮定できる
2.E(u|x)=E(u)
• uの期待値はxに依存しない
• uはxについて平均独立 (u is mean-independent of x)
E(u|x)=E(u) ⇔ Cov(x,u)=0
• xの値がわかってもそれがuの期待値を変化させないならば、
xとuは相関していないはず
仮定は成り立っているか?
y=β0+β1x+u
• yが収穫高、xが肥料の量
⇒uは畑のもともとの(肥料を与える前の)土壌の良さに大きく依
存する
• E(u|x)=E(u) が成り立っていると仮定
⇒肥料をたくさん与えられた畑とそうでない畑のもともとの土壌
の良さの平均値は変わらない
⇒もし土壌の良い畑ほどたくさん肥料が与えられるなら矛盾
固定効果モデル
観察対象をi、観察時期をtで表すと、
yit=β0+β1xit+δdt+αi+uit
• αiは時間に対して不変なので、固定効果(fixed effect)とよば
れる
• αiは観察できない個体差による影響を表しているので、
観察されない効果(unobserved effect)という
• dtは観察時期ダミー、δは観察時期による影響を表す
• uitは時間と共に変化し、誤差項についての仮定を満たす:
E(uit)=0 & E(uit|xi1,…xiT)=E(uit)
固定効果モデルの例
yit=β0+β1xit+δdt+αi+uit
• yitが収穫高、xitが肥料の量
• αiは畑のもともとの(肥料を与える前の)土壌の良さ
(時間と共に変化しない)
• δは技術進歩、全域の天候・災害等の影響
• uitは局所的な天候・災害等、その他のランダムな要因
差分回帰①
(first-differenced (FD) regression)
2時点でデータ収集: t=1,2
yit=β0+β1xit+δd2+αi+uit
d2: 2時点目ダミー
2時点目のデータなら1、そうでなければ0をとる変数
(←1時点目ダミーを入れると完全な多重共線性が生じる)
① yi1=β0+β1xi1 +αi+ui1
② yi2=β0+β1xi2+δ+αi+ui2
②から①を両辺で差し引くと
yi2 - yi1=β1(xi2 - xi1)+δ+ui2 - ui1
⇔ Δyi= δ+β1Δxi+Δui
αiを消せた!
差分回帰②
(first-differenced (FD) regression)
Δyi= δ+β1Δxi+Δui
被説明変数がΔyi 説明変数がΔxiの回帰モデルとして推定:
1.E(Δu)=0
2.E(Δu|Δx)=E(Δu)
の仮定が成り立っていなければならない
固定効果モデルの仮定より、E(uit)=0 & E(uit|xi1,…xiT)=E(uit)
E(Δu)=E(ui2-ui1)=E(ui2)-E(ui1)=0
E(Δu|Δx)=E(ui2-ui1|xi2-xi1)=E(ui2|xi2-xi1)-E(ui1|xi2-xi1)
=E(ui2)-E(ui1)=E(Δu)=0
仮定成立
ダミー変数による固定効果モデルの推定
(fixed effect (FE) model)
2時点でデータ収集: t=1,2
yit=β1xit+δd2+αidi+uit
d2: 2時点目ダミー
di: 個々の調査対象ダミー
• このモデルでは切片が調査対象によって異なる
• 調査対象の数だけダミー変数が必要なので、説明変数の数
が非常に多くなる
• パネルでないと推定できない(クロスセクションデータの場合、
説明変数の数がデータ数より大きくなってしまう!)
first-difference(FD) と fixed effect(FE)
の比較
2時点のパネルデータの場合
• どちらの方法でも推定結果は全く同じ
⇒FDのほうが説明変数が少なくて済むので楽
3時点以上のパネルデータの場合
• 推定結果はFDとFEで同じではない
⇒両方で結果が違うか検証する必要がある
• もし誤差項の系列相関がなければ、FEのほうが分散が小さ
い(efficient)ためFDより望ましい
系列相関:同一変数の時系列での相関
• 長期にわたるパネルデータの場合、誤差項の系列相関に対
して注意が必要
パネル分析の限界と可能性
• 説明変数が変化しない場合には意味がない
例: 所得を教育水準に回帰
• 重要な仮定: 固定効果が時間と共に変化しない
例: 健康を所得に回帰
理想的なケース: 調査対象によって差がある、外生的な変化
• 天候・災害・政策ショック
• 一律の変化では年別ダミーに効果が吸収されてしまう
例: 子ども手当
• ある自治体だけで起きた政策変化は扱いやすい