Advanced Topics in Economics I

エコノメトリックス
第6回
2011年前期
中村さやか
今日やること
Ch. 3 Multiple Regression Analysis: Estimation
3.3 The Expected Value of the OLS Estimators
• 4つの仮定から推定されたパラメタの不偏性を証明
パラメタの不偏性 -仮定1と仮定2
仮定 MLR.1: パラメタに対して線形
母集団におけるモデルは
y=β0+ β1 x1 + β2 x2 + β3 x3 + ... + βk xk +u
β0, β1,..., βk: 未知のパラメタ
u: 観察できない誤差項(攪乱項)
• このモデルを母集団モデル(population model)または真の
モデル(true model)と呼ぶ
仮定 MLR.2: 無作為抽出
仮定MLR.1の母集団モデルに従う、観察数nの無作為抽出
された標本: {(xi1, xi2,…, xik, yi): i=1, …, n}がある
パラメタの不偏性 -仮定3
仮定 MLR.3: 完全な共線性がないこと
標本において(したがって母集団においても)
説明変数の中に定数のものがないこと、また、
説明変数の間に完全な線形関係がないこと
• 説明変数の間に完全な線形関係がある
⇔説明変数の一つが他の説明変数の線形関数としてかける
⇒完全な共線性(perfect collinearlity)がある、と表現
• 相関が1だとモデルの推定が不可能になるが、説明変数の
間の相関が多少高くても問題ない
説明変数の間に完全な共線性がある例
• log(cons)=β0+ β1 log(inc) + β2 log(inc2) +u
• voteA=β0+ β1 expendA + β2 expendB + β3 totalexpend +u
– voteA: 候補者Aの得票率
– expendA: 候補者Aの選挙運動支出
– expendB: 候補者Bの選挙運動支出
– totalexpend: 選挙運動支出の総額
パラメタの不偏性 -仮定3 続き
仮定 MLR.3: 完全な多重共線性がないこと
標本において(したがって母集団においても)
説明変数の中に定数のものがないこと、また、
説明変数の間に完全な線形関係がないこと
• 標本数が少ないと、説明変数の変動が0になったり、説明変
数の間に完全な相関が生じる可能性が高くなる
例) 名古屋大学の学生の標本数が少ないと、全員の年齢が
同じだったり、ある学年の年齢が全員同じだったりする可能
性がある
• 一般に、k変数モデルでは n≧k+1であることが必要
• 標本数は多ければ多いほどよい
パラメタの不偏性 -仮定4
仮定 MLR.4: 条件付き期待値がゼロ
説明変数の任意の値を所与とした誤差項の条件付き期待値
がゼロ
E(u| x1, x2,…, xk)=0
この仮定が成立しない場合:
• 関数形(対数変換、二乗など)が正しく特定されていない
• 被説明変数の重要な決定要因がモデルに入っておらず、そ
の要因と説明変数の間に相関がある
• 説明変数に測定誤差がある (Ch.15 参照)
• 説明変数と被説明変数が同時決定される(Ch.16 参照)
パラメタの不偏性 -仮定4 続き
仮定 MLR.4: 条件付き期待値がゼロ
E(u| x1, x2,…, xk)=0
• この仮定が成立 ⇒ 説明変数は外生的(exogenous)
• 誤差項と説明変数のどれかの間に相関がある
⇒ その説明変数は内生的(endogenous)
• 仮定3(説明変数の間の完全な共線性がないこと)と仮定4
(誤差項の条件付き期待値がゼロ)は全く別
仮定3が成立しない⇒推定値が計算できない
仮定4が成立しない⇒推定値にバイアスが生じる
パラメタの不偏性
定理 3.1: 最小二乗法の不偏性
MLR.1からMLR.4までを仮定すると、母集団におけるパラメ
タβjがいかなる値であっても以下が成立する
E ( ˆ j )   j ,
j  0,1,..., k
すなわち、最小二乗法による推定値は母集団におけるパラ
メタの不偏推定量である
←現実には推定値が真の値と同じということはあり得ない
偏りのない手法で推定しているので、推定値が過大または
過小だと信じる理由はない、ということ
不偏性の証明
仮定3より、パラメタの推定
(rˆ y )


 rˆ
値が計算できる
n
ˆ1
i 1
n
(3.22) rˆi1  x1を x2 ,..., xkに回帰した残差
i1 i
2
i 1 i1
yi   0  1 xi1  ...   k xik  ui を (3.22)の分母に代入すると

n
rˆ (  0  1 xi1   2 xi 2  ...   k xik  ui )
i 1 i1
  0 i 1 rˆi1  1 i 1 rˆi1 xi1   2 i 1 rˆi1 xi 2  ...   k i 1 rˆi1 xik  i 1 rˆi1ui
n
n
n
n
2
ˆ
 1 i 1 ri1  i 1 rˆi1ui
n
n
 i 1 rˆi1  0,
n
i 1 rˆi1 xi1
n
 rˆ x
  rˆ ( xˆ
n
i 1 i1 ij
n
i 1 i1
 0,
j  2,..., k ,
2
ˆ
ˆ

r
)

r
i 1 i1
i1
i1
n
n
不偏性の証明 続き
rˆi1  x1を x2 ,..., xkに回帰した残差

ˆ1  1  i n1
n
rˆi1ui
2
ˆ
r
i1 i1

E ( ˆ1 | X )  1  i 1
n
rˆi1 E (ui | X )

n
rˆ
i 1 i1
 仮定4より E (ui | X )  0
2
 1
無関係な説明変数
Q. 被説明変数に全く影響を与えない説明変数を重回帰モデル
に加えたらどうなるか?
A. パラメタの不偏性には影響なし
ただし、パラメタの分散が大きくなるという問題がある
• 例)
想定したモデル: y   0  1 x1   2 x2   3 x3  v
 yˆ  ˆ  ˆ x  ˆ x  ˆ x
0
1 1
2 2
3 3
真のモデル: y   0  1 x1   2 x2  u
 E ( y | x1 , x2 , x3 )  E ( y | x1 , x2 )   0  1 x1   2 x2
x3を加えても仮定 1-4には影響しないので、
定理3.1よりパラメタの推定値
は全て不偏性を満たす
関係する説明変数の除外
Q. 被説明変数に影響を与える説明変数を重回帰モデルから
除いたらどうなるか?
A. 推定されたパラメタが不偏性を満たさなくなる
~ ~
~
想定したモデル: y   0  1 x1  v  y   0  1 x1
真のモデル: y   0  1 x1   2 x2  u  yˆ  ˆ0  ˆ1 x1  ˆ2 x2
~
x2を x1に回帰した時の x1の係数の推定値を 1とすると
~ ˆ ˆ ~
~
~
ˆ
ˆ
      (3.23)  E (  )  E (  )  E (   )
1
1
2 1
1
1
2 1
真のモデルについては 仮定1-4が満たされているとす ると
~
E ( ˆ1 )  1 , E ( ˆ2 )   2 , また 1は確率変数ではないの で
~
~
~
E ( 1 )  1   21   21だけのバイアスが生じ る
バイアスが大きいのはどんなとき?
~ ~
~
想定したモデル: y   0  1 x1  v  y   0  1 x1
真のモデル: y   0  1 x1   2 x2  u  yˆ  ˆ0  ˆ1 x1  ˆ2 x2
~
1  x2を x1に回帰した時の x1の係数の推定値
~
~
E ( 1 )  1   21
~
バイアスがゼロになる のは  2か 1がゼロの場合のみ
 2  0  x2が yに影響を与えない
~
1  0  x1と x2の相関がゼロ
•
被説明変数に影響を与える全ての要因を説明変数に含め
ることは不可能だが、yに影響を与える要因のうち説明変数
と相関があるものはモデルに含めることが不可欠
バイアスの方向性
~ ~
~
想定したモデル: y   0  1 x1  v  y   0  1 x1
真のモデル: y   0  1 x1   2 x2  u  yˆ  ˆ0  ˆ1 x1  ˆ2 x2
~
1  x2を x1に回帰した時の x1の係数の推定値
~
~
E ( 1 )  1   21
変数の除外によるバイアスの例 1
• 除外された説明変数が観察できない場合、それがyに与える
影響や他の説明変数との相関も観察できないが、それらの
符号は推測できることが多い
想定したモデル:
真のモデル:
log( wage)   0  1educ  v
log( wage)   0  1educ   2 ability  u
 v   2 ability  u
~
  ability を educationに回帰した時の傾きの 推定値
~
~
E ( 1 )  1   2
 2  0  能力が高いほど賃金も 高い
~
  0  能力と教育年数には正 の相関がある
~
 1は 1を過大に推定
変数の除外によるバイアスの例 2
•除外された説明変数が観察できない場合、それがyに与える
影響や他の説明変数との相関も観察できないが、それらの符
号は推測できることが多い
想定したモデル:
真のモデル:
avgscore   0  1expend  v
avgscore   0  1expend   2 povrate  u
 v   2 povrate  u
~
  povrateを expendに回帰した時の傾きの 推定値
~
~
E ( 1 )  1   2
 2  0  貧困地域に住む子ども は成績が悪い
~
  0  貧困と1人当たり教育費には負 の相関
~
 1は1を過大に推定
3変数の場合
想定したモデル: y   0  1 x1   2 x2  v
~ ~
~
~
y   x  x
0
1 1
2 2
真のモデル: y   0  1 x1   2 x2   3 x3  u
 yˆ  ˆ  ˆ x  ˆ x  ˆ x
0
1 1
2 2
3 3
x1とx3は相関しているがx2とx3には相関がない
~
~


⇒ 1 にはバイアスがあるが 2 にはない?
~ ~
と思いきや、  1 と  2 両方にバイアスあり
~ にバイアスがないのはx とx にも相関がない場合だけ
2
1
2
⇒一つでも誤差項と相関がある説明変数があると推定結果全
体がおかしくなってしまう可能性大
3変数の場合 続き
想定したモデル: y   0  1 x1   2 x2  v
~ ~
~
~
y   x  x
0
1 1
2 2
真のモデル: y   0  1 x1   2 x2   3 x3  u
 yˆ  ˆ  ˆ x  ˆ x  ˆ x
0
1 1
2 2
3 3
仮定:x1とx3は相関しているがx2はx1ともx3とも相関していない
~
 31  x3を x1に回帰した時の x1の係数の推定値
~
~
E ( 1 )  1   3 31
⇒ β3の符号とx1とx3の相関の符号によってバイアスの方向が
決まる
3変数の場合の例
想定したモデル: log( wage)   0  1educ   2 exper  v
~ ~
~
~
log( wage)     educ   exper
0
1
2
真のモデル: log( wage)   0  1educ   2 exper   3 ability  u
educとabilityは相関あり
→ experとabilityには相関ないと仮定しても、もしeducとexper
~ ~
が相関していれば  1 と  2 両方にバイアスがある
educとexperの相関なしと仮定
~
→  2 にはバイアスなし
~
 1 のバイアスの方向性は 3 の符号とeducとabilityの相関
の符号によって決まる