エコノメトリックス
第6回
2011年前期
中村さやか
今日やること
Ch. 3 Multiple Regression Analysis: Estimation
3.3 The Expected Value of the OLS Estimators
• 4つの仮定から推定されたパラメタの不偏性を証明
パラメタの不偏性 -仮定1と仮定2
仮定 MLR.1: パラメタに対して線形
母集団におけるモデルは
y=β0+ β1 x1 + β2 x2 + β3 x3 + ... + βk xk +u
β0, β1,..., βk: 未知のパラメタ
u: 観察できない誤差項(攪乱項)
• このモデルを母集団モデル(population model)または真の
モデル(true model)と呼ぶ
仮定 MLR.2: 無作為抽出
仮定MLR.1の母集団モデルに従う、観察数nの無作為抽出
された標本: {(xi1, xi2,…, xik, yi): i=1, …, n}がある
パラメタの不偏性 -仮定3
仮定 MLR.3: 完全な共線性がないこと
標本において(したがって母集団においても)
説明変数の中に定数のものがないこと、また、
説明変数の間に完全な線形関係がないこと
• 説明変数の間に完全な線形関係がある
⇔説明変数の一つが他の説明変数の線形関数としてかける
⇒完全な共線性(perfect collinearlity)がある、と表現
• 相関が1だとモデルの推定が不可能になるが、説明変数の
間の相関が多少高くても問題ない
説明変数の間に完全な共線性がある例
• log(cons)=β0+ β1 log(inc) + β2 log(inc2) +u
• voteA=β0+ β1 expendA + β2 expendB + β3 totalexpend +u
– voteA: 候補者Aの得票率
– expendA: 候補者Aの選挙運動支出
– expendB: 候補者Bの選挙運動支出
– totalexpend: 選挙運動支出の総額
パラメタの不偏性 -仮定3 続き
仮定 MLR.3: 完全な多重共線性がないこと
標本において(したがって母集団においても)
説明変数の中に定数のものがないこと、また、
説明変数の間に完全な線形関係がないこと
• 標本数が少ないと、説明変数の変動が0になったり、説明変
数の間に完全な相関が生じる可能性が高くなる
例) 名古屋大学の学生の標本数が少ないと、全員の年齢が
同じだったり、ある学年の年齢が全員同じだったりする可能
性がある
• 一般に、k変数モデルでは n≧k+1であることが必要
• 標本数は多ければ多いほどよい
パラメタの不偏性 -仮定4
仮定 MLR.4: 条件付き期待値がゼロ
説明変数の任意の値を所与とした誤差項の条件付き期待値
がゼロ
E(u| x1, x2,…, xk)=0
この仮定が成立しない場合:
• 関数形(対数変換、二乗など)が正しく特定されていない
• 被説明変数の重要な決定要因がモデルに入っておらず、そ
の要因と説明変数の間に相関がある
• 説明変数に測定誤差がある (Ch.15 参照)
• 説明変数と被説明変数が同時決定される(Ch.16 参照)
パラメタの不偏性 -仮定4 続き
仮定 MLR.4: 条件付き期待値がゼロ
E(u| x1, x2,…, xk)=0
• この仮定が成立 ⇒ 説明変数は外生的(exogenous)
• 誤差項と説明変数のどれかの間に相関がある
⇒ その説明変数は内生的(endogenous)
• 仮定3(説明変数の間の完全な共線性がないこと)と仮定4
(誤差項の条件付き期待値がゼロ)は全く別
仮定3が成立しない⇒推定値が計算できない
仮定4が成立しない⇒推定値にバイアスが生じる
パラメタの不偏性
定理 3.1: 最小二乗法の不偏性
MLR.1からMLR.4までを仮定すると、母集団におけるパラメ
タβjがいかなる値であっても以下が成立する
E ( ˆ j ) j ,
j 0,1,..., k
すなわち、最小二乗法による推定値は母集団におけるパラ
メタの不偏推定量である
←現実には推定値が真の値と同じということはあり得ない
偏りのない手法で推定しているので、推定値が過大または
過小だと信じる理由はない、ということ
不偏性の証明
仮定3より、パラメタの推定
(rˆ y )
rˆ
値が計算できる
n
ˆ1
i 1
n
(3.22) rˆi1 x1を x2 ,..., xkに回帰した残差
i1 i
2
i 1 i1
yi 0 1 xi1 ... k xik ui を (3.22)の分母に代入すると
n
rˆ ( 0 1 xi1 2 xi 2 ... k xik ui )
i 1 i1
0 i 1 rˆi1 1 i 1 rˆi1 xi1 2 i 1 rˆi1 xi 2 ... k i 1 rˆi1 xik i 1 rˆi1ui
n
n
n
n
2
ˆ
1 i 1 ri1 i 1 rˆi1ui
n
n
i 1 rˆi1 0,
n
i 1 rˆi1 xi1
n
rˆ x
rˆ ( xˆ
n
i 1 i1 ij
n
i 1 i1
0,
j 2,..., k ,
2
ˆ
ˆ
r
)
r
i 1 i1
i1
i1
n
n
不偏性の証明 続き
rˆi1 x1を x2 ,..., xkに回帰した残差
ˆ1 1 i n1
n
rˆi1ui
2
ˆ
r
i1 i1
E ( ˆ1 | X ) 1 i 1
n
rˆi1 E (ui | X )
n
rˆ
i 1 i1
仮定4より E (ui | X ) 0
2
1
無関係な説明変数
Q. 被説明変数に全く影響を与えない説明変数を重回帰モデル
に加えたらどうなるか?
A. パラメタの不偏性には影響なし
ただし、パラメタの分散が大きくなるという問題がある
• 例)
想定したモデル: y 0 1 x1 2 x2 3 x3 v
yˆ ˆ ˆ x ˆ x ˆ x
0
1 1
2 2
3 3
真のモデル: y 0 1 x1 2 x2 u
E ( y | x1 , x2 , x3 ) E ( y | x1 , x2 ) 0 1 x1 2 x2
x3を加えても仮定 1-4には影響しないので、
定理3.1よりパラメタの推定値
は全て不偏性を満たす
関係する説明変数の除外
Q. 被説明変数に影響を与える説明変数を重回帰モデルから
除いたらどうなるか?
A. 推定されたパラメタが不偏性を満たさなくなる
~ ~
~
想定したモデル: y 0 1 x1 v y 0 1 x1
真のモデル: y 0 1 x1 2 x2 u yˆ ˆ0 ˆ1 x1 ˆ2 x2
~
x2を x1に回帰した時の x1の係数の推定値を 1とすると
~ ˆ ˆ ~
~
~
ˆ
ˆ
(3.23) E ( ) E ( ) E ( )
1
1
2 1
1
1
2 1
真のモデルについては 仮定1-4が満たされているとす ると
~
E ( ˆ1 ) 1 , E ( ˆ2 ) 2 , また 1は確率変数ではないの で
~
~
~
E ( 1 ) 1 21 21だけのバイアスが生じ る
バイアスが大きいのはどんなとき?
~ ~
~
想定したモデル: y 0 1 x1 v y 0 1 x1
真のモデル: y 0 1 x1 2 x2 u yˆ ˆ0 ˆ1 x1 ˆ2 x2
~
1 x2を x1に回帰した時の x1の係数の推定値
~
~
E ( 1 ) 1 21
~
バイアスがゼロになる のは 2か 1がゼロの場合のみ
2 0 x2が yに影響を与えない
~
1 0 x1と x2の相関がゼロ
•
被説明変数に影響を与える全ての要因を説明変数に含め
ることは不可能だが、yに影響を与える要因のうち説明変数
と相関があるものはモデルに含めることが不可欠
バイアスの方向性
~ ~
~
想定したモデル: y 0 1 x1 v y 0 1 x1
真のモデル: y 0 1 x1 2 x2 u yˆ ˆ0 ˆ1 x1 ˆ2 x2
~
1 x2を x1に回帰した時の x1の係数の推定値
~
~
E ( 1 ) 1 21
変数の除外によるバイアスの例 1
• 除外された説明変数が観察できない場合、それがyに与える
影響や他の説明変数との相関も観察できないが、それらの
符号は推測できることが多い
想定したモデル:
真のモデル:
log( wage) 0 1educ v
log( wage) 0 1educ 2 ability u
v 2 ability u
~
ability を educationに回帰した時の傾きの 推定値
~
~
E ( 1 ) 1 2
2 0 能力が高いほど賃金も 高い
~
0 能力と教育年数には正 の相関がある
~
1は 1を過大に推定
変数の除外によるバイアスの例 2
•除外された説明変数が観察できない場合、それがyに与える
影響や他の説明変数との相関も観察できないが、それらの符
号は推測できることが多い
想定したモデル:
真のモデル:
avgscore 0 1expend v
avgscore 0 1expend 2 povrate u
v 2 povrate u
~
povrateを expendに回帰した時の傾きの 推定値
~
~
E ( 1 ) 1 2
2 0 貧困地域に住む子ども は成績が悪い
~
0 貧困と1人当たり教育費には負 の相関
~
1は1を過大に推定
3変数の場合
想定したモデル: y 0 1 x1 2 x2 v
~ ~
~
~
y x x
0
1 1
2 2
真のモデル: y 0 1 x1 2 x2 3 x3 u
yˆ ˆ ˆ x ˆ x ˆ x
0
1 1
2 2
3 3
x1とx3は相関しているがx2とx3には相関がない
~
~
⇒ 1 にはバイアスがあるが 2 にはない?
~ ~
と思いきや、 1 と 2 両方にバイアスあり
~ にバイアスがないのはx とx にも相関がない場合だけ
2
1
2
⇒一つでも誤差項と相関がある説明変数があると推定結果全
体がおかしくなってしまう可能性大
3変数の場合 続き
想定したモデル: y 0 1 x1 2 x2 v
~ ~
~
~
y x x
0
1 1
2 2
真のモデル: y 0 1 x1 2 x2 3 x3 u
yˆ ˆ ˆ x ˆ x ˆ x
0
1 1
2 2
3 3
仮定:x1とx3は相関しているがx2はx1ともx3とも相関していない
~
31 x3を x1に回帰した時の x1の係数の推定値
~
~
E ( 1 ) 1 3 31
⇒ β3の符号とx1とx3の相関の符号によってバイアスの方向が
決まる
3変数の場合の例
想定したモデル: log( wage) 0 1educ 2 exper v
~ ~
~
~
log( wage) educ exper
0
1
2
真のモデル: log( wage) 0 1educ 2 exper 3 ability u
educとabilityは相関あり
→ experとabilityには相関ないと仮定しても、もしeducとexper
~ ~
が相関していれば 1 と 2 両方にバイアスがある
educとexperの相関なしと仮定
~
→ 2 にはバイアスなし
~
1 のバイアスの方向性は 3 の符号とeducとabilityの相関
の符号によって決まる
© Copyright 2026 ExpyDoc