エコノメトリックス 第6回 2011年前期 中村さやか 今日やること Ch. 3 Multiple Regression Analysis: Estimation 3.3 The Expected Value of the OLS Estimators • 4つの仮定から推定されたパラメタの不偏性を証明 パラメタの不偏性 -仮定1と仮定2 仮定 MLR.1: パラメタに対して線形 母集団におけるモデルは y=β0+ β1 x1 + β2 x2 + β3 x3 + ... + βk xk +u β0, β1,..., βk: 未知のパラメタ u: 観察できない誤差項(攪乱項) • このモデルを母集団モデル(population model)または真の モデル(true model)と呼ぶ 仮定 MLR.2: 無作為抽出 仮定MLR.1の母集団モデルに従う、観察数nの無作為抽出 された標本: {(xi1, xi2,…, xik, yi): i=1, …, n}がある パラメタの不偏性 -仮定3 仮定 MLR.3: 完全な共線性がないこと 標本において(したがって母集団においても) 説明変数の中に定数のものがないこと、また、 説明変数の間に完全な線形関係がないこと • 説明変数の間に完全な線形関係がある ⇔説明変数の一つが他の説明変数の線形関数としてかける ⇒完全な共線性(perfect collinearlity)がある、と表現 • 相関が1だとモデルの推定が不可能になるが、説明変数の 間の相関が多少高くても問題ない 説明変数の間に完全な共線性がある例 • log(cons)=β0+ β1 log(inc) + β2 log(inc2) +u • voteA=β0+ β1 expendA + β2 expendB + β3 totalexpend +u – voteA: 候補者Aの得票率 – expendA: 候補者Aの選挙運動支出 – expendB: 候補者Bの選挙運動支出 – totalexpend: 選挙運動支出の総額 パラメタの不偏性 -仮定3 続き 仮定 MLR.3: 完全な多重共線性がないこと 標本において(したがって母集団においても) 説明変数の中に定数のものがないこと、また、 説明変数の間に完全な線形関係がないこと • 標本数が少ないと、説明変数の変動が0になったり、説明変 数の間に完全な相関が生じる可能性が高くなる 例) 名古屋大学の学生の標本数が少ないと、全員の年齢が 同じだったり、ある学年の年齢が全員同じだったりする可能 性がある • 一般に、k変数モデルでは n≧k+1であることが必要 • 標本数は多ければ多いほどよい パラメタの不偏性 -仮定4 仮定 MLR.4: 条件付き期待値がゼロ 説明変数の任意の値を所与とした誤差項の条件付き期待値 がゼロ E(u| x1, x2,…, xk)=0 この仮定が成立しない場合: • 関数形(対数変換、二乗など)が正しく特定されていない • 被説明変数の重要な決定要因がモデルに入っておらず、そ の要因と説明変数の間に相関がある • 説明変数に測定誤差がある (Ch.15 参照) • 説明変数と被説明変数が同時決定される(Ch.16 参照) パラメタの不偏性 -仮定4 続き 仮定 MLR.4: 条件付き期待値がゼロ E(u| x1, x2,…, xk)=0 • この仮定が成立 ⇒ 説明変数は外生的(exogenous) • 誤差項と説明変数のどれかの間に相関がある ⇒ その説明変数は内生的(endogenous) • 仮定3(説明変数の間の完全な共線性がないこと)と仮定4 (誤差項の条件付き期待値がゼロ)は全く別 仮定3が成立しない⇒推定値が計算できない 仮定4が成立しない⇒推定値にバイアスが生じる パラメタの不偏性 定理 3.1: 最小二乗法の不偏性 MLR.1からMLR.4までを仮定すると、母集団におけるパラメ タβjがいかなる値であっても以下が成立する E ( ˆ j ) j , j 0,1,..., k すなわち、最小二乗法による推定値は母集団におけるパラ メタの不偏推定量である ←現実には推定値が真の値と同じということはあり得ない 偏りのない手法で推定しているので、推定値が過大または 過小だと信じる理由はない、ということ 不偏性の証明 仮定3より、パラメタの推定 (rˆ y ) rˆ 値が計算できる n ˆ1 i 1 n (3.22) rˆi1 x1を x2 ,..., xkに回帰した残差 i1 i 2 i 1 i1 yi 0 1 xi1 ... k xik ui を (3.22)の分母に代入すると n rˆ ( 0 1 xi1 2 xi 2 ... k xik ui ) i 1 i1 0 i 1 rˆi1 1 i 1 rˆi1 xi1 2 i 1 rˆi1 xi 2 ... k i 1 rˆi1 xik i 1 rˆi1ui n n n n 2 ˆ 1 i 1 ri1 i 1 rˆi1ui n n i 1 rˆi1 0, n i 1 rˆi1 xi1 n rˆ x rˆ ( xˆ n i 1 i1 ij n i 1 i1 0, j 2,..., k , 2 ˆ ˆ r ) r i 1 i1 i1 i1 n n 不偏性の証明 続き rˆi1 x1を x2 ,..., xkに回帰した残差 ˆ1 1 i n1 n rˆi1ui 2 ˆ r i1 i1 E ( ˆ1 | X ) 1 i 1 n rˆi1 E (ui | X ) n rˆ i 1 i1 仮定4より E (ui | X ) 0 2 1 無関係な説明変数 Q. 被説明変数に全く影響を与えない説明変数を重回帰モデル に加えたらどうなるか? A. パラメタの不偏性には影響なし ただし、パラメタの分散が大きくなるという問題がある • 例) 想定したモデル: y 0 1 x1 2 x2 3 x3 v yˆ ˆ ˆ x ˆ x ˆ x 0 1 1 2 2 3 3 真のモデル: y 0 1 x1 2 x2 u E ( y | x1 , x2 , x3 ) E ( y | x1 , x2 ) 0 1 x1 2 x2 x3を加えても仮定 1-4には影響しないので、 定理3.1よりパラメタの推定値 は全て不偏性を満たす 関係する説明変数の除外 Q. 被説明変数に影響を与える説明変数を重回帰モデルから 除いたらどうなるか? A. 推定されたパラメタが不偏性を満たさなくなる ~ ~ ~ 想定したモデル: y 0 1 x1 v y 0 1 x1 真のモデル: y 0 1 x1 2 x2 u yˆ ˆ0 ˆ1 x1 ˆ2 x2 ~ x2を x1に回帰した時の x1の係数の推定値を 1とすると ~ ˆ ˆ ~ ~ ~ ˆ ˆ (3.23) E ( ) E ( ) E ( ) 1 1 2 1 1 1 2 1 真のモデルについては 仮定1-4が満たされているとす ると ~ E ( ˆ1 ) 1 , E ( ˆ2 ) 2 , また 1は確率変数ではないの で ~ ~ ~ E ( 1 ) 1 21 21だけのバイアスが生じ る バイアスが大きいのはどんなとき? ~ ~ ~ 想定したモデル: y 0 1 x1 v y 0 1 x1 真のモデル: y 0 1 x1 2 x2 u yˆ ˆ0 ˆ1 x1 ˆ2 x2 ~ 1 x2を x1に回帰した時の x1の係数の推定値 ~ ~ E ( 1 ) 1 21 ~ バイアスがゼロになる のは 2か 1がゼロの場合のみ 2 0 x2が yに影響を与えない ~ 1 0 x1と x2の相関がゼロ • 被説明変数に影響を与える全ての要因を説明変数に含め ることは不可能だが、yに影響を与える要因のうち説明変数 と相関があるものはモデルに含めることが不可欠 バイアスの方向性 ~ ~ ~ 想定したモデル: y 0 1 x1 v y 0 1 x1 真のモデル: y 0 1 x1 2 x2 u yˆ ˆ0 ˆ1 x1 ˆ2 x2 ~ 1 x2を x1に回帰した時の x1の係数の推定値 ~ ~ E ( 1 ) 1 21 変数の除外によるバイアスの例 1 • 除外された説明変数が観察できない場合、それがyに与える 影響や他の説明変数との相関も観察できないが、それらの 符号は推測できることが多い 想定したモデル: 真のモデル: log( wage) 0 1educ v log( wage) 0 1educ 2 ability u v 2 ability u ~ ability を educationに回帰した時の傾きの 推定値 ~ ~ E ( 1 ) 1 2 2 0 能力が高いほど賃金も 高い ~ 0 能力と教育年数には正 の相関がある ~ 1は 1を過大に推定 変数の除外によるバイアスの例 2 •除外された説明変数が観察できない場合、それがyに与える 影響や他の説明変数との相関も観察できないが、それらの符 号は推測できることが多い 想定したモデル: 真のモデル: avgscore 0 1expend v avgscore 0 1expend 2 povrate u v 2 povrate u ~ povrateを expendに回帰した時の傾きの 推定値 ~ ~ E ( 1 ) 1 2 2 0 貧困地域に住む子ども は成績が悪い ~ 0 貧困と1人当たり教育費には負 の相関 ~ 1は1を過大に推定 3変数の場合 想定したモデル: y 0 1 x1 2 x2 v ~ ~ ~ ~ y x x 0 1 1 2 2 真のモデル: y 0 1 x1 2 x2 3 x3 u yˆ ˆ ˆ x ˆ x ˆ x 0 1 1 2 2 3 3 x1とx3は相関しているがx2とx3には相関がない ~ ~ ⇒ 1 にはバイアスがあるが 2 にはない? ~ ~ と思いきや、 1 と 2 両方にバイアスあり ~ にバイアスがないのはx とx にも相関がない場合だけ 2 1 2 ⇒一つでも誤差項と相関がある説明変数があると推定結果全 体がおかしくなってしまう可能性大 3変数の場合 続き 想定したモデル: y 0 1 x1 2 x2 v ~ ~ ~ ~ y x x 0 1 1 2 2 真のモデル: y 0 1 x1 2 x2 3 x3 u yˆ ˆ ˆ x ˆ x ˆ x 0 1 1 2 2 3 3 仮定:x1とx3は相関しているがx2はx1ともx3とも相関していない ~ 31 x3を x1に回帰した時の x1の係数の推定値 ~ ~ E ( 1 ) 1 3 31 ⇒ β3の符号とx1とx3の相関の符号によってバイアスの方向が 決まる 3変数の場合の例 想定したモデル: log( wage) 0 1educ 2 exper v ~ ~ ~ ~ log( wage) educ exper 0 1 2 真のモデル: log( wage) 0 1educ 2 exper 3 ability u educとabilityは相関あり → experとabilityには相関ないと仮定しても、もしeducとexper ~ ~ が相関していれば 1 と 2 両方にバイアスがある educとexperの相関なしと仮定 ~ → 2 にはバイアスなし ~ 1 のバイアスの方向性は 3 の符号とeducとabilityの相関 の符号によって決まる
© Copyright 2025 ExpyDoc