Advanced Topics in Economics I

エコノメトリックス
第3回
2011年前期
中村さやか
今日やること
• 前回のまとめ
• Ch. 2 The Simple Regression Model
2.3
2.4
2.5
Properties of OLS on Any Sample of Data
Units of Measurement and Functional Form
Expected Values and Variances of
the OLS Estimators
前回のまとめ
統計: 1時点・1部分にすぎないサンプルから全体を推測
• 母集団: 世界全体
y=β0+ β1x1+u が成立(と仮定)
β0と β1の値は観察できない
誤差 (観察できない): ui  yi   0  1 xi
• 無作為抽出による標本: 母集団からランダムにn回抜き取
る {(xi, yi): i=1, …, n}
このサンプルをもとにβ0と β1の値を推定する
残差(観察できる): uˆi  yi  ˆ0  ˆ1 xi
方法1: 誤差項uについての二つの仮定から推定値を導出
方法2: 最小二乗法
どちらも全く同じ結果
Copyright © 2009 South-Western/Cengage Learning
Copyright © 2009 South-Western/Cengage Learning
推定方法1
誤差項uについての二つの仮定;
①E(u)=0 ②E(u|x)=0
誤差項(観察できない): ui  yi   0  1 xi
uˆi  yi  ˆ0  ˆ1 xi
残差(観察できる):
誤差項の期待値=残差の平均値
とすると、①と②から次が成り立つ
1 n
n
ˆ  ˆ x )  0
ˆ
u

0

(
y




i
i
0
1 i
i 1
n i 1
1 n
n
ˆ  ˆ x )  0
ˆ
x
u

0

x
(
y




i
i
i
i
0
1 i
i 1
n i 1
右側の二式を  0 , 1 の連立方程式として解く
推定方法2(最小二乗法)
(i番目の観測値の)yの予測値: yˆ i  ˆ0  ˆ1 xi
(i番目の観測値の)残差:
uˆi  yi  yˆ i  yi  ˆ0  ˆ1 xi
yの予測値をyの値に全体的にできるだけ近くしたい
→ 残差を全体的にできるだけ小さくしたい
→ 残差2 の和が最小になるように  0 , 1 を選ぶ
ˆ
Min
u

i 1 i
ˆ ˆ
n
 0 , 1
2
ˆ  ˆ x ) 2
 Min
(
y


i
0
1 i
ˆ ˆ i 1
n
 0 , 1
必要条件:  0 , 1で残差の二乗和を(偏)微分すると0になる

ˆ0
ˆ  ˆ x ) 2  0,
(
y


i1 i 0 1 i
n

n
ˆ  ˆ x ) 2  0
(
y



i
0
1 i
i 1
ˆ
1
必要条件の二式を  0 , 1 についての連立方程式として解く
2.3 Properties of OLS on Any Sample of Data
n
(1) uˆi  0 (2.30)
i 1
n
(2) xi uˆi  0 (2.31)
i 1
(3) y  ˆ0  ˆ1 x (2.31)  ( x , y )は必ず回帰直線上にあ る
1 n
  ( yi  ˆ0  ˆ1 xi )  0 (2.14)
n i 1
(3)より、 yˆの平均値は yと一致
n
1 n
1 n ˆ
1
  yˆ   (  0  ˆ1 xi )   y  y
n i 1
n i 1
n i 1
2.3 Properties of OLS on Any Sample of Data
n
(1) uˆi  0 (2.30)
i 1
n
(2) xi uˆi  0 (2.31)
i 1
(3) y  ˆ0  ˆ1 x
(2.31)  ( x , y )は必ず回帰直線上にあ る
1 n
  ( yi  ˆ0  ˆ1 xi )  0 (2.14)
n i 1
(3)より、 yˆ の平均値は yと一致
n
1 n
1 n ˆ
1
  yˆ   (  0  ˆ1 xi )   y  y
n i 1
n i 1
n i 1
2.3 Properties of OLS on Any Sample of Data
SST  SSE  SSR 
n
n
n
i 1
i 1
i 1
2
2
ˆ
  ui
)
y

y
(

)
y

y
(
 i
 i
n
n
n
2
  ( yi  y )   [( yi  yˆ i )  ( yˆ i  y )]   [uˆi  ( yˆ i  y )]2
2
2
i 1
i 1
i 1
n
n
n
i 1
i 1
  uˆi  2 uˆi ( yˆ i  y )   ( yˆ i  y ) 2
2
i 1
n
 uˆ ( yˆ
i 1
i
i
n
n
i 1
i 1
 y )   uˆi yˆ i  y  uˆi
n
n
 uˆ yˆ  uˆ (ˆ
i 1
i
n
 uˆ
i 1
i
i
i 1
i
0
n
n
i 1
i 1
 ˆ1 xi )  ˆ0  uˆi   uˆi xi
 0 (2.30),
n
 uˆ x
i 1
i i
 0 (2.31) より
n
 uˆ ( yˆ
i 1
i
i
 y)  0
2.3 Properties of OLS on Any Sample of Data
SST  SSE  SSR
 yの総変動 説明された総変動
 説明されなかった総変
動
SSE SSR
両辺を
SSTで割ると、

1
SST SST
SSE/SSTをR2 (R-squared)、または、決定係数(coefficient of
determination)と呼ぶ
SSE 説明された総変動
R 

SST
yの総変動
2
 yの総変動のうち説明さ
れた割合
当てはまりの良さ(goodness of fit)の尺度
2.3 Properties of OLS on Any Sample of Data
• 0≦ R2 ≦ 1 → %で表示されることもある
R2 =1 ⇒ 全ての観測値が一直線上に並んでいる
R2 が0に近い ⇒ モデルの説明力なし
• R2 の値が大きければ成功、小さければ失敗というわけでは
ないことに注意
– 一番大事なのは、E(u|x)=E(u)の仮定が成立しているか
– 説明変数がyに与える影響が小さい場合、 R2の値も小さくなるが、そ
れはそれで重要な結果
2.4 Units of Measurement and Functional Form
Q: 変数の測定単位を変えるとどんな影響があるか?
例1) 被説明変数(年収)を1000ドル単位ではなくドル単位で
測る
例2) 説明変数(利益率)を1000ドル単位ではなくドル単位で
測る
A: 本質的な影響はない
• 推定されたパラメタは変数の測定単位に応じて変化する
• 決定係数(R2)の値は変化しない
2.4 Units of Measurement and Functional Form
対数回帰分析:
被説明変数の(自然)対数をとって最小二乗法で推定
log(y)=β0+ β1x1+u
両辺をx1で偏微分すると
 log( y )  log( y ) y 1 y


x1
y x1 y x1

(  0  1 x1  u )  1
x1
1 y
y
 1 
 1 y
y x1
x1
⇒ x1がyに与える影響は一定ではなく、yが大きいほどx1がyに
与える影響が大きくなる
2.4 Units of Measurement and Functional Form
log(y)=β0+ β1x1+u (★)
1 y
 1 ( u  0 ならば)
y x1
y
 1x1
y
⇒ yの変化率=β1×x1の変化分
⇒ x1の変化がyの変化率に与える影響が一定
(★)の両辺を指数変換すると y=exp(β0+ β1x1+u)
Copyright © 2009 South-Western/Cengage Learning
2.4 Units of Measurement and Functional Form
log(wage)=β0+ β1educ+u β1の推定値が0.083
• 教育年数が1年増えると給与が8.3%上昇
• 時給が1000円の人
⇒教育年数が1年増えると時給が約80円上昇
• 時給が1万円の人
⇒教育年数が1年増えると時給が約830円上昇
• 「教育年数が1年増えると時給の対数値が0.083増える」とい
うのは正しくない
2.4 Units of Measurement and Functional Form
constant elasticity model:
被説明変数だけでなく説明変数も対数変換
log(y)=β0+ β1log(x1)+u
両辺をx1で偏微分すると
 log( y )  log( y ) y 1 y


x1
y x1 y x1
1 y 1

y x1 x1
( u  0 ならば)


(  0  1 log( x1 )  u )  1
x1
x1
y
x1
 1
y
x1
⇒ yの変化率=β1×x1の変化率
⇒ x1のyに対する弾力性がβ1 (constant elasticity)
2.4 Units of Measurement and Functional Form
log(salary)=β0+ β1log(sales)+u
β1の推定値が0.257
• 会社の売上が1%増えるとCEOの年棒が0.257%上昇
⇒ 売り上げに対する年棒の弾力性が0.257
⇒ 弾力性が一定であることが前提
Copyright © 2009 South-Western/Cengage Learning
2.4 Units of Measurement and Functional Form
線形回帰(linear regression model): パラメタに対して線形
線形モデルの例: 消費   0  1 所得  u
非線形モデルの例: 消費 
1
 0  1 所得
u
• 非線形モデルの推定もできないことはないが、この講義では
扱わない
• 線形モデルは非線形モデルの近似形
2.5
Expected Values and Variances of
the OLS Estimators
OLSの不偏性を証明
仮定1:パラメタについて線形
y=β0+ β1x1 +u
yやxが何かの変数の対数値でもOK
仮定2:無作為抽出
母集団から観察数nの標本を無作為抽出: {(xi, yi): i=1, …, n}
母集団について y=β0+β1x+u を仮定
⇒標本では yi=β0+β1xi+ui i=1, …, n
仮定3:説明変数の変動
標本で説明変数{xi: i=1, …, n}が全て同じ値をとっていない
⇒説明変数の分散や標本数が極端に少ない場合以外は問題
なし
2.5
Expected Values and Variances of
the OLS Estimators
OLSの不偏性を証明
仮定4:誤差項の条件付き期待値が0
説明変数がどんな値でも、誤差項の条件付き期待値は0
E(u|x)=0
E(ui|xi)=0
i=1, …, n
一番重要な仮定
2.2 Deriving the Ordinary Least Squares Estimates
n
ˆ1 
 (x
i
i 1
 x )( yi  y )
1 : 真の値(観察できな
い)
ˆ1 : OLSによる推定値
n
2
)
x

x
(
 i
i 1
n
 (x
i 1
i
n
n
i 1
i 1
 x )( yi  y )   ( xi  x ) yi   ( xi  x )(  0  1 xi  ui )
n
n
n
i 1
i 1
i 1
  0  ( xi  x )  1  ( xi  x ) xi   ( xi  x )ui
n
n
i 1
i 1
 ( xi  x )  xi  nx 0,
1
ˆ
 1  1 
SSTx
n
 (x
i 1
i
n
n
i 1
i 1
2
 SSTx
)
x

x
(

x
)
x

x
(
 i
 i
i
 x )ui
2.5
Expected Values and Variances of
the OLS Estimators
定理2.1: 推定されたパラメタの不偏性
E(ˆ0 )  0 0 , E(ˆ1 )  1 1
証明: {xi: i=1, …, n}について条件付き期待値を取ると、
1
ˆ
1  1 
SSTx
n
 ( x  x )u
i 1
i
i
n
1
1


ˆ
E ( 1 )  1 
E  ( xi  x )ui   1 
SSTx  i 1
SSTx

ˆ  y  ˆ x     x  u  ˆ x
0
1
0
1
1
E ( ˆ0 )   0  1 x  E ( ˆ1 ) x  E (u )   0
n
 ( x  x ) E (u )  
i 1
i
i
1
2.5
Expected Values and Variances of
the OLS Estimators
注意点
• 平均的には偏りがない推定値が得られるが、たまたま偏った
サンプルを得てしまったら推定値も偏る
• 仮定のうち一つでも成立しなければ不偏性は成立しない
• 特に、 E(u|x)=0 でなければパラメタにバイアスが生じる
• 誤差項uにyに影響を与えxとも相関した要素が含まれている
場合、本当はxがyに影響を与えていなくても見せかけの相
関(spurious correlation)が生じてしまう
例) 数学の成績=β0+β1学校給食+u, β1の推定値が負
⇒給食が成績を下げるのではなく、貧困地区ほど給食実施
率が高いことによるのではないか
E(u|x)=0の仮定
この仮定が成り立っているかのチェック
1.誤差項uにどのような要素が入っているか考える
• 説明変数以外でyに影響を与える要素は何かを全
て挙げてみる
2.それらの要素のどれかと説明変数の間に相関はあ
るか?
• E(u|x)=0 ならば Cov(u,x)=0
→相関があったらE(u|x)=0の仮定は成り立たない
• 誤差項に入っている要素と説明変数の間の関係を
一つ一つじっくり考えてみることが大切