Document

Qualitative Response Model
被説明変数がダミー変数の回帰
• 例)MROZ.RAW
• 女性労働
– inlf 女性が外で働いていれば1,そうでなければ0
– inlf=f(家計所得,教育年数,年齢,子育て費用)
• 推定方法
– 線型確率モデル(linear probability model)
– プロビットモデル probit model
– ロジットモデル logit model
線型確率モデル
被説明変数 y は1または0の値をとるダミー変数
線型モデルをそのまま当てはめる
yi    1 x1,i   2 x2,i     k xk ,i  ui
y
当てはめられた直線
1
0
x
yの予測値(当てはめ
られた直線)は,説明
変数が特定の値をとる
ときに,yが1となる確
率を表すと解釈するこ
とができる
係数bはxの増加がyが
1となる確率をどのくら
い増加させるかを表す
線型確率モデルの問題点
• yの予測値が0と1の間に収まらない
– Pr(y=1|x)のもっと良い定式化は?
– Pr(y=1|x)=F(b’x)
– F( ) に確率分布関数を当てはめるとこの問題は
回避できる
• 分散不均一性の問題
分布関数の当てはめ
probit model, logit model
次のようなモデルを想定 F( )は確率分布関数
 
Pr( y  1 | x)  F   1 x1     k xk  u   F y *
Probit model  標準正規分布
F ( y * )  ( y * )
Logit model  logisitic分布
 
 
*
exp
y
*
F(y ) 
1  exp y *
ただし,y*=’x+u
係数の意味
probit model, logit model


E y | x  0  1  F ( y* )  1 F ( y* )  F ( y* )
 E y | x  F ( y * ) F ( y * ) y *
*



f
(
y
) j
*
x j
x j
y x j
f( )は確率密度関数, y*=’x+u
probit modelやlogit modelでの係数の解釈
yの期待値に与える影響を正確に求めるためには,f(y*)の計算が必要
x1,x2,..,xkの水準に依存 (他の説明変数がとる値によっても異なる)
Probit model, logit modelの考え方
yi*    1 x1,i   2 x2,i     k xk ,i  ui
1 if yi*  0
yi  
*
0 if yi  0
ここでyは観察される変数であるが,y*は観察不可能な変数であるとする。また,
誤差項はある確率分布にしたがう。
例) 女性の労働参加を決定するある観察不可能な変数がある(y*)。
観察不可能な変数y*は,説明変数xの線型関数+誤差項で決定される。
y*がある閾値(critical value)を超えると女性は労働に参加する(y=1)。
しかし,y*が閾値を越えなければ女性は労働に参加しない(y=0)
Probit model, logit modelの考え方
(続き)


Pr y *  0  Pr  x  u  0 
 Pr u    x 
 1  F   x 
 F  x 
最後の等式は,確率密度関数がx=0に関して対称的な場合に成立
標準正規分布, ロジスティック分布では成立
線形確率モデル
probit, logit モデルの推定
menu から
Quick 
Estimate equation
を選択して,次の画面の
Estimation settings で
method にBINARY
を選択する。
specificationに Binary
estimation method とい
うoptionが表れるので,
Probit または Logit を
選択する
Probit model
係数の比較
ols
probit
coef
C
s.e.
coef
logit
s.e.
coef
s.e.
0.707
0.150
0.580
0.496
0.838
0.841
-0.003
0.001
-0.012
0.005
-0.020
0.008
EDUC
0.040
0.007
0.134
0.025
0.227
0.043
EXPER
0.023
0.002
0.070
0.008
0.120
0.014
AGE
-0.018
0.002
-0.056
0.008
-0.091
0.014
KIDSLT6
-0.272
0.034
-0.874
0.118
-1.439
0.201
KIDSGE6
0.013
0.013
0.035
0.043
0.058
0.073
NWIFEINC
Probit, Logit model の推定方法
最尤法による推定
尤度関数 likelihood function
L   1  F bxi  F b' xi 
yi  0
yi 1
n
yi
1 yi


  F b xi  1  F b xi 
i 1
n
ln L    yi ln F bxi   (1  yi ) ln 1  F bxi 
i 1
probit model, logit model :F( )を特定化し,最尤法でパラメータを決める
係数の意味 : marginal effect
probit model, logit model
 E y | x  F ( y * ) F ( y * ) y *
*


 f ( y ) j
*
x j
x j
y x j
f( )は確率密度関数, y*=’x+u
logit modelの場合
*
* 
*
*
* 



exp( y )
exp( y ) 1  exp( y )  exp( y ) 1  exp( y )

f ( y * )  * 

2
y  1  exp( y * ) 
1  exp( y * )


exp( y * )




exp( y )
1

 F ( y )1  F ( y )
1  exp( y ) 1  exp( y )
*
1  exp( y )
*

2
probit modelの場合
関数
*
*
*
*
f(y*)=f(y*) 標準正規分布の密度

係数の意味:marginal effect (2)
 E y | x  F ( y * ) F ( y * ) y *
*



f
(
y
) j
*
x j
x j
y x j
𝜕𝐸 𝑦|𝑥 𝜕𝑥𝑖 𝛽𝑖
=
𝜕𝐸 𝑦|𝑥 𝜕𝑥𝑗 𝛽𝑗
probit model, logit model の係数の比は,marginal effect の相対
的な比率を表す
marginal effectの求め方
Eviewsのコマンドウィンドウで次のようにタイプ
vector prob_b = @coefs
scalar yhat = prob_b(1)* 1
+ prob_b(2) *@mean(nwifeinc)
+ prob_b(3)* @mean(educ)
+ prob_b(4)* @mean(exper)
+ prob_b(5) * @mean(age)
+ prob_b(6) *@mean(kidslt6)
+ prob_b(7) * @mean(kidsge6)
scalar dnorm_y = @dnorm(yhat)
vector (7) dydx
dydx(2) = dnorm_y * prob_b(2)
dydx(3) = dnorm_y * prob_b(3)
dydx(4) = dnorm_y * prob_b(4)
dydx(5) = dnorm_y * prob_b(5)
dydx(6) = dnorm_y * prob_b(6)
dydx(7) = dnorm_y * prob_b(7)
説明
直前の回帰の係数@coefsを
prob_bというベクトルに代入
説明変数が平均値をとる場合のy*
を計算し,yhatというスカラー変数
に代入
yhatの値での標準正規分布の密度
関数の値を計算し,それを
dnorm_yというスカラー変数に代入
Marginal effectsの結果を代入する
ベクトルをdydxとする(要素数は7
個)
各要素に,それぞれの説明変数の
限界効果を代入
probit分析の結果を開いたまま,
View/ Representation とたどり,
そこの結果を張り付けて編集すると楽
marginal effect の求め方 Excelを用いた方法
説明変数の平均
値をここにコピー
する(定数項は1
とする)
係数の値
この列はB列と
C列の掛け算
marginal effects
上のセルの合計
関数を使ってy*
における密度関
数の値を得る
norm.s.dist( , )
問題(1)
• MROZ.RAWのデータを用い,女性の労働参
加を,線型確率モデルとlogit model, probit
model で推計し,係数を解釈せよ。
– 被説明変数: inlf 労働力であれば1
– 説明変数: nwifeinc( non wife income),
educ(教育年数),exper(実際に働いた年数),,
age(年齢),kidslt6(6歳未満の子供の数),
kidsge6(6-18歳の子供の数)
• logit model の場合のf(y*)は?
問題(2)
• 問題(1)の説明変数にexpersq(experの平方)
を加え, probit model およびlogit modelで推
計し,marginal effects を求めよ。
𝐸 𝑦|𝑥 = 𝐹 𝑦 ∗
∗
𝑦 = 𝑎 + 𝑏1 𝑥1 + ⋯ + 𝑏𝑘 𝑥𝑘 + 𝑏𝑘+1 𝑥𝑘
𝜕𝐸 𝑦|𝑥
の場合,
𝜕𝑥𝑘
=
𝜕𝐹 𝑦 ∗
𝜕𝑦 ∗
∙
𝜕𝑦 ∗
𝜕𝑥𝑘
2
+ ⋯+ 𝑒
= 𝑓 𝑦 ∗ 𝑏𝑘 +
marginal effectの求め方
Eviewsのコマンドウィンドウで次のようにタイプ
vector prob_b = @coefs
scalar yhat = prob_b(1)* 1
+ prob_b(2) *@mean(nwifeinc)
+ prob_b(3)* @mean(educ)
+ prob_b(4)* @mean(exper)
+ prob_b(5) * ( @mean(exper ) )^2
+ prob_b(6) * @mean(age)
+ prob_b(7) *@mean(kidslt6)
+ prob_b(8) * @mean(kidsge6)
scalar dnorm_y = @dnorm(yhat)
vector (8) dydx
dydx(2) = dnorm_y * prob_b(2)
dydx(3) = dnorm_y * prob_b(3)
dydx(4) = dnorm_y * ( prob_b(4) + 2 *
prob_b(5) * @mean(exper) )
dydx(6) = dnorm_y * prob_b(6)
dydx(7) = dnorm_y * prob_b(7)
dydx(8) = dnorm_y * prob_b(8)
probit分析の結果を開いたまま,
View/ Representation とたどり,
そこの結果を張り付けると便利
説明
直前の回帰の係数@coefsを
prob_bというベクトルに代入
説明変数が平均値をとる場合のy*
を計算し,yhatというスカラー変数
に代入
Yhatの値での標準正規分布の密
度関数の値を計算し,それを
dnorm_yというスカラー変数に代入
Marginal effectsの結果を代入する
ベクトルをdydxとする(要素数は8
個)
各要素に,それぞれの説明変数の
限界効果を代入
この例では,expersqというexperの
平方の項があるため,dydx(4)の計
算は他とは異なっている
marginal effect の求め方 Excelを用いた方法
説明変数の平
均値をここに
コピーする
marginal effects
係数の値
上のセルの合計
この列はB列と
C列の掛け算
関数を使っ
てy*におけ
る密度関数
の値を得る
Tobit model
• 耐久財の購入量(y)の決定
– 購入しない人(y=0)が存在
– y>0 と y=0 のみが観察される
• この場合も次のようなモデルを考える
– y* 観察不可能な変数で,耐久財の購入量(y)を決定する潜在変数
y    1 x1     k xk  u
*
 y*
y
0
if y  0
if y *  0
*
Tobit model の当てはめ
y
OLSの当てはめ
x
y*とxの関係
Tobit model
Tobit modelの応用
• 女性の労働供給
– MROZ.RAW
– 労働参加していない女性が一定割合存在
• 耐久財の購入
• 低賃金労働者の労働供給
– 生活保護の受給との関係で
Tobit model の解釈
y *  x  u

u ~ N 0,  2

y  max( 0, y * )
Pr  y  0   Pr  x  u  0   Pr u   x 
 Pr u    x      x  
 1    x  
Pr  y  0     x  
Tobit model の解釈(2)
E y | y  0  x  Eu | u   x 
 x  Eu | u    x  
f  x  
 x  
1    x  
f  x  
 x  
  x  
 x    x  
ここで,z~N(0,1)のとき,次の式が成り立つ
ことを用いている
Ez | z  c  
f (c)
1   (c)
inverse Mills ratio
y>0の条件付きの期待値は,xbよりも大きくなる
ことが重要
Tobit modelの解釈 (3)
yの unconditional expected value
E y   E y | y  0  Pr  y  0  0  Pr  y  0
 x    x    x  
   x  x  f  x  
説明変数xが与えられた場合のyの期待値
y>0の条件付き期待値は前頁
Tobitモデルの解釈(4)
結果だけまとめておく

Pr  y  0   j  f  x  
x j

E y     x     j
x j
Tobitの推定方法
menuで Quick 
Estimate equation
Estimation settings
のmethodで
CENSORED - ..
を選択する
打ち切りの位置
を指定する。0以
外の値も,右側
の指定もできる。
誤差項の分布を選択
(Tobitは正規分布)
E-ViewsでのTobit model
の推定
の推計値
Tobit model とOLSの比較
Dependent var
hours
Tobit
Coef
C
E-Viewsでの出
力
OLS
s.e.
Coef
s.e.
965.31
446.44
1330.48
270.78
NWIFEINC
-8.81
4.46
-3.45
2.54
EDUC
80.65
21.58
28.76
12.95
EXPER
131.56
17.28
65.67
9.96
-1.86
0.54
-0.70
0.32
-54.41
7.42
-30.51
4.36
KIDSLT6
-894.02
111.88
-442.09
58.85
KIDSGE6
-16.22
38.64
-32.78
23.18

1122.02
EXPERSQ
AGE
750.179
Tobitの場合,xj
の1単位の増加y
の期待値に与え
る影響をみるた
めには,x’b/s を
計算し,標準正
規分布関数から
その涙液分布を
計算する必要あ
り。単純に比較で
きない
問題(3)
• MROZ.RAW
• 女性の労働時間の回帰分析
– 40%強が労働時間0
– 被説明変数:hours
– 説明変数:nwifeinc, educ, exper, exper^2, age,
kidslt6,kidsge6
– OLSとTobit model で推計し,結果を解釈せよ