Qualitative Response Model 被説明変数がダミー変数の回帰 • 例)MROZ.RAW • 女性労働 – inlf 女性が外で働いていれば1,そうでなければ0 – inlf=f(家計所得,教育年数,年齢,子育て費用) • 推定方法 – 線型確率モデル(linear probability model) – プロビットモデル probit model – ロジットモデル logit model 線型確率モデル 被説明変数 y は1または0の値をとるダミー変数 線型モデルをそのまま当てはめる yi 1 x1,i 2 x2,i k xk ,i ui y 当てはめられた直線 1 0 x yの予測値(当てはめ られた直線)は,説明 変数が特定の値をとる ときに,yが1となる確 率を表すと解釈するこ とができる 係数bはxの増加がyが 1となる確率をどのくら い増加させるかを表す 線型確率モデルの問題点 • yの予測値が0と1の間に収まらない – Pr(y=1|x)のもっと良い定式化は? – Pr(y=1|x)=F(b’x) – F( ) に確率分布関数を当てはめるとこの問題は 回避できる • 分散不均一性の問題 分布関数の当てはめ probit model, logit model 次のようなモデルを想定 F( )は確率分布関数 Pr( y 1 | x) F 1 x1 k xk u F y * Probit model 標準正規分布 F ( y * ) ( y * ) Logit model logisitic分布 * exp y * F(y ) 1 exp y * ただし,y*=’x+u 係数の意味 probit model, logit model E y | x 0 1 F ( y* ) 1 F ( y* ) F ( y* ) E y | x F ( y * ) F ( y * ) y * * f ( y ) j * x j x j y x j f( )は確率密度関数, y*=’x+u probit modelやlogit modelでの係数の解釈 yの期待値に与える影響を正確に求めるためには,f(y*)の計算が必要 x1,x2,..,xkの水準に依存 (他の説明変数がとる値によっても異なる) Probit model, logit modelの考え方 yi* 1 x1,i 2 x2,i k xk ,i ui 1 if yi* 0 yi * 0 if yi 0 ここでyは観察される変数であるが,y*は観察不可能な変数であるとする。また, 誤差項はある確率分布にしたがう。 例) 女性の労働参加を決定するある観察不可能な変数がある(y*)。 観察不可能な変数y*は,説明変数xの線型関数+誤差項で決定される。 y*がある閾値(critical value)を超えると女性は労働に参加する(y=1)。 しかし,y*が閾値を越えなければ女性は労働に参加しない(y=0) Probit model, logit modelの考え方 (続き) Pr y * 0 Pr x u 0 Pr u x 1 F x F x 最後の等式は,確率密度関数がx=0に関して対称的な場合に成立 標準正規分布, ロジスティック分布では成立 線形確率モデル probit, logit モデルの推定 menu から Quick Estimate equation を選択して,次の画面の Estimation settings で method にBINARY を選択する。 specificationに Binary estimation method とい うoptionが表れるので, Probit または Logit を 選択する Probit model 係数の比較 ols probit coef C s.e. coef logit s.e. coef s.e. 0.707 0.150 0.580 0.496 0.838 0.841 -0.003 0.001 -0.012 0.005 -0.020 0.008 EDUC 0.040 0.007 0.134 0.025 0.227 0.043 EXPER 0.023 0.002 0.070 0.008 0.120 0.014 AGE -0.018 0.002 -0.056 0.008 -0.091 0.014 KIDSLT6 -0.272 0.034 -0.874 0.118 -1.439 0.201 KIDSGE6 0.013 0.013 0.035 0.043 0.058 0.073 NWIFEINC Probit, Logit model の推定方法 最尤法による推定 尤度関数 likelihood function L 1 F bxi F b' xi yi 0 yi 1 n yi 1 yi F b xi 1 F b xi i 1 n ln L yi ln F bxi (1 yi ) ln 1 F bxi i 1 probit model, logit model :F( )を特定化し,最尤法でパラメータを決める 係数の意味 : marginal effect probit model, logit model E y | x F ( y * ) F ( y * ) y * * f ( y ) j * x j x j y x j f( )は確率密度関数, y*=’x+u logit modelの場合 * * * * * exp( y ) exp( y ) 1 exp( y ) exp( y ) 1 exp( y ) f ( y * ) * 2 y 1 exp( y * ) 1 exp( y * ) exp( y * ) exp( y ) 1 F ( y )1 F ( y ) 1 exp( y ) 1 exp( y ) * 1 exp( y ) * 2 probit modelの場合 関数 * * * * f(y*)=f(y*) 標準正規分布の密度 係数の意味:marginal effect (2) E y | x F ( y * ) F ( y * ) y * * f ( y ) j * x j x j y x j 𝜕𝐸 𝑦|𝑥 𝜕𝑥𝑖 𝛽𝑖 = 𝜕𝐸 𝑦|𝑥 𝜕𝑥𝑗 𝛽𝑗 probit model, logit model の係数の比は,marginal effect の相対 的な比率を表す marginal effectの求め方 Eviewsのコマンドウィンドウで次のようにタイプ vector prob_b = @coefs scalar yhat = prob_b(1)* 1 + prob_b(2) *@mean(nwifeinc) + prob_b(3)* @mean(educ) + prob_b(4)* @mean(exper) + prob_b(5) * @mean(age) + prob_b(6) *@mean(kidslt6) + prob_b(7) * @mean(kidsge6) scalar dnorm_y = @dnorm(yhat) vector (7) dydx dydx(2) = dnorm_y * prob_b(2) dydx(3) = dnorm_y * prob_b(3) dydx(4) = dnorm_y * prob_b(4) dydx(5) = dnorm_y * prob_b(5) dydx(6) = dnorm_y * prob_b(6) dydx(7) = dnorm_y * prob_b(7) 説明 直前の回帰の係数@coefsを prob_bというベクトルに代入 説明変数が平均値をとる場合のy* を計算し,yhatというスカラー変数 に代入 yhatの値での標準正規分布の密度 関数の値を計算し,それを dnorm_yというスカラー変数に代入 Marginal effectsの結果を代入する ベクトルをdydxとする(要素数は7 個) 各要素に,それぞれの説明変数の 限界効果を代入 probit分析の結果を開いたまま, View/ Representation とたどり, そこの結果を張り付けて編集すると楽 marginal effect の求め方 Excelを用いた方法 説明変数の平均 値をここにコピー する(定数項は1 とする) 係数の値 この列はB列と C列の掛け算 marginal effects 上のセルの合計 関数を使ってy* における密度関 数の値を得る norm.s.dist( , ) 問題(1) • MROZ.RAWのデータを用い,女性の労働参 加を,線型確率モデルとlogit model, probit model で推計し,係数を解釈せよ。 – 被説明変数: inlf 労働力であれば1 – 説明変数: nwifeinc( non wife income), educ(教育年数),exper(実際に働いた年数),, age(年齢),kidslt6(6歳未満の子供の数), kidsge6(6-18歳の子供の数) • logit model の場合のf(y*)は? 問題(2) • 問題(1)の説明変数にexpersq(experの平方) を加え, probit model およびlogit modelで推 計し,marginal effects を求めよ。 𝐸 𝑦|𝑥 = 𝐹 𝑦 ∗ ∗ 𝑦 = 𝑎 + 𝑏1 𝑥1 + ⋯ + 𝑏𝑘 𝑥𝑘 + 𝑏𝑘+1 𝑥𝑘 𝜕𝐸 𝑦|𝑥 の場合, 𝜕𝑥𝑘 = 𝜕𝐹 𝑦 ∗ 𝜕𝑦 ∗ ∙ 𝜕𝑦 ∗ 𝜕𝑥𝑘 2 + ⋯+ 𝑒 = 𝑓 𝑦 ∗ 𝑏𝑘 + marginal effectの求め方 Eviewsのコマンドウィンドウで次のようにタイプ vector prob_b = @coefs scalar yhat = prob_b(1)* 1 + prob_b(2) *@mean(nwifeinc) + prob_b(3)* @mean(educ) + prob_b(4)* @mean(exper) + prob_b(5) * ( @mean(exper ) )^2 + prob_b(6) * @mean(age) + prob_b(7) *@mean(kidslt6) + prob_b(8) * @mean(kidsge6) scalar dnorm_y = @dnorm(yhat) vector (8) dydx dydx(2) = dnorm_y * prob_b(2) dydx(3) = dnorm_y * prob_b(3) dydx(4) = dnorm_y * ( prob_b(4) + 2 * prob_b(5) * @mean(exper) ) dydx(6) = dnorm_y * prob_b(6) dydx(7) = dnorm_y * prob_b(7) dydx(8) = dnorm_y * prob_b(8) probit分析の結果を開いたまま, View/ Representation とたどり, そこの結果を張り付けると便利 説明 直前の回帰の係数@coefsを prob_bというベクトルに代入 説明変数が平均値をとる場合のy* を計算し,yhatというスカラー変数 に代入 Yhatの値での標準正規分布の密 度関数の値を計算し,それを dnorm_yというスカラー変数に代入 Marginal effectsの結果を代入する ベクトルをdydxとする(要素数は8 個) 各要素に,それぞれの説明変数の 限界効果を代入 この例では,expersqというexperの 平方の項があるため,dydx(4)の計 算は他とは異なっている marginal effect の求め方 Excelを用いた方法 説明変数の平 均値をここに コピーする marginal effects 係数の値 上のセルの合計 この列はB列と C列の掛け算 関数を使っ てy*におけ る密度関数 の値を得る Tobit model • 耐久財の購入量(y)の決定 – 購入しない人(y=0)が存在 – y>0 と y=0 のみが観察される • この場合も次のようなモデルを考える – y* 観察不可能な変数で,耐久財の購入量(y)を決定する潜在変数 y 1 x1 k xk u * y* y 0 if y 0 if y * 0 * Tobit model の当てはめ y OLSの当てはめ x y*とxの関係 Tobit model Tobit modelの応用 • 女性の労働供給 – MROZ.RAW – 労働参加していない女性が一定割合存在 • 耐久財の購入 • 低賃金労働者の労働供給 – 生活保護の受給との関係で Tobit model の解釈 y * x u u ~ N 0, 2 y max( 0, y * ) Pr y 0 Pr x u 0 Pr u x Pr u x x 1 x Pr y 0 x Tobit model の解釈(2) E y | y 0 x Eu | u x x Eu | u x f x x 1 x f x x x x x ここで,z~N(0,1)のとき,次の式が成り立つ ことを用いている Ez | z c f (c) 1 (c) inverse Mills ratio y>0の条件付きの期待値は,xbよりも大きくなる ことが重要 Tobit modelの解釈 (3) yの unconditional expected value E y E y | y 0 Pr y 0 0 Pr y 0 x x x x x f x 説明変数xが与えられた場合のyの期待値 y>0の条件付き期待値は前頁 Tobitモデルの解釈(4) 結果だけまとめておく Pr y 0 j f x x j E y x j x j Tobitの推定方法 menuで Quick Estimate equation Estimation settings のmethodで CENSORED - .. を選択する 打ち切りの位置 を指定する。0以 外の値も,右側 の指定もできる。 誤差項の分布を選択 (Tobitは正規分布) E-ViewsでのTobit model の推定 の推計値 Tobit model とOLSの比較 Dependent var hours Tobit Coef C E-Viewsでの出 力 OLS s.e. Coef s.e. 965.31 446.44 1330.48 270.78 NWIFEINC -8.81 4.46 -3.45 2.54 EDUC 80.65 21.58 28.76 12.95 EXPER 131.56 17.28 65.67 9.96 -1.86 0.54 -0.70 0.32 -54.41 7.42 -30.51 4.36 KIDSLT6 -894.02 111.88 -442.09 58.85 KIDSGE6 -16.22 38.64 -32.78 23.18 1122.02 EXPERSQ AGE 750.179 Tobitの場合,xj の1単位の増加y の期待値に与え る影響をみるた めには,x’b/s を 計算し,標準正 規分布関数から その涙液分布を 計算する必要あ り。単純に比較で きない 問題(3) • MROZ.RAW • 女性の労働時間の回帰分析 – 40%強が労働時間0 – 被説明変数:hours – 説明変数:nwifeinc, educ, exper, exper^2, age, kidslt6,kidsge6 – OLSとTobit model で推計し,結果を解釈せよ
© Copyright 2024 ExpyDoc