教育水準が,労働者の賃金にどのような影響を与えているかを

【経済情報処理 II 練習問題 1】
教育水準が,労働者の賃金にどのような影響を与えているかを分析するため,アメリカの労働者 526 人のデータ
を用いて以下のようなモデルを推定した。
それぞれの変数の定義と推定結果については別紙を参照し,以下の問に答えよ。
問 1 修学年数(educ)の係数の推定結果についての解釈を述べよ。
問 2 賃金が最も高くなるのは,経験年数が何年のときか。
問 3 女性ダミー(female)の係数の推定結果についての解釈を述べよ。
問 4 南部ダミー(south)の係数の推定結果についての解釈を述べよ。
問 5 決定係数(R-squared)の解釈を述べよ。
問 6 独立変数のなかで,賃金に対して 5%の有意水準で統計的に有意な影響を与えていないものはどれか。
解答・解説
問 1 他の要因を一定として修学年数が 1 年増えると,賃金が 7.74%上昇する。
言い換えると,学校教育の収益率は 1 年に月 7.74%。
係数の解釈⇒「他の要因を一定として x(独立変数)が~だけ増えると,y(従属変数)が~だけ増える(減る)
」
y=a+bx⇒x が 1 単位増えると,y は b だけ増える。
他の要因とは?⇒x 以外のすべての独立変数と,u(誤差項)
x や y の代わりに,その自然対数(log)に変換したものを用いることで,独立変数と従属変数の非線形の関係を
捉えることができる。
log y=a+b log x
⇒x が 1%増えると,y が b%だけ増える(b は y の x に関する弾力性)。
log y=a+bx
⇒x が 1 単位増えると,y が b×100%だけ増える。
y=a+b log x
⇒x が 1%増えると,y が b/100 単位だけ増える。
log(wage)と x の関係
wage と x の関係
問 2 25 年のとき
モデルに独立変数の二乗項を追加することにより,独立変数と従属変数の非線形の関係を捉えることができる。
モデルの経験年数(exper)に関する部分だけを考えよう。
すなわち,log (wage)は exper に関する二次関数。二次関数の頂点は,
。
(1)
(2)
(3)
(4)
二次関数
において,x が 1 単位増加すると,
yは
⇒
だけ増加する。
,
の正負によってグラフの形状を判
断できる(右図)
。
0
問 3 他の要因を一定として,女性は男性よりも 29.6%賃金が低い。
性別や人種など,数値で表せないような情報を「質的な」情報という(賃金や修学年数など数値で表せる情報は
「量的な」情報)
。
0 か 1 のどちらかの値をとるような変数をダミー変数という(例: female は女性であれば 1,男性であれば 0
となるダミー変数)
。
⇒質的な情報はダミー変数を用いて分析。
モデルの女性ダミーに関する部分だけを考えよう。
男性であれば female=0:
女性であれば female=1:
⇒他の要因を一定として(教育水準や経験年数などが同じであれば),女性は男性と だけ賃金が異なる。
問 4 他の要因を一定として,東部在住の労働者に比べて,南部在住の労働者は 9.8%だけ賃金が低い。
性別は男性か女性の二分類なので,0 か 1 のダミー変数で分析できる。
⇒カテゴリが三つ以上ある場合は,基準となるカテゴリを決めて,残りのカテゴリそれぞれに関するダミー変数
を作成して分析する。
たとえば,居住地域が東部,北・中部,南部,西部の四つのカテゴリに分類されていれば,東部を基準カテゴリ
として,
・北・中部であれば 1,それ以外は 0 となるダミー変数 northcen を作成
・南部であれば 1,それ以外は 0 となるダミー変数 south を作成
・西部であれば 1,それ以外は 0 となるダミー変数 south を作成
東部在住であれば,
北・中部在住であれば,
南部であれば,
西部であれば,
⇒northcen,south,west の係数
,
,
はそれぞれ,他の要因を一定として,基準である東部と比べた,
北・中部,南部,西部での賃金。
基準となるカテゴリについては,ダミー変数をモデルに含めないことに注意(この場合では,東部ダミーはモデ
ルに含めない)
。
問 5 ここで用いた独立変数で説明できる対数賃金の変動は約 45%。
問 6 nonwhite,married,notthcen, west
を(誰にもわからない)真の値とすると,最小二乗法で推定された
の分布は,サンプル・サイズが十分に
大きければ,
すなわち,サンプルが違えば最小二乗法によって推定される係数も違うが,その平均値は真の値となる(これを
最小二乗推定量の不偏性という)
。
は標準誤差で,推定結果の std. error で報告されている。
計量経済モデルで重要なことは,独立変数が従属変数に対して影響を与えているかどうか。
⇒
が 0 ではないかどうか。
⇒
の信頼区間を求めて,その区間に 0 が含まれるかどうかをチェックする(仮説検定)。
educ の係数 の推定値は 0.0774864,標準誤差は 0.00683489 なので, の 95%信頼区間は,
0.0774864―1.96×0.00683489~0.0774864+1.96×0.00683489
⇒
0.064~0.091
教育の収益率は 95%の確率で 0.064~0.091 の間にある,すなわち 0 である確率は 5%未満(厳密にいえば, の
真の値が 0 であれば 0.0774864 という推定値が得られる確率は 5%未満)
。
⇒educ は log(wage)に対して 5%の有意水準で統計的に有意な影響を与えているという。
married の係数 の推定値は 0.0580882,標準誤差は 0.0406876 なので, の 95%信頼区間は,
0.0580882―1.96×0.0406876~0.0580882+1.96×0.040687
⇒
―0.022~0.13
未婚者と既婚者の賃金格差 は 95%の確率で―0.022~0.138 の間にある,すなわち 0 である確率は 5%以上(厳
密にいえば, の真の値が
であっても,
という推定値が得られる確率が %以上ある)
。
⇒married は log(wage)に対して 5%の有意水準で統計的に有意な影響を与えていない。
独立変数が従属変数に対して統計的に有意な影響を与えているかどうかを判断するには,推定結果の p-value を
見る。p-value が 0.1 よりも小さければ,その独立変数は 10%の有意水準で有意。0.05 よりも小さければ 5%,
0.01 よりも小さければ 1%の有意水準で有意。推定結果には,わかりやすいように,1%水準で有意なら***,5%
水準で有意なら**,10%水準で有意なら*の印がつけられることが多い。
Model 1: OLS, using observations 1-526
Dependent variable: lwage
coefficient
std. error
t-ratio
p-value
----------------------------------------------------------const
0.480063
0.104914
4.576
5.95e-06
educ
0.0774864
0.00683489
11.34
9.60e-027
exper
0.0276295
0.00533079
5.183
3.14e-07
expersq
-0.000551409
0.000112360 -4.908
1.24e-06
tenure
0.0306451
0.00683037
4.487
8.94e-06
tenursq
-0.000565753
0.000234235 -2.415
0.0161
nonwhite -0.0179937
0.0578211
-0.3112 0.7558
female
-0.296466
0.0359817
-8.239
1.45e-015
married
0.0580882
0.0406876
1.428
0.1540
northcen -0.0673379
0.0505175
-1.333
0.1831
south
-0.0976792
0.0474969
-2.057
0.0402
west
0.0508025
0.0560800
0.9059 0.3654
Mean dependent var 1.623268
Sum squared resid
81.03867
R-squared
0.453659
F(11, 514)
38.80035
Log-likelihood
-254.4531
Schwarz criterion
584.0898
S.D. dependent var
S.E. of regression
Adjusted R-squared
P-value(F)
Akaike criterion
Hannan-Quinn
***
***
***
***
***
**
***
**
0.531538
0.397068
0.441967
1.38e-60
532.9062
552.9468
Log-likelihood for wage = -1108.29
Excluding the constant, p-value was highest for variable 5 (nonwhite)
wage
:時間あたり賃金(ドル)
educ
:修学年数(年)
exper
:労働市場における経験年数(=年齢―修学年数―6,年)
expersq :exper の二乗
tenure :現在の職場での勤続年数(年)
tenuresq:tenure の二乗
nonwhite:非白人であれば 1(それ以外は 0)となるダミー変数
female :女性であれば 1(男性は 0)となるダミー変数
married :既婚であれば 1(未婚は 0)となるダミー変数
northcen:中部・北部に住んでいれば 1(それ以外は 0)となるダミー変数
south
:南部に住んでいれば 1(それ以外は 0)となるダミー変数
west
:西部に住んでいれば 1(それ以外は 0)となるダミー変数
(居住地域は,東部,北・中部,南部,西部の四つに分類)