解答例 2014
設問1
1.
(1)




0
x<0
x /2
0≤x<1
F (x) =
2
−1 + 2x − x /2 1 ≤ x ≤ 2



1
2<x
(2)
∫
2
1
(x − 1)2 xdx = 1/4 − 2/3 + 1/2 = 1/12
∫0 2
(x − 1)2 (2 − x)dx = 1/3 − 1/4 = 1/12
1
よって、1/6.
2.
(1)
E(aX + bY + c)
∫ ∞∫ ∞
=
(ax + by + c)f (x, y)dxdy
−∞ −∞
∫ ∞
∫ ∞
=a
xfX (x)dx + b
yfY (y)dy + c
−∞
−∞
= aE(X) + bE(Y ) + c.
(2)
Cov(aX + bY, cX + dY )
= E[((aX + bY ) − E(aX) − E(bY ))((cX + dY ) − E(cX) − E(dY ))]
∫ ∞
∫ ∞
∫ ∞∫ ∞
2
2
=
acx fX (x)dx +
bdy fY (y)dx +
(ad + bc)xyf (x, y)dxdy
−∞
−∞
−∞ −∞
∫ ∞
∫ ∞
∫ ∞
∫
2
2
−[ac(
xfX (x)dx) + bd(
yfY (y)dy) + (ad + bc)(
xfX (x)dx)ac(
−∞
−∞
(3) 1)
∫
∞
E(ϵ|X) =
∫−∞
∞
=
∫−∞
∞
=
−∞
−∞
(y − m(x))f (y|X = x)dy
(y − m(x))f (x, y)/fX (x)dy
∫
yf (x, y)/fX (x)dy − m(x)/fX (x)
= m(x) − m(x) = 0.
1
∞
f (x, y)dy
−∞
∞
−∞
yfY (y)dy)]
2)
∫
E(Y |X) =
∫
∞
∞
yf (y|X = x)dy =
−∞
−∞
∫
E(E(Y |X)) =
∫
∞
yf (x, y)/fX (x)dy
∞
(1/fX (x))(
yf (x, y)dy)fX (x)dx
−∞
−∞
∫ ∞∫ ∞
=
yf (x, y)dydx
−∞ −∞
∫ ∞ ∫ ∞
=
y
f (x, y)dxdy
−∞
−∞
∫ ∞
=
yfY (y)dy = E(Y )
−∞
3)
E(ϵ) = E(E(ϵ|X)) = E(0) = 0.
2
設問2
(1)
ˆ = (X′ X)−1 X′ (Xβ + ϵ)
β
= β + (X′ X)−1 X′ ϵ
ˆ は正規確率変数 ϵ の線形関数であることから正規分布に従う。また、
より、β
ˆ
β の期待値と分散は、それぞれ
ˆ = β + (X′ X)−1 X′ E[ϵ] = β,
E[β]
ˆ = E[(β
ˆ − β)(β
ˆ − β)′ ]
V ar(β)
= (X′ X)−1 X′ E[ϵϵ′ ]X(X′ X)−1
= σ 2 (X′ X)−1
となる。従って、
ˆ ∼ N (β, σ 2 (X′ X)−1 )
β
が成り立つ。
(2)
e =
=
=
=
ˆ
Y − Xβ
Y − X(X′ X)−1 X′ Y
(I − X(X′ X)−1 X′ )(Xβ + ϵ)
(I − X(X′ X)−1 X′ )ϵ.
最後の等式は (I − X(X′ X)−1 X′ )X = 0 から従う。
(3) M = I − X(X′ X)−1 X′ とおく。M はベキ等行列であることに注意す
ると
(n − k)s2
e ′ e ( ϵ )′ ( ϵ )
= 2 =
M
σ2
σ
σ
σ
である。また、ベキ等行列のランクとトレースは一致することに注意すると
rank(M) = tr(M) = tr(I) − tr(X(X′ X)−1 X′ )
= tr(I) − tr((X′ X)−1 X′ X) = n − k
2
が成り立つ。さらに、ϵ/σ ∼ N (0, I) である。従って、 (n−k)s
は自由度 n − k
σ2
2
の χ 分布に従う。
3
ˆ と e は共に正規確率変数 ϵ の線形関数なので、正規分布に従う。また、
(4) β
ˆ e) = E[(X′ X)−1 X′ ϵϵ′ (I − X(X′ X)−1 X′ )]
Cov(β,
= σ 2 (X′ X)−1 X′ (I − X(X′ X)−1 X′ ) = 0
ˆ
である。2 つの正規確率変数が互いに無相関ならば独立であることから、β
と e は独立である。
(5) 統計量を
ˆ
√
βˆ2
s2 {(X′ X)−1 }22
√ 2 β′2 −1
σ {(X X) }22
=√
(n−k)s2
/(n − k)
σ2
と書き直す。すると (1)-(4) の結果より、帰無仮説の下で √
√
Z
W/(n−k)
βˆ2
s2 {(X′ X)−1 }22
=
と書ける。ここで、Z ∼ N (0, 1)、W ∼ χ2 (n − k) で、Z と W が独
立である。t 分布の定義より、これは自由度 n − k の t 分布に従う。
(6)
ˆ = E[(β
ˆ − β)(β
ˆ − β)′ ]
V ar(β)
= (X′ X)−1 X′ E[ϵϵ′ ]X(X′ X)−1
= (X′ X)−1 X′ ΣX(X′ X)−1
となる。
(7) 尤度関数は
(
2
L(β, σ ) =
1
2πσ 2
)n/2
(
)
1
′
exp − 2 (y − Xβ) (y − Xβ)
2σ
である。よって対数尤度関数は
1
n
log L(β, σ 2 ) = − log 2πσ 2 − 2 (y − Xβ)′ (y − Xβ)
2
2σ
である。従って、β の最尤推定量は (y − Xβ)′ (y − Xβ) を最小にする解、つ
まり最小 2 乗推定量 (X′ X)−1 X′ y と同じになる。
4
設問3
(1) S の係数は 「仕事経験年数を一定とした時、教育年数が 1 年長くなると
時間あたり平均賃金が 13.5 パーセント高くなること」を示している。t 値は
t = 0.135
= 9.64 なので、S の係数は有意水準 5% で統計的に有意である。(自
0.014
由度 535 の t 分布の上側 2.5%点は 1.96。)
(2) を検定するための F 統計量は
F =
(150.60 − 142.62)/2
= 14.97
142.62/535
である。自由度 2 及び 535 の F 分布の上側 5%点は 2.99 と 3.07 の間であるの
で、F 検定より「Dm と Dm × S の係数が同時に 0 である」という仮説は有
意水準 5%で棄却される。
(3) log y = β1 + β2 X2 + β3 X3 + β4 D + β5 D × X2 + ϵ において
E[y|x2 , x3 , d = 1] − E[y|x2 , x3 , d = 0]
E[y|x2 , x3 , d = 0]
exp(β1 + β2 x2 + β3 x3 + β4 + β5 x2 )E[exp(ϵ)] − exp(β1 + β2 x2 + β3 x3 )E[exp(ϵ)]
=
exp(β1 + β2 x2 + β3 x3 )E[exp(ϵ)]
= exp(β4 + β5 x2 ) − 1
となる。従って、推定結果は「S 及び EXP を一定とした時、男性の平均賃
金は女性の平均賃金に比べて [exp(0.529 − 0.021S) − 1] × 100% ≈ [0.529 −
0.021S] × 100% だけ高い」ことを示している。
5