第 26 回 切断・検閲・標本選択

第 26 回 切断・検閲・標本選択
村澤 康友
2015 年 1 月 26 日
目次
切断
1
1
1.1
切断された分布
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
1.2
切断された回帰モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
1.3
ML 推定量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2
検閲
3
2
2.1
検閲された分布
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.2
検閲された回帰モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.3
ML 推定量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
標本選択
5
3
3.1
標本選択モデル
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
3.2
ML 推定量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
1 切断
1.1 切断された分布
X を確率変数とする.X を c で上から切断した確率変数の cdf は,任意の x について
FX|X≤c (x) := Pr[X ≤ x|X ≤ c]
Pr[X ≤ x, X ≤ c]
Pr[X ≤ c]
Pr[X ≤ min{x, c}]
=
Pr[X ≤ c]
FX (min{x, c})
=
FX (c)
=
FX (.) が微分可能なら,任意の x について
{
fX|X≤c (x) =
fX (x)/FX (c) for x ≤ c
0
for x > c
1
0.8
0.6
0.4
0.2
0.0
dnorm(x)/pnorm(c) * (x <= c)
−4
−2
0
2
4
x
図 1 0 で上から切断した標準正規分布の pdf
下から切断した場合も同様.
例 1. 0 で上から切断した標準正規分布(図 1).
1.2 切断された回帰モデル
(y, X) を大きさ n の無作為標本とする.yi の xi 上への線形回帰モデルは
yi = x′i β + ui
E(ui |xi ) = 0
定義 1. yi ≤ (>)c のときのみ (yi , xi ) を観測する線形回帰モデルを c で上から(下から)切断された線形回
帰モデルという.
注 1. 観測される部分標本では
E(yi |xi , yi ≤ c) = x′i β + E(ui |xi , x′i β + ui ≤ c)
= x′i β + E(ui |xi , ui ≤ c − x′i β)
第 2 項は一般に 0 でないので回帰係数の OLS 推定量は一致推定量でない.
1.3 ML 推定量
yi の xi 上への正規線形回帰モデルは
yi = x′i β + ui
(
)
ui |xi ∼ N 0, σ 2
2
c で上から切断された yi の条件つき pdf は,任意の y について
{
fy (y|xi ; β)/Fy (c|xi ; β)
fy≤c (y|xi , yi ≤ c; β) =
0
for y ≤ c
for y > c
ただし
Fy (y|xi ; β) := Pr[yi ≤ y|xi ]
= Pr[x′i β + ui ≤ y|xi ]
= Pr[ui ≤ y − x′i β|xi ]
[
]
ui
y − x′i β
= Pr
≤
|xi
σ
σ
(
)
′
y − xi β
=Φ
σ
(
)
1
y − x′i β
fy (y|xi ; β) = ϕ
σ
σ
(
)
切断された (y, X) を観測したときの β, σ 2 の尤度関数は,
][y ≤c]
n [
∏
(
)
(1/σ)ϕ((yi − x′i β)/σ) i
2
L β, σ ; y, X :=
Φ((c − x′i β)/σ)
i=1
2 検閲
2.1 検閲された分布
X ∗ を確率変数とする.X ∗ を c で上から検閲した確率変数を X とする.すなわち
{
X ∗ if X ∗ ≤ c
X :=
c
if X ∗ > c
このとき任意の x について


for x < c
fX ∗ (x)
fX (x) = 1 − FX ∗ (c) for x = c


0
for x > c
下から検閲した場合も同様.
例 2. 0 で上から検閲した標準正規分布(図 2).
2.2 検閲された回帰モデル
(y ∗ , X) を大きさ n の無作為標本とする.yi∗ の xi 上への線形回帰モデルは
yi∗ = x′i β + ui
E(ui |xi ) = 0
3
0.5
0.4
0.3
0.2
0.0
0.1
dnorm(x) * (x <= c)
−4
−2
0
2
4
x
図 2 0 で上から検閲した標準正規分布の pdf
定義 2. yi の xi 上への c で上から検閲された線形回帰モデルは
{
yi∗
yi :=
c
if yi∗ ≤ c
if yi∗ > c
E(yi∗ |xi ) = x′i β
注 2. 検閲されたデータを捨てると切断になる.
定義 3. 0 で下から検閲された線形回帰モデルを(第 1 種の)トービット・モデルという.
2.3 ML 推定量
yi∗ の xi 上への正規線形回帰モデルは
yi∗ = x′i β + ui
(
)
ui |xi ∼ N 0, σ 2
yi の条件つき pdf は,任意の y について


for y < c
fy∗ (y|xi ; β)
fy (y|xi ; β) = 1 − Fy∗ (c|xi ; β) for y = c


0
for y > c
4
ただし
Fy∗ (y|xi ; β) := Pr[yi∗ ≤ y|xi ]
= Pr[x′i β + ui ≤ y|xi ]
= Pr[ui ≤ y − x′i β|xi ]
[
]
ui
y − x′i β
= Pr
≤
|xi
σ
σ
(
)
y − x′i β
=Φ
σ
(
)
y − x′i β
1
fy∗ (y|xi ; β) = ϕ
σ
σ
(
)
(y, X) を観測したときの β, σ 2 の尤度関数は
n
∏
(
)
L β, σ 2 ; y, X :=
i=1
(
1
ϕ
σ
(
yi − x′i β
σ
))[yi <c] (
(
1−Φ
c − x′i β
σ
))[yi =c]
3 標本選択
3.1 標本選択モデル
(y ∗ , X, Z) を無作為標本とする.yi∗ の xi 上への線形回帰モデルは
yi = x′i β + ui
E(ui |xi ) = 0
次の潜在変数を定義する.
Ui = zi′ γ + vi
定義 4. Ui > 0 のときのみ (yi∗ , xi ) を観測する線形回帰モデルを標本選択モデル(第 2 種のトービット・モ
デル)という.
3.2 ML 推定量
誤差項に正規分布を仮定する.すなわち
yi = x′i β + ui
Ui = zi′ γ + vi
( )
ui
|xi , zi ∼ N(0, Σ)
vi
尤度関数は複雑だが,計量経済分析ソフトを使えば簡単に ML 推定量が得られる.
5