第 26 回 切断・検閲・標本選択 村澤 康友 2015 年 1 月 26 日 目次 切断 1 1 1.1 切断された分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 切断された回帰モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 1.3 ML 推定量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2 検閲 3 2 2.1 検閲された分布 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2.2 検閲された回帰モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2.3 ML 推定量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 標本選択 5 3 3.1 標本選択モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 3.2 ML 推定量 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1 切断 1.1 切断された分布 X を確率変数とする.X を c で上から切断した確率変数の cdf は,任意の x について FX|X≤c (x) := Pr[X ≤ x|X ≤ c] Pr[X ≤ x, X ≤ c] Pr[X ≤ c] Pr[X ≤ min{x, c}] = Pr[X ≤ c] FX (min{x, c}) = FX (c) = FX (.) が微分可能なら,任意の x について { fX|X≤c (x) = fX (x)/FX (c) for x ≤ c 0 for x > c 1 0.8 0.6 0.4 0.2 0.0 dnorm(x)/pnorm(c) * (x <= c) −4 −2 0 2 4 x 図 1 0 で上から切断した標準正規分布の pdf 下から切断した場合も同様. 例 1. 0 で上から切断した標準正規分布(図 1). 1.2 切断された回帰モデル (y, X) を大きさ n の無作為標本とする.yi の xi 上への線形回帰モデルは yi = x′i β + ui E(ui |xi ) = 0 定義 1. yi ≤ (>)c のときのみ (yi , xi ) を観測する線形回帰モデルを c で上から(下から)切断された線形回 帰モデルという. 注 1. 観測される部分標本では E(yi |xi , yi ≤ c) = x′i β + E(ui |xi , x′i β + ui ≤ c) = x′i β + E(ui |xi , ui ≤ c − x′i β) 第 2 項は一般に 0 でないので回帰係数の OLS 推定量は一致推定量でない. 1.3 ML 推定量 yi の xi 上への正規線形回帰モデルは yi = x′i β + ui ( ) ui |xi ∼ N 0, σ 2 2 c で上から切断された yi の条件つき pdf は,任意の y について { fy (y|xi ; β)/Fy (c|xi ; β) fy≤c (y|xi , yi ≤ c; β) = 0 for y ≤ c for y > c ただし Fy (y|xi ; β) := Pr[yi ≤ y|xi ] = Pr[x′i β + ui ≤ y|xi ] = Pr[ui ≤ y − x′i β|xi ] [ ] ui y − x′i β = Pr ≤ |xi σ σ ( ) ′ y − xi β =Φ σ ( ) 1 y − x′i β fy (y|xi ; β) = ϕ σ σ ( ) 切断された (y, X) を観測したときの β, σ 2 の尤度関数は, ][y ≤c] n [ ∏ ( ) (1/σ)ϕ((yi − x′i β)/σ) i 2 L β, σ ; y, X := Φ((c − x′i β)/σ) i=1 2 検閲 2.1 検閲された分布 X ∗ を確率変数とする.X ∗ を c で上から検閲した確率変数を X とする.すなわち { X ∗ if X ∗ ≤ c X := c if X ∗ > c このとき任意の x について for x < c fX ∗ (x) fX (x) = 1 − FX ∗ (c) for x = c 0 for x > c 下から検閲した場合も同様. 例 2. 0 で上から検閲した標準正規分布(図 2). 2.2 検閲された回帰モデル (y ∗ , X) を大きさ n の無作為標本とする.yi∗ の xi 上への線形回帰モデルは yi∗ = x′i β + ui E(ui |xi ) = 0 3 0.5 0.4 0.3 0.2 0.0 0.1 dnorm(x) * (x <= c) −4 −2 0 2 4 x 図 2 0 で上から検閲した標準正規分布の pdf 定義 2. yi の xi 上への c で上から検閲された線形回帰モデルは { yi∗ yi := c if yi∗ ≤ c if yi∗ > c E(yi∗ |xi ) = x′i β 注 2. 検閲されたデータを捨てると切断になる. 定義 3. 0 で下から検閲された線形回帰モデルを(第 1 種の)トービット・モデルという. 2.3 ML 推定量 yi∗ の xi 上への正規線形回帰モデルは yi∗ = x′i β + ui ( ) ui |xi ∼ N 0, σ 2 yi の条件つき pdf は,任意の y について for y < c fy∗ (y|xi ; β) fy (y|xi ; β) = 1 − Fy∗ (c|xi ; β) for y = c 0 for y > c 4 ただし Fy∗ (y|xi ; β) := Pr[yi∗ ≤ y|xi ] = Pr[x′i β + ui ≤ y|xi ] = Pr[ui ≤ y − x′i β|xi ] [ ] ui y − x′i β = Pr ≤ |xi σ σ ( ) y − x′i β =Φ σ ( ) y − x′i β 1 fy∗ (y|xi ; β) = ϕ σ σ ( ) (y, X) を観測したときの β, σ 2 の尤度関数は n ∏ ( ) L β, σ 2 ; y, X := i=1 ( 1 ϕ σ ( yi − x′i β σ ))[yi <c] ( ( 1−Φ c − x′i β σ ))[yi =c] 3 標本選択 3.1 標本選択モデル (y ∗ , X, Z) を無作為標本とする.yi∗ の xi 上への線形回帰モデルは yi = x′i β + ui E(ui |xi ) = 0 次の潜在変数を定義する. Ui = zi′ γ + vi 定義 4. Ui > 0 のときのみ (yi∗ , xi ) を観測する線形回帰モデルを標本選択モデル(第 2 種のトービット・モ デル)という. 3.2 ML 推定量 誤差項に正規分布を仮定する.すなわち yi = x′i β + ui Ui = zi′ γ + vi ( ) ui |xi , zi ∼ N(0, Σ) vi 尤度関数は複雑だが,計量経済分析ソフトを使えば簡単に ML 推定量が得られる. 5
© Copyright 2024 ExpyDoc