第 20 回 区間推定

第 20 回 区間推定
村澤 康友
2015 年 7 月 5 日
目次
1
信頼域
1
2
正規母集団
1
2.1
母平均の信頼区間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1
2.2
母分散の信頼区間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
2.3
母平均の差の信頼区間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
2.4
母分散の比の信頼区間 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
5
2 項母集団
7
3
1 信頼域
定義 1. 母数を含む領域を定める推定を区間推定という.
定義 2. ある確率で母数を含む確率的な領域を,その母数の信頼域という.
定義 3. 1 次元の信頼域を信頼区間という.
定義 4. 信頼域が母数を含む確率を,その信頼域の信頼係数という.
注 1. 「信頼係数 α の信頼域」を「100α %信頼域」と略すことが多い.
2 正規母集団
2.1 母平均の信頼区間
2.1.1 母分散が既知
(
)
母集団分布を N µ, σ 2 とする.µ の 95 %信頼区間を求める.ただし σ 2 は既知とする.大きさ n の無作為
標本の標本平均を X̄ とすると
)
(
σ2
X̄ ∼ N µ,
n
1
標準化すると
X̄ − µ
√
∼ N(0, 1)
σ 2 /n
標準正規分布表より
]
X̄ − µ
Pr −1.96 ≤ √
≤ 1.96 = .95
σ 2 /n
[
すなわち
[
√
Pr −1.96
または
[
√ ]
σ2
σ2
≤ X̄ − µ ≤ 1.96
= .95
n
n
√
Pr X̄ − 1.96
√ ]
σ2
σ2
≤ µ ≤ X̄ + 1.96
= .95
n
n
したがって µ の 95 %信頼区間は
[
√
X̄ − 1.96
σ2
, X̄ + 1.96
n
√
σ2
n
]
2.1.2 母分散が未知
標本分散を s2 とする.σ 2 を s2 に置き換えると
X̄ − µ
√
∼ t(n − 1)
s2 /n
t 分布表より,例えば n = 10 なら
[
]
X̄ − µ
Pr −2.262 ≤ √
≤ 2.262 = .95
s2 /10
すなわち
[
√
Pr −2.262
または
[
√ ]
s2
s2
≤ X̄ − µ ≤ 2.262
= .95
10
10
√
Pr X̄ − 2.262
√ ]
s2
s2
≤ µ ≤ X̄ + 2.262
= .95
10
10
したがって n = 10 なら µ の 95 %信頼区間は
[
X̄ − 2.262
√
s2
, X̄ + 2.262
10
2
√
s2
10
]
2.2 母分散の信頼区間
2.2.1 母平均が既知
σ 2 の 95 %信頼区間を求める.ただし µ は既知とする.標本分散は
1∑
(Xi − µ)2
n i=1
n
σ̂ 2 :=
このとき
nσ̂ 2
∼ χ2 (n)
σ2
χ2 分布表より,例えば n = 10 なら
]
[
10σ̂ 2
≤
20.4832
= .95
Pr 3.24697 ≤
σ2
すなわち
または
[
]
1
σ2
1
Pr
≤
≤
= .95
20.4832
10σ̂ 2
3.24697
[
]
10σ̂ 2
10σ̂ 2
2
Pr
≤σ ≤
= .95
20.4832
3.24697
したがって n = 10 なら σ 2 の 95 %信頼区間は
[
10σ̂ 2
10σ̂ 2
,
20.4832 3.24697
]
2.2.2 母平均が未知
µ が未知なら標本分散は
)2
1 ∑(
Xi − X̄
n − 1 i=1
n
s2 :=
このとき
(n − 1)s2
∼ χ2 (n − 1)
σ2
χ2 分布表より,例えば n = 10 なら
[
]
9s2
Pr 2.70039 ≤ 2 ≤ 19.0228 = .95
σ
すなわち
[
]
1
σ2
1
Pr
≤ 2 ≤
= .95
19.0228
9s
2.70039
または
[
Pr
]
9s2
9s2
≤ σ2 ≤
= .95
19.0228
2.70039
したがって n = 10 なら σ 2 の 95 %信頼区間は
[
9s2
9s2
,
19.0228 2.70039
3
]
2.3 母平均の差の信頼区間
2.3.1 母分散が既知
(
)
(
)
2
2
母集団分布を N µX , σX
,N µY , σY2 とする.µX − µY の 95 %信頼区間を求める.ただし σX
, σY2 は既
知とする.各母集団から独立に抽出した大きさ m, n の無作為標本の標本平均を X̄, Ȳ とすると
(
)
σ2
X̄ ∼ N µX , X
m
)
(
σY2
Ȳ ∼ N µY ,
n
両者は独立だから
(
)
σ2
σ2
X̄ − Ȳ ∼ N µX − µY , X + Y
m
n
標準化すると
X̄ − Ȳ − (µX − µY )
√
∼ N(0, 1)
2 /m + σ 2 /n
σX
Y
標準正規分布表より
すなわち
[
]
X̄ − Ȳ − (µX − µY )
Pr −1.96 ≤ √ 2
≤ 1.96 = .95
σX /m + σY2 /n
[
√
Pr −1.96
または
[
2
σX
σ2
+ Y ≤ X̄ − Ȳ − (µX − µY ) ≤ 1.96
m
n
√
Pr X̄ − Ȳ − 1.96
√
2
σX
σ2
+ Y
m
n
= .95
]
√
2
2
σX
σY2
σX
σY2
+
≤ µX − µY ≤ X̄ − Ȳ + 1.96
+
= .95
m
n
m
n
したがって µX − µY の 95 %信頼区間は
[
√
X̄ − Ȳ − 1.96
]
√
2
2
σX
σY2
σX
σY2
+
, X̄ − Ȳ + 1.96
+
m
n
m
n
2.3.2 母分散が未知
2
σX
= σY2 = σ 2 なら
]
X̄ − Ȳ − (µX − µY )
√
∼ N(0, 1)
σ 2 (1/m + 1/n)
プールした標本分散を s2 とする.σ 2 を s2 に置き換えると
X̄ − Ȳ − (µX − µY )
√
∼ t(m + n − 2)
s2 (1/m + 1/n)
t 分布表より,例えば m = 4,n = 6 なら
[
]
X̄ − Ȳ − (µX − µY )
Pr −2.306 ≤ √
≤ 2.306 = .95
s2 (1/4 + 1/6)
4
すなわち
√
[
Pr −2.306
s2
(
1 1
+
4 6
√
)
≤ X̄ − Ȳ − (µX − µY ) ≤ 2.306
(
s2
1 1
+
4 6
)]
= .95
または
√
[
Pr X̄ − Ȳ − 2.306 s2
(
1 1
+
4 6
√
)
≤ µX − µY ≤ X̄ − Ȳ + 2.306 s2
(
1 1
+
4 6
)]
= .95
したがって m = 4,n = 6 なら µX − µY の 95 %信頼区間は
[
√
X̄ − Ȳ − 2.306
(
s2
√ (
)
)]
1
1 1
1
+
, X̄ − Ȳ + 2.306 s2
+
4 6
4 6
2
注 2. σX
̸= σY2 なら近似的な信頼区間を用いる.
2.4 母分散の比の信頼区間
2.4.1 母平均が既知
補題 1.
X ∼ F(m, n) =⇒
1
∼ F(n, m)
X
証明. F 分布の定義より
U/m
V /n
1
U/n
=
X
V /m
X=
ただし U ∼ χ2 (m) と V ∼ χ2 (n) は独立.
注 3. したがって
[
1
1
Pr[X ≤ x] = Pr
≥
X
x
]
より F(n, m) の上側確率から F(m, n) の下側確率が求まる(図 1).
2
2
σX
/σY2 の 95 %信頼区間を求める.ただし µX , µY は既知とする.標本分散を σ̂X
, σ̂Y2 とすると
2
mσ̂X
∼ χ2 (m)
2
σX
nσ̂Y2
∼ χ2 (n)
σY2
両者は独立だから
2
2
σ̂X
/σX
∼ F(m, n)
2
σ̂Y /σY2
F 分布表より,例えば m = 4,n = 6 なら
]
[
2
2
σ̂X
/σX
1
≤ 2 2 ≤ 6.227 = .95
Pr
9.197
σ̂Y /σY
5
0.8
0.0
0.2
0.4
df(x, 25, 5)
0.6
0.8
0.6
0.4
0.0
0.2
df(x, 5, 25)
0
2
4
6
8
10
0
2
x
図1
すなわち
または
6
x
F(5, 25) の 10 %下側確率と F(25, 5) の 10 %上側確率
]
σ̂Y2 /σY2
1
≤ 2 2 ≤ 9.197 = .95
Pr
6.227
σ̂X /σX
[
[
2
2
2
1 σ̂X
σX
σ̂X
Pr
≤
≤
9.197
6.227 σ̂Y2
σY2
σ̂Y2
]
= .95
2
したがって m = 4,n = 6 なら σX
/σY2 の 95 %信頼区間は
[
2
1 σ̂X
σ̂ 2
, 9.197 X
2
6.227 σ̂Y
σ̂Y2
]
2.4.2 母平均が未知
標本分散を s2X , s2Y とすると
(m − 1)s2X
∼ χ2 (m − 1)
2
σX
(n − 1)s2Y
∼ χ2 (n − 1)
σY2
両者は独立だから
2
s2X /σX
∼ F(m − 1, n − 1)
2
sY /σY2
F 分布表より,例えば m = 4,n = 6 なら
]
[
2
s2X /σX
1
≤ 2 2 ≤ 7.764 = .95
Pr
14.885
sY /σY
すなわち
4
]
s2Y /σY2
1
≤ 2 2 ≤ 14.885 = .95
Pr
7.764
sX /σX
[
6
8
10
または
[
Pr
2
1 s2X
σX
s2X
≤
≤
14.885
7.764 s2Y
σY2
s2Y
]
= .95
2
したがって m = 4,n = 6 なら σX
/σY2 の 95 %信頼区間は
[
1 s2X
s2
, 14.885 X
2
7.764 sY
s2Y
]
3 2 項母集団
母集団分布を Bin(1, p) とする.p の 95 %信頼区間を近似的に求める.Bin(1, p) の平均は p,分散は
p(1 − p).したがって母平均の信頼区間を近似的に求めればよい.大きさ n の無作為標本の標本平均を p̂ とす
ると,中心極限定理より
(
)
p(1 − p)
p̂ ∼ N p,
n
a
標準化すると
√
分母の p を p̂ に置き換えると
√
標準正規分布表より
[
p̂ − p
a
p(1 − p)/n
p̂ − p
∼ N(0, 1)
a
p̂(1 − p̂)/n
∼ N(0, 1)
p̂ − p
]
Pr −1.96 ≤ √
≤ 1.96 ≈ .95
p̂(1 − p̂)/n
すなわち
[
√
Pr −1.96
または
[
]
√
p̂(1 − p̂)
p̂(1 − p̂)
≤ p̂ − p ≤ 1.96
≈ .95
n
n
√
Pr p̂ − 1.96
]
√
p̂(1 − p̂)
p̂(1 − p̂)
≤ p ≤ p̂ + 1.96
≈ .95
n
n
したがって p の 95 %信頼区間は近似的に
[
√
p̂ − 1.96
]
√
p̂(1 − p̂)
p̂(1 − p̂)
, p̂ + 1.96
n
n
例 1. 100 世帯を対象にある番組の視聴率を調査したら 10 %の視聴率であった.真の視聴率 p の 95 %信頼区
間は n = 100,p̂ = .1 を代入すると
[
]
√
√
.1(1 − .1)
.1(1 − .1)
.1 − 1.96
, .1 + 1.96
10
10
計算すると [.0412, .1588],すなわち 4.12∼15.88 %となる.
7