第17回 2標本問題(10.5)

2015 年 6 月 29 日
第 17 回 2 標本問題(10.5)
村澤 康友
前回のキーワード
正規分布,標準正規分布,正規分布の標準化,標準正規分布
表,自由度 n の χ2 分布,χ2 分布表,標本分散の分布(母平均
が既知,母平均が未知),標本平均の分布(母分散が既知)
,
自由度 n の t 分布,t 分布表,標本平均の分布(母分散が未知)
1
目次
1
2 標本問題(p. 204)
2
2.1
2.2
2.3
標本平均の差の分布
5
母分散が既知の場合 . . . . . . . . . . . . . . 5
母分散が未知で等しい場合 . . . . . . . . . . 9
母分散が未知で異なる場合(p. 206) . . . . . 17
3.1
3.2
3.3
標本分散の比の分布
18
F 分布(p. 207) . . . . . . . . . . . . . . . . 18
母平均が既知の場合 . . . . . . . . . . . . . . 22
母平均が未知の場合 . . . . . . . . . . . . . . 24
3
2
3
1 2 標本問題(p. 204)
定義 1. 標本を用いて 2 つの母集団を比較する問題を 2 標本
問題という.
例:男女別の成績の分布の比較.
3
正規母集団の 2 標本問題(p. 204)
(
)
(
)
2
2
母集団分布 N µX , σX ,N µY , σY から独立に抽出した無
作為標本を (X1 , . . . , Xm ),(Y1 , . . . , Yn ) とする.
2
µX と µY を比較するには標本平均の差 X̄ − Ȳ ,σX
と σY2 を
比較するには標本分散の比 s2X /s2Y を見ればよい.
ただし標本分布を考慮する必要がある.
4
2 標本平均の差の分布
2.1 母分散が既知の場合
定理 1.
(
X̄ − Ȳ ∼ N µX − µY ,
2
σX
m
+
σY2
)
n
証明:標本平均の分布は
(
X̄ ∼ N µX ,
2
σX
m
)
,
X̄ と Ȳ は独立.
5
(
)
2
σY
Ȳ ∼ N µY ,
n
系 1.
X̄ − Ȳ − (µX − µY )
√
∼ N(0, 1)
2
2
σX /m + σY /n
注:X̄ − Ȳ の累積確率は標準正規分布表から次のように求
める.
[
]
Pr X̄ − Ȳ ≤ c
[
]
X̄ − Ȳ − (µX − µY )
c − (µX − µY )
√
√
≤
= Pr
2 /m + σ 2 /n
2 /m + σ 2 /n
σX
σ
Y
X
Y
(
)
c − (µX − µY )
=Φ √ 2
σX /m + σY2 /n
6
例(p. 205)
:男子の身長の母集団分布を N(172.3, 30),女子
の身長の母集団分布を N(160.2, 25) とする.
独立に抽出した男子 10 人,女子 15 人の無作為標本の標本平
均をそれぞれ X̄ ,Ȳ とすると
(
)
30
X̄ ∼ N 172.3,
10
(
)
25
Ȳ ∼ N 160.2,
15
7
X̄ と Ȳ は独立だから
(
14
X̄ − Ȳ ∼ N 12.1,
3
)
標準化すると
X̄ − Ȳ − 12.1
√
∼ N(0, 1)
14/3
8
2.2 母分散が未知で等しい場合
プールした標本分散(p. 205)
2
σX
= σY2 = σ 2 とする.
定義 2. (X1 , . . . , Xm ) と (Y1 , . . . , Yn ) をプールした標本分
散は
1
s :=
m+n−2
2


m
n
∑
(
)2 ∑
(
)2

Xi − X̄ +
Yj − Ȳ 
i=1
j=1
9
χ2 分布の再生性
定理 2. X ∼ χ2 (m) と Y ∼ χ2 (n) が独立なら
X + Y ∼ χ2 (m + n)
証明:Z1 , . . . , Zm+n ∼ N(0, 1) を独立とすると,χ2 分布の
定義より
2
X := Z12 + · · · + Zm
2
2
Y := Zm+1
+ · · · + Zm+n
したがって
2
X + Y = Z12 + · · · + Zm+n
10
プールした標本分散の分布(p. 206)
2
= σY2 = σ 2 なら
定理 3. σX
(m + n − 2)s2
2
∼
χ
(m + n − 2)
2
σ
証明:標本分散の分布は
(m − 1)s2X
2
∼
χ
(m − 1),
2
σX
11
(n − 1)s2Y
2
∼
χ
(n − 1)
2
σY
両者は独立なので
)2
∑n (
(
)2
∑
m
(m + n − 2)s2
j=1 Yj − Ȳ
i=1 Xi − X̄
=
+
2
2
σ
σ
σ2
(n − 1)s2Y
(m − 1)s2X
+
=
2
σ
σ2
∼ χ2 (m + n − 2)
12
標本平均の差の分布(母分散が未知)
2
σX
= σY2 = σ 2 なら
X̄ − Ȳ − (µX − µY )
√
∼ N(0, 1)
σ 2 (1/m + 1/n)
定理 4.
X̄ − Ȳ − (µX − µY )
√
∼ t(m + n − 2)
s2 (1/m + 1/n)
13
証明:変形すると
X̄ − Ȳ − (µX − µY )
√
s2 (1/m + 1/n)
[
] √
X̄ − Ȳ − (µX − µY ) / σ 2 (1/m + 1/n)
√
=
[(m + n − 2)s2 /σ 2 ] /(m + n − 2)
14
ここで
X̄ − Ȳ − (µX − µY )
√
∼ N(0, 1)
σ 2 (1/m + 1/n)
(m + n − 2)s2
2
∼
χ
(m + n − 2)
2
σ
分子と分母の独立性も証明できる(省略).
15
注:X̄ − Ȳ の累積確率は t 分布表から次のように求める.
[
]
Pr X̄ − Ȳ ≤ c
[
]
X̄ − Ȳ − (µX − µY )
c − (µX − µY )
√
= Pr
≤√
s2 (1/m + 1/n)
s2 (1/m + 1/n)
[
]
c − (µX − µY )
= Pr t(m + n − 2) ≤ √
s2 (1/m + 1/n)
16
2.3 母分散が未知で異なる場合(p. 206)
2
,σY2 に分布が依存しない統計量を作れない.
未知の σX
ただし大数の法則と中心極限定理より
X̄ − Ȳ − (µX − µY ) a
√
∼ N(0, 1)
2
2
sX /m + sY /n
もっとよい近似もある(ウェルチの近似).
17
3 標本分散の比の分布
3.1 F 分布(p. 207)
定義 3. U ∼ χ2 (m) と V ∼ χ2 (n) が独立のとき
(U/m)/(V /n) の分布を自由度 (m, n) の F 分布という.
注:F(m, n) と書く.
注:累積確率は F 分布表を参照.
注:X ∼ F(m, n) なら 1/X ∼ F(n, m).
注:t ∼ t(n) なら t2 ∼ F(1, n).
18
0.0
0.5
1.0
df(x, 1, 25)
1.5
F(1, 25) の密度関数
0
1
2
3
x
19
4
5
0.0
0.2
0.4
df(x, 5, 25)
0.6
F(5, 25) の密度関数
0
1
2
3
x
20
4
5
0.0
0.2
0.4
0.6
df(x, 25, 25)
0.8
1.0
F(25, 25) の密度関数
0
1
2
3
x
21
4
5
3.2 母平均が既知の場合
定理 5.
2
σ̂X
/σ̂Y2
∼ F(m, n)
2
2
σX /σY
証明:標本分散の分布は
2
mσ̂X
2
∼
χ
(m)
2
σX
nσ̂Y2
2
∼
χ
(n)
2
σY
22
両者は独立なので
2
2
2
/σ̂Y2
σ̂X
/σX
σ̂X
= 2 2
2
2
σX /σY
σ̂Y /σY
( 2 2)
mσ̂X /σX /m
=
(nσ̂Y2 /σY2 ) /n
∼ F(m, n)
23
3.3 母平均が未知の場合
定理 6.
s2X /s2Y
∼ F(m − 1, n − 1)
2
2
σX /σY
証明:標本分散の分布は
(m − 1)s2X
2
∼
χ
(m − 1)
2
σX
(n − 1)s2Y
2
∼
χ
(n − 1)
2
σY
24
両者は独立なので
2
s2X /σX
s2X /s2Y
= 2 2
2
2
σX /σY
sY /σY
[
]
2
(m − 1)s2X /σX
/(m − 1)
=
[(n − 1)s2Y /σY2 ] /(n − 1)
∼ F(m − 1, n − 1)
25
注:s2X /s2Y の累積確率は F 分布表から次のように求める.
[
Pr
s2X
s2Y
]
]
[ 2 2
sX /sY
c
≤ c = Pr 2 2 ≤ 2 2
σX /σY
σX /σY
]
[
c
= Pr F(m − 1, n − 1) ≤ 2 2
σX /σY
26
(
2
)
(
2
)
例(p. 209)
:N µX , σ ,N µY , σ から独立に抽出した
大きさ 10,15 の無作為標本の標本分散をそれぞれ s2X ,s2Y と
する(母分散は等しい).
s2X /s2Y > 3 の確率は
[
Pr
s2X
s2Y
]
> 3 = Pr[F(9, 14) > 3]
≈ .03
27
今日のキーワード
2 標本問題,χ2 分布の再生性,標本平均の差の分布(母分散
が既知・未知で等しい・未知で異なる)
,F 分布,標本分散の
比の分布(母平均が既知・未知)
28