補足プリント17:標本平均と標本分散の分布

補足プリント 17:標本平均と標本分散の分布
松井宗也 南山大学経営学部
平成 27 年 9 月 22 日
今回の内容は「数理統計学」(稲垣宣生、裳華房)のセクション 6 を参考にした。
1
標本平均と標本分散の分布
正規母集団 X ∼ N (µ, σ 2 ) から、無作為抽出により n 個の標本 (X1 , . . . , Xn ) を得るものとする。こ
∑
のとき標本平均 X = n1 ni=1 Xi と標本分散
1 ∑
(Xi − X)2
n−1
n
S2 =
i=1
の分布を考える。Xi , i = 1, . . . , n は独立で Xi ∼ N (µ, σ 2 ) なので、標準化したものを Yi =
すれば、Yi ∼ N (0, 1) となり、Y = (Y1 , Y2 , . . . , Yn ) の同時確率密度関数は
fY (y) = fY (y1 , . . . , yn ) =
n
∏
(2π)− 2 e−
1
yi2
2
Xi −µ
σ
と
′
= (2π)− 2 e− 2 y y
n
1
i=1
となる。いま直交行列 C:
√1
n
√1
2
√1
2·3
···
√ 1
(n−1)·n
√1
n
− √12
√1
2·3
···
···
···
···
···
0
···
···
− √22·3
0
···
···
···
···
···
0
0
···
n−1
−√
(n−1)·n
√1
n
···
√
1
(n−1)·n
を考えると、C は直交行列となり CC ′ = C ′ C = I が成り立つ。(ここで I は n × n 単位行列で C ′
は C の転置行列を表す。)この行列による変換


 
Y1
Z1
 .. 
 .. 
Y =  .  → Z =  .  = CY
Yn
Zn
を行うとき、ヤコビアンが J = |C ′ | = ±1 であるから、Z の同時確率密度関数は
′
′
′
′
′
′
fZ (z) = fY (C ′ z)|J | = (2π)− 2 e− 2 (C z) (C z) = (2π)− 2 e− 2 z CC z = (2π)− 2 e− 2 z z =
π
1
π
1
1
π
1
n
∏
zi2
1
√ e− 2
2π
i=1
となる。従って確率変数 Z1 , Z2 , . . . , Zn は互いに独立で各変数は Zi ∼ N (0, 1) である。
∑
∑
直交変換を考えたから Z ′ Z = (CY )′ (CY ) = Y ′ Y となり ni=1 Zi2 = ni=1 Yi2 を満たすことに注
意する。さらに直交行列の第 1 行から
 
Y1
√
( 1
)
1 ∑
n(X − µ)
1  . 
Z1 = √ , . . . √  ..  = √
Yi =
∼ N (0, 1)
σ
n
n
n
i=1
Yn
も分かる。これらに注意すると
Z12 + Z22 + · · · + Zn2 = Y12 + Y22 + · · · + Yn2
=
n
∑
(Xi − µ)2
i=1
σ2
n(X − µ)2 ∑ (Xi − X)2
(n − 1)S 2
2
+
=
Z
+
1
σ2
σ2
σ2
n
=
i=1
(n−1)S 2
が成り立ち、 σ2 の分布は Z22 + Z32 + · · · + Zn2 の分布と等しく、それは Zi ∼ N (0, 1), i = 2, . . . , n
に注意して、自由度
n − 1 のカイ2乗分布に従うことが分かる。さらに Z1 と (Z2 , Z3 , . . . , Zn ) は独立
√
n(X−µ)
(n−1)S 2
であることから、
と σ2 も独立となることが分かる。このことは X と S 2 が独立である
σ
ことを意味する。
定理
正規母集団 N (µ, σ 2 ) に従う無作為標本 X1 , . . . , Xn に関して以下が成り立つ。
√
(1) 標本平均 X を標準化したものは、標準正規分布に従う。つまり Z = n(X−µ)
∼ N (0, 1).
σ
n−1
2
(2) 標本分散 S を σ2 倍したものは、自由度 n − 1 のカイ2乗分布に従う。
n
(n − 1)S 2
1 ∑
(Xi − X)2 ∼ χ2 (n − 1).
=
σ2
σ2
i=1
(3) 標本平均 X と標本分散 S 2 は独立である。
N (µ, σ 2 )
この定理をもとに、正規母集団
から得られる代表的な2つの統計量を考えてみる。統計科
学では標本の分布に正規分布を仮定することがほとんどである。
□ T 統計量。平均の検定や区間推定に用いられる。正規母集団 N (µ, σ 2 ) から独立に得られた n 個の
標本 (X1 , . . . , Xn ) を考える。上の定理から Z ∼ N (0, 1) で
(n − 1)S 2
=
σ2
∑n
i=1 (Xi −
σ2
X)2
∼ χ2 (n − 1)
となり、またこれらが独立となることから、
X −µ
X − µ/
√ =
√
T =
S/ n
σ/ n
√∑
n
i=1 (Xi
− X)2
Z
=√
(n − 1)σ 2
S 2 /σ 2
は自由度 n − 1 の t 分布に従うことがわかる。(t 分布の定義と T の形を見比べよ。)ここでは σ をそ
の推定量 S で置き換えたものとなっている。
2
□ F 統計量。当分散性の検定や分散分析で用いられる。それぞれ正規母集団 N (µ1 , σ12 ) と N (µ2 , σ22 )
に独立に従う (X11 , . . . , X1n ), (X21 , . . . , X2n )、(n = n1 + n2 ) を考える。このとき
F =
S1
S 2 /σ 2
= 12 2
S1
S1 /σ2
は自由度 n1 − 1, n2 − 1 の F 分布に従うことが分かる。S1 と S2 は独立である。(分子と分母それぞ
れが χ2 分布に従う確率変数をその自由度で割ったものになっている。)
3