0.1. 標本平均の分布

0.1.
標本平均の分布
母集団から n 個の標本 x1 , x2 , ..., xn を抽出するとき、それらは標本ごとに変わる確率変数であり、その各々を
∑n
X1 , X2 , ..., Xn で表すと、このときの標本平均 X̄ はX̄ = i=1 Xni となり、この標本平均もまた新しい確率変数と
して標本分布する。この標本平均の分布の確率密度関数はその母集団が N (µ, σ 2 ) である正規分布をする場合には
次式で与えられる。
−
1
f (X̄) = σ √ e
√
2π
n
(X̄−µ)2
2
2σ
n
2
これより、正規母集団 N (µ, σ 2 ) からの標本平均 X̄ の分布は N (µ, σn ) である正規分布をすることがわかる。以上
より次の定理を得る。
定理 1:正規母集団 N (µ, σ 2 ) から大きさ n の標本を任意抽出した場合の標本平均 X̄ =
∑n
Xi
i=1 n
2
の分布は N (µ, σn )
となる正規分布をする。
次に、正規母集団でない任意の母集団から n 個の標本を任意抽出したときの標本平均 X̄ の分布について考えると、
2
n が十分大きければ 1 以下の中心極限定理より標本平均 X̄ の分布は N (µ, σn ) となる正規分布に近づくことが証明
されている。
中心極限定理:平均 µ、分散 σ 2 の任意の確率分布に従う母集団から n 個の標本を無作為抽出したときの標本平均
2
X̄ の分布は、n が十分大きい時に正規分布 N (µ, σn ) に近似する。また、中心極限定理の系として以下の定理を得
る。
定理 2:平均 µ、分散 σ 2 の任意の確率分布に従う母集団から n 個の標本を無作為抽出したときの標本平均 X̄ を確
率変数とみなし、X̄ を標準化した
Z=
X̄ − µ
√σ
n
の分布は n → ∞ のとき、N (0, 1) の標準正規分布に従う。
ここで、平均 µ、分散 σ 2 の正規母集団もしくは、任意の確率分布に従う母集団から n 個の標本を無作為抽出した
ときの標本平均 X̄ の分布における平均が µ、分散が
σ2
n
となることを期待値 (平均)、分散の定義と性質を述べた
後に示す。X = xi となる確率が pi であるような確率変数 X を考えると、
• 期待値の定義
E(X) =
k
∑
xi pi
( 但し、µ = E(X) )
i=1
• 分散の定義
V (X) =
k
∑
pi (xi − µ)2 = E[(X − µ)2 ]
(1)
i=1
• 期待値の性質
X, Y を確率変数、a, b を定数とする。但し、(5) は X, Y が独立 2 な確率変数のとき。また、(6) は (3),(4) よ
1n
が大きければ大きい良好であり、母分布が極端に正規性から外れていない限り一般に n > 10 で標本平均の分布は正規分布と見なして
良いことが経験的に確かめられている。
2 X の結果に関わらず、Y の確率が変わらないこと
1
り、期待値の線形性という。
E(a) = a
(2)
E(aX) = aE(X)
(3)
E(X + a) = E(X) + a
E(X + Y ) = E(X) + E(Y )
(4)
E(XY ) = E(X)E(Y )
(5)
E(aX + bY ) = aE(X) + bE(Y )
(6)
• 分散の性質
X, Y を確率変数、a を定数とする。但し、(9) は X と Y が独立な確率変数のとき。
V (a) = 0
(7)
2
V (aX) = a V (X)
(8)
V (X + a) = V (X)
V (X + Y ) = V (X) + V (Y )
(9)
V (X) = E(X ) − {E(X)}
(10)
2
2
また、各々が独立な標本 X1 , X2 , ..., Xn は母平均 µ、母分散 σ 2 の分布に従う確率変数とする。各 X1 , X2 , ..., Xn
はそれぞれ全く同じ集合から抽出された n 個の標本なので次の式が成立する。
E(X1 ) = … = E(Xn ) = E(X) = µ
(11)
E(X12 )
(12)
=…=
E(Xn2 )
2
= E(X )
V (X1 ) = … = V (Xn ) = V (X) = σ 2
(13)
ところで、(10) は (1),(2),(3),(4),(11) より、導くことが出来る。
V (X) = E[(X − µ)2 ] = E(X 2 − 2µX + µ2 ) = E(X 2 ) + E(−2µX) + E(µ2 )
= E(X 2 ) − 2µE(X) + µ2 = E(X 2 ) − 2µ × µ + µ2 = E(X 2 ) − µ2
= E(X 2 ) − {E(X)}2
従って、標本平均の分布の期待値 (平均)E(X̄) は (3),(4),(11) より、
(
X1 + X2 + … + Xn
n
)
1
E(X1 + X2 + … + Xn )
n
1
1
1
= {E(X1 ) + E(X2 ) + … + E(Xn )} = (µ + µ + … + µ) = × nµ = µ
n
n
n
E(X̄) = E
=
(14)
標本平均の分布の分散 V (X̄) は (8),(9),(13) より、
(
)
X1 + X2 + … + Xn
1
1
V (X̄) = V
= 2 V (X1 + X2 + … + Xn ) = 2 {V (X1 ) + V (X2 ) + … + V (Xn )}
n
n
n
=
1 2
1
σ2
(σ + σ 2 + … + σ 2 ) = 2 × nσ 2 =
2
n
n
n
(15)
一方で (10) から、
V (X̄) = E(X̄ 2 ) − {E(X̄)}2
よって (15) より、
E(X̄ 2 ) − {E(X̄)}2 =
2
σ2
n
(16)
母平均と母分散の推定
0.2.
母平均の推定
0.2.1.
(14) より、標本平均 X̄ を平均したものが母平均 µ である。つまり、ある標本平均 X̄ の値を母平均 µ の 1 つの標
本として扱える。従って、標本平均 X̄ は母平均 µ の推定値とし、以下の式が成り立つ。
E(X) = µ = E(X̄)
(17)
母分散の推定
0.2.2.
今、X1 , X2 , ..., Xn を平均 µ と分散 σ 2 の分布から得られた標本とする。つまり、E(Xi ) = µ, E[(Xi −µ)] = σ 2 (i =
∑n
1, 2, ..., n) とする。この時、標本から得られる母集団の分散の推定値を s2 = n1 i=1 (Xi − X̄)2 とするとき、s2 が
不偏推定量 3 かどうか調べる。つまり、E(s2 ) を計算すると、
)
1∑
1∑ 2
1 ∑ 2 1 ∑(
−2Xi X̄ + X̄ 2
(Xi − X̄)2 =
(Xi − 2Xi X̄ + X̄ 2 ) =
Xi +
n i=1
n i=1
n i=1
n i=1
n
s2 =
n
n
n
(∗)
(*) の第二項において、
)
1 ∑(
1
−2Xi X̄ + X̄ 2 =
n i=1
n
n
=
(
−2X̄
n
∑
Xi + X̄
i=1
2
n
∑
)
i=1
1
=
n
(
−2X̄
n
∑
)
Xi + nX̄
2
i=1
1
=
n
(
1∑
−2nX̄
Xi + nX̄ 2
n i=1
n
)
1
1
(−2nX̄ × X̄ + nX̄ 2 ) = (−nX̄ 2 ) = −X̄ 2
n
n
従って、(3),(4),(12) より E(s2 ) は、
)
)
( n
( n
∑
1
1
1∑ 2
2
2
2
= E
E(s ) = E
Xi − X̄
Xi − E(X̄ 2 ) = E(X12 + X22 + … + Xn2 ) − E(X̄ 2 )
n i=1
n
n
i=1
[
]
n
n
1
1∑
1∑
=
{E(X12 ) + E(X22 ) + … + E(Xn2 )} − E(X̄ 2 ) =
E(Xi2 ) − E(X̄ 2 ) =
E(X 2 ) − E(X̄ 2 )
n
n
n
i=1
i=1
1
= × nE(X 2 ) − E(X̄ 2 ) = E(X 2 ) − E(X̄ 2 )
n
2
また、(10),(13) より E(X 2 ) = σ 2 + {E(X)} かつ (16),(17) より、
{
}2
2
E(s2 ) = σ 2 + {E(X)} − E(X̄ 2 ) = σ 2 + E(X̄) − E(X̄ 2 )
= σ 2 − [E(X̄ 2 ) − {E(X̄)}2 ] = σ 2 −
n−1 2
σ2
=
σ
n
n
ゆえに、不偏推定量を標本分散 s2 とすると、母分散より小さく見積もってしまうことになるので、この式を σ 2 に
ついて解くと (3) より、
(
2
σ =E
この式は
n
2
n−1 s
n 2
s
n−1
)
の期待値が母分散 σ 2 に等しいことを示しているので、ある
n
2
n−1 s
の値を母分散 σ 2 の 1 つの標本
n
n
として扱える。即ち、 n−1
s2 を母分散 σ 2 の推定値とすることができる。よって、 n−1
s2 を不偏分散 u2 とすると、
u2 は以下の通りである。
n
1∑
1 ∑
n 2
s =
×
(Xi − X̄)2 =
(Xi − X̄)2
n−1
n − 1 n i=1
n − 1 i=1
n
u2 =
n
3 標本空間で期待値をとると母数に一致する推定量のこと
3
参考文献
[1] 三上 操:
「数学講座 6 統計的推測」株式会社 筑摩書房,1969 年 12 月 20 日発行
[2] 薩摩 順吉:
「確率・統計」株式会社 岩波書店,1989 年 2 月 8 日発行
[3] 岸根 卓郎:
「理論応用統計学」株式会社 養賢堂,1966 年 1 月 5 日発行
[4] 大島 利雄ほか 16 名:
「改訂版 数学 B」, 数研出版株式会社,2009 年 1 月 10 日発行
[5] 木田 祐司ほか 16 名:
「改訂版 数学 C」, 数研出版株式会社,2009 年 1 月 10 日発行
[6] 尾畑 伸明:
「数理統計学の基礎」共立出版株式会社,2014 年 12 月 25 日発行
[7] 栗原 伸一:
「入門統計学 -検定から多変量解析・実験計画法まで-」, 株式会社オーム社,2011 年 7 月 25 日発行
4