1章 データの整理

4章 標本分布
(Sampling Distributions)
4.4 中心極限定理(続)
■中心極限定理による
二項確率の正規近似
0.3
0.2
0.1
0
p = 0.5 n = 10
p = 0.5 n = 100
0.10
0.05
x
0 1 2 3 4 5 6 7 8 9 10
x
0.00
35
40
45
50
55
60
65
De Moivre – Laplace (ド・モアブル–ラプラス)の定理
(歴史:正規分布の発見)
成功の確率 p 試行回数 n の二項分布において
n が大きくなるにつれて正規分布に近づく。
成功の回数
x ~ 正規分布(平均 np, 分散 npq)
pq
平均成功率 ˆ x
p
)
~ 正規分布(平均 p, 分散
n
(標本割合)
n
4.5 標本分散の分布
【実験】標本分散の確率変動 n = 2 / 3 / 5 / 10
(母集団:上智男子学生283人の身長)
12%
10%
8%
母集団分布: 上智男子学生 283人の 身長
20%
10%
5%
0%
92.5
82.5
72.5
62.5
52.5
42.5
32.5
22.5
12.5
標本抽出分布: 標本分散 の確率変動
標本サイズ n=5
実験回数 50000
10%
10%
5%
5%
0%
186
標本サイズ n=3
実験回数 50000
2.5
92.5
82.5
72.5
62.5
52.5
42.5
32.5
22.5
12.5
2.5
15%
184
0%
182
0%
180
5%
178
176
174
172
170
168
10%
標本サイズ n=10
実験回数 50000
166
10%
15%
標本抽出分布: 標本分散 の確率変動
15%
20%
標本抽出分布: 標本分散 の確率変動
164
20%
162
標本サイズ n=2
実験回数 50000
160
186
184
182
180
178
176
174
172
170
168
166
164
162
160
標本抽出分布: 標本分散 の確率変動
30%
20%
標本サイズ n=4
実験回数 50000
15%
6%
4%
2%
0%
40%
標本抽出分布: 標本平均値 の確率変動
0%
92.5
82.5
72.5
62.5
52.5
42.5
32.5
22.5
12.5
2.5
92.5
82.5
72.5
62.5
52.5
42.5
32.5
22.5
12.5
2.5
■カイ自乗分布(
2
χ
分布)
[英] Karl Pearson (1857 – 1936)
カイ自乗分布の確率密度曲線 f(x; 自由度)
0.6
f(x;5)
0.5
f(x;4)
0.4
f(x;3)
0.3
f(x;2)
0.2
f(x;1)
0.1
0
0
1
2
3
4
5
6
7
8
x
カイ自乗分布の確率密度関数
f ( x) 
1
2  m / 2
0  x  
m/2
x
m/ 2  1 x/2
m: 自由度 (1, 2, …)
Γ(・): ガンマ関数 (階乗の一般化)
 k   k  1  k  1
 1  1,  1 / 2  
e
定義 カイ自乗( χ2 )分布
Z1, Z2, …, Zk 互いに独立 標準正規分布
その自乗和
W = Z12 + Z22 + … +Zk2
の分布 … 自由度 k のカイ自乗分布
平均・分散 E[W] = k, V[W] = 2k
以下、自由度 k = 1 の分布を導く。
X = Z2 (Z 標準正規変量) X  Z
G(z) 標準正規分布の分布関数
g(z) 密度関数
X の分布関数 F(x)

F ( x)  PX  x  P  x  Z  x


F ( x )  P X  x P  x  Z 
 x  G  x 
 G  x  1  G  x 

x

G
 
標準正規分布は
原点を軸に左右対称
 2G x  1
d
d
f x  
F ( x)  2 G
dx
dx
d x d
2
G
dx d x
1 1 x/2

e
2 x
 x
 
1
x 
g
x
 x
0  x   
定理4.7 標本分散 S2 の分布
X1, X2, …, Xn 互いに独立
E[Xi] = μ, V[Xi] = σ2 の正規分布
標本分散 S2 に比例する統計量
n 1 2
1
Y 2 S  2
σ
σ
 X
n
i 1
 X
2
i
自由度 n – 1 のカイ自乗分布
(n = 2 の証明)
1

2
 X
2
i 1
 X
2
i
2
2

1 
X1  X 2  
X1  X 2  
 2  X 1 
   X2 
 
 
2
2
 
 
2
X1  X 2
Z
2
E Z  
2  X1  X 2   X1  X 2 
 2

 
 
2
2 
 
E X 1   E X 2 
1
V Z  
2σ 2
2σ

μ μ
2σ
2
0





X 1   V X 2   2Cov( X 1 , X 2 )  1
V
 



 σ 2

 0 ( 独立 )
σ 2
4.5 標本平均と標本標準偏差の
Xμ
比の分布
t
S/ n
【実験】
t 統計量の確率変動 n = 2 / 3 / 5 / 10
(母集団:上智男子学生283人の身長)
8%
標本抽出分布: t統計量 の確率変動
標本サイズ n=2
実験回数 50000
6%
8%
4%
2%
2%
0%
-4
8%
標本サイズ n=3
実験回数 50000
6%
4%
0%
標本抽出分布: t統計量 の確率変動
-3
-2
-1
0
1
2
3
4
標本抽出分布: t統計量 の確率変動
標本サイズ n=5
実験回数 50000
6%
-4
8%
4%
2%
2%
0%
0%
-3
-2
-1
0
1
2
3
4
-2
-1
0
1
2
3
4
標本抽出分布: t統計量 の確率変動
標本サイズ n=10
実験回数 50000
6%
4%
-4
-3
-4
-3
-2
-1
0
1
2
3
4
t分布の確率密度曲線 f(t; 自由度)
0.5
標準正規
f(t;10)
f(t;4)
f(t;2)
f(t;1)
0.4
0.3
0.2
0.1
0
-4
-3
-2
-1
0
1
2
3
Γ ( m  1) / 2 
x 
1 

f ( x) 
m
Γ m / 2 2πm 
   x    m: 自由度(1, 2, …)
f ( x)  標準正規分布 m  
2
 ( m 1) / 2
4
t
定義 t 分布
Z 標準正規分布
W 自由度 k のカイ自乗分布
Z と W 統計的に独立
t
Z
W /k
自由度 k の(Student の) t 分布
E[ t ] = 0, V[ t ] = k / ( k – 2) ( k ≧ 3 )