1章 データの整理 - Econom01 Web Site, Sophia

4章 標本分布
(Sampling Distributions)
4.2 標本平均の分布(続)
■ポアソン確率変数の和の分布
(テキスト:例4.3)
0.3
p (x ):
0.2
0.3
X=2
p (y ):
0.2
Y=
3
0.1
0.1
0.0
0.0
x
0
2
4
6
y
0
8
2
4
6
8
Z=
5
X+Y=Z
0.3
X, Y が独立
p (z ):
0.2
0.1
0.0
z
0
2
4
6
8
10 12
10
定理 ポアソン分布の再生性
X ~ ポアソン分布(平均 λX )
Y ~ ポアソン分布(平均 λY )
X, Y が独立なら
Z=X+Y
~ ポアソン分布(平均 λZ = λX + λY )
pZ ( z ) 

p
x yz
XY
( x, y )
pX ( x) pY ( y)


 

x yz
独立な時
z
  pX ( x) pY ( z  x)
x 0
5
4
3
2
1
0
0
1
2
3
4
( z  0,1,2,)
5
  X x  X   Y z  x Y 
pX ( x) pY ( z  x)   
e 
e 

x 0
x 0  x!
  ( z  x)!

z
e
z
(  X Y )
z
 X Y
x
z x
 x!( z  x)!
x 0
e
(  X Y )
Cx
z

1 z
z!
x
z x
 X Y

z! 
x 0 x! ( z  x )!



(  X Y ) z
( X  Y )z (  X Y )

e
z!
( z  0,1,2,)
系 ポアソン分布母集団からの
標本合計値の分布
X1, X2, …, Xn が互いに独立に、同平均
E[Xi] = λ (分散 V[Xi] = λ ) (i = 1, …, n)
のポアソン分布にしたがう時
その和(標本合計値)
S = X1 + X2 + … +Xn
~ ポアソン分布(平均 nλ )
(証明) n = 2 として前の定理を使い、
その和と X3 との和に再び前の定理を使えば
n = 3 が証明される(以下同様)。
■正規確率変数の和の分布
0.4
0.3
0.2
0.1
0.0
0.4
0.3
0.2
0.1
0.0
X= 3
2
X
=1
x
0
2
4
6
8
Y
=5
2
Y
=2
y
0
2
4
6
8
10
X+Y=Z
X, Y が独立
0.4
0.3
0.2
0.1
0.0
Z=8
2
Z
=3
z
0
2
4
6
8
10 12 14
定理 正規分布の再生性
X ~正規分布(平均 μX 、分散 σX2 )
Y ~正規分布(平均 μY 、分散 σY2 )
X, Y が独立なら
Z=X+Y
~正規分布(平均 μZ = μX + μY 、
分散 σZ2 = σX2 + σY2 )
(証明)
証明は途中の式が複雑になるため、以下
では導出原理を見るために、X, Y が標準正
規分布にしたがう時、和 Z = X + Y の分布が
正規分布になることを導く。
f ( x ; , )
2
平均 μ 分散 σ2 の正規分布の
確率密度関数
f ( z ; z ,  )  
2
Z



f ( x ; 0, 1) f ( z  x ; 0, 1) dx



 1
2 
2   1
1
1
 
exp  2 x  
exp  2 z  x   dx

 2
  2

1 
2
2
1

exp  2 x  z  x  dx

2 
1 
2
2
1

exp  2 2 x  2zx  z dx

2 
2
2 


1 
z   z  
 1 

exp 2  2 x 

dx





2 
2   2   

 


 
 


1

2
1

2
1

2
2
2 



z   z  
 1 
 exp 2  2 x  2    2    dx

 
2
2 



 1  x z/ 2  z   
 exp 2  1 / 2    2    dx

 
2
2



 1 z   
 1  x z/ 2 

exp 2 
  dx
   exp 2 

 1/ 2  
  2 
 




平均z / 2 分散 1 / 2 の正規分布密度の
指数部の積分値
 2 1 / 2
2

1
 1 z  


exp 2 
   f ( z ; 0, 2)
2 2

  2 

系 正規分布母集団からの
標本合計と標本平均の分布
X1, X2, …, Xn が互いに独立に、同じ
平均 E[Xi] = μ , 分散 V[Xi] = σ2 (i = 1,…,n)
の正規分布にしたがう時
標本合計
S = X1 + X2 + … +Xn
~ 正規分布(平均 nμ , 分散 nσ2 )
標本平均
X  n1 X1  X2  Xn   n1 S
~ 正規分布(平均 μ , 分散 σ2/ n )
■有限母集団からの標本平均
(非復元抽出)
母集団サイズ = N
1
1
2


μ

x

x



x
σ

2
N
母平均
母分散
N 1
N
2


x

μ
 i
N
i 1
標本サイズ = n
σ
V[ X ]  σ 
n
2
標本平均値の分散
2
X
 N n


 N 1 
有限母集団修正項 (FPC: Finite Population Correction factor)
実際的な目安 「標本抽出率(= n / N)が 5% (または 2%) 以下な
ら、有限母集団修正項(FPC) は無視しても良い」
4.3 大数の法則
(Law of Large Numbers)
密度
3.5
3.0
2.5
標本平均値の分布
標本平均の分布
平均
n = 64
E[ X ]  μX  μ
2.0
分散
σ
V[ X ]  σ 
n
1.5
1.0
0.5
0.0
2
2
X
n = 16
n=4
x
定理 4. 3 チェビシェフの不等式
任意の実数 λ > 0
標準化された確率変数 Z
P Z ≧  ≦
1

2
 X 

1
標本平均値 P 
≧ ≦ 2
 / n
 
 
n c 
c

と置くと


 
n 
P


X   ≧c ≦
2
nc2
定理 4. 4 大数の法則(数学的)
「標本平均値が、母平均 μ から任意の実数 c > 0
以上隔たる確率」


P X   ≧c ≦

2
nc
2
は、標本サイズ n が大きくなるにつれて、
ゼロに収束する。


lim P X   ≧c  0
n
標本平均 X は μ に確率収束する
4.4 中心極限定理
(Central Limit Theorem)
一様分布母集団からの
標本平均値の分布
密度
右歪分布母集団からの
標本平均値の分布
密度
4.0
3.0
n =5
3.5
n =5
3.0
n =4
n =4
2.5
n =3
2.0
n =3
2.5
n =2
n =2
2.0
1.5
1.5
1.0
n =1
n =1
1.0
0.5
0.5
0.0
0.0
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
1.0
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
x
x
中心極限定理(直感的)
平均 μ 分散 σ2 の分布を持つ母集団からの
無作為標本において、
標本平均値の確率分布は、標本サイズ n
が大きくなるにつれて、正規分布に近づく。
定理 4.6 中心極限定理(数学的)
平均 μ 分散 σ2 の分布を持つ母集団からの
無作為標本において、標本平均値は、標準
化した統計量
Xμ
n

Z

X  μ
σ
σ/ n
の確率分布が、標本サイズ n が大きくなる
につれて、(標準)正規分布に近づく。