統計推定

統計推定:
母集団比率の区間推定
1.基本概念
2.母集団比率の区間推定
3.小標本の区間推定
4.標本の大きさの決定
1.基本概念
点推定(point estimation):母集団の未知
パラメータ  を一つの値で推計する。
区間推定(interval estimation):母集団の
パラメータ  が入る確率がある値 1  
以上と保証される区間[L1, L2]を求める。
(  は  が区間に入らない確率)
P( L1    L2 )  1  
母集団比率の区間推定
標本比率の期待値と分散


pq
E ( p )  p, V ( p ) 
n
基準化確率変数

Z 
p
p
pq / n
2.信頼区間の作成
中心極限定理により、Nが大きいとき
N(0,1)
P(| Z | c)  1  
 P( pˆ  c
pq
n
 P  pˆ  c
pq
n
) q=1-p
x
不等式の両端の辺でpの変わりに pˆ  を
n
用いると、
信頼区間、信頼係数、区間推定
 P * ( pˆ  c
近似的に区間
pˆ (1  pˆ
n
J z ( pˆ )  ( pˆ  c
 P  pˆ  c
pˆ (1  pˆ
n
, pˆ  c
pˆ (1  qˆ
n
)
pˆ (1  qˆ
n
)
の中に母集団比率Pが含まれる確率が 1   である
ことを示す。ただし、ここで信頼度の大きさ 1  
を信頼係数という。P*は確率ではないこと。
練習問題
ある都市の労働力人口から1000人を無作
為に抽出した結果、31人が失業であった。
1)失業率の点推定値 pˆ を求め、標本の
データから標本分布の標本分散を推定し、
推定の誤差を説明せよ。
2)母集団比率P(この都市の失業率)につい
て信頼係数0.95の信頼区間を求めよ。
解答(1)
N=1000、x=31
x
31
pˆ  
 0.031
n 1000
n=1000で大標本であるので、 pˆ の分散の
推定値は
pˆ (1  pˆ ) 0.031(1  0.031)
v( pˆ ) 

 0.00003
n
1000
 pˆ  0.0055
解答(2)
 P(| Z | c)  2(c)  1  1    0.95
(c)  0.975 C=1.96
L1  0.0311.96 0.0055 0.02
L2  0.031 1.96 0.0055 0.042
即ち、
0.02  P  0.042
3. N<30、1    0.95 ときの区間推定
P(| Z | c)  0.95  p(| Z | 1.96)


P 1.96 


x

P

n
 1.96  0.95
p(1  p) / n


x
2
2 p (1  p )
上の式を書き直すと、 ( n  p )  (1.96 )
n
これを整理すると、Pについての2次不等式
2
x
(n  3.84) p  (2 x  3.84) p   0
n
2
P( p1  p  p2 )  0.95
p1  p2
2次方程式 ap  bp  c  0 の解
2
2
x
(n  3.84) p  (2 x  3.84) p 
0
n
2
 b  b 2  4ac
p1 
2a
 b  b  4ac
p2 
2a
2
練習問題
学生400人をランダムに選んで、たばこを
好む人の数を調べたところ、95人であった。
学生全員の中で喫煙者の割合Pを、信頼係
数95%で区間推定してみよう。
4.標本の大きさの決定
nが大であれば、標本比率x/nは近似的に正規
分布N(p,pq/n)に従うから、信頼係数95%で
x
P
n
 1.96
p(1  p) / n
推定の誤差|x/n - p|をE以内にとすると、
|x/n - p|=Eとし、不等号を等号にして求められ
ると、nの値は
1.96 2
n(
)  p(1  p) となる。(P=1/2とする)
E
練習問題
ある電気器具メーカが自社のある製品を利
用している家庭の割合を標本調査によっ
て推定しようと考えている。信頼係数95%
で誤差を3%以内におさえたいとすれば必
要な標本数はどれくらいか?
解:E=0.03,P=1/2として、
1.96 2 1 1
n(
) ( )( )  1067 .1
0.03 2 2