PowerPoint プレゼンテーション

母平均の区間推定
ケース2 ・・・ 母分散σ2が未知の場合
母集団(平均μ、分散σ2)からのN個の無作為標本から平均値
xが得られている
標本平均は平均μ、分散σ2/Nの正規分布に近似的に従う
N (,
2
N
信頼水準1-αで
区間推定
)
μ
95%信頼水準 α=0.05
99%信頼水準 α=0.01
標本平均が前提区間の最大値の位置にある場合(母平均の信頼区間の最小値)
N (,

n
母分散が既知
x
2
)

2
a
Pr( X  x ) 

2
X
標準化
母分散σ2が既知
N (0,1)
x
/ n
 
z 
2
X 
Z
/ n
x

Pr(Z 
)
2
/ n

2
   :標準正規分布においてその
z 
 2  上側確率がα/2となる値
Z
  x  
z  
2 / n
  
  x  z 
2 n
標本平均が前提区間の最大値の位置にある場合(母平均の信頼区間の最小値)
N (,

n
母分散が未知
x
2
)

2
a
Pr( X  x ) 

2
X
母分散σ2が未知
2
不偏分散
を使う
標準化
ˆ
自由度n-1のt分布
x
ˆ / n
x

Pr(t 
)
2
ˆ / n

2
t
 
tn 1  
2
X 
t
ˆ / n
 
tn 1  
2
:自由度n-1のt分布においてその
上側確率がα/2となる値
  x  
tn 1   
 2  ˆ / n
   ˆ
  x  tn 1  
2 n
標本平均が前提区間の最小値の位置にある場合(母平均の信頼区間の最大値)
x

2
N (,
a
2
n
)
Pr( X  x ) 

2
X
母分散σ2が未知
2
不偏分散
を使う
標準化
ˆ

2
x
ˆ / n
自由度n-1のt分布
X 
t
ˆ / n
x

Pr(t 
)
2
ˆ / n
 
 tn 1   :自由度n-1のt分布においてその
 2  下側確率がα/2となる値
 
 tn 1  
2
t
  x  
 tn 1   
 2  ˆ / n
   ˆ
  x  tn 1  
2 n
信頼水準1-αでの母平均の区間推定 (母分散が未知の場合) まとめ
自由度n-1のt分
布
x
ˆ / n
標本平均が前提区間の最大値に位置している場合

2
t

x
ˆ / n
 
tn 1  
2
:自由度n-1のt分布においてその
上側確率がα/2となる値
  x  
tn 1   
 2  ˆ / n
   ˆ
  x  tn 1  
2 n
標本平均が前提区間の最小値に位置している場合
自由度n-1のt分布
 
 tn 1  
2
2
 
 tn 1  
2
 
tn 1  
2
t
:自由度n-1のt分布においてその
下側確率がα/2となる値
  x  
 tn 1   
 2  ˆ / n
x
   ˆ
  x  tn 1  
2 n
母集団からのn個の無作為標本から標本平均値
が得られている。この時、標本不偏
分散が ˆ 2 とすると、母平均μの信頼水準1-αの信頼区間は下式で与えられる。
   ˆ
   ˆ
x  tn 1  
   x  tn 1  
2 n
2 n
適用例
母平均の区間推定 (母分散が未知の場合)
36個の標本から標本平均100と不偏分散144が得られている。この時、信頼水準95%と99%
の信頼区間を求めよ
   ˆ
   ˆ
x  tn 1  
   x  tn 1  
2 n
2 n
95%
100 t35 (0.025)
t35 (0.025)  2.0301
99%
144
 100 t35 (0.025)  2    100 t35 (0.025)  2
36
100 2.0301 2  95.931   100 2.0301 2  104.06
144
 100 t35 (0.005)  2    100 t35 (0.005)  2
36
100 2.7238 2  94.55    100 2.7238 2  105.45
100 t35 (0.005)
t35 (0.005)  2.7238
不偏分散144が母分散だとしたら
  
  
x  z 
   x  z 
2 n
2 n
95%
144
 100 z(0.025)  2    100 z(0.025)  2
36
100 1.96  2  96.08    100 1.96  2  103.92
100 z(0.025)
z(0.025)  1.9600
t分布と正規分布
正規分布
自由度5のt分布
-2
-1
0
1
2
   
tn 1    z  
2 2
   ˆ
   ˆ
x  tn 1  
   x  tn 1  
2 n
2 n
  
  
x  z 
   x  z 
2 n
2 n
広い
狭い
標本比率の分布
母比率πの母集団からのn個の無作為標本に基づく標本比率pの分布
平均π、分散π(1-π)/n の正規分布で近似できる
N ( ,
 (1   )
n
)
分散は? → 既知 又は 未知 ?
×
分散が既知(π(1-π))
○
分散は未知
← 母分散πが既知
分散は未知 → どのように推定するか?
標本比率 p を用いる
標本比率の分布の分散は p(1-p)/n とする
標本比率を議論する場合には標本数が多いことが前提
平均π、分散 p(1-p)/n の正規分布で近似できる
母比率の区間推定(信頼水準1-α)
その1:標本比率が前提区間の最大値の位置にある場合(母比率の信頼区間の最小値)
p(1  p )
N (,
)
n
p

a
Pr( P  p ) 
2
π-a
π
π+a
p 
p(1  p) / n
Z 
Pr(Z 

2
Z
 
z 
2
2
P
標準化
N (0,1)

p 
p(1  p ) / n
p 

)
2
p(1  p) / n
   :標準正規分布においてその
z 
 2  上側確率がα/2となる値
 
z  
2
p 
p(1  p) / n
   p(1  p)
  p  z 
2
n
母比率の区間推定(信頼水準1-α)
その2:標本比率が前提区間の最小値の位置にある場合(母比率の信頼区間の最大値)
p

N (,
p(1  p )
)
n
a
2
π-a
Pr( P  p ) 
π
π+a
P
標準化
p 
p(1  p) / n
N (0,1)

2
 
z 
2
2
Z 
p 
p(1  p ) / n
Pr(Z 
p 

)
2
p(1  p) / n
 
 z 
2
Z

 
 z  
2
:標準正規分布においてその
下側確率がα/2となる値
p 
p(1  p) / n
   p(1  p)
  p  z 
2
n
信頼水準1-αでの母比率の区間推定
p 
p(1  p) / n
N (0,1)
標本比率が前提区間の最大値に位置している場合

2
Z
p 
p(1  p) / n
 
z 
2
 
z 
2
:標準正規分布においてその
上側確率がα/2となる値
 
z  
2
p 
p(1  p) / n
   p(1  p)
  p  z 
2
n
標本平均が前提区間の最小値に位置している場合
N (0,1)
 
 z 
2

2
Z
 
z 
2
まとめ
 
 z  
2
母集団からのn個の無作為標本から標本比率
頼水準1-αの信頼区間は下式で与えられる。
:標準正規分布においてその
下側確率がα/2となる値
p 
p(1  p) / n
   p(1  p)
  p  z 
2
n
p が得られている。この時、母比率πの信
   p(1  p)
   p(1  p)
p  z 
   p  z 
n
n
2
2
適用例
母比率の区間推定
100個の標本から標本比率0.5が得られている。この時、母比率の信頼水準95%と99%の信
頼区間を求めよ
   p(1  p)
   p(1  p)
p  z 
   p  z 
n
n
2
2
95%
0.5  z(0.025)
z(0.025)  1.9600
99%
0.5  1.96  0.05  0.402    0.5  1.96  0.05  0.598
0.5  z(0.005)
z(0.005)  2.5758
0.5(1  0.5)
0.5
0.5
 0.5  z(0.025) 
   0.5  z(0.025) 
10
10
100
0.5(1  0.5)
0.5
0.5
 0.5  z(0.005) 
   0.5  z(0.005) 
10
10
100
0.5  2.5758  0.05  0.3712    0.5  2.5758  0.05  0.5129
区間推定の精度に基づく標本数の決定
①母分散が既知の場合の、n個の標本に基づく標本平均の区間推定
x  z ( / 2)

n
   x  z ( / 2)

n
信頼区間の長さは?

2 z ( / 2)
n
精度の高い(区間幅の狭い)予測値を得るためには?
標本数を多くする
区間幅をある値 a より小さくするためには?
2 z ( / 2)
4 z( / 2)

n
2

2
n
a
 a2
4 z ( / 2)2  2
n
2
a
②母分散が未知の場合の、n個の標本に基づく標本平均の区間推定
x  tn 1 ( / 2)
ˆ
n
   x  tn 1 ( / 2)
ˆ
n
区間幅をある値 a より小さくするためには?
2tn 1 ( / 2)
ˆ
n
a
4tn 1 ( / 2)
2
ˆ

2
n
ˆ
 a2
4tn 1 ( / 2)2 ˆ 2
n
2
a
の値は過去の類似調査を参考とする
③n個の標本に基づく標本比率の区間推定
p  z( / 2)
p(1  p)
p(1  p)
   p  z( / 2)
n
n
区間幅をある値 a より小さくするためには?
2 z( / 2)
p(1  p)
a
n
p(1  p ) 2
4 z ( / 2)2
a
n
● P の値は過去の値を参考とする
● 安全を見越すとすれば
p(1-p) は p=0.5 の時最大値となる → p=0.5 を用いる
4 z ( / 2)2 p(1  p )
n
2
a
例 : 区間推定の精度に基づく標本数の決定
①標本平均の区間推定の精度に基づく標本数の決定(母分散が既知)
母分散が100の時、信頼係数
95%の信頼区間の幅を5以内
に抑えたい
4 z ( / 2)2 2
n
a2
4  1.962  100
 61.5  n
52
②母分散が未知の場合の、n個の標本に基づく標本平均の区間推定
不偏分散が100の時、信頼係
数95%の信頼区間の幅を5以
内に抑えたい
4tn 1 ( / 2)2 ˆ 2
n
a2
N=64
4  1.99832  100
 63.89  n
2
5
③n個の標本に基づく標本比率の区間推定
TV番組の視聴率調査をする。こ
の時、信頼係数95%の信頼区
間の幅を5%以内に抑えたい
4 z ( / 2)2 p(1  p )
n
2
a
安全を見込めば
4  1.962  0.5  (1  0.5)
 1536.6  n
0.052
TV番組の視聴率で
あることを考えれば
4  1.962  0.3  (1  0.3)
 1290.8  n
2
0.05