PowerPoint プレゼンテーション

統計的推定
標本から算出された値に基づいて母集団における値(母数)を推測すること
標本平均値 → 母平均
標本比率
→
母比率
統計的推定のための2つの方法
①点推定
母平均を1つの値で推定すること。例え
ば、標本平均を母平均の推定値とするこ
と。
標本平均値30 → 母平均は30である
平均50、分散100の母集団から
の50個の無作為標本に基づく標
本平均値
平均50、分散2の正規分布
45
50
55
推定値が母数と一致することはまれである
推定値がどの程度正確なものかも分からない
② 区間推定
母数がとりうる値の範囲(区間)を、その推測の確からしさ(確率)ととも
に示す。つまり、
推測の精度
→
とりうる値の範囲で示す
推測の確実性
→
その推測が成り立つ確率を示す
標本平均値30 から、
母平均は20~40の範囲(区間)にあると推定される
この推測の確からしさ(正しい確率)は 0.95 である
推測の精度が粗い(区間が広い)
推測の確実性が低い
推定結果の利用は、慎重に行
う必要がある
推定結果の利用に関するリスクを考慮できる → 一般に広く利用されている
区間推定の基本的な考え方(母平均の推定)
N (,

(1)最も現れやすい値はμとその近傍の値であり、
2
n
(2)μから離れるに従って、それが生じる可能性
は小さくなる
)
↓ しかし
(3)μを中心として、極めて広い範囲の値をとる
可能性があり、このままでは手掛かりが無い
μ
区間推定を行うための大前提
我々が手にした標本平均は、母平均を中
心して、その前後±a の範囲の値、つまり
μ-a ~μ+a
の値である。
この前提が正しい確率は、標本平均がこの範
囲にある確率、つまり水色の面積である
大前提が正しい場合に、母平均に関してどのような推論が行えるか? ・・その1
観測された平均値が前提の範囲の最大値に相当する場合
x
a
x
xa
大前提が正しい場合の
母平均の最小値(μL)
大前提が正しい場合に、母平均に関してどのような推論が行えるか? ・・その2
観測された平均値が前提の範囲の最小値に相当する場合
x
a
x
xa
大前提が正しい場合の
母平均の最大値(μU)
大前提が正しい場合に、母平均に関してどのような推論が行えるか? ・・結論
x
x a
大前提が正しい場合の
母平均の最小値(μL)
L  x  a
a
大前提が正しい場合の
母平均の最大値(μU)
U  x  a
大前提が正しい場合の
母平均の範囲
x a    x a
この推論が正しい確率は?
a
x a
大前提が正しい確率
我々が手にした標本平均が母平
均を中心にしてその前後±a の範
囲にある確率 → 水色の面積
区間推定の考え方のまとめ
x
標本平均
存在範囲は
が得られた時、母平均μの
x a    x a
この推論が正しい確率は、標本平均が母平
均を中心にしてその前後±a の範囲にある
確率である
推論が正しい確率 : 信頼水準
精度の高い(予測範囲の狭い)予測をしたい
→ 信頼水準が下がる(予測がはずれる可能性が高くな
る)
はずれる危険性の低い予測をしたい
→ 精度の低い予測で我慢する
一般的に用いられる信頼水準は、
95% → 20回に1回誤った結論を導く可能性がある
又は99% → 100回に1回誤った結論を導く可能性がある
母平均の区間推定
ケース1 ・・・ 母分散σ2が既知の場合
母集団(平均μ、分散σ2からのN個の無作為標本から平均値
xが得られている
標本平均は平均μ、分散σ2/Nの正規分布に近似的に従う
N (,
2
N
信頼水準1-αで
区間推定
)
μ
95%信頼水準 α=0.05
99%信頼水準 α=0.01
観測された平均値が前提の範囲の最大値に相当する場合
x
Pr( X  x ) 
a

2
X  N (,
2
N
)
確率α/2
z
X
Pr(Z 
x
/ N
x

)
2
/ N
Z
X 
/ N
Z  N (0,1)

z ( ) 標準正規分布においてその上
2 側確率がα/2となる値

x
 
z( ) 
   x  z( )
2
2 N
/ N
例:95%の信頼区間 → α=0.05(5%) → Z(0.025)=1.9600
  x  1.96

N
観測された平均値が前提の範囲の最小値に相当する場合
x
Pr( X  x ) 
確率α/2
a
z
Pr(Z 

 z( )
2

2
x
/ N
x

)
2
/ N
X  N (,
Z
2
N
)
X 
/ N
Z  N (0,1)
標準正規分布においてその下側確率がα/2と
なる値

x
 
 z( ) 
   x  z( )
2
2 N
/ N
例:95%の信頼区間 → α=0.05(5%) → Z(0.025)=1.9600
  x  1.96

N
まとめ
母平均の区間推定
ケース1 ・・・ 母分散σ2が既知の場合

z ( ) 標準正規分布においてその上
2 側確率がα/2となる値
信頼区間の
下限値
x
/ N

x
 
z( ) 
   x  z( )
2
2 N
/ N
x
/ N
信頼区間の
下限値

x
 
 z( ) 
   x  z( )
2
2 N
/ N




 z( )
2

x  z( )
   x  z( )
2 N
2 N
例: 母分散が100の母集団からの100個の標本に基づく標本平

z( )
2
ケース1 ・・・ 母分散σ2が既知の場合
母平均の区間推定
母分散がσ2の母集団からのN個の標本に基づく標本平均が
間 (信頼水準1-α)



x の場合の母平均の信頼区

x  z( )
   x  z( )
2 N
2 N
例: 母分散が100の母集団からの100個の標本に基づく標本平均が50であった場合の母
平均の信頼区間は?
信頼水準95%(α=0.05)
z(0.025)  1.9600
信頼水準99%(α=0.01)
z(0.005)  2.5758
50  z(0.025)
10
10
   50  z (0.025)
100
100
50  1.96    50  1.96  48.04    51.96
50  z(0.005)
10
10
   50  z (0.005)
100
100
50  2.58    50  2.58  47.42    52.58