Document

統計基礎(第9回)
推定と検定
早稲田大学大学院商学研究科
2015年6月10日
大塚忠義
1
講義資料
http://tyotsuka.cocolog-nifty.com/blog/
から各自事前にダウンロードしてください
2
Agenda
第9回 推計と検定
• 点推定
• 区間推定
• 検定
3
点推定(1)
母平均、母分散をさだめること
母集団から抽出した標本をもとに、母集団
の分布の母数を定める
ピンポイントで母数を定める(当然に一定
の誤差を許容する)
母集団の分布関数がわかっても母数がわ
からないと使えない
⇔未知の母数を標本から定める
4
点推定(2)
母平均:
推定量:ˆ
母分散:
ˆ ( X 1 , X 2 , , X n )
2
2
ˆ
推定量:
2
ˆ
 ( X1, X 2 ,
, Xn)
母数と推定量ˆの間には誤差が存在する
5
点推定(3)
最尤推定量:得られた標本値が現れる確
率が最も高い母数を推定値とする
不偏推定量:推定値の平均が母数と等しく
なる推定量
一致推定量:標本数を多くしたときに推定
値が母数と等しくなる推定量
6
点推定(4)
標本平均は不偏推定量かつ一致推定量
1
X  ( X1  X 2  X 3   X n )
n
E( X )  
lim X  
n 
7
点推定(5)
標本分散は不偏推定量かつ一致推定量
n
1
2
2
s 
(Xi  X )

n  1 i 1
n
1
2
(Xi  X )

n i 1
は一致推定量だが不偏推定量でない
8
区間推定
母数が含まれる確率を保証する区間を定
める
誤差を許容して範囲で定める
P( L    U )  1  
L    U :信頼区間
L: 下側信頼限界
U: 上側信頼限界
1-α:信頼係数 99%、95%
9
仮説検定(1)
母集団について仮定された命題を標本に
基づいて検証すること
仮説のもとで期待される結果と標本を観測
した結果の違いが、偶然によって起きたも
のなのか、そもそも仮説が正しくないのか
を評価する:統計的判断の論理学
(仮説のもとで期待される結果)-(標本を
観測した結果)<誤差??
10
仮説検定(2)
統計的仮説、仮説に対する有意性の検定
仮説:コインに歪みがない
:コインの表が出る確率は0.5が有意であ
るといえるか?
100回コインを投げてみる
:仮説が正しければ、50回が表
実際にやってみたら41回表が出た
9=50-41は誤差の範囲といえるか?
11
仮説検定(3)
仮説検定は、統計的仮説のもとで、標本結
果が生まれる確率を算出し、その結果に
対する有意性の存在を判定する
「差が9もあったら誤差と言えない」と判断
できるのであれば、「差が9」とは誤差以外
の要因が存在する。つまり、 「差が9」には
意味がある:「有意」である
B(100,1/ 2)
P( X  41)  4.43%
12
仮説検定(4)
表の数が41回以下となる確率は、4.43%
この確率は誤差の範囲か有意か
これを判断するためにはあらかじめ基準を
作っておかなければならない
この基準を有意水準(α)という
10、5、1%。。。たいてい 5または1%
有意水準5%としたら、それより低い4.43%
の発生確率である
表の数41回以下は稀! つまり、有意!
13
仮説検定(5)
仮説:コインの表が出る確率は0.5
100回コインを投げてみる
実際にやってみたら41回表が出た
この仮説のもとで、表が41回以下の確率
は4.43%であるので、有意水準(α) 5%で
仮説と観測値の間には、誤差とはいえない
差異が有意に存在する
従って、仮説は「棄却」される
仮説検定により、仮説「確率0.5」は誤って
いると判断される
14
帰無仮説と対立仮説(1)
仮説検定の結果に基づき主張する内容は
極めて「謙虚」である
結果で仮説が有意でないとき
仮説が正しいとは言わない:仮説は棄却で
きない⇒間違っているとはいえない
結果で仮説が有意のとき
仮説は「棄却」される:この場合は積極的
に仮説は正しくないという
15
帰無仮説と対立仮説(2)
帰無仮説( H 0 ):もともと建てた仮説
対立仮説( H1 ):帰無仮説に対立する仮説
例えば H1  H 0
帰無仮説は否定されることを前提に立てる
ことが多い・・・無に帰す仮説
帰無仮説が「棄却」される:対立仮説が「採
択」される
帰無仮説が採択されるとは絶対に言わな
い
16
帰無仮説と対立仮説(3)
背理法
帰無仮説のもとで、期待する結果が生じな
かったことを根拠に帰無仮説を棄却、否定
する
帰無仮説が棄却されなかったこと
≠帰無仮説が採択、支持される
≠帰無仮説が「真」であることを証明する
単に観測結果と帰無仮説の間に矛盾が生
じなかっただけのこと
17
帰無仮説と対立仮説(4)
実際の検定では、否定したい方を帰無仮
説にすることが多い
例:新しい風邪薬の効果を調べる
A:風邪をひいた100人が新しい薬を服用
B:風邪をひいた100人が従来の薬を服用
風邪は治った日数の平均  A ,  B
帰無仮説( H 0 ):  A  B
対立仮説( H1 ):  A  Bまたは A<B
18
帰無仮説と対立仮説(5)
H 0 を棄却しない
H 0 を棄却する
が正しい
①
③
が誤り
②
④
①④は正しい
③:第1種の過誤:生産者のリスク
仮説が正しいのに棄却してしまう
規格に合格した良品を不合格にする
②:第2種の過誤:消費者のリスク
仮説が正しくないのに棄却しない
規格に合格しないはずの不良品を合格にする
19
棄却域
P(採択域)+P(棄却域)=1
予測される値(確率変数)が正規分布に従うと
仮定できると数値の算出が容易になる
20
帰無仮説と対立仮説(6)
帰無仮説( H 0 ):
対立仮説( H1 ): H1  H 0
両側検定
対立仮説( )
H1>H 0またはH1<H 0
片側検定
例:XXの効果、
 A , B
21
母平均の検定(1)
正規分布を活用する検定
:標本の数が100以上
例:東京のラーメンの価格は500円より高
い?
帰無仮説 H 0 : μ=500
対立仮説 H1 : μ>500
有意水準 5%で片側検定を行う
電話帳でランダムに200件のラーメン屋に
電話をかけ価格を調査した
22
母平均の検定(2)
その結果:標本平均520円、
標本標準偏差160円
500
母平均
unknown
母分散
200
標本数
520
標本平均
160
標本標準偏差
標本数が100を超えているので
標本標準偏差を代用する
Z値
p値
1-p値
1.77
0.961
0.039
NORMS.DIST(1.77)
帰無仮説は棄却される。従って、 東京の
ラーメンは500円より高い
23
Question?
お疲れ様でした
24