統計解析第11回 第15章 有意性検定

統計解析第11回
第15章 有意性検定
今日学ぶこと
• 仮説の設定
– 帰無仮説、対立仮説
• 検定
– 棄却域、有意水準
– 片側検定、両側検定
• 過誤
– 第1種の過誤、第2種の過誤、検出力
中心極限定理
変量Xが平均μ、分散σ2の確率分布に従うならば
xのn個の平均はだいたい平均μ、分散σ2/nの正規分布に従う
例:1,2,3が1/3の確率で出るルーレット、期待値2、分散2/3(0.66…)、標準偏差0.816
3回の和は
3(3/3):1/27
4(4/3):3/27
5(5/3):6/27
6(6/3):7/27
7(7/3):6/27
8(8/3):3/27
9(9/3):1/27
0.3
期待値6
分散0.22
標準偏差0.4714
0.25
0.2
0.15
0.1
0.816/1.73=0.4716
0.05
0
3
4
5
6
7
8
9
仮説の設定
ある女性は、ミルクティーに関して
「ミルクを先に入れたか、後に入れたか、飲めばわかる」
と主張する。
主張を確かめるために実験する
•ミルクを先に入れた紅茶
•ミルクを後に入れた紅茶
をそれぞれ1杯ずつ用意して飲んでもらい、
当たるか否か確かめる。
帰無仮説:
彼女はわからない。→当たる確率は1/2
対立仮説:
彼女はわかる。→当たる確率は1/2より大きい
有意水準と棄却域
テストを10回行う。
もし、当たる確率が1/2ならば、すなわち帰無仮説が正しいならば
彼女が当てる回数の確率は以下の通り
n回当てる確率 = 10Cn(1/2)n(1/2)10-n
0
0.000977
1
0.009766
2
0.043945
0.25
3
0.117188
0.2
4
0.205078
5
0.246094
6
0.205078
7
0.117188
0.05
8
0.043945
0
9
0.009766
10
0.000977
彼女が9回以上当てる確率
=0.009766+0.000977
=0.010742≒1%
0.3
帰無仮説が正しいならば
起こりそうもない。
0.15
0.1
0
1
2
3
4
5
6
7
8
9
10
有意水準と棄却域(2)
有意水準:起こりそうもないという目安
例:有意水準5%→5%以下しか起こりそうにないことはうそ
棄却域:起こりそうもない結果
0
0.000977
1
0.009766
2
0.043945
3
0.117188
4
0.205078
5
0.246094
0.15
6
0.205078
0.1
7
0.117188
8
0.043945
9
0.009766
10
0.000977
棄却域に落ちた結果は有意であるという
例:10回中9回以上当てたならば、
5%有意水準で有意である。
0.3
0.25
0.2
有意水準5%
の棄却域は9回以上
0.05
0
0
1
2
3
4
5
6
7
8
9
10
有意水準10%の棄却域は
8回以上
片側検定と両側検定
製品を平均1000g, 標準偏差5gで生産する機械
帰無仮説:機械は正しい→平均1000, 標準偏差5
対立仮説:機械は正しくない→平均1000, 標準偏差5でない
1009gの製品が生産された。
帰無仮説が正しいとするとその結果が起こる確率は?
X~N(1000, 52)
z=(x-1000)/5とすると
Z~N(0,12)
x=1009→z=1.8
よって、1009以上の製品が生産される確率は
P(x>1009)=P(z>1.8)=1-F(1.8)=1-0.9641≒0.0359
5%有意で棄却
片側
検定
平均から9以上離れた製品が生産される確率は
P(x>1009)+P(x<991)=2×P(x>1008) ≒0.0718
両側
検定
5%有意で棄却されない
中心極限定理と一緒に使う
製品を平均1000g, 標準偏差5gで生産する機械
帰無仮説:機械は正しい→平均1000, 標準偏差5
対立仮説:機械は正しくない→平均1000, 標準偏差5でない
9回の平均を計ったら1003gであった。
帰無仮説:N(1000, 52)→9回の平均~N(1000,(5/3)2)
対立仮説:N(1000, 52)でない→9回の平均~N(1000,(5/3)2)でない
1003gは有意水準5%で片側検定するとどうか?
有意水準5%で両側検定するとどうか?
?
第1種の過誤と第2種の過誤
第1種の過誤:帰無仮説は本当は真の時、これを棄却する誤り。
第2種の過誤:帰無仮説が本当は偽の時、これを保持する誤り。
箱の中に白玉と黒玉がある
帰無仮説:白10、黒90
対立仮説:白50、黒50
非復元抽出で4個取り出す。4つとも黒ならば帰無仮説を採択、
そうでなければ帰無仮説を棄却
第1種の過誤
白10、黒90で4つとも黒でない
第2種の過誤
白50、黒50で4つとも黒
?
?
過誤の確率を知るには対立仮説で具体的に数値が与えられていないとだめ
検出力
検出力=1-(第2種の過誤の起こる確率)
第2種の過誤の起こる確率
→帰無仮説が本当は偽の時、これを保持する確率
1-(第2種の過誤の起こる確率)
→帰無仮説が本当は偽の時、これを棄却する確率