第2章 確率と確率分布

第4章 統計的検定
統計学 2006年度
Ⅰ 仮説検定の考え方
a) 仮説の設定
1) 検定仮説、対立仮説
2) 片側検定、両側検定
(その1)
b) 2種類の誤り
c) 仮説検定の手順
Ⅱ 1つの標本にもとづく検定
a) 母平均の検定
1) 母分散が既知の場合
2) 母分散が未知の場合
Ⅲ 2つの標本にもとづく検定
a) 母平均の差の検定
b) 母比率の差の検定
(その2)
Ⅰ 仮説検定の考え方
次のような問題を考える。
• 2005年のセンター試験、数学Ⅱ・Bの平均点は53点であっ
た。
• K予備校はセンター入試の直前に、「センター入試直前講
習」をおこなった。この講習の受講生の中から100人を選ん
で調査したところ、その平均点は70点であった。
• K予備校の直前講習の成果はあったといえるだろうか。
⇒ この疑問に対し、統計的に答える方法が統計的検定
a) 仮説の設定
1) 検定仮説、対立仮説
• この問題において、「直前講習の受講生の点数は全国平均と
変わらない」のか、 「直前講習の受講生の点数は全国平均よ
り高い」のかが知りたいことである。
• 直前講習の受講生全体の平均点をμとあらわすと、
H0: μ=53
H1: μ>53
という二者択一の仮説を考え、標本の情報によっていずれか一
方の仮説を採択する。
• 検定仮説(H0) 検定したい状況を表したもの。否定されること
を目的とした仮説の設定をおこなうことがあるので、帰無仮説
といわれることもある。(この場合、K予備校としては直前講習
の効果があったという結論を出したいので、この仮説は否定し
てほしい)
• 対立仮説(H1) 検定仮説と反対の状況をあらわしたもの。
検定仮説と対立仮説は、同時に成り立つことはなく、その2つ
ですべての状況をあらわしている。
2) 片側検定、両側検定
• この例では、直前講習の受講生の平均点は「変わらない」か
「高い」の場合のみを考えた。(K予備校の直前講習を受けて
「低くなる」場合は考えなかった)
⇒ このように、対立仮説のとりうる範囲が検定仮説の片側
にくる検定を片側検定という。
• 一方、ネジを作る工場において作られたネジが規格どおりか
どうかを判断する場合には、「規格どおり」か「大きいか、小さ
いか」という判断が必要となる。
⇒ この場合、対立仮説は検定仮説の両側の範囲をとる。こ
のような検定を両側検定という。
b) 2種類の誤り
• 仮説検定には2種類の誤りがある。
• 理想的な仮説検定は第1種の誤りと第2種の誤りがともに小さ
くなるような検定であるが、これらを同時に成り立たせることは
難しい。
• 通常は第1種の誤りを0.05などの一定の小さな値(有意水準
という)以下におさえた検定をおこなう。これはH0を否定(棄却)
する強い証拠がない限り、H0を採択するということである。
c) 仮説検定の手順
仮説検定は次のような手順をとる。
• K予備校の直前講習会の例では、100人の標本平均 x の分
布は中心極限定理により、平均μ、分散σ2 /nの正規分布にし
たがう。
• これを標準化した
x
z

n
は標準正規分布にしたがうので、これが仮説検定に適当な統
計量である。
x
(母分散が未知の場合は t  s n  1 が自由度n-1のt分布にし
たがうことを使う)
• 仮説検定では、まず検定仮説が正しいと思ってみる。もし、
σ=10だったら、
z=(70-53)/10=1.7 となる。これは標本分布の95%の範囲内で
ある。⇒ 検定仮説を採択
反対に標本分布の95%の範囲を超えたら対立仮説を採択す
る。→ 他の母集団から得られた標本と考える。
5
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
100
95
90
85
80
75
70
65
60
55
50
45
40
35
30
25
20
→
-2.5
標準化
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-3
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
• 採択域と棄却域は次のように設定される。
両側検定
棄却域
採択域
棄却域
片側検定
採択域
棄却域
• 判定の境界値はそれぞれの統計量の分布による。(統計量
の分布が標準正規分布で両側検定の場合は、-1.96と1.96
の間に入れば採択域、それ以外が棄却域となる)