第2章 確率と確率分布

第4章 統計的検定
(その2)
統計学 2006年度
Ⅰ 仮説検定の考え方
a) 仮説の設定
1) 検定仮説、対立仮説
2) 片側検定、両側検定
(その1)
b) 2種類の誤り
c) 仮説検定の手順
Ⅱ 1つの標本にもとづく検定
a) 母平均の検定
1) 母分散が既知の場合
2) 母分散が未知の場合
Ⅲ 2つの標本にもとづく検定
a) 母平均の差の検定
b) 母比率の差の検定
(その2)
Ⅱ 1つの標本にもとづく検定
a) 母平均の検定
1) 母分散が既知の場合
次のような問題を考える。
(例) ある工場では直径5mmのねじを標準偏差0.04mmにお
さまるような管理体制で製造している。製造機械の劣化に
よって、品質に変化が生じたかどうかを検討するために、9本
を標本として選んだところ、その平均が4.97mmであった。こ
れは品質管理上異常なしと考えて良いだろうか。
この問題に答えるためには仮説検定が必要となる。仮説検
定は次のような手順をとる。
この手順にしたがって、この例を考えてみる。
1.仮説の設定
この例の場合、 「品質管理上異常がない」か、「品質管理上異常がある」
かを検定する。
検定仮説としては「品質管理上異常がない」という仮説を用いる。このと
き対立仮説は「品質管理上異常がある」という仮説となり、
H0: μ=5 vs. H1: μ≠5
と表すことができる。この場合、対立仮説は検定仮説の両側をとる(「異
常がある」には、大きすぎると小さすぎるの両方が含まれ、「異常がない」
という検定仮説の両側の範囲をとる)。
※1 検定仮説と対立仮説を逆にし、 H0: μ≠5 vs. H1: μ =5 とすることも考えられ
る。しかし、採択域と棄却域を構成する場合、検定仮説が正しいとみなして構成
するため、検定仮説はある範囲(複合仮説)より、1つの数値(単純仮説)であること
の方が望ましい。
※2 「ねじがねじ穴に入るかどうか」を検定するなら、「ねじ穴に入る」という検定
仮説と、「ねじ穴に入らない」という対立仮説が考えられる。すなわち、 H0: μ≦5
vs. H1: μ > 5 とすることである。
2.検定統計量
この例では母分散が分かっているので、標本平均 x を用いて、
z
x
 n
を考えると、これは標準正規分布にしたがう。
3.採択域と棄却域
検定仮説が正しいと仮定する。このとき、標本平均をもとに計算したzが0
から大きく離れていたならばこの仮定は誤りだったと考える。
zがここだったら検
定仮説が正しいが
5
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
-0.5
-1
-1.5
-2
-2.5
-3
0.45
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
zがここだったら検定仮
説は誤りで、 このような分布が正し
いと考える。
この場合、zは標準正規分布にしたがうので、有意水準5%†の仮説検定
をおこなうなら、
 1.96  z  1.96 のとき検定仮説を採択し、
z  1.96 または z  1.96 のとき対立仮説を採択する。
棄却域
-1.96
採択域
1.96
棄却域
† 検定仮説が正しいなら、z>1.96またはz<-1.96となるような x が選ばれる確率は
5%である。これは第1種の誤りの確率すなわち有意水準が5%であることを意味
している。
4.統計量の計算
検定仮説が正しいとみなして(μに5を入れて)統計量を計算すると
x
4.97  5
z

 2.25
 n 0.04 9
となる。よって z  1.96 なので棄却域に入り、検定仮説を棄却し、対立
仮説を採択する。
2) 母分散が未知の場合
母分散が未知の場合は、zの代わりに
t
x
s n 1
を考え、こ
れが自由度n-1のt分布にしたがうことを用いて仮説検定をお
こなう。
次のような問題を考える。
(例) ある科目の試験を、平均点70点となるように作成したい。
そこで、26人をサンプルとして選び、問題をといてもらったと
ころ、26人の平均点は60点、分散が625であった。試験の問
題作りは成功したといえるだろうか。
(解)
1.仮説の設定 「平均点が70点である」という仮説を、「平均点が70点でな
い」という仮説に対して検定するので、 H0: μ=70 vs. H1: μ≠70 という仮
説を設定する。
2.検定統計量 標本平均 x を用いて、
x
t
s n 1
を考えると、これは自由度n-1のt分布にしたがう。
3.採択域と棄却域 検定仮説が正しいと仮定する。このとき、標本平均をも
とに計算したtが0から大きく離れていたならばこの仮定は誤りだったと考
える。tは自由度26-1=25のt分布にしたがうので、t0.95=2.060でる。有意
水準5%の仮説検定をおこなうなら、 2.060  t  2.060 のとき検定仮説
を採択し、t  2.060 または t  2.060 のとき対立仮説を採択する。
4.統計量の計算
x 
60  70
t

 2
s n  1 25 26  1
となる。  2.060  t  2.060 なので検定仮説をを採択する。よって問題
作りは成功したといえる。
b) 母比率の検定
• 母比率の検定では、 z 
ことを利用する。
pˆ  p
が標準正規分布にしたがう
pq n
(例) 2006年6月18日(日)に放送された「FIFAワールドカップ
日本×クロアチア」では、視聴率が52.7%(関東地区 600世
帯を対象)であった。この結果から、50%を超えたといえるで
あろうか。
(解)
1.仮説の設定 H0: p=0.5 vs. H1: p>0.5 という仮説を設定する。「50%を
超えない」という検定仮説に対し、「50%を超えた」という対立仮説を検定
するので、 H0: p≦0.5 vs. H1: p>0.5 であるが、検定仮説は対立仮説に
最も近い1点を考えれば良い。(0.5で成り立てば、それより小さな値では
必ず成り立つ)
2.検定統計量 標本比率 p̂ を用いて、
z
pˆ  p
pq n
を考えると、これは標準正規分布にしたがう。
3.採択域と棄却域 zは標準正規分布にしたがうので、有意水準5%の仮説
検定を片側検定でおこなうなら、 z  1.64 のとき検定仮説を採択し、z  1.64
のとき対立仮説を採択する。
4.統計量の計算
z
pˆ  p
0.527 0.5

 1.323
pq n
(0.5  0.5) 600
となる。 z  1.96 なので検定仮説をを採択する。よってこの番組の視聴
率は50%を超えたとはいえない。