1章 データの整理

6章 仮説検定の基礎
6.4成功率の検定
■二項確率関数による検定
[例4] 横断歩道の自動式信号
時間の 2 割 青信号
しかしタイミング良く渡れることが多い
10 回の記録
6 回は待たずに渡れた
検定問題:
[単なる偶然変動] 渡れる確率 0.2(= p0)
か? (H0 : p = p0)
[センサー付き信号] それとも 0.2 を超え
ているか?(H1 : p0 < p)
使用する性質
待たずに渡れる回数 = X
仮説 Ho の下で
X ~ 二項分布(試行回数 n = 10,
成功の確率 p = 0.2)
観測値 x = 6 のような(対立仮説 H1 の方
向への)乖離が起きる確率を計算可能。
二項分布(n = 10, po = 0.2 )
p(x)
30%
0.3
27%
20%
0.2
確率合計 = 有意水準(P値)
11%
0.00%
0.00%
0.01%
0.08%
3%
0.55%
9%
0.1
x
0
0
1
2
3
4
5
6
7
8
9
10
求める確率(有意水準、P値)
二項分布(テキスト p.276 表)
P  6 ≦ X | n  10, p  0.2
 1  P  X ≦ 5 | n  10, p  0.2
≒ 1  0 .994
1
 0.006≒
167
(統計的)結論
仮説(Ho : p = po)が正しいとすれば、
標本のように大きな値が出現する確率は
0.6 %(167回に1回)。
(偶然変動として)稀な事象
⇒ この結果は有意(偶然変動ではない)。
よってその信号には「横断者を検知する機
能がある」と考えた方が良いだろう。
■標準正規近似による検定
[例5]
NO
40%
YES
60%
ある法律の制定
ある政治家の主張
『有権者の 60% の支持がある』
n = 400 人の有権者の無作為標本
有意水準 5% で、この政治家の主張を
「否定」するには、支持者の標本割合 pˆ が
どのくらい小さいことが必要か?
仮説
H0: p = 0.6 (= p0)
対立仮説 H1: p < 0.6
二項分布(n = 400, p = 0.6) の正規近似


pˆ ~ 正規分布 平均 p, 分散  2pˆ  pq / n
を用いて
有意水準 5% の
左片側検定を行う。
← 左 5%
0.02
二項分布(n = 400, po= 0.6 )
と
その正規近似
0.04
0.03
0.01
^
p
0
0.7
0.69
0.68
0.67
0.66
0.65
0.64
0.63
0.62
0.61
0.6
0.59
0.58
0.57
0.56
0.55
0.54
0.53
0.52
0.51
0.5
1) 標準正規分布表より
左片側 5 % 点は z0 ≒ –1.65 (1.645)
2) よって、仮説 p = p0 (= 0.6) の下で


pˆ  po
P Z 
≦ 1.65
 pˆ




pˆ  0.6
 P
≦ 1.65
 0.61  0.6  / 400

≒ 0.05
3) 有意水準(P値) 5% となる標本割合 pˆ
の範囲(棄却域)
ˆ ≦ 0.6  1.65 0.61  0.6 / 400≒0.56
p
結論
400人の調査における支持者の割合が
0.56(56%)以下であれば、
「仮説: p = 0.6」は有意水準 5% で棄却さ
れ、政治家の主張は否定される。
6.5 成功率の差の検定
0
[例6]
GROUP 1
GROUP 2
50
100
150
152
132
200
48
68
船酔い薬 銘柄 A 銘柄 B
200人×2グループの船員
船酔いしなかった人数
GROUP 1 : 152人、GROUP 2: 132人
検定問題: 船酔いしない確率 p1 = p2 ?
使用する性質 2つの正規変量の差
ˆp1 ~ 正規分布 平均 p1 , 分散  2pˆ 1  p1q1 / n1
pˆ 2

~ 正規分布平均 p , 分散 
かつ独立なら
2
2
pˆ 2
 p2 q 2

/n 
2

ˆp1  pˆ 2 ~ 正規分布 平均 p1  p2 , 分散  2pˆ 1   2pˆ 2
仮説
H0: p1 – p2 = 0
対立仮説 H1: p1 – p2 ≠ 0
仮説の下で

ˆp1  p
ˆ 2 ~ 正規分布 平均 0, 分散  2pˆ 1   2pˆ 2


分散 
2
pˆ 1

2
pˆ 2
p1q1 p2 q2


n1
n2
仮説 p1  p2  p の下で
分散 
標本値
2
pˆ 1

2
pˆ 2
1 1 
    pq
 n1 n2 
x1 152
x 2 132
pˆ 1 

, pˆ 2 

n1 200
n2 200
20
pˆ 1  pˆ 2 
 0.1
200
x1  x 2 284
pˆ 

 0.71
n1  n2 400
大標本法を使って p  pˆ とすると
 pˆ  pˆ
1
2
1 
 1
 

0.711  0.71 ≒ 0.045
 200 200 
よって標本のような乖離が起きる確率は、
標準正規分布を用いて


pˆ 1  pˆ 2
0 .1
P Z 
≧z 
 2.22 
 pˆ 1  pˆ 2
0.045


1
≒ 0.0132 2  0.0264≒
38
←2.5%
2.5%→
5%→ 1%→
n(0, 1)
←1% ←5%
Z
-4
-3
-2
-1
0
1
2
2.33
2.22
1.96
1.64
-1.64
-1.96
-2.33
=z
3
4
(統計的)結論
仮説(Ho : p1 = p2)が正しいとすれば、
標本のように大きな値が出現する確率は
2.6 %(38回に1回)。
(偶然変動として)やや稀な事象
よって船酔薬銘柄 A, B が「同じ効き目を持
つ」という仮説は、疑わしくなる。(より
明確に差があることを示したければ、さら
に実験を行ってデータを集める)