応用統計学第6回

第6回 適合度の検定
教科書p122~141
問題例1
サイコロを60回振って、各目の出た度数は次の通りであった。
目の出方は一様と考えてよいか。
サイコロの目(i)
1
2
3
4
5
6
観測度数:実験値(Oi) 18
8
11
7
9
7
帰無仮説:サイコロの目は一様に出る
=>それぞれの目の出る確率piは1/6
H0:p1=・・・=μ6=1/6
サイコロの目
1
期待値:60回中(Ei) 10
2
10
対立仮説:サイコロは歪んでいる
H1:p1 ≠ ・・・ ≠ p6
有意水準5%で検定
3
10
4
10
5
10
6
10
計数値の分布
T
T:計測時間
X:計測数
T
時間
2項分布
m=np
σ2=np(1-p)
n:大
p:小
ポアソン分布
e m m x
P ( x; m ) 
x!
<x>=m
<(x-m)2>=m
サイコロの目(i)
1
観測度数:実験値(Oi) 18
期待値:60回中(Ei) 10
2
8
10
3
11
10
4
7
10
5
9
10
6
7
10
期待値からのズレ具合?
n

i 1
Oi  Ei 
2
Ei
x
自由度n-1のχ2(カイ2ジョウ)分布
 x x 
1
f x; m  
e 2  
m
2
2 
2
1
m;自由度
m
1
2
; 0  x   
χ2(カイ2ジョウ)分布
zi:標準正規分布
x  z1  z2    zn
2
2
1
f x; m  
e
m
2 
2
1
 x
2
2
 x
 
2
m
1
2
; 0  x   
n

i 1
Oi  Ei 2
Ei
サイコロの目(i)
度数:実験値(Oi)
期待値:60回中(Ei)
Oi-Ei
(Oi-Ei)^2/Ei
x
1
18
10
8
6.4
自由度df=5
2
8
10
-2
0.4
3
11
10
1
0.1
4
7
10
-3
0.9
5
9
10
-1
0.1
6
7
10
-3
0.9
8.8
x=χ2=8.8
χ2α=5%=11.07
χ2=8.8
πx≧8.8>α
帰無仮説を棄却できない
問題例2
ある臓器の癌の症例をその組織型(A1,A2,A3)と主たる
転移巣(B1,B2,B3)によって分類した。癌の種類と転移巣
の間に一定の傾向があると判断してよいか。
A1
A2
A3
計
B1
20
21
9
50
B2
7
15
8
30
B3
3
4
13
20
計
30
40
30
100
帰無仮説:癌の種類と転移巣の間に一定の傾向はない
H0:周辺度数にのみ従うイベント
対立仮説:癌の種類と転移巣の間に一定の傾向がある
H1:周辺度数にのみ従うイベントとは言えない
有意水準5%で検定
l×m分割表
A1
A2
・
・
Al
計
B1
O11
O21
・
・
Ol1
C1
B2
O12
O22
・
Oij
・
・・・
・・・
・・・
・・・
・・・
・・・
Bm
O1m
O2m
・
・
Olm
Cm
計
R1
Oij:観測データ
Rl
N
H0:要因A、要因Bが互いに無関係ならば、周辺度数(要因の計)のみに依存する。
A1
A2
・
・
Al
計
B1
E11
E21
・
・
El1
C1
B2
E12
E22
・
Eij
・
・・・
・・・
・・・
・・・
・・・
・・・
Bm
E1m
E2m
・
・
Elm
Cm
計
R1
期待値: Eij= Ri ×Cj
N
m
l
  
2
Rl
N
j 1 i 1
O
ij
 Eij 
2
E ij
自由度df=(l-1)(m-1)
A1
A2
A3
計
B1
20
21
9
50
B2
7
15
8
30
B3
3
4
13
20
計
30
40
30
100
B1
15
20
15
50
A1
A2
A3
計
m
B2
9
12
9
30
l
  
2
j 1 i 1
O
ij
 Eij
E ij
B3
6
8
6
20

計
30
40
30
100
2
 17.0889
自由度df=(l-1)(m-1)=(3-1)(3-1)=4
χ2α=5%=9.488
χ2=17.09
πx≧17.09<α
帰無仮説を棄却
問題例3
ある疾患には小児型と成人型があるという、その疾患を持つ患者
にある抗体反応テストをし、陽性か陰性を調べたものである。
小児型
成人型
計
陽性
6
2
8
陰性
10
22
32
計
16
24
40
小児型と成人型で抗体反応に差があるといってよいか。有意水準5%
イベント数が少ない
陽性
陰性
計
小児型
3.2
12.8
16
期待度数の分散が大きめになる
成人型
4.8
19.2
24
期待度数に5以下がある場合
計
8
32
40
期待値:
Eij= Ri ×Cj
N
Fisherの直接確率計算法
Fisherの直接確率計算法
A1
A2
計
B1
a
c
C1
計
R1
R2
N
B2
b
d
C2
① 小児型 成人型
陽性
6
2
陰性
10
22
計
16
24
計
8
32
40
この結果になる確率p
C 1! C 2 !

C !C ! R ! R !
C1 Ca C2 Cb
p
 a!c! b!d!  1 2 1 2
N!
N!a!b!c!d!
N C R1
R1! R2!
② 小児型 成人型
陽性
7
1
陰性
9
23
計
16
24
計
8
32
40
③ 小児型 成人型
陽性
8
0
陰性
8
24
計
16
24
計
8
32
40
まれな結果
16!24!8!32!
p1 
 0.0287
40!6!2!10!22!
p2 
16!24!8!32!
 0.0036
40!7!1!9!23!
16!24!8!32!
p3 
 0.0002
40!8!0!8!24!
上側確率p=p1+p2+p3=0.0287+0.0036+0.0002=0.0325
πEi≦5<α
帰無仮説を棄却
演習6.1
日本のある年の人口の年齢構成比が分かっている。ある調査のために2000名
を無作為に選び、年齢区分毎の人数を調べた。
年齢構成比に偏りがないといえるか。有意水準5%で検定しなさい。
演習6.2
ある症状を持つ患者の生年月日の季節的分布を見たところ
春
夏
秋
冬
度数
3
8
16
4
であった。その症状発生に季節的な偏りがあるといえるか。
有意水準5%で検定しなさい。
演習6.3
ある病気を持つ患者140名を無作為に2群に分け、A,B2種の方法で治療した。
一定期間後の生存・死亡数を比較した。
A
B
生存
48
24
死亡
32
36
治療法により生存率が異なるといえるか。有意水準5%で検定しなさい。