確率・統計Ⅰ

確率・統計Ⅱ
第7回
カイ二乗検定(1)
1. 適合度検定
2. 独立性検定
適合度検定とは
例題: 1つのサイコロを120回投げたとこ
ろ、1の目が27回出た。このサイコロ
は正常か。危険率5%で検定せよ。
まず比率の検定として解いてみる。
帰無仮説 H0 : 母比率 p = 1/6
27
標本比率 x 
 0.225
120
帰無仮説 H0 : 母比率 p = 1/6
27
標本比率 x 
 0.225
120
Z
xp
0.225 1 / 6 7 6


10
1/ 6  5 / 6
p(1  p)
120
n
=1.71…
< 1.96
Z = 1.71 < z0.025=1.96 だから
(両側検定; 対立仮説 H1 : p ≠ 1/6 )
H0 は棄却できない。
すなわち、正常でないとはいえない。
適合度検定とは
例題: 1つのサイコロを120回投げたとこ
ろ、各目の出た回数は次のとおりで
あった。このサイコロは正常か。危険
率5%で検定せよ。
1の目 2の目 3の目 4の目 5の目 6の目
27
12
14
28
24
15
計
120
適合度検定とは
母集団 E が k 個のグループ E1, E2, …, Ek
から成っているとする:
E = E1 + E2 + … + Ek
それぞれの比率(確率)は p1, p2, …, pk とする。
大きさ n の標本を抽出したとき、それぞれの
グループに属するものの個数が x1, x2, …, xk
であったとする。
適合度検定とは
グループ
実現度数
期待度数
定理:
E1
x1
np 1
E2
x2
np 2
…
…
( xi  npi )
 
npi
i 1
k
Ek
xk
np k
…
計
2
2
は、自由度 k-1 のカイ二乗分布に従う。
n
n
適合度検定とは
もっと標語的に書くと:
(実現度数 期待度数)
 
の和
期待度数
2
2
χ2の値がχ20.05 (自由度k-1のカイ二乗分布の
右側5%点)より大なら、有意水準5%で仮説
(p1, p2, …, pk)を棄却する。
適合度検定とは
例題: 1つのサイコロを120回投げたとこ
ろ、各目の出た回数は次のとおりで
あった。このサイコロは正常か。危険
率5%で検定せよ。
1の目 2の目 3の目 4の目 5の目 6の目
27
12
14
28
24
15
計
120
適合度検定とは
1の目 2の目 3の目 4の目 5の目 6の目
27
12
14
28
24
15
20
20
20
20
20
20
計
120
120
サイコロを正常と仮定した場合の期待度数
7 (8) (6) 8 4 (5)
  

  
20 20
20 20 20 20
2
2
2
2
2
2
2
適合度検定とは
7 (8) (6) 8 4 (5)
  

  
20 20
20 20 20 20
2
2
2
2
2
2
254

 12.7
20
自由度5のカイ二乗分布の5%点 χ20.05 = 11.07
これより大きいから、仮説は棄却できる。
(サイコロは正常でない)
2
カイ二乗分布のパーセント点
2
1
2
3
4
5
6
7
8
9
0.00
0.05
0.22
0.48
0.83
1.24
1.69
2.18
2.70
0.00
0.10
0.35
0.71
1.15
1.64
2.17
2.73
3.33
3.84
5.99
7.81
9.49
11.07
12.59
14.07
15.51
16.92
5.02
7.38
9.35
11.14
12.83
14.45
16.01
17.53
19.02
…
0.025
…
χ
…
0.050
…
χ
2
…
自由度 n χ20.975 χ2 0.950
自由度5のカイ二乗分布
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0.0
2.0
4.0
6.0
8.0
10.0
12.0
右側5%点
14.0
実現値
適合度検定と比率検定の関係
例題: 1つのサイコロを120回投げたとこ
ろ、1の目の出た回数は次のとおりで
あった。このサイコロは正常か。危険
率5%で検定せよ。
1の目 他の目
27
93
計
120
適合度検定と比率検定の関係
1の目 他の目
27
93
期待度数
20
計
120
100
120
カイ二乗検定で計算すると
7 (7) 7  6
  

 2.94
20 100
100
2
2
2
2
適合度検定と比率検定の関係
7 (7) 7  6
  

 2.94
20 100
100
2
2
2
2
自由度 1のカイ二乗分布の5%点 χ20.05 = 3.84
これより小さいから、仮説は棄却できない。
(サイコロは正常でないとはいえない)
自由度1のカイ二乗分布
1.4
1.2
1
0.8
0.6
0.4
0.2
0
0.0
2.0
実現値
4.0
右側5%点
6.0
8.0
適合度検定と比率検定の関係
7 6
Z
 1.71 < z0.05 = 1.96
10
7 6
2
<
(自由度1)
χ
 
 2.94
0.05 = 3.84
100
2
2
上の式を2乗すると下の式になっている。
1.962 = 3.84
適合度検定と比率検定の関係
一般に、自由度1の場合の適合度検定
は、比率の検定(大標本の場合の両側
検定)とまったく同じになる。
すなわち、カイ二乗検定(適合度検定)
は比率の検定の拡張と考えられ、自由
度が2以上の場合にも使えて便利。
[演習]適合度検定
[1] ある問題について400人にアンケー
トをとったところ、賛成222人、反対178
人だった。この問題について世論は
賛成多数といえるか、有意水準5%で
検定せよ。
[演習]適合度検定
[2] 240人に支持政党を尋ねたところ、
自由党90人、共和党85人、公民党65
人であった。これらの政党の支持率に
差があるといってよいか。危険率5%
で検定せよ。
[演習]適合度検定
[3] 前回の投票結果では、自由党・共和
党・公民党の支持率は7:8:5であった。
今回100人調査したところ、自由党35
人、共和党30人、公民党35人であっ
た。これらの政党の支持率は前回か
ら変化したといってよいか。危険率5%
で検定せよ。
[演習]適合度検定
[4] 硬貨を投げたところ、続けて8回表が
出た。この硬貨は正常といってよいか。
メニューに戻る
メニューへ