確率と統計

確率と統計
平成21年12月3日(木)
いろいろな検定


今日は、前回の知識を元に幾つかの代表的かつ実
用的な検定方法を紹介します。
覚えて、どんどん使ってみましょう!
その前に連絡事項を2つ...
1.
2.
来週12月10日は休講です。
1月15日1限に補講があります。
(台風で大学全体が休校になった日の分)
適合性の検定
問題:メンデルの遺伝法則によれば、ある交配の
結果は赤、黒、白の割合が 9:3:4 になるという。
実験でそれぞれの色が70個、36個、38個得ら
れたとする。この実験結果は、メンデルの遺伝法
則に当てはまっているか?
χ2検定


適用分野:適合性の検定
方法:
1.
2.
3.
4.
5.
6.
仮説H0の設定
有意水準の設定 (以下、5%とする)
自由度φの計算 (φ = n-1 )
χ2分布の表からχ20を求める。
χ2=Σ{ (測定値 - 理論値)2/ 理論値 } を計算
χ2 > χ20 ならば、仮説をH0棄却する。
χ2検定


適用分野:適合性の検定
方法:
1.
2.
3.
4.
5.
6.
仮説H0の設定
有意水準の設定 (以下、5%とする)
自由度φの計算 (φ = n-1 )
χ2分布の表(教科書298頁)からχ20を求める。
χ2=Σ{ (測定値 - 理論値)2/ 理論値 } を計算
χ2 > χ20 ならば、仮説をH0棄却する。
もっと分かりやすい例での説明
サイコロの例
問題:1つのサイコロを60回振った結果が、以下のように
なった。このサイコロは正しく作られているか?
目
1
2
3
実験値 15
7
4 11
理論値
4
5
6
計
6 17 60
サイコロの例
問題:1つのサイコロを60回振った結果が、以下のように
なった。このサイコロは正しく作られているか?
仮説H0:各目の出る確率は1/6
目
1
2
3
4
実験値 15
7
4 11
5
6 計
6 17 60
理論値 10 10 10 10 10 10 60
自由度φ= 6 – 1 = 5
有意水準5%
χ2分布表の見方

いま、
自由度φ= 6 – 1 = 5


有意水準5%
したがって、…(黒板で説明)
χ20 = 11.07

χ2 = (15-10)2/10 + (7-10)2/10 + (4-10)2/10
+ (11-10)2/10 + (6-10)2/10 + (17-10)2/10
= 13.6
目
1
実験値
15
7
4
11
6
17
60
理論値
10
10
10
10
10
10
60
2
3
4
5
6
計
χ2 = 13.6 > 11.07 => 仮説は棄却する。
結論: 正しく作られていない。
同じ考えでやってみよう!

検定対象:
メンデルの法則は本当に成り立つのか?
適合度の検定(再)
問題:メンデルの遺伝法則によれば、ある交配の
結果は赤、黒、白の割合が 9:3:4 になるという。
実験でそれぞれの色が70個、36個、38個得ら
れたとする。この実験結果は、メンデルの遺伝法
則に当てはまっているか?
赤
黒
白
合計
理論値比
9
3
4
16
測定値x
70
36
38
144
理論値e
(X-e)2 / e
144 *9/16 144*3 / 16 144*4 / 16 144
=81
=27
=36
121 / 81
81 / 27
4 / 36
4.60




自由度φ=3 ー 1=2
有意水準5%
χ2分布の表(教科書p.298)より、
χ2=4.60 < χ20= 5.99
結論:仮説は棄却されない。
(メンデルの法則が成り立たつことを疑う理由は
ない。)
統計の例(これを検定してみよう!)
タバコと肺がん
肺がん患者
喫煙者
60
非喫煙者
3
正 常
32
11
肺ガン患者
正常
合計
喫煙者
60
32
92
非喫煙者
3
11
14
合計
63
43
106
肺ガン患者
正常
合計
測定値
喫煙者
60
63*92/106
32
43*92/106
92
非喫煙者
3
63*14/106
11
43*14/106
14
理論値
63
43
106
合計
2×2の表の場合には自由度は常にφ=1
χ20 = 3.84
肺カン患者
正常
合計
喫煙
者
A
B
A+B
(A+C)*(A+B)/F (B+D)*(A+B)/F
非喫
煙者
C
D
C+D
(A+C)*(C+D)/F (B+D)*(C+D)/F
合計
A+C
B+D
A+B+C+D
=F

χ2 = (A ー(A+C)*(A+B)/F)2
/ {(A+C)*(A+B)/F)}
+…
( A  B  C  D)( AD  BC )
 
( A  B)( A  C )( B  D)(C  D)
2
2
χ2 =9.66 > χ20 = 3.84 => 結果:棄却
他の測定値

検定してみよう!
重度の
喫煙者
非喫煙者 合計
患者
30
70
100
非患者
54
84
246
316
300
400
以上の表の解析は、分割表の検定ともいう