確率と統計 平成21年12月3日(木) いろいろな検定 今日は、前回の知識を元に幾つかの代表的かつ実 用的な検定方法を紹介します。 覚えて、どんどん使ってみましょう! その前に連絡事項を2つ... 1. 2. 来週12月10日は休講です。 1月15日1限に補講があります。 (台風で大学全体が休校になった日の分) 適合性の検定 問題:メンデルの遺伝法則によれば、ある交配の 結果は赤、黒、白の割合が 9:3:4 になるという。 実験でそれぞれの色が70個、36個、38個得ら れたとする。この実験結果は、メンデルの遺伝法 則に当てはまっているか? χ2検定 適用分野:適合性の検定 方法: 1. 2. 3. 4. 5. 6. 仮説H0の設定 有意水準の設定 (以下、5%とする) 自由度φの計算 (φ = n-1 ) χ2分布の表からχ20を求める。 χ2=Σ{ (測定値 - 理論値)2/ 理論値 } を計算 χ2 > χ20 ならば、仮説をH0棄却する。 χ2検定 適用分野:適合性の検定 方法: 1. 2. 3. 4. 5. 6. 仮説H0の設定 有意水準の設定 (以下、5%とする) 自由度φの計算 (φ = n-1 ) χ2分布の表(教科書298頁)からχ20を求める。 χ2=Σ{ (測定値 - 理論値)2/ 理論値 } を計算 χ2 > χ20 ならば、仮説をH0棄却する。 もっと分かりやすい例での説明 サイコロの例 問題:1つのサイコロを60回振った結果が、以下のように なった。このサイコロは正しく作られているか? 目 1 2 3 実験値 15 7 4 11 理論値 4 5 6 計 6 17 60 サイコロの例 問題:1つのサイコロを60回振った結果が、以下のように なった。このサイコロは正しく作られているか? 仮説H0:各目の出る確率は1/6 目 1 2 3 4 実験値 15 7 4 11 5 6 計 6 17 60 理論値 10 10 10 10 10 10 60 自由度φ= 6 – 1 = 5 有意水準5% χ2分布表の見方 いま、 自由度φ= 6 – 1 = 5 有意水準5% したがって、…(黒板で説明) χ20 = 11.07 χ2 = (15-10)2/10 + (7-10)2/10 + (4-10)2/10 + (11-10)2/10 + (6-10)2/10 + (17-10)2/10 = 13.6 目 1 実験値 15 7 4 11 6 17 60 理論値 10 10 10 10 10 10 60 2 3 4 5 6 計 χ2 = 13.6 > 11.07 => 仮説は棄却する。 結論: 正しく作られていない。 同じ考えでやってみよう! 検定対象: メンデルの法則は本当に成り立つのか? 適合度の検定(再) 問題:メンデルの遺伝法則によれば、ある交配の 結果は赤、黒、白の割合が 9:3:4 になるという。 実験でそれぞれの色が70個、36個、38個得ら れたとする。この実験結果は、メンデルの遺伝法 則に当てはまっているか? 赤 黒 白 合計 理論値比 9 3 4 16 測定値x 70 36 38 144 理論値e (X-e)2 / e 144 *9/16 144*3 / 16 144*4 / 16 144 =81 =27 =36 121 / 81 81 / 27 4 / 36 4.60 自由度φ=3 ー 1=2 有意水準5% χ2分布の表(教科書p.298)より、 χ2=4.60 < χ20= 5.99 結論:仮説は棄却されない。 (メンデルの法則が成り立たつことを疑う理由は ない。) 統計の例(これを検定してみよう!) タバコと肺がん 肺がん患者 喫煙者 60 非喫煙者 3 正 常 32 11 肺ガン患者 正常 合計 喫煙者 60 32 92 非喫煙者 3 11 14 合計 63 43 106 肺ガン患者 正常 合計 測定値 喫煙者 60 63*92/106 32 43*92/106 92 非喫煙者 3 63*14/106 11 43*14/106 14 理論値 63 43 106 合計 2×2の表の場合には自由度は常にφ=1 χ20 = 3.84 肺カン患者 正常 合計 喫煙 者 A B A+B (A+C)*(A+B)/F (B+D)*(A+B)/F 非喫 煙者 C D C+D (A+C)*(C+D)/F (B+D)*(C+D)/F 合計 A+C B+D A+B+C+D =F χ2 = (A ー(A+C)*(A+B)/F)2 / {(A+C)*(A+B)/F)} +… ( A B C D)( AD BC ) ( A B)( A C )( B D)(C D) 2 2 χ2 =9.66 > χ20 = 3.84 => 結果:棄却 他の測定値 検定してみよう! 重度の 喫煙者 非喫煙者 合計 患者 30 70 100 非患者 54 84 246 316 300 400 以上の表の解析は、分割表の検定ともいう
© Copyright 2024 ExpyDoc