寄り道1 タイプが同じならば、 同一人物由来の試料なのか? 法数学勉強会 2012/03/24 京都大学 医学研究科 統計遺伝学分野 山田 タイプが同じならば、 同一人物由来の試料なのか? • 「同一タイプ」の人がこの世に1人ならば、「同 一人物」と判定される • 「同一タイプ」の人がこの世に複数いれば、 「同一人物」と判定するのは、確率的になる 消しゴム事件 • ある小学校では、すべての男子生徒300人 に「消しゴム屋」さんから1個ずつ消しゴムが 配られた – 「ナルト」柄が50個、「ワンピース」柄が100個、 「ドラえもん」柄が150個 ある日、音楽室で • 1個の消しゴムの落し物が発見された • 「ナルト」柄だった(50個/300個) らぶ 「ほなみたまちゃん♥」 • その消しゴムには – 「ほなみたまちゃん♥」と書かれていた! • さあ、この消しゴムは誰のものか? – 女子児童たちの捜査が始まった • 「消しゴム屋さん、『ナルト』柄の消しゴムを 配った男子のリストを出しなさいよー」 – リストが得られれば、『ナルト』所有者50名に絞ら れる – 50名は、1/50の確率で「たまちゃん♥」 • 「消しゴム屋さん、『ナルト』柄の消しゴムを 配った男子のリストを出しなさいよー」 – 「あいにく、個人情報保護法の規定により、リスト をお出しすることはできません」 • 「消しゴム屋さん、『ナルト』柄の消しゴムを 配った男子のリストを出しなさいよー」 – 「あいにく、個人情報保護法の規定により、リスト をお出しすることはできません」 – 「特定の児童さんを指名していただけば、その児 童さんにどのタイプを渡したかはお答えできます」 「たまちゃん♥」の『犯人』って誰だと思う? 「やっぱり、同じクラスの男子?」 「クラブが一緒?」 「委員会つながりかも?」 「以前に同じクラスだった・・・とか」 「帰り道が一緒だからだったりして」 「事前確率なんて考えるのはやめなさい」 「下手な考え、休むに似たりって言うじゃない」 「そうとも、限らないのだが…」 音楽の先生 曰く • 「音楽室はいつも鍵がかかっていて、鍵は私 しか持っていないから、その日、音楽室に出 入りできた児童は、その日に音楽の授業が あったクラスの子、だけよ」 • 「その日、音楽の授業があったのは、3クラス、 120人のうち、男子は、60人」 • 「300人のうち、60人」 • 「その日、音楽の授業があったのは、3クラス、 120人のうち、男子は、60人」 • 「音楽の授業は、300人のうち、60人」 • 「『ナルト』柄は、300人のうち、50人」 • 「じゃあ、音楽のあったクラスで、『ナルト』消し ゴムを持っていたのは何人?」 • 「その日、音楽の授業があったのは、3クラス、 120人のうち、男子は、60人」 • 「音楽の授業は、300人のうち、60人」 • 「『ナルト』柄は、300人のうち、50人」 • 「じゃあ、音楽のあったクラスで、『ナルト』消し ゴムを持っていたのは何人?」 • 60x50/300 =10人 くらいね! • 「あいにく、個人情報保護法の規定により、リ ストをお出しすることはできません」 • 「特定の児童さんを指名していただけば、そ の児童さんにどのタイプを渡したかはお答え できます」 • 「あいにく、個人情報保護法の規定により、リ ストをお出しすることはできません」 • 「特定の児童さんを指名していただけば、そ の児童さんにどのタイプを渡したかはお答え できます」 絶対 花輪君のを教えてもらうわ 誰も文句ないわよね! 「花輪君ですね、花輪君は、『ナルト』柄でした」 「花輪君ですね、花輪君は、『ナルト』柄でした」 • 「花輪君以外の男子(59人)が、『ナルト』 柄である確率は 50/300 = 1/6→49/299」 • 「そのうちの誰かが、落とし主だとすると、 それが『ナルト』柄である確率は1/6」 • 「花輪君が落としたのなら、それが『ナル ト』柄である確率は 1」 • 「誰かが落としたのなら、それが『ナルト』 柄である確率は 1/6」 • 「尤度比は6」 • 「花輪君が落としたと考える方がよさそう じゃない?」 • 「花輪君以外の男子(59人)が、『ナルト』 柄である確率は 50/300 = 1/6→49/299」 • 「そのうちの誰かが、落とし主だとすると、 それが『ナルト』柄である確率は49/299」 • 「花輪君が落としたのなら、それが『ナル ト』柄である確率は 1」 • 「誰かが落としたのなら、それが『ナルト』 柄である確率は 1/6」 • 「尤度比は6」 • 「花輪君が落としたと考える方がよさそう じゃない?」 • 「花輪君以外の男子(59人)が、『ナルト』 柄である確率は 50/300 = 1/6→49/299 」 • 「そのうちの誰かが、落とし主だとすると、 それが『ナルト』柄である確率は49/299」 • 「花輪君が落としたのなら、それが『ナル ト』柄である確率は 1」 • 「誰かが落としたのなら、それが『ナルト』 柄である確率は 1/6」 • 「尤度比は6」 • 「花輪君が落としたと考える方がよさそう じゃない?」 • 「花輪君以外の男子(59人)が、『ナルト』 柄である確率は 50/300 = 1/6→49/299 」 • 「そのうちの誰かが、落とし主だとすると、 それが『ナルト』柄である確率は49/299」 • 「花輪君が落としたのなら、それが『ナル ト』柄である確率は 1」 • 「誰かが落としたのなら、それが『ナルト』 柄である確率は 49/299」 • 「尤度比は6」 • 「花輪君が落としたと考える方がよさそう じゃない?」 • 「花輪君以外の男子(59人)が、『ナルト』 柄である確率は 50/300 = 1/6→49/299 」 • 「そのうちの誰かが、落とし主だとすると、 それが『ナルト』柄である確率は1/6」 • 「花輪君が落としたのなら、それが『ナル ト』柄である確率は 1」 • 「誰かが落としたのなら、それが『ナルト』 柄である確率は 49/299」 • 「尤度比は1/(49/299) = 299/49 = 6.10」 • 「花輪君が落としたと考える方がよさそう じゃない?」 • 「花輪君以外の男子(59人)が、『ナルト』 柄である確率は 50/300 = 1/6→49/299 」 • 「そのうちの誰かが、落とし主だとすると、 それが『ナルト』柄である確率は1/6」 • 「花輪君が落としたのなら、それが『ナル ト』柄である確率は 1」 • 「誰かが落としたのなら、それが『ナルト』 柄である確率は 49/299」 • 「尤度比は1/(49/299) = 299/49 = 6.10」 • 「花輪君が落としたと考える方がよさそう じゃない?」 • 「尤度比は 6.10」 • 「花輪君が落としたと考える方がよさそうじゃ ない?」 • 「花輪君が落としたのなら、それが『ナルト』柄である確率は 1」 • 「誰かが落としたのなら、それが『ナルト』柄である確率は 49/299」 • 「尤度比は1/(49/299) = 299/49 = 6.10」 • 「候補の男子が59人もいるのに、いきなり、 『 6.10倍』っていうのは、おかしいんじゃねー か?」 • 「花輪君が落としたのなら、それが『ナルト』柄 である確率は 1」 • • • • 「誰か1が落としたのなら、それが『ナルト』柄である確率は 49/299」 「誰か2が落としたのなら、それが『ナルト』柄である確率は 49/299 」 … 「誰か59が落としたのなら、それが『ナルト』柄である確率は 49/299 」 • 「花輪君が落としたのなら、それが『ナルト』柄 である確率は 1」 • • • • 「誰か1が落としたのなら、それが『ナルト』柄である確率は 49/299」 「誰か2が落としたのなら、それが『ナルト』柄である確率は 49/299 」 … 「誰か59が落としたのなら、それが『ナルト』柄である確率は 49/299 」 • 「花輪君 vs. その他59人 は 1: 59x49/299 = 0.103 」 • 「花輪君が落としたのなら、それが『ナルト』柄 である確率は 1」 • • • • 「誰か1が落としたのなら、それが『ナルト』柄である確率は 49/299」 「誰か2が落としたのなら、それが『ナルト』柄である確率は 49/299 」 … 「誰か59が落としたのなら、それが『ナルト』柄である確率は 49/299 」 • 「花輪君 vs. その他59人 は 1: 59x49/299 = 0.103 」 • • • • 「音楽の授業は、300人のうち、60人」 「『ナルト』柄は、300人のうち、50人」 「じゃあ、音楽のあったクラスで、『ナルト』消しゴムを持っていたのは何人? 60x50/300 =10人 くらいね! • 「本当のところは、音楽授業の60人中、何人が『ナルト』柄 じゃったんかいのー」 – 1人、2人、…、50人の場合がありえる – 1人だけが『ナルト』柄で、それが花輪君なら、「たまちゃん♥」 は花輪君で確定 – 2人が『ナルト』柄なら、花輪君かもしれないし、もう1人かもし れなくて、確率は1/2 – … – k 人が『ナルト』柄で、花輪君がそのうちの1人なら、確率は1/k • 『ナルト』柄の確率 : p = 50/300 = 1/6 • 音楽50人中、k人が『ナルト』柄の確率 – Pr 𝑘 = 50!250!60!240! 300!𝑘! 50−𝑘 ! 60−𝑘 ! 190+𝑘 ! • kが大きい方が『ナルト』柄を落としやすいからその分を上 乗せして – Pr 𝑘 = 𝑘 50!250!60!240! 300!𝑘! 50−𝑘 ! 60−𝑘 ! 190+𝑘 ! • 花輪君が「たまちゃん♥」である確率 – k人の場合 1 𝑘 • Pr 𝑘 × = 50!250!60!240! 300!𝑘! 50−𝑘 ! 60−𝑘 ! 190+𝑘 ! k 50-k 50 60-k 190+k 250 60 240 300 – k=1,2,...,50の場合の合計 • 50 𝑘=1 Pr 1 𝑘 ×𝑘 • 『ナルト柄』の人数が0人の可能性は、もう、ないことがわ かっているので、その分を割り引いて考えよう – ( 50 𝑘=1 Pr 1 𝑘 𝑘 × ) /( 50 𝑘=1 Pr 𝑘 ) • p=50/300=1/6 • N=60 50! 250! 60! 240! Pr 𝑘 = 300! 𝑘! 50 − 𝑘 ! 60 − 𝑘 ! 190 + 𝑘 ! • 『ナルト』柄の人数 は、何人の可能性 が1番高いか 60x50/300 =10人 くらいね! 『ナルト』柄人数 • 『ナルト』柄の人 数は、何人の可 能性が一番高い か • 「花輪君」が犯人 だ、とみなされる 可能性は、『ナ ルト』柄の保有 者が名人のとき に一番高いか Pr 𝑘 = 𝑘 50! 250! 60! 240! 300! 𝑘! 50 − 𝑘 ! 60 − 𝑘 ! 190 + 𝑘 ! Pr 𝑘 × 1 𝑘 • 花輪君が「たまちゃん♥」である確率は – 0.100 • 花輪君が「たまちゃん♥」である尤度と、他の 誰かが「たまちゃん♥」である尤度の比は – 0.111 • 花輪君が「たまちゃん♥」である確率は – 0.100 • 花輪君が「たまちゃん♥」である尤度と、他の 誰かが「たまちゃん♥」である尤度の比は – 0.111 花輪君 vs. 誰か1人 1/(1/6) = 6 花輪君 vs. 誰か59人 1/(59x49/299) = 0.103 花輪君が、『ナルト』柄 の持ち主である比率 0.111 Pr 𝑘 = 𝑘 50! 250! 60! 240! 300! 𝑘! 50 − 𝑘 ! 60 − 𝑘 ! 190 + 𝑘 ! • p 「タイプ」の割合 1/6 • N 「花輪君以外の対立候補者数」 59人 • p, N を振ってみよう p=1/6のまま 対立候補者数 N = 1,2,...,100 尤度比 対立候補者数 によらず一定 対立候補者数 N 対立候補者数が増 えると下がる 尤度比 対立候補者数 N = 1 のまま p=を変える p pが小さければ尤 度比は高い 2つの方法に差は ない 尤度比 対立候補者数 N = 59 p=を変える p pが小さければ尤 度比は高い 2つの方法に差が 出る この2つの違い • N=59 • pを変える 花輪君 vs. 誰か1人 1/(1/6) = 6 花輪君 vs. 誰か59人 1/(59x49/299) = 0.103 花輪君が、『ナルト』柄 の持ち主である比率 Pr 𝑘 = 0.111 50! 250! 60! 240! 300! 𝑘! 50 − 𝑘 ! 60 − 𝑘 ! 190 + 𝑘 ! この2つの違い • N=59 • pを変える p=1/6 0.103 vs. 0.111 この2つの違い • N=59 • pを変える p=1/6 0.103 vs. 0.111 pが大きいときは大 差がないが、 pが小さくなると、差 が出てくる この2つの違い • Nを変える • p=1/6 この2つの違い • Nを変える • p=1/6 N=59 0.103 vs. 0.111 この2つの違い • Nを変える • p=1/6 N=59 0.103 vs. 0.111 Nが大きいときは大 差がないが、 Nが小さくなると、 差が出てくる この2つの違い p=1/6 0.103 vs. 0.111 pが大きいときは大差がないが、 pが小さくなると、差が出てくる N=59 0.103 vs. 0.111 Nが大きいときは大差がないが、 Nが小さくなると、差が出てくる pが小さいとき、Nが小さいとき 「犯人だ」という尤度比が大きくなる • 「ばあさんの意見では、『ナルト』を持っている のが2人以上いても、花輪君が犯人の可能 性を捨てないってことだぜ」 • 「ぜーったい、花輪君しかありえねぇ、ってこと にしないと、花輪君に悪いだろう」 • 「確かに、 もしれない」 さんに責められるのはかわいそうか • 「じゃあ、残りの59人が全員、誰一人として、 『ナルト』を持っていない確率を計算してみる よ」 – 尤度比 6.9724e-05 • 「これは低すぎて、おかしいんじゃないか い?」 • 「 の意見と、ものすごく違うよ」 • 「ばあさんの意見では、『ナルト』を持っている のが2人以上いても、花輪君が犯人の可能 性を捨てないってことだぜ」 • 「それに、お前だって、59 x 49/299っていう計 算をしているけど、『誰か一人でもナルトだ』っ ていう計算は、こうするのが本当だよ」 – 1-(1-49/299)59 = 1- 2.593346e-05 • 「じゃあ、おれの数字とばあさんの数字が近 いってことは、お互い、悪い意見じゃないって ことか?!」 • 「でもな、ばあさんの意見は、花輪君が『ナル ト』を持っていたら、2人目以降が、『ナルト』を 持っているのは、珍しくなる、ってことだろ う?」 • 「花輪君のうちは大富豪で、その他の庶民風 情がどうかとは、関係がねーぜ」 • 「配られた消しゴムに関する限りそんなことはないと思 うのだが…」 • 「DNAジェノタイプに関する限りは、この意見は正しい かもしれない」 めずらしいこと1 • 町内会の福引、サイコロを振って1が出たらあたり – p=1/6 の確率で起きること • 山田さんと佐藤さんが1回ずつ実施した • 両家でそろって当たる確率 – p^2 • 山田さんで当たって、佐藤さんで当たらない確率 – p • 山田さんで外れて、佐藤さんで当たる確率 – p • 両家でそろって外れる確率 – (1-p)^2 めずらしいこと1 • 山田さんが喜んでいるのを聞いて、佐藤さん が思うこと • 「山田さん、おめでとう。うちも当てよう」 めずらしいこと2 • 町内会のくじ、6本あって、1本が当たり – p=1/6 の確率で起きること • 山田さんと佐藤さんが1枚ずつ購入した • 両家でそろって当たる確率 – 0 • 山田さんで当たって、佐藤さんで当たらない確率 – p • 山田さんで外れて、佐藤さんで当たる確率 – p • 両家でそろって外れる確率 – 1-2p めずらしいこと2 • 山田さんが喜んでいるのを聞いて、佐藤さん が思うこと • 「山田さん、おめでとう。うちは、もうだめだ」 消しゴム・DNA鑑定は さてどっち 集団には、そこそこ、同じ タイプの人がいるかもしれ ない k 1000-k 1000 10-k 1億-1010+k 1億-1000 10 1億-10 1億 候補者数は場合によって 増減する フィッシャーの正確確 率検定(とはちょっと 違うけれど)とかなり 近い枠組み 人口を無限大にして、 候補者数が少なすぎ ないという条件でなら、 カイ自乗検定的な漸 近近似計算も(多分) 可能 正確確率ではない、計算法 • 『ナルト』柄の確率 : p = 50/300 = 1/6 • 音楽50人中、k人が『ナルト』柄の確率 – Pr 𝑘 = 50! 𝑘! × 50−𝑘 ! 𝑝𝑘 (1 − 𝑝)(50−𝑘) 𝑘 50! 𝑘! × 50−𝑘 ! 𝑝𝑘 (1 − 𝑝)(50−𝑘) • kが大きい方が『ナルト』柄を落としやすいからその分を上 乗せして – Pr 𝑘 = • 花輪君が「たまちゃん♥」である確率 – k人の場合 1 • Pr 𝑘 × 𝑘 = 𝑘! × 50! 50−𝑘 ! 𝑝𝑘 (1 − 𝑝)(50−𝑘) – k=1,2,...,50の場合の合計 • 50 𝑘=1 Pr 1 𝑘 ×𝑘 • 『ナルト柄』の人数が0人の可能性は、もう、ないことがわ かっているので、その分を割り引いて考えよう – ( 50 𝑘=1 Pr 1 𝑘 𝑘 × ) /( 50 𝑘=1 Pr 𝑘 )
© Copyright 2024 ExpyDoc