情報の多寡

寄り道1
タイプが同じならば、
同一人物由来の試料なのか?
法数学勉強会
2012/03/24
京都大学 医学研究科
統計遺伝学分野
山田
タイプが同じならば、
同一人物由来の試料なのか?
• 「同一タイプ」の人がこの世に1人ならば、「同
一人物」と判定される
• 「同一タイプ」の人がこの世に複数いれば、
「同一人物」と判定するのは、確率的になる
消しゴム事件
• ある小学校では、すべての男子生徒300人
に「消しゴム屋」さんから1個ずつ消しゴムが
配られた
– 「ナルト」柄が50個、「ワンピース」柄が100個、
「ドラえもん」柄が150個
ある日、音楽室で
• 1個の消しゴムの落し物が発見された
• 「ナルト」柄だった(50個/300個)
らぶ
「ほなみたまちゃん♥」
• その消しゴムには
– 「ほなみたまちゃん♥」と書かれていた!
• さあ、この消しゴムは誰のものか?
– 女子児童たちの捜査が始まった
• 「消しゴム屋さん、『ナルト』柄の消しゴムを
配った男子のリストを出しなさいよー」
– リストが得られれば、『ナルト』所有者50名に絞ら
れる
– 50名は、1/50の確率で「たまちゃん♥」
• 「消しゴム屋さん、『ナルト』柄の消しゴムを
配った男子のリストを出しなさいよー」
– 「あいにく、個人情報保護法の規定により、リスト
をお出しすることはできません」
• 「消しゴム屋さん、『ナルト』柄の消しゴムを
配った男子のリストを出しなさいよー」
– 「あいにく、個人情報保護法の規定により、リスト
をお出しすることはできません」
– 「特定の児童さんを指名していただけば、その児
童さんにどのタイプを渡したかはお答えできます」
「たまちゃん♥」の『犯人』って誰だと思う?
「やっぱり、同じクラスの男子?」
「クラブが一緒?」
「委員会つながりかも?」
「以前に同じクラスだった・・・とか」
「帰り道が一緒だからだったりして」
「事前確率なんて考えるのはやめなさい」
「下手な考え、休むに似たりって言うじゃない」
「そうとも、限らないのだが…」
音楽の先生 曰く
• 「音楽室はいつも鍵がかかっていて、鍵は私
しか持っていないから、その日、音楽室に出
入りできた児童は、その日に音楽の授業が
あったクラスの子、だけよ」
• 「その日、音楽の授業があったのは、3クラス、
120人のうち、男子は、60人」
• 「300人のうち、60人」
• 「その日、音楽の授業があったのは、3クラス、
120人のうち、男子は、60人」
• 「音楽の授業は、300人のうち、60人」
• 「『ナルト』柄は、300人のうち、50人」
• 「じゃあ、音楽のあったクラスで、『ナルト』消し
ゴムを持っていたのは何人?」
• 「その日、音楽の授業があったのは、3クラス、
120人のうち、男子は、60人」
• 「音楽の授業は、300人のうち、60人」
• 「『ナルト』柄は、300人のうち、50人」
• 「じゃあ、音楽のあったクラスで、『ナルト』消し
ゴムを持っていたのは何人?」
• 60x50/300 =10人 くらいね!
• 「あいにく、個人情報保護法の規定により、リ
ストをお出しすることはできません」
• 「特定の児童さんを指名していただけば、そ
の児童さんにどのタイプを渡したかはお答え
できます」
• 「あいにく、個人情報保護法の規定により、リ
ストをお出しすることはできません」
• 「特定の児童さんを指名していただけば、そ
の児童さんにどのタイプを渡したかはお答え
できます」
絶対
花輪君のを教えてもらうわ
誰も文句ないわよね!
「花輪君ですね、花輪君は、『ナルト』柄でした」
「花輪君ですね、花輪君は、『ナルト』柄でした」
• 「花輪君以外の男子(59人)が、『ナルト』
柄である確率は 50/300 = 1/6→49/299」
• 「そのうちの誰かが、落とし主だとすると、
それが『ナルト』柄である確率は1/6」
• 「花輪君が落としたのなら、それが『ナル
ト』柄である確率は 1」
• 「誰かが落としたのなら、それが『ナルト』
柄である確率は 1/6」
• 「尤度比は6」
• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「花輪君以外の男子(59人)が、『ナルト』
柄である確率は 50/300 = 1/6→49/299」
• 「そのうちの誰かが、落とし主だとすると、
それが『ナルト』柄である確率は49/299」
• 「花輪君が落としたのなら、それが『ナル
ト』柄である確率は 1」
• 「誰かが落としたのなら、それが『ナルト』
柄である確率は 1/6」
• 「尤度比は6」
• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「花輪君以外の男子(59人)が、『ナルト』
柄である確率は 50/300 = 1/6→49/299 」
• 「そのうちの誰かが、落とし主だとすると、
それが『ナルト』柄である確率は49/299」
• 「花輪君が落としたのなら、それが『ナル
ト』柄である確率は 1」
• 「誰かが落としたのなら、それが『ナルト』
柄である確率は 1/6」
• 「尤度比は6」
• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「花輪君以外の男子(59人)が、『ナルト』
柄である確率は 50/300 = 1/6→49/299 」
• 「そのうちの誰かが、落とし主だとすると、
それが『ナルト』柄である確率は49/299」
• 「花輪君が落としたのなら、それが『ナル
ト』柄である確率は 1」
• 「誰かが落としたのなら、それが『ナルト』
柄である確率は 49/299」
• 「尤度比は6」
• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「花輪君以外の男子(59人)が、『ナルト』
柄である確率は 50/300 = 1/6→49/299 」
• 「そのうちの誰かが、落とし主だとすると、
それが『ナルト』柄である確率は1/6」
• 「花輪君が落としたのなら、それが『ナル
ト』柄である確率は 1」
• 「誰かが落としたのなら、それが『ナルト』
柄である確率は 49/299」
• 「尤度比は1/(49/299) = 299/49 = 6.10」
• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「花輪君以外の男子(59人)が、『ナルト』
柄である確率は 50/300 = 1/6→49/299 」
• 「そのうちの誰かが、落とし主だとすると、
それが『ナルト』柄である確率は1/6」
• 「花輪君が落としたのなら、それが『ナル
ト』柄である確率は 1」
• 「誰かが落としたのなら、それが『ナルト』
柄である確率は 49/299」
• 「尤度比は1/(49/299) = 299/49 = 6.10」
• 「花輪君が落としたと考える方がよさそう
じゃない?」
• 「尤度比は 6.10」
• 「花輪君が落としたと考える方がよさそうじゃ
ない?」
• 「花輪君が落としたのなら、それが『ナルト』柄である確率は
1」
• 「誰かが落としたのなら、それが『ナルト』柄である確率は
49/299」
• 「尤度比は1/(49/299) = 299/49 = 6.10」
• 「候補の男子が59人もいるのに、いきなり、
『 6.10倍』っていうのは、おかしいんじゃねー
か?」
• 「花輪君が落としたのなら、それが『ナルト』柄
である確率は 1」
•
•
•
•
「誰か1が落としたのなら、それが『ナルト』柄である確率は 49/299」
「誰か2が落としたのなら、それが『ナルト』柄である確率は 49/299 」
…
「誰か59が落としたのなら、それが『ナルト』柄である確率は 49/299 」
• 「花輪君が落としたのなら、それが『ナルト』柄
である確率は 1」
•
•
•
•
「誰か1が落としたのなら、それが『ナルト』柄である確率は 49/299」
「誰か2が落としたのなら、それが『ナルト』柄である確率は 49/299 」
…
「誰か59が落としたのなら、それが『ナルト』柄である確率は 49/299 」
• 「花輪君 vs. その他59人 は 1: 59x49/299 =
0.103 」
• 「花輪君が落としたのなら、それが『ナルト』柄
である確率は 1」
•
•
•
•
「誰か1が落としたのなら、それが『ナルト』柄である確率は 49/299」
「誰か2が落としたのなら、それが『ナルト』柄である確率は 49/299 」
…
「誰か59が落としたのなら、それが『ナルト』柄である確率は 49/299 」
• 「花輪君 vs. その他59人 は 1: 59x49/299 =
0.103 」
•
•
•
•
「音楽の授業は、300人のうち、60人」
「『ナルト』柄は、300人のうち、50人」
「じゃあ、音楽のあったクラスで、『ナルト』消しゴムを持っていたのは何人?
60x50/300 =10人 くらいね!
• 「本当のところは、音楽授業の60人中、何人が『ナルト』柄
じゃったんかいのー」
– 1人、2人、…、50人の場合がありえる
– 1人だけが『ナルト』柄で、それが花輪君なら、「たまちゃん♥」
は花輪君で確定
– 2人が『ナルト』柄なら、花輪君かもしれないし、もう1人かもし
れなくて、確率は1/2
– …
– k 人が『ナルト』柄で、花輪君がそのうちの1人なら、確率は1/k
• 『ナルト』柄の確率 : p = 50/300 = 1/6
• 音楽50人中、k人が『ナルト』柄の確率
– Pr 𝑘 =
50!250!60!240!
300!𝑘! 50−𝑘 ! 60−𝑘 ! 190+𝑘 !
• kが大きい方が『ナルト』柄を落としやすいからその分を上
乗せして
– Pr 𝑘 =
𝑘 50!250!60!240!
300!𝑘! 50−𝑘 ! 60−𝑘 ! 190+𝑘 !
• 花輪君が「たまちゃん♥」である確率
– k人の場合
1
𝑘
• Pr 𝑘 × =
50!250!60!240!
300!𝑘! 50−𝑘 ! 60−𝑘 ! 190+𝑘 !
k
50-k
50
60-k
190+k
250
60
240
300
– k=1,2,...,50の場合の合計
•
50
𝑘=1 Pr
1
𝑘 ×𝑘
• 『ナルト柄』の人数が0人の可能性は、もう、ないことがわ
かっているので、その分を割り引いて考えよう
– (
50
𝑘=1 Pr
1
𝑘
𝑘 × ) /(
50
𝑘=1 Pr
𝑘 )
• p=50/300=1/6
• N=60
50! 250! 60! 240!
Pr 𝑘 =
300! 𝑘! 50 − 𝑘 ! 60 − 𝑘 ! 190 + 𝑘 !
• 『ナルト』柄の人数
は、何人の可能性
が1番高いか
60x50/300 =10人 くらいね!
『ナルト』柄人数
• 『ナルト』柄の人
数は、何人の可
能性が一番高い
か
• 「花輪君」が犯人
だ、とみなされる
可能性は、『ナ
ルト』柄の保有
者が名人のとき
に一番高いか
Pr 𝑘 =
𝑘 50! 250! 60! 240!
300! 𝑘! 50 − 𝑘 ! 60 − 𝑘 ! 190 + 𝑘 !
Pr 𝑘 ×
1
𝑘
• 花輪君が「たまちゃん♥」である確率は
– 0.100
• 花輪君が「たまちゃん♥」である尤度と、他の
誰かが「たまちゃん♥」である尤度の比は
– 0.111
• 花輪君が「たまちゃん♥」である確率は
– 0.100
• 花輪君が「たまちゃん♥」である尤度と、他の
誰かが「たまちゃん♥」である尤度の比は
– 0.111
花輪君 vs. 誰か1人
1/(1/6) = 6
花輪君 vs. 誰か59人 1/(59x49/299) = 0.103
花輪君が、『ナルト』柄
の持ち主である比率
0.111
Pr 𝑘 =
𝑘 50! 250! 60! 240!
300! 𝑘! 50 − 𝑘 ! 60 − 𝑘 ! 190 + 𝑘 !
• p 「タイプ」の割合 1/6
• N 「花輪君以外の対立候補者数」 59人
• p, N を振ってみよう
p=1/6のまま
対立候補者数 N = 1,2,...,100
尤度比
対立候補者数
によらず一定
対立候補者数 N
対立候補者数が増
えると下がる
尤度比
対立候補者数 N = 1 のまま
p=を変える
p
pが小さければ尤
度比は高い
2つの方法に差は
ない
尤度比
対立候補者数 N = 59
p=を変える
p
pが小さければ尤
度比は高い
2つの方法に差が
出る
この2つの違い
• N=59
• pを変える
花輪君 vs. 誰か1人
1/(1/6) = 6
花輪君 vs. 誰か59人 1/(59x49/299) = 0.103
花輪君が、『ナルト』柄
の持ち主である比率
Pr 𝑘 =
0.111
50! 250! 60! 240!
300! 𝑘! 50 − 𝑘 ! 60 − 𝑘 ! 190 + 𝑘 !
この2つの違い
• N=59
• pを変える
p=1/6
0.103 vs. 0.111
この2つの違い
• N=59
• pを変える
p=1/6
0.103 vs. 0.111
pが大きいときは大
差がないが、
pが小さくなると、差
が出てくる
この2つの違い
• Nを変える
• p=1/6
この2つの違い
• Nを変える
• p=1/6
N=59
0.103 vs. 0.111
この2つの違い
• Nを変える
• p=1/6
N=59
0.103 vs. 0.111
Nが大きいときは大
差がないが、
Nが小さくなると、
差が出てくる
この2つの違い
p=1/6
0.103 vs. 0.111
pが大きいときは大差がないが、
pが小さくなると、差が出てくる
N=59
0.103 vs. 0.111
Nが大きいときは大差がないが、
Nが小さくなると、差が出てくる
pが小さいとき、Nが小さいとき
「犯人だ」という尤度比が大きくなる
• 「ばあさんの意見では、『ナルト』を持っている
のが2人以上いても、花輪君が犯人の可能
性を捨てないってことだぜ」
• 「ぜーったい、花輪君しかありえねぇ、ってこと
にしないと、花輪君に悪いだろう」
• 「確かに、
もしれない」
さんに責められるのはかわいそうか
• 「じゃあ、残りの59人が全員、誰一人として、
『ナルト』を持っていない確率を計算してみる
よ」
– 尤度比 6.9724e-05
• 「これは低すぎて、おかしいんじゃないか
い?」
• 「
の意見と、ものすごく違うよ」
• 「ばあさんの意見では、『ナルト』を持っている
のが2人以上いても、花輪君が犯人の可能
性を捨てないってことだぜ」
• 「それに、お前だって、59 x 49/299っていう計
算をしているけど、『誰か一人でもナルトだ』っ
ていう計算は、こうするのが本当だよ」
– 1-(1-49/299)59 = 1- 2.593346e-05
• 「じゃあ、おれの数字とばあさんの数字が近
いってことは、お互い、悪い意見じゃないって
ことか?!」
• 「でもな、ばあさんの意見は、花輪君が『ナル
ト』を持っていたら、2人目以降が、『ナルト』を
持っているのは、珍しくなる、ってことだろ
う?」
• 「花輪君のうちは大富豪で、その他の庶民風
情がどうかとは、関係がねーぜ」
• 「配られた消しゴムに関する限りそんなことはないと思
うのだが…」
• 「DNAジェノタイプに関する限りは、この意見は正しい
かもしれない」
めずらしいこと1
• 町内会の福引、サイコロを振って1が出たらあたり
– p=1/6 の確率で起きること
• 山田さんと佐藤さんが1回ずつ実施した
• 両家でそろって当たる確率
– p^2
• 山田さんで当たって、佐藤さんで当たらない確率
– p
• 山田さんで外れて、佐藤さんで当たる確率
– p
• 両家でそろって外れる確率
– (1-p)^2
めずらしいこと1
• 山田さんが喜んでいるのを聞いて、佐藤さん
が思うこと
• 「山田さん、おめでとう。うちも当てよう」
めずらしいこと2
• 町内会のくじ、6本あって、1本が当たり
– p=1/6 の確率で起きること
• 山田さんと佐藤さんが1枚ずつ購入した
• 両家でそろって当たる確率
– 0
• 山田さんで当たって、佐藤さんで当たらない確率
– p
• 山田さんで外れて、佐藤さんで当たる確率
– p
• 両家でそろって外れる確率
– 1-2p
めずらしいこと2
• 山田さんが喜んでいるのを聞いて、佐藤さん
が思うこと
• 「山田さん、おめでとう。うちは、もうだめだ」
消しゴム・DNA鑑定は
さてどっち
集団には、そこそこ、同じ
タイプの人がいるかもしれ
ない
k
1000-k
1000
10-k
1億-1010+k
1億-1000
10
1億-10
1億
候補者数は場合によって
増減する
フィッシャーの正確確
率検定(とはちょっと
違うけれど)とかなり
近い枠組み
人口を無限大にして、
候補者数が少なすぎ
ないという条件でなら、
カイ自乗検定的な漸
近近似計算も(多分)
可能
正確確率ではない、計算法
• 『ナルト』柄の確率 : p = 50/300 = 1/6
• 音楽50人中、k人が『ナルト』柄の確率
– Pr 𝑘 =
50!
𝑘! × 50−𝑘 !
𝑝𝑘 (1 − 𝑝)(50−𝑘)
𝑘 50!
𝑘! × 50−𝑘 !
𝑝𝑘 (1 − 𝑝)(50−𝑘)
• kが大きい方が『ナルト』柄を落としやすいからその分を上
乗せして
– Pr 𝑘 =
• 花輪君が「たまちゃん♥」である確率
– k人の場合
1
• Pr 𝑘 × 𝑘 = 𝑘! ×
50!
50−𝑘 !
𝑝𝑘 (1 − 𝑝)(50−𝑘)
– k=1,2,...,50の場合の合計
•
50
𝑘=1 Pr
1
𝑘 ×𝑘
• 『ナルト柄』の人数が0人の可能性は、もう、ないことがわ
かっているので、その分を割り引いて考えよう
– (
50
𝑘=1 Pr
1
𝑘
𝑘 × ) /(
50
𝑘=1 Pr
𝑘 )