決断するための情報

決断するための情報
法医学会
2013年6月
京都大学(医)統計遺伝学
山田 亮
~決断理論~
哲学
経済学
心理学
数学
『最適な決断戦略』
• 「情報がないなら、ないなりに、あるなら、ある
なりに」
• 「確率的に決断」しよう
• それが「長い目」で見たときの、『最適戦略』
• 生物進化、ギャンブル…
Multi-armed bandit problem,
Thompson sampling
情報があっても
確率的に決断するしかない
最後の決断は
個人に任せて
個人によって決断が割れてもよい
決断するための情報
法数学の役割
決断したい人の
役に立つような情報を
使い方指南も含め
利用しやすい形で
情報提供
治療法 AとB
• 過去の11人は、AとBとのどちらを受けたの
か?
• その結果、治ったのか、治らなかったのか?
• あなたはどちらの治療法を選びますか?
治療法
治った
治らな
かった
計
A
B
2
5
7
1
3
4
3
8
11
何を考慮した?
• どちらの治療法を選ぶと「治りやすい?」
– 治る確率の「期待値」が高いのはどちら?
• どちらの治療法が「より良い」?
– Aの治癒率>Bの治癒率なのか。その確率
は?
この問に答えるために必要なのは
ベイズ推定
共役事前分布
治療法
治った
治らな
かった
計
A
B
2
5
7
1
3
4
3
8
11
二項の観察から
A、Bの成功率を
ベータ分布として
推定する
何を考慮した?
• どちらの治療法を選ぶと「治りやすい?」
– 治る確率の「期待値」が高いのはどちら?
治療法
治った
治らな
かった
計
A
B
2
5
7
1
3
4
3
8
11
Aを選択して治る確率の期待値
(2+1)/ ((2+1)+(1+1)) = 0.6
Bを選択して治る確率の期待値
(5+1)/ ((5+1)+(3+1)) = 0.6
何を考慮した?
二項の観察から
A、Bの成功率を
ベータ分布として
推定する
• どちらの治療法が「より良い」?
– Aの治癒率>Bの治癒率なのか。その確率
は?
治療法
治った
治らな
かった
計
A
B
2
5
7
1
3
4
3
8
11
治療法
治った
治らな
かった
計
A
B
2
5
7
1
3
4
3
8
11
Aを選択して治る確率
の期待値 0.6
Bを選択して治る確率
の期待値 0.57
Aの方が治療成績が良
い確率 0.75
Aを選択して治る確率
の期待値 0.6
Bを選択して治る確率
の期待値 0.6
Aの方が治療成績が良
い確率 0.51
治療法
治った
治らな
かった
計
A
B
240
120
360
160
90
250
400
210
610
最後の決断は
個人に任せて
個人によって決断が割れてもよい
事後●●を何にするか?
「AとBとのそれぞれの『期待値』」
「AとBとを比べて『Aがより良い』確率?
事後●●の値はいくつが十分か?
どのくらいの「事前●●」が必要か?
事前●●を何にするかは決まった。
「AとBとのそれぞれの『期待値』」
「AとBとを比べて『Aがより良い』確率?
事前●●の値はいくつが不十分なのか?
「事前●●」に関する問題
「犯人か」「犯人でないか」の2択
「犯人でない」=「別の誰かが犯人だ」
『別の誰?』
無関係な人?
血縁者?
近縁関係の強弱と地域差
「事前●●」に関する問題
「犯人か」「犯人でないか」の2択
「犯人でない」=「別の誰かが犯人だ」
『別の誰?』
1人、2人、…、たくさん
『複数の候補が居る』
平均を取る
平均だけでは、まずいこともある
「事前●●」に関する問題
『複数の候補が居る』
平均を取る
平均だけでは、まずいこともある
たとえば:バースデイ・パラドクス
『パーティの出席者に同じ誕生日の人がいるだろうか?』
『この人と同じDNAジェノタイプの人がいるだろうか?』
誕生日:すべての日の確率を1/365と揃えて計算する。簡単
DNAタイプ:タイプ別の確率は不均一。簡単じゃない
全員が違う確率
均一な場合
ばらばらな場合の一例
パーティの人数
どんな試料?
どんな実験?マーカー数?
実験精度?計算手法?
試料
• 1人 複数人混合
• 十分量 希少量
• 質の良否
多型
• 多型種類
• 多型箇所数
• 集団のアレル頻度推定値
実験
• 実験成否
• 実験精度
統計計算
• 実験データのクオリティコントロールと外れ値
• 推定を含む処理
• 同一事項の推定に複数手法の提案、その異
同
• ベイズ流の判定
入口と出口が違えば
データ×解釈に求められる
情報力は変わる
場合の整理とそれ
に応じた情報力の
確認
今日のまとめ
• 事後●●(事後確率など)
– 人によって変わる、場合に
よって変わる、事後情報の強
さ
– 個人の意見があってよい…D
NA鑑定でも?
• 事前●●(事前確率など)
– 事後●●に影響を与える事前
●●は、どこまで精度を保っ
ているか?
• データと解釈
– 事前●●と事後●●をつなぐ
部分
– いろいろな課題
• 試料の量と混合・マーカー種類と
数・実験精度・解釈手法