0/1表現型と個別化医療における決断 ~多要素を勘案した末に白黒つける

0/1表現型と
個別化医療における決断
多要素を勘案した末に
白黒つけること
京都大学(医)統計遺伝学分野
山田 亮
ゲノム
統計遺伝学
家系
離散
少数
数学系
抽象代数
グラフ理論
トランスクリプトーム
プロテオーム
連続量系
正規分布系
デジタル
インフォマティクス
大規模
情報系
数値解析系
統計遺伝学分野
•
•
•
•
•
•
•
•
GWAS
SNP
遺伝疫学
疾患関連遺伝子多型
ゲノム創薬
。。。
「疾病の理解」と「個別化医療」
治験
統計遺伝学分野
•
•
•
•
•
•
•
•
GWAS
SNP
遺伝疫学
疾患関連遺伝子多型
ゲノム創薬
。。。
「疾病の理解」と「個別化医療」
治験
Unreliable research
Trouble at the lab
Scientists like to think of science as
self-correcting. To an alarming
degree, it is not
Oct 19th 2013
癌創薬
6/53
21 + 32 = 53
FIGURE 1 | Analysis of the reproducibility of published data in 67 inhouse projects.
FROM THE FOLLOWING ARTICLE:
Believe it or not: how much can we rely on published data on
potential drug targets?
Florian Prinz, Thomas Schlange & Khusru Asadullah
Nature Reviews Drug Discovery 10, 712 (September 2011)
Unreliable research
Trouble at the lab
Scientists like to think of science as self-correcting. To an alarming degree, it is not
Oct 19th 2013
Yukinori Okada, et. al
Nature Genetics 44, 511–516 (2012)
doi:10.1038/ng.2231
マルチプルテスティング
Yukinori Okada, et. al
Nature Genetics 44, 511–516 (2012)
doi:10.1038/ng.2231
治療法A vs. B
p = 0.01
• 「AはBよりよい」と信じよう
• 「AはBよりよい」と信じると、それは100回に
1度は「誤った選択」
治療法A vs. B
p = 0.01
• 「AはBよりよい」と信じよう
• 「AはBよりよい」と信じると、それは100回に
1度は「誤った選択」
「誤った選択」とは
•
•
•
•
本当はBの方がよい治療法なのに
N人のトライアルで
「A>B(p < 0.01)」となったので
(N+1)番目以降の人はAだけとなった
• ・・・「本当はBの方が良い治療法」だったのに
• 『誤った治療法への固定』という問題
サンプルサイズを増やせば…
p値の基準を厳しくすれば…
サンプルサイズを増やせば…
p値の基準を厳しくすれば…
• サンプルサイズを増やすのにも限界がある
– コスト
– 希少疾患・個別化医療による細分
• 「スタディの賞味期限」はそれほど長くない
– スタディをしている間に、新治療薬が登場!
サンプルサイズを増やせば…
p値の基準を厳しくすれば…
• サンプルサイズを増やすのにも限界がある
– コスト
– 希少疾患・個別化医療による細分
• 「スタディの賞味期限」はそれほど長くない
– 新規治療法が出てくれば、もういらない
それに・・・
白黒つかないうちに決断する
わからなくても決断する
• あなたは冒険旅行中
• 分かれ道があって、電光掲示板がある
– 『右の道を選んだ者、7名あり。4名は幸福に、3
名は不幸になった』
– 『左の道を選んだ者、3名あり。2名は幸福に、1
名は不幸になった』
• 11例目のあなたは、どちらの道を選ぶか
我を過ぐれば憂ひの都あり、
我を過ぐれば永遠の苦患あり、
我を過ぐれば滅亡の民あり
二項分布から
ベータ分布を思う
○
×
和
X
12
11
23
Y
3
4
7
(12+1)/(23+2)
12/23
道X
道Y
期待値
最頻値
3/7
○率
(3+1)/(7+2)
期待値で選択することは「悪くない」
• 方針
– 「期待値」が大きい方を選ぶ
– 「期待値」が同じなら、どちらかを選ぶ
本当はよい道を選んで
不幸になった
本当はよい道を選んで
幸福になった
本当は悪い道を選んで
不幸になった
本当は悪い道を選んで
幸福になった
本当に「よい方」ばかりが
選ばれるようになるか
本当によい方が選ばれがち
Sele
本当は悪い方が選ばれがち
期待値で選択することは「悪くない」
• 方針
– 「期待値」が大きい方を選ぶ
– 「期待値」が同じなら、どちらかを選ぶ
画一的な方針だと、どうしても、
「悪い方への固定」が起きる
確率的な決断
• Multi-armed bandit 問題
– 複数のスロットマシンがあって、それぞれのマシ
ンには「当たり」の確率が決まっているが、その確
率が不明であるという
– マシンを1つずつ選んでは、勝負をして、各マシン
の当否結果を記録しながら、勝負を繰り返すこと
にする
– どんなルールで選ぶと、儲けが最大になりやすい
か、という問題
選択問題
Multi-Armed Bandit
• 「一見、悪そうに見える選択肢も、思い切って選
んでみないといけないよ」~確率的決断
– よさそうな方に8回
– 悪そうな方に 2回
• 「何度もスロットマシーンを試せるなら…」
• 「何人も子孫を残せるなら…」
– 生物の生き抜き戦略
• 「自分ではない、ほかの人が試してくれるなら…」
– 治験とはある意味そういう枠組み
• 倫理的課題
Bandit solutions provide unified ethical models
for randomized clinical trials and comparative
effectiveness research
PNAS vol. 106 no. 52 William H. Press, 22387–22392,
doi: 10.1073/pnas.0912378106
○率が高い確率応じて
X,Yを「確率的に」選択してみよう
選択問題
Multi-Armed Bandit
• 「一見、悪そうに見える選択肢も、思い切って選
んでみないといけないよ」 ~確率的決断
– よさそうな方に8回
– 悪そうな方に 2回
• 「何度もスロットマシーンを試せるなら…」
• 「何人も子孫を残せるなら…」
– 生物の生き抜き戦略
• 「自分ではない、ほかの人が試してくれるなら…」
– 治験とはある意味そういう枠組み
• 倫理的課題
Bandit solutions provide unified ethical models
for randomized clinical trials and comparative
effectiveness research
PNAS vol. 106 no. 52 William H. Press, 22387–22392,
doi: 10.1073/pnas.0912378106
選択問題
Multi-Armed Bandit
• 「一見、悪そうに見える選択肢も、思い切って選
んでみないといけないよ」 ~確率的決断
– よさそうな方に8回
– 悪そうな方に 2回
• 「何度もスロットマシーンを試せるなら…」
• 「何人も子孫を残せるなら…」
– 生物の生き抜き戦略
• 「自分ではない、ほかの人が試してくれるなら…」
– 治験とはある意味そういう枠組み
• 倫理的課題
Bandit solutions provide unified ethical models
for randomized clinical trials and comparative
effectiveness research
PNAS vol. 106 no. 52 William H. Press, 22387–22392,
doi: 10.1073/pnas.0912378106
選択問題
Multi-Armed Bandit
• 「一見、悪そうに見える選択肢も、思い切って選
んでみないといけないよ」 ~確率的決断
– よさそうな方に8回
– 悪そうな方に 2回
• 「何度もスロットマシーンを試せるなら…」
• 「何人も子孫を残せるなら…」
– 生物の生き抜き戦略
• 「自分ではない、ほかの人が試してくれるなら…」
– 治験とはある意味そういう枠組み
• 倫理的課題
Bandit solutions provide unified ethical models
for randomized clinical trials and comparative
effectiveness research
PNAS vol. 106 no. 52 William H. Press, 22387–22392,
doi: 10.1073/pnas.0912378106
選択問題
Multi-Armed Bandit
• 「一見、悪そうに見える選択肢も、思い切って選
んでみないといけないよ」 ~確率的決断
– よさそうな方に8回
– 悪そうな方に 2回
• 「何度もスロットマシーンを試せるなら…」
• 「何人も子孫を残せるなら…」
– 生物の生き抜き戦略
• 「自分ではない、ほかの人が試してくれるなら…」
– 治験とはある意味そういう枠組み
• 倫理的課題
Bandit solutions provide unified ethical models
for randomized clinical trials and comparative
effectiveness research
PNAS vol. 106 no. 52 William H. Press, 22387–22392,
doi: 10.1073/pnas.0912378106
倫理的課題
倫理的課題
• 無知につけこんではならない
○
×
和
X
12
11
23
Y
3
4
7
(12+1)/(23+2)
12/23
道X
道Y
ベータ分布を
知らないがために
判断がばらつく
というのようなことはよくない
期待値
最頻値
3/7
○率
(3+1)/(7+2)
倫理的課題
• 無知につけこんではならない
• 何か受け入れ可能な指標は?
– 「個人によってばらつく何か」によって
– 「ベータ分布に基づいて変わる何か」
倫理的課題
• 無知につけこんではならない
• 何か受け入れ可能な指標は?
– 「個人によってばらつく何か」によって
– 「ベータ分布に基づいて変わる何か」
たとえば…
期待値は黒の方が高いが
(3+1)/(7+2)
(12+1)/(23+2)
たとえば…
期待値は黒の方が高いが
(3+1)/(7+2)
(12+1)/(23+2)
「成功率が7割を超える確率」
は
赤の方が高い
たとえば…
そんな変な発想をする人が居る?
100人治療して50人成功の治療法がある。
その治療法は
成功率が60%以上である確率は
2%しかない
そんな治療法には満足できない
もしかしたら
成功率が80%を超えるかもしれない
そんな治療法があるなら
その治療法の治験をしよう!
チャレンジ精神
「成功率が7割を超える確率」
は
赤の方が高い
たとえば…
そんな変な発想をする人が居る?
100人治療して50人成功の治療法がある。
その治療法は
成功率が60%以上である確率は
2%しかない
そんな治療法には満足できない
もしかしたら
成功率が80%を超えるかもしれない
そんな治療法があるなら
その治療法の治験をしよう!
チャレンジ精神
「成功率が7割を超える確率」
は
赤の方が高い
選択問題
Multi-Armed Bandit
• 「一見、悪そうに見える選択肢も、思い切って選んでみないと
いけないよ」~確率的決断
• 何か受け入れ可能な指標は?
– 「個人によってばらつく何か」によって
– 「ベータ分布に基づいて変わる何か」
– チャレンジ精神の強さには個人差がある(だろう)「
• 何人も子孫を残せるなら…」
– 生物の生き抜き戦略
• 「自分ではない、ほかの人が試してくれるなら…」
– 治験とはある意味そういう枠組み
• 倫理的課題
Bandit solutions provide unified ethical models
for randomized clinical trials and comparative
effectiveness research
PNAS vol. 106 no. 52 William H. Press, 22387–22392,
doi: 10.1073/pnas.0912378106
全員がチャレンジャー
である必要はない
詳細は
現在、進行形
何の話だったのか
何の話だったのか
•
•
•
•
選択という0/1
決め打ちではなく、確率的0/1
少数でもよいから、チャレンジャーを
生物戦略としての0/1を介した多様性
• 離散性・区分性を導入して決め打ちを避ける
…これが生物の本質?
0/1
離散が大事
0/1
離散 vs. 連続量
21世紀初めの
大きな棲み分け
SNP 遺伝疫学
vs.
マイクロアレイ 発現解析
21世紀初めの
大きな棲み分け
家系図
連鎖解析
グラフ
離散
タイピング
シークエンシング
SNP 遺伝疫学
vs.
マイクロアレイ 発現解析
正規分布
アナログ測定
連続量検定
NGS
DNAもRNAも同じデータ
家系図
連鎖解析
グラフ
離散
タイピング
シークエンシング
DNA
大量並列
RNA
ポアソン分布モデル
離散化
正規分布
アナログ測定
連続量検定
離散~統計遺伝学分野
連鎖解析は離散
コアレセントも離散
家系図も離散
グラフからベイジアンネットワーク
あふれる離散表現型
0/1
健 病
未分化 分化
活
静
On Off
良
悪
たくさん調べて、病気を理解する
たくさん、情報を集めて、
判断に活かす
そのもっとも単純な場合
決断という離散
決断
決断
組織
個体
分子
細胞
化学反応も離散的
動きも離散
ブラウン運動という離散
ブラウン運動という離散
遺伝的浮動という
ブラウン運動
離散化と閾値
コモン・ディジーズの
閾値モデル
活性電位
離散化と非線形・相転移
分岐モデル
曲率による相転移
非線形アトラクタ
ロジスティック関数
健
病
膀胱癌
大腸ポリープ
良性腫瘍
悪性腫瘍
負の曲率
正の曲率
離散化と相転移…量子化
群論 代数統計学
デジタル解析は離散
疎行列という手法としての離散
グラフという手法としての離散
De Bruijn
ネットワーク
グラフで組み合わせ
次世代データ
De Bruijn
分岐木→ZDD
グラフで組み合わせ
次世代データ
De Bruijn
非線形
アトラクタとつながる
分岐木→ZDD
グラフで組み合わせ
次世代データ
De Bruijn
…で 1細胞解析
という離散
ゲノム
統計遺伝学
家系
離散
少数
数学系
抽象代数
グラフ理論
トランスクリプトーム
プロテオーム
連続量系
正規分布系
デジタル
インフォマティクス
大規模
情報系
数値解析系