医学に活かす確率・統計

医学に活かす
確率・統計
避けて通れない確率・統計
• 不確実だから
– 研究はわからないことを対象にする
• 未知が対象
– 臨床は不十分な情報に基づいて行動する
• 既知のリストから選び出す
• 研究も 臨床も、論理的・科学的であることが必要だ
から
– 他人を説得する
– 自分が納得する
• 論理・科学の(唯一の)共通言語だから
計算機は不要(かも) 勘は必要
• 確率的思考をしているときに、電卓をたたい
ている暇はない
• そこそこ、はずれない「勘」を持っていることが
大事
• その「勘」のよさが、臨床のセンス、研究のセ
ンスのよさ・・・のような気がします
• この辺りのことに、なにがしかのイメージを持
つことが3コマの目標です
計算機が欲しいなら
• フリーソフトをどうぞ
–R
http://www.r-project.org/
http://www.okada.jp.org/RWiki/index.php
確率・統計的な考え方のこつ
• 自分なりにわかること
– 覚えることは何もない
– 自分で考えを進められれば、よし
– 疑う
• 情報を鵜呑みにしない
• 理由を見つける
• こだわらない・こだわっている自分に気づく
– 「絶対」はない
• 場合にわける
• 条件をつける
みんなが使うものならば
•
•
正答確率 0.8の場合の得点分布の確率分布は
「知られている」
• 「知られてい」れば、「知れ」ばよ
し
– 情報収集・調査・勉強
• 「知られていないけれど、知りた」
ければ、「知れ」ばよし
– 研究
• 仮説→事象が起きる 確率 (起きそうなやすさ)
• 事象が起きる→仮説 尤度 (ありそうな程度)
真の正答確率が p のときに8点を取る確率は
8点を取ったときに、真の正答確率がpである尤度
1回目の模試が8点の場合
実力が0.8の場合
尤度
テストの点
実力
実力
「真の正答力は、『正答する確率』がpである」と
いう仮説の下で、10問中8問を正答する確率
10問中8問正答のときの真の正答力の尤度
• p=0.8のときに
最も大きい
– 最大の尤度を
持つ仮説は「
p=0.8」
– pの最尤推定
値
1回目の模試が80%正解の場合
実力はどこまで推定できた?
信頼区間をどう決めたい?
模試の結果から、実力を推定した。
実力 実力
正答率80%を最高に(最尤推定値) : 点推定
幅がある(信頼区間) : 区間推定
信頼区間をどう決めたい?
下限と上限に挟まれた範囲が95%
実力
上限・下限それぞれに2.5%ずつ
上限・下限の尤度を同じにして合わせて5%
上限・下限を中心から等距離とするとして、合わせて5%
下限だけ?
真の力より、次回は何点取るか?
• 真の正答確率は 0 <= p <=1
• p=P のときに t 点(t=0,1,2,...,10)を取る確率
は Pr(t|p=P)
• p=Pの確率は Pr(p=P)
• 全部のpについて、Pr(t|p=P) x Pr(p=P)を足
し合わせれば、t点を取る確率がわかる
真の力より、次回は何点取るか?
point<-8
p<-seq(from=0,to=1,by=0.01)
#ds<-dbinom(point,nq,p)
#plot(p,ds,type="l")
#abline(h=ds[81])
#par(new=T)
v<-dbeta(p,point+1,nq-point+1)
plot(p,v,type="l",col="red")
newpoints<-0:nq
cp<-choose(nq,newpoints)
out<-matrix(0,length(newpoints),length(p))
for(i in 1:length(newpoints)){
out[i,]<-cp[i]*p^newpoints[i]*(1-p)^(nq-newpoints[i])*v
}
out2<-apply(out,1,sum)
par(new=T)
plot(newpoints,out2,type="b")
推定
• 推定(の代表)値
• 推定値の範囲(信頼区間)
• 推定結果「の全部」を使って、さらなる推定
確率と尤度
実力が0.8の場合
確率
1回目の模試が80%正解の
場合
1回目の模試が80%正解の
場合に、次回の試験の点数
の予想
尤度
テストの点
確率
実力
実力
テストの点
臨床における推定
• 診断という推定
– 診断Aという仮説
– 診断Bという仮説
–…
• 予後の推定
Aのときの確率
臨床情報
問診・検査
A,B,...の尤度
– 予後Xという予想
– 予後Yという予想
• 推定(診断)には
– 最尤推定がある
– 信頼区間がある
予後推定(A,Bが決まらなくても・・・)
研究における推定
• 値を計測(実験)したら、必ず推定
• 模試:全10問の模試
– たくさんの実験(10問)を実施していた
• 実験も繰り返しが必要
• 推定には繰り返しが必要