模試から得る情報 - bYTEBoss

医学に活かす
確率・統計
• A4用紙の配布
– 縦に使います
– 学生番号 氏名
避けて通れない確率・統計
• 不確実だから
– 研究はわからないことを対象にする
• 未知が対象
– 臨床は不十分な情報に基づいて行動する
• 既知のリストから選び出す
• 研究も 臨床も、論理的・科学的であることが必要だ
から
– 他人を説得する
– 自分が納得する
• 論理・科学の(唯一の)共通言語だから
手法は不要 考え方は必要
• 過去問になっている問題
• 過去問の類似問題
• 新しい問題
計算機は不要(かも) 勘は必要
• 確率的思考をしているときに、電卓をたたい
ている暇はない
• そこそこ、はずれない「勘」を持っていることが
大事
• その「勘」のよさが、臨床のセンス、研究のセ
ンスのよさ・・・のような気がします
• この辺りのことに、なにがしかのイメージを持
つことが3コマの目標です
計算機が欲しいなら
• フリーソフトをどうぞ
–R
http://www.r-project.org/
http://www.okada.jp.org/RWiki/index.php
確率・統計的な考え方のこつ
• 自分なりにわかること
– 覚えることは何もない
– 自分で考えを進められれば、よし
– 疑う
• 情報を鵜呑みにしない
• 理由を見つける
• こだわらない・こだわっている自分に気づく
– 「絶対」はない
• 場合にわける
• 条件をつける
推定*
推定* : 斜字体の言葉はこの講義で理解するべき概念(「学問
的」部分)
合格したい試験がある
• 自分が合格する確率は?
合格したい試験がある
• 自分が合格する確率は?
• 「当てる」ために必要な情報は?
合格したい試験がある
• 自分が合格する確率は?
• 「当てる」ために有用な情報は?
– 合格率は?
合格したい試験がある
• 自分が合格する確率は?
• 「当てる」ために有用な情報は?
– 合格率は?
• どうしてそれを知ることが有用?
合格したい試験がある
• 自分が合格する確率は?
• 「当てる」ために必要な情報は?
– 合格率は?
– 何の試験?
• どうしてそれを知ることが有用?
【医師国家試験・医学部のある大学別合格率と合格者数】
(2008年度医師国家試験のデータ)
大学名
新卒
既卒
(受験者数・合格者数・合格率) <受験者数・合格者数・合格率>
国立大学医学部(42校)(4,016 3,819 95.1%)<434 257 59.2%>
北海道大学
(106 104 98.1%)
<17 10 58.8%>
旭川医科大学 ( 96
89 92.7%)
<8
3 37.5%>
弘前大学
(102 101 99.0%)
< 9 5 55.6%>
東北大学
( 88 84 95.5%)
<16 4 25.0%>
秋田大学
(103 94 91.3%)
< 8 6 75.0%>
山形大学
( 99 97 98.0%)
< 3 3 100.0%>
筑波大学
(108 105 97.2%)
< 8 8 100.0%>
群馬大学
(103 94 91.3%)
< 7 6 85.7%>
千葉大学
(103 99 96.1%)
< 7 4 57.1%>
東京大学
( 95 88 92.6%)
< 2 0 0.0%>
東京医科歯科大学 ( 86 82 95.3%)
< 7 6 85.7%>
新潟大学
( 94 86 91.5%)
< 6 2 33.3%>
富山大学
( 91 88 96.7%)
< 7 5 71.4%>
金沢大学
(101 97 96.0%)
<11 4 36.4%>
福井大学
(107 97 90.7%)
<12 5 41.7%>
山梨大学
( 97 90 92.8%)
<14 11 78.6%>
信州大学
( 98 93 94.9%)
< 8 2 25.0%>
岐阜大学
( 80 78 97.5%)
< 8 5 62.5%>
浜松医科大学 (112 109 97.3%)
< 6 4 66.7%>
名古屋大学
(100 96 96.0%)
< 5 2 40.0%>
三重大学
( 97 95 97.9%)
< 7 5 71.4%>
滋賀医科大学 (100 95 95.0%)
京都大学
( 97 95 97.9%)
大阪大学
( 98 92 93.9%)
神戸大学
(100 98 98.0%)
鳥取大学
( 78 76 97.4%)
島根大学
( 89 82 92.1%)
岡山大学
( 92 87 94.6%)
広島大学
( 95 89 93.7%)
山口大学
( 96 83 86.5%)
徳島大学
( 89 85 95.5%)
香川大学
( 89 87 97.8%)
愛媛大学
( 92 91 98.9%)
高知大学
( 88 81 92.0%)
九州大学
(100 98 98.0%)
佐賀大学
( 91 88 96.7%)
長崎大学
( 77 72 93.5%)
熊本大学
( 94 93 98.9%)
大分大学
( 84 80 95.2%)
宮崎大学
( 96 90 93.8%)
鹿児島大学
( 93 89 95.7%)
琉球大学
(112 102 91.1%)
<3
<16
<11
<11
<11
<7
<8
<10
<10
<15
<8
<10
<13
<15
<7
<18
<18
<11
<15
<24
<17
2
9
6
7
8
4
5
5
9
7
7
7
5
10
3
11
8
9
12
16
7
66.7%>
56.3%>
54.5%>
63.6%>
72.7%>
57.1%>
62.5%>
50.0%>
90.0%>
46.7%>
87.5%>
70.0%>
38.5%>
66.7%>
42.9%>
61.1%>
44.4%>
81.8%>
80.0%>
66.7%>
41.2%>
【医師国家試験・医学部のある大学別合格率と合格者数】
(2008年度医師国家試験のデータ)
大学名
新卒
既卒
(受験者数・合格者数・合格率) <受験者数・合格者数・合格率>
国立大学医学部(42校)(4,016 3,819 95.1%)<434 257 59.2%>
北海道大学
(106 104 98.1%)
<17 10 58.8%>
旭川医科大学 ( 96
89 92.7%)
<8
3 37.5%>
弘前大学
(102 101 99.0%)
< 9 5 55.6%>
東北大学
( 88 84 95.5%)
<16 4 25.0%>
秋田大学
(103 94 91.3%)
< 8 6 75.0%>
山形大学
( 99 97 98.0%)
< 3 3 100.0%>
筑波大学
(108 105 97.2%)
< 8 8 100.0%>
群馬大学
(103 94 91.3%)
< 7 6 85.7%>
千葉大学
(103 99 96.1%)
< 7 4 57.1%>
東京大学
( 95 88 92.6%)
< 2 0 0.0%>
東京医科歯科大学 ( 86 82 95.3%)
< 7 6 85.7%>
新潟大学
( 94 86 91.5%)
< 6 2 33.3%>
富山大学
( 91 88 96.7%)
< 7 5 71.4%>
金沢大学
(101 97 96.0%)
<11 4 36.4%>
福井大学
(107 97 90.7%)
<12 5 41.7%>
山梨大学
( 97 90 92.8%)
<14 11 78.6%>
信州大学
( 98 93 94.9%)
< 8 2 25.0%>
岐阜大学
( 80 78 97.5%)
< 8 5 62.5%>
浜松医科大学 (112 109 97.3%)
< 6 4 66.7%>
名古屋大学
(100 96 96.0%)
< 5 2 40.0%>
三重大学
( 97 95 97.9%)
< 7 5 71.4%>
滋賀医科大学 (100 95 95.0%)
京都大学
( 97 95 97.9%)
大阪大学
( 98 92 93.9%)
神戸大学
(100 98 98.0%)
鳥取大学
( 78 76 97.4%)
島根大学
( 89 82 92.1%)
岡山大学
( 92 87 94.6%)
広島大学
( 95 89 93.7%)
山口大学
( 96 83 86.5%)
徳島大学
( 89 85 95.5%)
香川大学
( 89 87 97.8%)
愛媛大学
( 92 91 98.9%)
高知大学
( 88 81 92.0%)
九州大学
(100 98 98.0%)
佐賀大学
( 91 88 96.7%)
長崎大学
( 77 72 93.5%)
熊本大学
( 94 93 98.9%)
大分大学
( 84 80 95.2%)
宮崎大学
( 96 90 93.8%)
鹿児島大学
( 93 89 95.7%)
琉球大学
(112 102 91.1%)
•場合分け
•どうしてそれを知ることが有用?
<3
<16
<11
<11
<11
<7
<8
<10
<10
<15
<8
<10
<13
<15
<7
<18
<18
<11
<15
<24
<17
2
9
6
7
8
4
5
5
9
7
7
7
5
10
3
11
8
9
12
16
7
66.7%>
56.3%>
54.5%>
63.6%>
72.7%>
57.1%>
62.5%>
50.0%>
90.0%>
46.7%>
87.5%>
70.0%>
38.5%>
66.7%>
42.9%>
61.1%>
44.4%>
81.8%>
80.0%>
66.7%>
41.2%>
合格したい試験がある
• 自分が合格する確率は?
• 模試とは?
共用試験ナビ-年度一覧 > 第6版 共用試験ナビ > 医学系CBT-第3回正式実施全国成績
模試から得る情報
• 自分の得点
• 自分の順位
• 知りたいことは?
全体 vs. 個
模試から得る情報
• 知りたいことは?
– 自分の得点→自分の「真の」正答力
– 自分の順位→自分の「真の」順位
模試から得る情報
• 知りたいことは?
– 自分の得点→自分の「真の」正答力
– 自分の順位→自分の「真の」順位
• さらに知りたいことは?
– 「真の」正答力→自分が本番でとる得点
– 「真の」順位→自分が本番でとる順位
模試から得る情報
• 知りたいことは?
– 自分の得点→自分の「真の」正答力
– 自分の順位→自分の「真の」順位
• さらに、知りたいことは?
– 「真の」正答力→自分が本番でとる得点
– 「真の」順位→自分が本番でとる順位
• さらに、さらに、知りたいことは?
– 「真の」正答力と「ありたい正答力」との差
– その差の詰め方
模試から得る情報
• 知りたいことは?
– 自分の得点→自分の「真の」正答力
– 自分の順位→自分の「真の」順位
• 試験実施者が本当に知りたいことは
– 「正答力」ではなくて「実力」なんだけれど・・・
• 「知りたいこと」は観察できない(ことが多い)
– テスト(検査)で代用する
– 実験で代用する
模試から得る情報
• 「真の正答力」を推定する
– 10問中8問の正解
– 模試の点数→「真の正当力」
• どうやって?
模試から得る情報
• 「真の正答力」を推定する
– 模試の点数→「真の正当力」
• どうやって?
模試から得る情報
• 「真の正答力」を推定する
– 模試の点数→「真の正当力」
• どうやって?
– 仮説からスタートする
– 仮説を立てよう
模試から得る情報
• 「真の正答力」を推定する
– 模試の点数→「真の正当力」
• どうやって?
– 仮説からスタートする
– 「真の正答力は、『正答する確率』が80%である」
という仮説
• 仮説には「確率」がある
模試から得る情報
• 「真の正答力は、『正答する確率』が80%であ
る」という仮説
• この場合の模試の点数は?
->RGUI (編集→GUIpreference→フォント(20))
–
–
–
–
p<-0.8;nq<-10
rs<-rbinom(nq,1,p);mean(rs)*nq
rs<-rbinom(nq,1,p);mean(rs)*nq
…
模試から得る情報
• 「真の正答力は、『正答する確率』が80%であ
る」という仮説
– 「テストのたびに値が変わる・・・」
•
•
•
•
•
•
p<-0.8
nq<-10
nt<-10
rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)
obs<-apply(rs,1,sum)
table(obs)
模試から得る情報
• 「真の正答力は、『正答する確率』が80%であ
る」という仮説
– 「テストのたびに値が変わる・・・」
• テストを繰り返せば
•
•
p<-0.8
nq<-10
• nt<-10
•
•
•
rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)
obs<-apply(rs,1,sum)
table(obs)
p<-0.8
nq<-10
nt<-100
rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)
obs<-apply(rs,1,sum)
table(obs)
h<-hist(obs,xlim=c(0,nq),breaks=-1:nq)
plot(0:nq,h$counts,type="b")
模試から得る情報
• 「真の正答力は、『正答する確率』が80%であ
る」という仮説
– 「テストのたびに値が変わる・・・」
•
•
•
•
•
•
p<-0.8
nq<-10
nt<-10
rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)
obs<-apply(rs,1,sum)
table(obs)
p<-0.8
nq<-10
nt<-100
rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)
obs<-apply(rs,1,sum)
table(obs)
h<-hist(obs,xlim=c(0,nq),breaks=-1:nq)
plot(0:nq,h$counts,type="b")
模試から得る情報
• 「真の正答力は、『正答する確率』が80%であ
る」という仮説
– 「テストのたびに値が変わる・・・」
• 100回 模試を受けても・・・
•
•
•
•
•
•
p<-0.8
nq<-10
nt<-10
rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)
obs<-apply(rs,1,sum)
table(obs)
p<-0.8
nq<-10
nt<-100
rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)
obs<-apply(rs,1,sum)
table(obs)
h<-hist(obs,xlim=c(0,nq),breaks=-1:nq)
plot(0:nq,h$counts,type="b")
模試から得る情報
100回 模試を受けても
• 「真の正答力は、『正答する確率』が80%であ
る」という仮説
– 「テストのたびに値が変わる・・・」
• 100回 模試を受けても・・・
•
•
•
•
•
•
p<-0.8
nq<-10
nt<-10
rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)
obs<-apply(rs,1,sum)
table(obs)
p<-0.8
nq<-10
nt<-100
rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)
obs<-apply(rs,1,sum)
table(obs)
h<-hist(obs,xlim=c(0,nq),breaks=-1:nq)
plot(0:nq,h$counts,type="b")
模試から得る情報
• 「真の正答力は、『正答する確率』が80%であ
る」という仮説
– 「テストのたびに値が変わる・・・」→無限回 受ければ
•
•
•
•
•
•
p<-0.8
nq<-10
nt<-10
rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)
obs<-apply(rs,1,sum)
table(obs)
•
•
•
•
plot(0:nq,h$counts,type="b")
ds<-dbinom(0:nq,nq,p)
par(new=TRUE)
plot(0:nq,ds,type="b",col="red")
模試から得る情報
• 「真の正答力は、『正答する確率』が80%であ
る」という仮説
– 「テストのたびに値が変わる・・・」
•
•
•
•
•
•
p<-0.8
nq<-10
nt<-10
rs<-matrix(rbinom(nq*nt,1,p),nrow=nt)
obs<-apply(rs,1,sum)
table(obs)
•
•
•
•
plot(0:nq,h$counts,type="b")
ds<-dbinom(0:nq,nq,p)
par(new=TRUE)
plot(0:nq,ds,type="b",col="red")
みんなが使うものだから
• 正答確率 0.8の場
合の得点分布の確
率分布は
• 「知られている」
みんなが使うものならば
•
•
正答確率 0.8の場合の得点分布の確率分布は
「知られている」
• 「知られてい」れば、「知れ」ばよ
し
– 情報収集・調査・勉強
• 「知られていないけれど、知りた」
ければ、「知れ」ばよし
– 研究
模試から得る情報
• 「真の正答力」を推定する
– 「真の正答力は、『正答する確率』が80%である」という仮説
– どうして、「80%」と思った???
– 50%,10%,90%だったら?
•
•
•
•
p<-c(0.8,0.5,0.1,0.9)
ds<-dbinom(0:nq,nq,p[1])
ylim<-c(0,1)
plot(0:nq,ds,type="b",col="red",ylim=ylim)
•
•
•
par(new=T)
ds<-dbinom(0:nq,nq,p[2])
plot(0:nq,ds,type="b",ylim=ylim)
•
•
•
par(new=T)
ds<-dbinom(0:nq,nq,p[3])
plot(0:nq,ds,type="b",ylim=ylim)
•
•
•
par(new=T)
ds<-dbinom(0:nq,nq,p[4])
plot(0:nq,ds,type="b",ylim=ylim)
0.8
0.5
0.1
0.9
0.8
0.5
0.1
0.9
0.8
0.5
0.1
0.9
0.8
0.5
0.1
0.9
今、気になるのは、8点を取った場合
0.8
0.5
0.1
0.9
• 仮説→事象が起きる 確率 (起きそうなやすさ)
• 事象が起きる→仮説 尤度 (ありそうな程度)
真の正答確率が p のときに8点を取る確率は
8点を取ったときに、真の正答確率がpである尤度
「真の正答力は、『正答する確率』がpである」という仮説の下で
、10問中8問を正答する確率
10問中8問を正答したときに、真の正答力がpである尤度
point<-8
p<-seq(from=0,to=1,by=0.01)
ds<-dbinom(point,nq,p)
plot(p,ds,type="l")
abline(h=ds[81])
par(new=T)
v<-dbeta(p,point+1,nq-point+1)
plot(p,v)
模試から得る情報
• 「真の正答力」を推定する
• 何点を取ろうとも。
p<-seq(from=0,to=1,by=0.01)
obss<-matrix(0,length(p),nq+1)
for(i in 1:length(p)){
obss[i,]<-ds<-dbinom(0:nq,nq,p[i])
}
persp(obss,xlab="p",ylab="points",theta=90,
phi=30)
persp(obss,xlab="p",ylab="points",theta=0,p
hi=30)
仮説の下での確率密度分布
テストの点
観察の下での尤度分布
実力
1回目の模試が8点の場合
実力が0.8の場合
尤度
テストの点
実力
実力
「真の正答力は、『正答する確率』がpである」と
いう仮説の下で、10問中8問を正答する確率
10問中8問正答のときの真の正答力の尤度
• p=0.8のときに
最も大きい
– 最大の尤度を
持つ仮説は「
p=0.8」
– pの最尤推定
値
1回目の模試が80%正解の場合
実力はどこまで推定できた?
信頼区間をどう決めたい?
模試の結果から、実力を推定した。
実力 実力
正答率80%を最高に(最尤推定値) : 点推定
幅がある(信頼区間) : 区間推定
信頼区間をどう決めたい?
下限と上限に挟まれた範囲が95%
実力
上限・下限それぞれに2.5%ずつ
上限・下限の尤度を同じにして合わせて5%
上限・下限を中心から等距離とするとして、合わせて5%
下限だけ?
真の力より、次回は何点取るか?
• 真の正答確率は 0 <= p <=1
• p=P のときに t 点(t=0,1,2,...,10)を取る確率
は Pr(t|p=P)
• p=Pの確率は Pr(p=P)
• 全部のpについて、Pr(t|p=P) x Pr(p=P)を足
し合わせれば、t点を取る確率がわかる
真の力より、次回は何点取るか?
point<-8
p<-seq(from=0,to=1,by=0.01)
#ds<-dbinom(point,nq,p)
#plot(p,ds,type="l")
#abline(h=ds[81])
#par(new=T)
v<-dbeta(p,point+1,nq-point+1)
plot(p,v,type="l",col="red")
newpoints<-0:nq
cp<-choose(nq,newpoints)
out<-matrix(0,length(newpoints),length(p))
for(i in 1:length(newpoints)){
out[i,]<-cp[i]*p^newpoints[i]*(1-p)^(nq-newpoints[i])*v
}
out2<-apply(out,1,sum)
par(new=T)
plot(newpoints,out2,type="b")
次回は何点取るの?
推定
• 推定(の代表)値
• 推定値の範囲(信頼区間)
• 推定結果「の全部」を使って、さらなる推定
確率と尤度
実力が0.8の場合
確率
1回目の模試が80%正解の
場合
1回目の模試が80%正解の
場合に、次回の試験の点数
の予想
尤度
テストの点
確率
実力
実力
テストの点
問題
• 確率と尤度について自分の言葉で説明しなさ
い(A4の紙に記入)
臨床における推定
• 診断という推定
– 診断Aという仮説
– 診断Bという仮説
–…
• 予後の推定
Aのときの確率
臨床情報
問診・検査
A,B,...の尤度
– 予後Xという予想
– 予後Yという予想
• 推定(診断)には
– 最尤推定がある
– 信頼区間がある
予後推定(A,Bが決まらなくても・・・)
予想の調整
• 「真の正当力が80%」と思っていた
• 75/100点を取った
– 「ま、そんなものか」
– 「真の正当力」の予想は(ほぼ)変わらない
• 50/100点を取った
– 「え・・・」
– 「真の正当力は60%くらいかな・・・」
– 「真の正当力」の予想が変わる
予想の調整
• 「真の正当力が50%」と思っていた
• 75/100点を取った
– 「え・・・」
– 「真の正当力は60%くらいかな」
• 50/100点を取った
– 「ま、そんなものか」
– 「真の正当力」の予想は(ほぼ)変わらない
事前予想
• 「真の正当力が50%」と思っていた
• 75/100点を取った
観察
– 「え・・・」
– 「真の正当力は60%くらいかな」
• 50/100点を取った
事後予想
– 「ま、そんなものか」
– 「真の正当力」の予想は(ほぼ)変わらない
研究における推定
• 値を計測(実験)したら、必ず推定
• 模試:全10問の模試
– たくさんの実験(10問)を実施していた
• 実験も繰り返しが必要
• 推定には繰り返しが必要