医学に活かす 確率・統計 • A4用紙の配布 – 縦に使います – 学生番号 氏名 避けて通れない確率・統計 • 不確実だから – 研究はわからないことを対象にする • 未知が対象 – 臨床は不十分な情報に基づいて行動する • 既知のリストから選び出す • 研究も 臨床も、論理的・科学的であることが必要だ から – 他人を説得する – 自分が納得する • 論理・科学の(唯一の)共通言語だから 手法は不要 考え方は必要 • 過去問になっている問題 • 過去問の類似問題 • 新しい問題 計算機は不要(かも) 勘は必要 • 確率的思考をしているときに、電卓をたたい ている暇はない • そこそこ、はずれない「勘」を持っていることが 大事 • その「勘」のよさが、臨床のセンス、研究のセ ンスのよさ・・・のような気がします • この辺りのことに、なにがしかのイメージを持 つことが3コマの目標です 計算機が欲しいなら • フリーソフトをどうぞ –R http://www.r-project.org/ http://www.okada.jp.org/RWiki/index.php 確率・統計的な考え方のこつ • 自分なりにわかること – 覚えることは何もない – 自分で考えを進められれば、よし – 疑う • 情報を鵜呑みにしない • 理由を見つける • こだわらない・こだわっている自分に気づく – 「絶対」はない • 場合にわける • 条件をつける 推定* 推定* : 斜字体の言葉はこの講義で理解するべき概念(「学問 的」部分) 合格したい試験がある • 自分が合格する確率は? 合格したい試験がある • 自分が合格する確率は? • 「当てる」ために必要な情報は? 合格したい試験がある • 自分が合格する確率は? • 「当てる」ために有用な情報は? – 合格率は? 合格したい試験がある • 自分が合格する確率は? • 「当てる」ために有用な情報は? – 合格率は? • どうしてそれを知ることが有用? 合格したい試験がある • 自分が合格する確率は? • 「当てる」ために必要な情報は? – 合格率は? – 何の試験? • どうしてそれを知ることが有用? 【医師国家試験・医学部のある大学別合格率と合格者数】 (2008年度医師国家試験のデータ) 大学名 新卒 既卒 (受験者数・合格者数・合格率) <受験者数・合格者数・合格率> 国立大学医学部(42校)(4,016 3,819 95.1%)<434 257 59.2%> 北海道大学 (106 104 98.1%) <17 10 58.8%> 旭川医科大学 ( 96 89 92.7%) <8 3 37.5%> 弘前大学 (102 101 99.0%) < 9 5 55.6%> 東北大学 ( 88 84 95.5%) <16 4 25.0%> 秋田大学 (103 94 91.3%) < 8 6 75.0%> 山形大学 ( 99 97 98.0%) < 3 3 100.0%> 筑波大学 (108 105 97.2%) < 8 8 100.0%> 群馬大学 (103 94 91.3%) < 7 6 85.7%> 千葉大学 (103 99 96.1%) < 7 4 57.1%> 東京大学 ( 95 88 92.6%) < 2 0 0.0%> 東京医科歯科大学 ( 86 82 95.3%) < 7 6 85.7%> 新潟大学 ( 94 86 91.5%) < 6 2 33.3%> 富山大学 ( 91 88 96.7%) < 7 5 71.4%> 金沢大学 (101 97 96.0%) <11 4 36.4%> 福井大学 (107 97 90.7%) <12 5 41.7%> 山梨大学 ( 97 90 92.8%) <14 11 78.6%> 信州大学 ( 98 93 94.9%) < 8 2 25.0%> 岐阜大学 ( 80 78 97.5%) < 8 5 62.5%> 浜松医科大学 (112 109 97.3%) < 6 4 66.7%> 名古屋大学 (100 96 96.0%) < 5 2 40.0%> 三重大学 ( 97 95 97.9%) < 7 5 71.4%> 滋賀医科大学 (100 95 95.0%) 京都大学 ( 97 95 97.9%) 大阪大学 ( 98 92 93.9%) 神戸大学 (100 98 98.0%) 鳥取大学 ( 78 76 97.4%) 島根大学 ( 89 82 92.1%) 岡山大学 ( 92 87 94.6%) 広島大学 ( 95 89 93.7%) 山口大学 ( 96 83 86.5%) 徳島大学 ( 89 85 95.5%) 香川大学 ( 89 87 97.8%) 愛媛大学 ( 92 91 98.9%) 高知大学 ( 88 81 92.0%) 九州大学 (100 98 98.0%) 佐賀大学 ( 91 88 96.7%) 長崎大学 ( 77 72 93.5%) 熊本大学 ( 94 93 98.9%) 大分大学 ( 84 80 95.2%) 宮崎大学 ( 96 90 93.8%) 鹿児島大学 ( 93 89 95.7%) 琉球大学 (112 102 91.1%) <3 <16 <11 <11 <11 <7 <8 <10 <10 <15 <8 <10 <13 <15 <7 <18 <18 <11 <15 <24 <17 2 9 6 7 8 4 5 5 9 7 7 7 5 10 3 11 8 9 12 16 7 66.7%> 56.3%> 54.5%> 63.6%> 72.7%> 57.1%> 62.5%> 50.0%> 90.0%> 46.7%> 87.5%> 70.0%> 38.5%> 66.7%> 42.9%> 61.1%> 44.4%> 81.8%> 80.0%> 66.7%> 41.2%> 【医師国家試験・医学部のある大学別合格率と合格者数】 (2008年度医師国家試験のデータ) 大学名 新卒 既卒 (受験者数・合格者数・合格率) <受験者数・合格者数・合格率> 国立大学医学部(42校)(4,016 3,819 95.1%)<434 257 59.2%> 北海道大学 (106 104 98.1%) <17 10 58.8%> 旭川医科大学 ( 96 89 92.7%) <8 3 37.5%> 弘前大学 (102 101 99.0%) < 9 5 55.6%> 東北大学 ( 88 84 95.5%) <16 4 25.0%> 秋田大学 (103 94 91.3%) < 8 6 75.0%> 山形大学 ( 99 97 98.0%) < 3 3 100.0%> 筑波大学 (108 105 97.2%) < 8 8 100.0%> 群馬大学 (103 94 91.3%) < 7 6 85.7%> 千葉大学 (103 99 96.1%) < 7 4 57.1%> 東京大学 ( 95 88 92.6%) < 2 0 0.0%> 東京医科歯科大学 ( 86 82 95.3%) < 7 6 85.7%> 新潟大学 ( 94 86 91.5%) < 6 2 33.3%> 富山大学 ( 91 88 96.7%) < 7 5 71.4%> 金沢大学 (101 97 96.0%) <11 4 36.4%> 福井大学 (107 97 90.7%) <12 5 41.7%> 山梨大学 ( 97 90 92.8%) <14 11 78.6%> 信州大学 ( 98 93 94.9%) < 8 2 25.0%> 岐阜大学 ( 80 78 97.5%) < 8 5 62.5%> 浜松医科大学 (112 109 97.3%) < 6 4 66.7%> 名古屋大学 (100 96 96.0%) < 5 2 40.0%> 三重大学 ( 97 95 97.9%) < 7 5 71.4%> 滋賀医科大学 (100 95 95.0%) 京都大学 ( 97 95 97.9%) 大阪大学 ( 98 92 93.9%) 神戸大学 (100 98 98.0%) 鳥取大学 ( 78 76 97.4%) 島根大学 ( 89 82 92.1%) 岡山大学 ( 92 87 94.6%) 広島大学 ( 95 89 93.7%) 山口大学 ( 96 83 86.5%) 徳島大学 ( 89 85 95.5%) 香川大学 ( 89 87 97.8%) 愛媛大学 ( 92 91 98.9%) 高知大学 ( 88 81 92.0%) 九州大学 (100 98 98.0%) 佐賀大学 ( 91 88 96.7%) 長崎大学 ( 77 72 93.5%) 熊本大学 ( 94 93 98.9%) 大分大学 ( 84 80 95.2%) 宮崎大学 ( 96 90 93.8%) 鹿児島大学 ( 93 89 95.7%) 琉球大学 (112 102 91.1%) •場合分け •どうしてそれを知ることが有用? <3 <16 <11 <11 <11 <7 <8 <10 <10 <15 <8 <10 <13 <15 <7 <18 <18 <11 <15 <24 <17 2 9 6 7 8 4 5 5 9 7 7 7 5 10 3 11 8 9 12 16 7 66.7%> 56.3%> 54.5%> 63.6%> 72.7%> 57.1%> 62.5%> 50.0%> 90.0%> 46.7%> 87.5%> 70.0%> 38.5%> 66.7%> 42.9%> 61.1%> 44.4%> 81.8%> 80.0%> 66.7%> 41.2%> 合格したい試験がある • 自分が合格する確率は? • 模試とは? 共用試験ナビ-年度一覧 > 第6版 共用試験ナビ > 医学系CBT-第3回正式実施全国成績 模試から得る情報 • 自分の得点 • 自分の順位 • 知りたいことは? 全体 vs. 個 模試から得る情報 • 知りたいことは? – 自分の得点→自分の「真の」正答力 – 自分の順位→自分の「真の」順位 模試から得る情報 • 知りたいことは? – 自分の得点→自分の「真の」正答力 – 自分の順位→自分の「真の」順位 • さらに知りたいことは? – 「真の」正答力→自分が本番でとる得点 – 「真の」順位→自分が本番でとる順位 模試から得る情報 • 知りたいことは? – 自分の得点→自分の「真の」正答力 – 自分の順位→自分の「真の」順位 • さらに、知りたいことは? – 「真の」正答力→自分が本番でとる得点 – 「真の」順位→自分が本番でとる順位 • さらに、さらに、知りたいことは? – 「真の」正答力と「ありたい正答力」との差 – その差の詰め方 模試から得る情報 • 知りたいことは? – 自分の得点→自分の「真の」正答力 – 自分の順位→自分の「真の」順位 • 試験実施者が本当に知りたいことは – 「正答力」ではなくて「実力」なんだけれど・・・ • 「知りたいこと」は観察できない(ことが多い) – テスト(検査)で代用する – 実験で代用する 模試から得る情報 • 「真の正答力」を推定する – 10問中8問の正解 – 模試の点数→「真の正当力」 • どうやって? 模試から得る情報 • 「真の正答力」を推定する – 模試の点数→「真の正当力」 • どうやって? 模試から得る情報 • 「真の正答力」を推定する – 模試の点数→「真の正当力」 • どうやって? – 仮説からスタートする – 仮説を立てよう 模試から得る情報 • 「真の正答力」を推定する – 模試の点数→「真の正当力」 • どうやって? – 仮説からスタートする – 「真の正答力は、『正答する確率』が80%である」 という仮説 • 仮説には「確率」がある 模試から得る情報 • 「真の正答力は、『正答する確率』が80%であ る」という仮説 • この場合の模試の点数は? ->RGUI (編集→GUIpreference→フォント(20)) – – – – p<-0.8;nq<-10 rs<-rbinom(nq,1,p);mean(rs)*nq rs<-rbinom(nq,1,p);mean(rs)*nq … 模試から得る情報 • 「真の正答力は、『正答する確率』が80%であ る」という仮説 – 「テストのたびに値が変わる・・・」 • • • • • • p<-0.8 nq<-10 nt<-10 rs<-matrix(rbinom(nq*nt,1,p),nrow=nt) obs<-apply(rs,1,sum) table(obs) 模試から得る情報 • 「真の正答力は、『正答する確率』が80%であ る」という仮説 – 「テストのたびに値が変わる・・・」 • テストを繰り返せば • • p<-0.8 nq<-10 • nt<-10 • • • rs<-matrix(rbinom(nq*nt,1,p),nrow=nt) obs<-apply(rs,1,sum) table(obs) p<-0.8 nq<-10 nt<-100 rs<-matrix(rbinom(nq*nt,1,p),nrow=nt) obs<-apply(rs,1,sum) table(obs) h<-hist(obs,xlim=c(0,nq),breaks=-1:nq) plot(0:nq,h$counts,type="b") 模試から得る情報 • 「真の正答力は、『正答する確率』が80%であ る」という仮説 – 「テストのたびに値が変わる・・・」 • • • • • • p<-0.8 nq<-10 nt<-10 rs<-matrix(rbinom(nq*nt,1,p),nrow=nt) obs<-apply(rs,1,sum) table(obs) p<-0.8 nq<-10 nt<-100 rs<-matrix(rbinom(nq*nt,1,p),nrow=nt) obs<-apply(rs,1,sum) table(obs) h<-hist(obs,xlim=c(0,nq),breaks=-1:nq) plot(0:nq,h$counts,type="b") 模試から得る情報 • 「真の正答力は、『正答する確率』が80%であ る」という仮説 – 「テストのたびに値が変わる・・・」 • 100回 模試を受けても・・・ • • • • • • p<-0.8 nq<-10 nt<-10 rs<-matrix(rbinom(nq*nt,1,p),nrow=nt) obs<-apply(rs,1,sum) table(obs) p<-0.8 nq<-10 nt<-100 rs<-matrix(rbinom(nq*nt,1,p),nrow=nt) obs<-apply(rs,1,sum) table(obs) h<-hist(obs,xlim=c(0,nq),breaks=-1:nq) plot(0:nq,h$counts,type="b") 模試から得る情報 100回 模試を受けても • 「真の正答力は、『正答する確率』が80%であ る」という仮説 – 「テストのたびに値が変わる・・・」 • 100回 模試を受けても・・・ • • • • • • p<-0.8 nq<-10 nt<-10 rs<-matrix(rbinom(nq*nt,1,p),nrow=nt) obs<-apply(rs,1,sum) table(obs) p<-0.8 nq<-10 nt<-100 rs<-matrix(rbinom(nq*nt,1,p),nrow=nt) obs<-apply(rs,1,sum) table(obs) h<-hist(obs,xlim=c(0,nq),breaks=-1:nq) plot(0:nq,h$counts,type="b") 模試から得る情報 • 「真の正答力は、『正答する確率』が80%であ る」という仮説 – 「テストのたびに値が変わる・・・」→無限回 受ければ • • • • • • p<-0.8 nq<-10 nt<-10 rs<-matrix(rbinom(nq*nt,1,p),nrow=nt) obs<-apply(rs,1,sum) table(obs) • • • • plot(0:nq,h$counts,type="b") ds<-dbinom(0:nq,nq,p) par(new=TRUE) plot(0:nq,ds,type="b",col="red") 模試から得る情報 • 「真の正答力は、『正答する確率』が80%であ る」という仮説 – 「テストのたびに値が変わる・・・」 • • • • • • p<-0.8 nq<-10 nt<-10 rs<-matrix(rbinom(nq*nt,1,p),nrow=nt) obs<-apply(rs,1,sum) table(obs) • • • • plot(0:nq,h$counts,type="b") ds<-dbinom(0:nq,nq,p) par(new=TRUE) plot(0:nq,ds,type="b",col="red") みんなが使うものだから • 正答確率 0.8の場 合の得点分布の確 率分布は • 「知られている」 みんなが使うものならば • • 正答確率 0.8の場合の得点分布の確率分布は 「知られている」 • 「知られてい」れば、「知れ」ばよ し – 情報収集・調査・勉強 • 「知られていないけれど、知りた」 ければ、「知れ」ばよし – 研究 模試から得る情報 • 「真の正答力」を推定する – 「真の正答力は、『正答する確率』が80%である」という仮説 – どうして、「80%」と思った??? – 50%,10%,90%だったら? • • • • p<-c(0.8,0.5,0.1,0.9) ds<-dbinom(0:nq,nq,p[1]) ylim<-c(0,1) plot(0:nq,ds,type="b",col="red",ylim=ylim) • • • par(new=T) ds<-dbinom(0:nq,nq,p[2]) plot(0:nq,ds,type="b",ylim=ylim) • • • par(new=T) ds<-dbinom(0:nq,nq,p[3]) plot(0:nq,ds,type="b",ylim=ylim) • • • par(new=T) ds<-dbinom(0:nq,nq,p[4]) plot(0:nq,ds,type="b",ylim=ylim) 0.8 0.5 0.1 0.9 0.8 0.5 0.1 0.9 0.8 0.5 0.1 0.9 0.8 0.5 0.1 0.9 今、気になるのは、8点を取った場合 0.8 0.5 0.1 0.9 • 仮説→事象が起きる 確率 (起きそうなやすさ) • 事象が起きる→仮説 尤度 (ありそうな程度) 真の正答確率が p のときに8点を取る確率は 8点を取ったときに、真の正答確率がpである尤度 「真の正答力は、『正答する確率』がpである」という仮説の下で 、10問中8問を正答する確率 10問中8問を正答したときに、真の正答力がpである尤度 point<-8 p<-seq(from=0,to=1,by=0.01) ds<-dbinom(point,nq,p) plot(p,ds,type="l") abline(h=ds[81]) par(new=T) v<-dbeta(p,point+1,nq-point+1) plot(p,v) 模試から得る情報 • 「真の正答力」を推定する • 何点を取ろうとも。 p<-seq(from=0,to=1,by=0.01) obss<-matrix(0,length(p),nq+1) for(i in 1:length(p)){ obss[i,]<-ds<-dbinom(0:nq,nq,p[i]) } persp(obss,xlab="p",ylab="points",theta=90, phi=30) persp(obss,xlab="p",ylab="points",theta=0,p hi=30) 仮説の下での確率密度分布 テストの点 観察の下での尤度分布 実力 1回目の模試が8点の場合 実力が0.8の場合 尤度 テストの点 実力 実力 「真の正答力は、『正答する確率』がpである」と いう仮説の下で、10問中8問を正答する確率 10問中8問正答のときの真の正答力の尤度 • p=0.8のときに 最も大きい – 最大の尤度を 持つ仮説は「 p=0.8」 – pの最尤推定 値 1回目の模試が80%正解の場合 実力はどこまで推定できた? 信頼区間をどう決めたい? 模試の結果から、実力を推定した。 実力 実力 正答率80%を最高に(最尤推定値) : 点推定 幅がある(信頼区間) : 区間推定 信頼区間をどう決めたい? 下限と上限に挟まれた範囲が95% 実力 上限・下限それぞれに2.5%ずつ 上限・下限の尤度を同じにして合わせて5% 上限・下限を中心から等距離とするとして、合わせて5% 下限だけ? 真の力より、次回は何点取るか? • 真の正答確率は 0 <= p <=1 • p=P のときに t 点(t=0,1,2,...,10)を取る確率 は Pr(t|p=P) • p=Pの確率は Pr(p=P) • 全部のpについて、Pr(t|p=P) x Pr(p=P)を足 し合わせれば、t点を取る確率がわかる 真の力より、次回は何点取るか? point<-8 p<-seq(from=0,to=1,by=0.01) #ds<-dbinom(point,nq,p) #plot(p,ds,type="l") #abline(h=ds[81]) #par(new=T) v<-dbeta(p,point+1,nq-point+1) plot(p,v,type="l",col="red") newpoints<-0:nq cp<-choose(nq,newpoints) out<-matrix(0,length(newpoints),length(p)) for(i in 1:length(newpoints)){ out[i,]<-cp[i]*p^newpoints[i]*(1-p)^(nq-newpoints[i])*v } out2<-apply(out,1,sum) par(new=T) plot(newpoints,out2,type="b") 次回は何点取るの? 推定 • 推定(の代表)値 • 推定値の範囲(信頼区間) • 推定結果「の全部」を使って、さらなる推定 確率と尤度 実力が0.8の場合 確率 1回目の模試が80%正解の 場合 1回目の模試が80%正解の 場合に、次回の試験の点数 の予想 尤度 テストの点 確率 実力 実力 テストの点 問題 • 確率と尤度について自分の言葉で説明しなさ い(A4の紙に記入) 臨床における推定 • 診断という推定 – 診断Aという仮説 – 診断Bという仮説 –… • 予後の推定 Aのときの確率 臨床情報 問診・検査 A,B,...の尤度 – 予後Xという予想 – 予後Yという予想 • 推定(診断)には – 最尤推定がある – 信頼区間がある 予後推定(A,Bが決まらなくても・・・) 予想の調整 • 「真の正当力が80%」と思っていた • 75/100点を取った – 「ま、そんなものか」 – 「真の正当力」の予想は(ほぼ)変わらない • 50/100点を取った – 「え・・・」 – 「真の正当力は60%くらいかな・・・」 – 「真の正当力」の予想が変わる 予想の調整 • 「真の正当力が50%」と思っていた • 75/100点を取った – 「え・・・」 – 「真の正当力は60%くらいかな」 • 50/100点を取った – 「ま、そんなものか」 – 「真の正当力」の予想は(ほぼ)変わらない 事前予想 • 「真の正当力が50%」と思っていた • 75/100点を取った 観察 – 「え・・・」 – 「真の正当力は60%くらいかな」 • 50/100点を取った 事後予想 – 「ま、そんなものか」 – 「真の正当力」の予想は(ほぼ)変わらない 研究における推定 • 値を計測(実験)したら、必ず推定 • 模試:全10問の模試 – たくさんの実験(10問)を実施していた • 実験も繰り返しが必要 • 推定には繰り返しが必要
© Copyright 2025 ExpyDoc