数理統計学(第一回) 確率変数とは? 浜田知久馬 数理統計学第1回 1 世の中は不確定なことが多い 決まりきったことばかりとは限らない. 予想される値は決まっていてもばらつく. このようなとき,確率変数によって,物事を確率 的に記述できると便利なことが多い. 数理統計学第1回 2 確率変数X 条件1)Xが取り得る値はある範囲(標本空間: sample space)に定まっている. 条件2)Xはある時点が過ぎると値が定まる「実現 値」が,それまでは値が不確定である. 条件3)Xの取り得る値についての確率分布は定 まっている. 数理統計学第1回 3 サイコロの目の例 条件1)1,2,3,4,5,6 条件2)サイコロを投げると目は定まる 条件3)Pr{X=i}=1/6 i=1,2,3,4,5,6 サイコロが壷の中で投げられていたら いかさまだったら 数理統計学第1回 4 隣の人の明日の登校時間 条件1)0時~24時 条件2)明日来てみればわかる. 条件3)8時50分位を中心にして,ある バラツキを持った分布にしたがう. 明日自分が休んでしまったら. 総武線が遅れてしまったら. 数理統計学第1回 5 演習 1)自分の身近なもので確率変数を3つあげるこ と. 2)条件1),条件2),条件3)を上げること. 3)条件1),条件2),条件3)を動かす要因を考 えること. 数理統計学第1回 6 天気予報より きょう 4/22 (月) の 天気 4/23 時間帯 6時-12時 12時-18時 18時-24時 0時-6時 降水確率 30% 20% 10% 10% 予想気温 (℃)18 / 23 / 13 週間予報 4/24 (水) 4/25 (木) 4/26 (金) 4/27 (土) 4/28 (日) 降水確率 30% 50% 50% 予想気温 (℃) 23/14 20/15 16/12 数理統計学第1回 40% 19/10 20% 21/12 7 統計工学Ⅱの得点 0.02 密 度 0.01 0 0 12 24 36 48 60 72 84 96 x x 20 40 数理統計学第1回x 60 80 8 統計工学ⅠとⅡの平均得点 N 平均値 標準偏差 歪度 無修正平方和 変動係数 100% 75% 50% 25% 0% 最大値 Q3 中央値 Q1 最小値 範囲 Q3-Q1 最頻値 モーメント 88.0000 重みの合計 42.6477 合計 22.9863 分散 0.2988 尖度 206025.000 修正平方和 53.8980 標準誤差 パーセント点 90.0000 60.0000 33.5000 23.5000 4.0000 86.0000 36.5000 60.0000 数理統計学第1回 99.0% 97.5% 95.0% 90.0% 10.0% 5.0% 2.5% 1.0% 88.0000 3753.0000 528.3687 -1.2634 45968.0795 2.4503 90.0000 80.0000 80.0000 80.0000 15.0000 13.0000 10.0000 4.0000 9 確率変数と実現値 確率変数:ある時点までは,確率分布によって 記述される. 実現値:ある時点を過ぎて定まった値のことを 実現値または観測値と呼ぶ 確率変数は大文字で,実現値は小文字で表現 するのが一般的である. X→x 数理統計学第1回 10 確率変数の分布の記述法 1)確率(密度)関数 2)(累積)分布関数 3)%点 4)期待値,分散 5)モーメント 6)母関数 数理統計学第1回 11 確率分布の記述 確率分布とは,標本空間における確率という名 の量の分布である. 確率の和は1である 離散分布:確率関数 Σp(x)=1 連続分布:確率密度関数 ∫f(x)dx=1 p(x)≧0,f(x)≧0 身長は離散分布か,連続分布か? お金は離散分布か,連続分布か? 数理統計学第1回 12 サイコロの目の確率分布 確 率 1/6 1 2 3 4 数理統計学第1回 5 6 13 連続分布の確率 9:00ちょうどに大学に来る確率はいくらか? 9:00と9:10に来る可能性はどちらが大きいか? 9:00から9:10に来る確率は? 8:59:30から9:00:30に来る確率は? 確率密度(1/時間)は定義できる. ある区間(a,b)に入る確率:∫ab f(x)dx 数理統計学第1回 14 正規分布の確率密度関数 , f(x) x exp 2 2 2 2 2 1 x 数理統計学第1回 15 標準正規分布の確率密度関数 数理統計学第1回 16 Carl Friedrich Gauss 1777-1855 ガウスについては下記に詳しい http://www-groups.dcs.st-and.ac.uk/~history/Mathematicians/Gauss.html 数理統計学第1回 17 分布関数 確率分布の別の記述方法 F(x):x以下になる確率(0~1) 離散型の分布: F ( x) p (u ) ux 例) サイコロで3以下になる確率 連続型の分布: F ( x ) x f ( u ) du 例) 9:00までに来る確率 数理統計学第1回 18 サイコロの目の例 6/6 5/6 4/6 3/6 2/6 1/6 0/6 1 2 3数理統計学第1回 4 5 6 19 正規分布の例 数理統計学第1回 20 分布関数と確率関数 離散型の分布 p(x)=F(x)-F(x-) 連続型の分布 f(x)=dF(x)/dx * x-の意味はxの-の側から単調に 増加して収束することを意味する. 数理統計学第1回 21 H13年度17歳の体格 もしある確率変数の分布が定まれば,様々な 情報を得ることができる. 身長 平均 SD 体重 平均 SD 男子 170.9 5.76 62.8 10.47 女子 158.0 5.32 53.2 8.11 仮に正規分布に従っているとすれば,ある範 囲に入る確率,ある値を超える確率を分布 22 数理統計学第1回 関数,確率密度関数から求められる. 演習 コインを4枚投げたときの,表が出る回数の 確率関数と分布関数を記述せよ. 数理統計学第1回 23 表の回数の分布 二項分布(n,p) p(x)=nCxpx(1-p)n-x 表表表表 表表表裏 表表裏表 表裏表表 裏表表表 表表裏裏 表裏表裏 裏表表裏 表裏裏表 裏表裏表 裏裏表表 裏裏裏表 裏裏表裏 裏表裏裏 表裏裏裏 裏裏裏裏 確率=(1/2)× (1/2) ×(1/2) ×(1/2)=1/16 数理統計学第1回 24 SASのプログラム例 data data;phi=0.50;n=4; do y=0 to 4; p=pdf('binomial',y,phi,n); F=cdf('binomial',y,phi,n); output;end; proc gplot;plot p*y/vzero; symbol1 i=needle; proc gplot;plot f*y/vzero; symbol1 i=steplj; 数理統計学第1回 25 確率関数 数理統計学第1回 26 分布関数 数理統計学第1回 27 EXCELのBINOMDIST関数 2項分布の確率関数 or 分布関数 BINOMDIST(成功数, 試行回数, 成功率, 関数形式) 成功数 試行回数 に含まれる成功の回数を指定 試行回数 独立試行の回数を指定 成功率 1 回の試行が成功する確率を指定 関数形式 0:確率関数 1:分布関数 例 BINOMDIST(1,4,0.5,0)=0.25 BINOMDIST(1,4,0.5,1)=0.3125 数理統計学第1回 28 EXCELによる計算 0 1 2 3 4 0.25 0.375 0.25 0.0625 数理統計学第1回 0.0625 0.3125 0.6875 0.9375 1 29 %点:percentile 分布関数:確率密度関数の積分 →簡単な関数では表せない 数表 x→F(x) F(x)=α →x 下側100α%点:F(x)=αとなるxの値 上側100α%点:F(x)=1-αとなるxの値 両側100α%点:F(x)=1-α/2となるxの値 50%点:メジアン 25,75%点:四分位点 数理統計学第1回 30 NORMDIST関数 正規分布の確率密度関数 or 分布関数 NORMDIST(x, 平均, 標準偏差, 関数形式) x 関数に代入する数値を指定 平均 分布の算術平均 を指定 標準偏差 分布の標準偏差を指定 関数形式 0:確率密度関数 1:分布関数 例 NORMDIST(-1,0,1,0)=0.241971 NORMDIST(-1,0,1,1)=0.158655 数理統計学第1回 31 NORMINV関数 標準正規累積分布関数の%点の値を返す。 書式 NORMINV(確率, 平均, 標準偏差) 確率 正規分布における確率を指定 平均 分布の算術平均 (相加平均) を指定 標準偏差 分布の標準偏差値を指定 例 NORMINV(0.95,0,1)=1.644853 数理統計学第1回 32 正規分布の数表の作成 0.001 0.005 0.01 0.025 0.05 0.1 0.9 0.95 0.975 0.99 0.995 0.999 -3.09025 -2.57583 -2.32635 -1.95996 -1.64485 -1.28155 1.281552 1.644853 1.959963 2.326347 2.575831 3.090253 数理統計学第1回 33 SASの乱数関数 NORMAL(seed) RANNOR(seed) 正規分布 RANBIN(seed,n,p) 2 項分布 RANCAU(seed) Cauchy 分布 RANEXP(seed) 指数分布 RANGAM(seed,alpha) ガンマ分布 RANPOI(seed,lambda) ポアソン分布 RANTBL(seed,p1,..pi,..pn) 指定した重み RANTRI(seed,h) 三角分布 RANUNI(seed) UNIFORM(seed) 一様乱数 数理統計学第1回 34 分布関数の%点 BETAINV(p,a,b) CINV(p,df<,nc>) FINV(p,ndf,ddf<,nc>) GAMINV(p,a) PROBIT(p) TINV(p,df<,nc>) ベータ分布 カイ 2 乗分布 F 分布 ガンマ分布 標準正規分布 t 分布 数理統計学第1回 35 確率(密度)関数 POISSON((lambda,n) ポアソン分布 PROBBETA(x,a,b) ベータ分布 PROBBNML(p,n,m) 2 項分布 PROBCHI(x,df<,nc>) カイ 2 乗分布 PROBF(x,ndf,ddf<,nc>) F 分布 PROBGAM(x,a) ガンマ分布 PROBHYPR(nn,k,x<,or>) 超幾何分布 PROBNEGB(p,n,m) 負の 2 項分布 PROBNORM(x) 正規分布 PROBT(x,df<,nc>) スチューデントの t 分布 数理統計学第1回 36 演習1 指数分布(連続分布) 機械(コンピュータ等)の故障するまでの時間は指 数分布にしたがうことが知られている. 指数分布では分布関数は F(x)=1 - exp(-λx) となる. λ=1として,指数分布の分布関数と確率 密度関数を図示せよ. ヒント exp(-1)=0.3679,exp(-2)=0.1353 exp(-3)=0.0498,exp(-4)=0.0183 数理統計学第1回 37 演習2 ポアソン分布(離散分布) 稀な事象(交通事故等)の生起数はポアソン分布 にしたがうことが知られている. ポアソン分布では確率関数は p(x)= λxexp(-λ)/x! x=0,1,2,・・・ となる. λ=2として,ポアソン分布の分布関数と 確率関数を図示せよ. ヒント exp(-2)=0.1353 数理統計学第1回 38
© Copyright 2024 ExpyDoc