数理統計学(第一回) 確率変数とは?

数理統計学(第一回)
確率変数とは?
浜田知久馬
数理統計学第1回
1
世の中は不確定なことが多い
決まりきったことばかりとは限らない.
予想される値は決まっていてもばらつく.
このようなとき,確率変数によって,物事を確率
的に記述できると便利なことが多い.
数理統計学第1回
2
確率変数X
条件1)Xが取り得る値はある範囲(標本空間:
sample space)に定まっている.
条件2)Xはある時点が過ぎると値が定まる「実現
値」が,それまでは値が不確定である.
条件3)Xの取り得る値についての確率分布は定
まっている.
数理統計学第1回
3
サイコロの目の例
条件1)1,2,3,4,5,6
条件2)サイコロを投げると目は定まる
条件3)Pr{X=i}=1/6
i=1,2,3,4,5,6
サイコロが壷の中で投げられていたら
いかさまだったら
数理統計学第1回
4
隣の人の明日の登校時間
条件1)0時~24時
条件2)明日来てみればわかる.
条件3)8時50分位を中心にして,ある
バラツキを持った分布にしたがう.
明日自分が休んでしまったら.
総武線が遅れてしまったら.
数理統計学第1回
5
演習
1)自分の身近なもので確率変数を3つあげるこ
と.
2)条件1),条件2),条件3)を上げること.
3)条件1),条件2),条件3)を動かす要因を考
えること.
数理統計学第1回
6
天気予報より
きょう 4/22 (月) の 天気
4/23
時間帯 6時-12時 12時-18時 18時-24時 0時-6時
降水確率
30%
20%
10%
10%
予想気温
(℃)18 / 23 / 13
週間予報
4/24 (水) 4/25 (木) 4/26 (金) 4/27 (土) 4/28
(日)
降水確率
30% 50% 50%
予想気温 (℃) 23/14 20/15
16/12
数理統計学第1回
40%
19/10
20%
21/12
7
統計工学Ⅱの得点
0.02
密
度
0.01
0
0
12
24
36
48
60
72
84
96
x
x
20
40
数理統計学第1回x
60
80
8
統計工学ⅠとⅡの平均得点
N
平均値
標準偏差
歪度
無修正平方和
変動係数
100%
75%
50%
25%
0%
最大値
Q3
中央値
Q1
最小値
範囲
Q3-Q1
最頻値
モーメント
88.0000
重みの合計
42.6477
合計
22.9863
分散
0.2988
尖度
206025.000
修正平方和
53.8980
標準誤差
パーセント点
90.0000
60.0000
33.5000
23.5000
4.0000
86.0000
36.5000
60.0000
数理統計学第1回
99.0%
97.5%
95.0%
90.0%
10.0%
5.0%
2.5%
1.0%
88.0000
3753.0000
528.3687
-1.2634
45968.0795
2.4503
90.0000
80.0000
80.0000
80.0000
15.0000
13.0000
10.0000
4.0000
9
確率変数と実現値
確率変数:ある時点までは,確率分布によって
記述される.
実現値:ある時点を過ぎて定まった値のことを
実現値または観測値と呼ぶ
確率変数は大文字で,実現値は小文字で表現
するのが一般的である.
X→x
数理統計学第1回
10
確率変数の分布の記述法
1)確率(密度)関数
2)(累積)分布関数
3)%点
4)期待値,分散
5)モーメント
6)母関数
数理統計学第1回
11
確率分布の記述
確率分布とは,標本空間における確率という名
の量の分布である. 確率の和は1である
離散分布:確率関数
Σp(x)=1
連続分布:確率密度関数 ∫f(x)dx=1
p(x)≧0,f(x)≧0
身長は離散分布か,連続分布か?
お金は離散分布か,連続分布か?
数理統計学第1回
12
サイコロの目の確率分布
確
率
1/6
1
2
3
4
数理統計学第1回
5
6
13
連続分布の確率
9:00ちょうどに大学に来る確率はいくらか?
9:00と9:10に来る可能性はどちらが大きいか?
9:00から9:10に来る確率は?
8:59:30から9:00:30に来る確率は?
確率密度(1/時間)は定義できる.
ある区間(a,b)に入る確率:∫ab f(x)dx
数理統計学第1回
14
正規分布の確率密度関数
,
f(x) 
 x   

exp  
2
2
2
2 


2
1
  x  
数理統計学第1回
15
標準正規分布の確率密度関数
数理統計学第1回
16
Carl Friedrich Gauss 1777-1855
ガウスについては下記に詳しい
http://www-groups.dcs.st-and.ac.uk/~history/Mathematicians/Gauss.html
数理統計学第1回
17
分布関数
確率分布の別の記述方法
F(x):x以下になる確率(0~1)
離散型の分布:
F ( x) 

p (u )
ux
例) サイコロで3以下になる確率
連続型の分布: F ( x )  x f ( u ) du


例) 9:00までに来る確率
数理統計学第1回
18
サイコロの目の例
6/6
5/6
4/6
3/6
2/6
1/6
0/6
1
2
3数理統計学第1回
4
5
6
19
正規分布の例
数理統計学第1回
20
分布関数と確率関数
離散型の分布
p(x)=F(x)-F(x-)
連続型の分布
f(x)=dF(x)/dx
* x-の意味はxの-の側から単調に
増加して収束することを意味する.
数理統計学第1回
21
H13年度17歳の体格
もしある確率変数の分布が定まれば,様々な
情報を得ることができる.
身長 平均 SD 体重 平均 SD
男子
170.9 5.76
62.8
10.47
女子
158.0 5.32
53.2
8.11
仮に正規分布に従っているとすれば,ある範
囲に入る確率,ある値を超える確率を分布
22
数理統計学第1回
関数,確率密度関数から求められる.
演習
コインを4枚投げたときの,表が出る回数の
確率関数と分布関数を記述せよ.
数理統計学第1回
23
表の回数の分布
二項分布(n,p)
p(x)=nCxpx(1-p)n-x
表表表表
表表表裏 表表裏表 表裏表表 裏表表表
表表裏裏 表裏表裏 裏表表裏 表裏裏表 裏表裏表 裏裏表表
裏裏裏表 裏裏表裏 裏表裏裏 表裏裏裏
裏裏裏裏
確率=(1/2)× (1/2) ×(1/2) ×(1/2)=1/16
数理統計学第1回
24
SASのプログラム例
data data;phi=0.50;n=4;
do y=0 to 4;
p=pdf('binomial',y,phi,n);
F=cdf('binomial',y,phi,n);
output;end;
proc gplot;plot p*y/vzero;
symbol1 i=needle;
proc gplot;plot f*y/vzero;
symbol1 i=steplj;
数理統計学第1回
25
確率関数
数理統計学第1回
26
分布関数
数理統計学第1回
27
EXCELのBINOMDIST関数
2項分布の確率関数 or 分布関数
BINOMDIST(成功数, 試行回数, 成功率, 関数形式)
成功数
試行回数 に含まれる成功の回数を指定
試行回数 独立試行の回数を指定
成功率
1 回の試行が成功する確率を指定
関数形式 0:確率関数 1:分布関数
例
BINOMDIST(1,4,0.5,0)=0.25
BINOMDIST(1,4,0.5,1)=0.3125
数理統計学第1回
28
EXCELによる計算
0
1
2
3
4
0.25
0.375
0.25
0.0625
数理統計学第1回
0.0625
0.3125
0.6875
0.9375
1
29
%点:percentile
分布関数:確率密度関数の積分
→簡単な関数では表せない
数表
x→F(x)
F(x)=α →x
下側100α%点:F(x)=αとなるxの値
上側100α%点:F(x)=1-αとなるxの値
両側100α%点:F(x)=1-α/2となるxの値
50%点:メジアン 25,75%点:四分位点
数理統計学第1回
30
NORMDIST関数
正規分布の確率密度関数 or 分布関数
NORMDIST(x, 平均, 標準偏差, 関数形式)
x
関数に代入する数値を指定
平均
分布の算術平均 を指定
標準偏差 分布の標準偏差を指定
関数形式 0:確率密度関数 1:分布関数
例 NORMDIST(-1,0,1,0)=0.241971
NORMDIST(-1,0,1,1)=0.158655
数理統計学第1回
31
NORMINV関数
標準正規累積分布関数の%点の値を返す。
書式
NORMINV(確率, 平均, 標準偏差)
確率
正規分布における確率を指定
平均
分布の算術平均 (相加平均) を指定
標準偏差 分布の標準偏差値を指定
例 NORMINV(0.95,0,1)=1.644853
数理統計学第1回
32
正規分布の数表の作成
0.001
0.005
0.01
0.025
0.05
0.1
0.9
0.95
0.975
0.99
0.995
0.999
-3.09025
-2.57583
-2.32635
-1.95996
-1.64485
-1.28155
1.281552
1.644853
1.959963
2.326347
2.575831
3.090253
数理統計学第1回
33
SASの乱数関数
NORMAL(seed) RANNOR(seed) 正規分布
RANBIN(seed,n,p)
2 項分布
RANCAU(seed)
Cauchy 分布
RANEXP(seed)
指数分布
RANGAM(seed,alpha)
ガンマ分布
RANPOI(seed,lambda)
ポアソン分布
RANTBL(seed,p1,..pi,..pn)
指定した重み
RANTRI(seed,h)
三角分布
RANUNI(seed) UNIFORM(seed) 一様乱数
数理統計学第1回
34
分布関数の%点
BETAINV(p,a,b)
CINV(p,df<,nc>)
FINV(p,ndf,ddf<,nc>)
GAMINV(p,a)
PROBIT(p)
TINV(p,df<,nc>)
ベータ分布
カイ 2 乗分布
F 分布
ガンマ分布
標準正規分布
t 分布
数理統計学第1回
35
確率(密度)関数
POISSON((lambda,n) ポアソン分布
PROBBETA(x,a,b)
ベータ分布
PROBBNML(p,n,m)
2 項分布
PROBCHI(x,df<,nc>) カイ 2 乗分布
PROBF(x,ndf,ddf<,nc>)
F 分布
PROBGAM(x,a)
ガンマ分布
PROBHYPR(nn,k,x<,or>) 超幾何分布
PROBNEGB(p,n,m) 負の 2 項分布
PROBNORM(x)
正規分布
PROBT(x,df<,nc>)
スチューデントの t 分布
数理統計学第1回
36
演習1 指数分布(連続分布)
機械(コンピュータ等)の故障するまでの時間は指
数分布にしたがうことが知られている.
指数分布では分布関数は
F(x)=1 - exp(-λx)
となる. λ=1として,指数分布の分布関数と確率
密度関数を図示せよ.
ヒント exp(-1)=0.3679,exp(-2)=0.1353
exp(-3)=0.0498,exp(-4)=0.0183
数理統計学第1回
37
演習2 ポアソン分布(離散分布)
稀な事象(交通事故等)の生起数はポアソン分布
にしたがうことが知られている.
ポアソン分布では確率関数は
p(x)= λxexp(-λ)/x!
x=0,1,2,・・・
となる. λ=2として,ポアソン分布の分布関数と
確率関数を図示せよ.
ヒント exp(-2)=0.1353
数理統計学第1回
38