医療統計学 vol.3

医療統計学 vol.3
木村 朗
ある現象につき、起こりえるすべての場合を
取り上げ、各々の場合の確率をまとめて考え
るためのいろいろな「分布」について考える。
確率変数
偶然の結果で値が定まるのが確率変数。
「試行の結果によって、値が決まる変数のこと」
サイコロを1回投げることを場合、出る目の数をXとする
と、Xは1、2、3、4、5、6のいずれかの値をとる変数(一
定の値をとらない値という意味)である。
今、1の目がでる事象の確率をP(X=1)と表せば
P(X=1)=1/6と記せる。
偶然に左右される試行の結果で定まる値を
確率変数という。
確率の計算
• 確率変数Xは、サイコロを1回投げたときにでる目の数
Ex)5以上の目が出る事象は?
{X>=5}={5、6}={5}⋃{6}=A⋃B
ここでA={X=5}、B={X=6}と置いた
A⋂B=φなので、AとBは排反事象となる
加法定理が使える
P(X>=5)=P(X=5)+P(X=6)=1/6+1/6=1/3
確率変数とその確率を対応させた
のが「確率分布」
P=(X=1)=・・・=P(X=6)=1/6
ここで確率変数Xのとる値と、それぞれの値をとる確
率を表にすると (サイコロの例)
Xの値
1
2
3
4
5
6
計
確率
1/6
1/6
1/6
1/6
1/6
1/6
1
この表のように、確率変数のとる値と、その確率を
対応させたものを、この確率変数の確率分布という
P=(Y=0)=P(Y=1)=1/2
ここで確率変数Yは、2個のサイコロを投げたときの
出た目の合計が偶数のとき Y=0、奇数のとき Y=
1とする、それぞれの値をとる確率を表にすると
(サイコロの例)確率変数Yの確率分布の表は
Yの値
0
1
確率
1/2
1/2
確率変数を一般化する
確率変数Xは、X1、X2、・・・、Xnの値をとる
P(X=Xk)=Pk (K=1、2、・・・、n)とすると、
P1>=0、P2>=0、・・・、Pn>=0
P1+P2+・・・+Pn=1
これを確率変数の表で表すと・・・
Xの値
X1
X2
・
・
・
Xn
計
確率
P1
P2
・
・
・
Pn
1
確率変数Xの平均を計算する
• 確率変数Xの平均*のことを、別名称で北一
(期待値)という
E(X)と表す
Expectation
Xの値
確率
X1
P1
X2
P2
X1P1 X2P2
・
・
・
・
・
・
・ Xn 計
1
・ Pn
・ XnPn
E(X)=(X1P1+X2P2+・・・+XnPn)
確率変数(確率)の実値×確率の積和=期待値。
練習問題
• サイコロを1回投げる際の確率変数Xの平均
すなわち、期待値を求めよ
3.5(1×1/6+・・・6×1/6=21/6)
宝くじの期待値は5割、買えば買うほど半分お金を損していることになる
確率が等しくなくても
平均を求められるE(X)
n個のデータ、x1、x2・・・xnがあるとき、その平均xbar=(x1、x2・・・xn)/
n
確率変数XがX1、X2、・・・、Xnをとるときの平均E(X)とこのxbarの関係は
Xbarの右辺はx1×1/n+x2×1/n+・・・+Xn×1/n
P1=1/n、P2=1/n、・・・Pn=1/nとして、各データが等しい割合で出現する
ならば、Xbar=x1P1+x2P2+・・・XnPn=E(X)
つまり、平均E(X)はそれぞれの確率変数が等しくても、等しくなくても、平
均を求めることができる
確率変数の分散
確率変数Xのばらつきの度合いを表す分散は
この表を使うと、確率変数Xの平均E(X)を簡単に表すためにmと置
きかえる、この時、
(X1-m)^2*P1+(X2-m)^2*P2+・・・
・・・+(Xn-m)^2*Pn
は確率変数の分散を表しV(x)と書く
分散の正の平方根をXの標準偏差といい、σ(X)シグマXと書くσ
(X)=√V(X) これは確率変数のばらつきを表す、この数値が大
きいと、裾野が横に広がった形のデータのあつまり(分布)を示す。
確率分布から、
頻出確率を求めることができる
V(x)=(X1-m)^2*P1+(X2-m)^2*P2+・・・+(Xn-m)^2*Pn
サイコロを1回投げるときに出る目の数をXとする。この時のXの分散を求める。
M=3.5だったので、
V(X)=(1-3.5)^2*1/6+(2-3.5)^2*1/6・・・(6-3.5)^2*1/6
=35/12(2.92)
σ(x)=√V(x)=√35/12near=1.71
ここで平均値に標準偏差を正負の方向に足すと・・・3.5±1.71 (およそ面積は68%
となる) 10(cm)の正方形を考えると各辺に接する円の面積と同じになる・・・
課題
• サイコロを2個投げるときに、出た目の差の絶対値
をXとする、この時の絶対値Xの平均値を求めて下
さい
• (ヒント 差の数値の場合分けをコツコツと作る)
Xの値
0
1
2
3
4
5
計
確率
6/36
10/36
8/36
6/36
4/36
2/36
1
• 1.94