確率・統計(電子2年) 第7講 前回復習

確率・統計(電子2年)
第7講
• 確率的な問題のモデル化
• 確率変数の関数の分布
• (独立な)確率変数の和、正規分布・ポアソン分布の再現性
前回復習
1> 3 個のサイコロを同時に投げて,
「i の目」が出るサイコロの個数を Xi とする.
この時,
「1 の目」がちょうど 1 個出たことが判った場合の「2 の目」の個数
の条件付確率関数 Pr[X2 = j|X1 = 1] を求めよ(j = 0, 1, 2).
1 2
52
1
5
=
.
6
6
2 · 62
ただし,Y は 1 以外の目が出たサイコロの個数(X1 + Y = 3).
• Pr[X1 = 1] = Pr[X1 = 1, Y = 2] = 3 C1
• Pr[X1 = 1, X2 = j] = Pr[X1 = 1, X2 = j, Z = 2 − j]
1 j 2−j
3!
1
1
2
41−j
=
=
.
1!j!(1 − j)! 6
6
3
9 · j!(2 − j)!
ただし,Z は 1 と 2 以外の目が出たサイコロの個数(X1 + X2 + Z = 3).
よって,Pr[X2 = j|X1 = 1] =
2 · 42−j
Pr[X1 = 1, X2 = j]
=
Pr[X1 = 1]
25 · j!(2 − j)!
2> 18 時ちょうどに坂ノ下バス停を出発する天神行き高速バスが九工大入口バス
停に着くまでに掛かる時間(分)は,実数区間 [15, 25] 上の一様分布に従う.
バスは時間調整をせず,バス停に人が居れば瞬時に乗せて出発する.一方,
18 時 10 分に大学を出た A 君がバス停に着くまでに掛かる時間(分)は実数
区間 [3, 8] 上の一様分布に従う.この場合,A君がバスに乗れる確率は?
バスおよびA君が九工大入口バス停に着く時刻を,各々,18 時 X 分と 18 時 Y
分とすると,確率変数 X, Y は独立で,X は実数区間 [15, 25] 上の一様分布に従い,
Y は実数区間 [13, 18] 上の一様分布に従う.つまり,
1
(15 ≤ x ≤ 25); = 0 (otherwise)
10
1
• Y の密度関数:g(x) = (13 ≤ x ≤ 18); = 0 (otherwise)
5
• X の密度関数:f (x) =
一般に,(X, Y ) の結合密度関数を用いて確率を計算できる.X と Y が独立なの
で,結合密度関数 h(x, y) は,
h(x, y) = f (x)g(y) =
1
(if (x, y) ∈ [15, 25] × [13, 18]); = 0 (otherwise)
50
1
この時,
「A君がバスに乗れる確率」は
Pr[X ≥ Y ] =
1
h(x, y)dxdy =
50
x≥y
18 25
13
1dx dy
max(y,15)
15
25
18
25
1
dx dy +
dx dy
50 13
15
15
y
18
1
=
2 × 10 +
(25 − y)dy
50
15
1
1
1
49 − 100
91
2 18
=
20 − (25 − y)
=
20 −
=
= 0.91
15
50
2
50
2
100
=
なお,下図の面積を使って確率を計算してもよい.四角内で (Y ≤ X) を満たす
91
45.5
領域の面積は 45.5 なので,四角全体の面積 50 で割って,
=
50
100
Y
Y=X
18
13
15
25
X
9. 確率的な問題のモデル化
Buffon の針
平面上に等間隔 L の平行線群が引かれている.ここに長さ r の細い針を無作為
に投げ落す時,針が1本の線と交わる確率は?ただし,L > r とする.
• 針の落ちた位置に関して,針の中心と最寄りの平行線までの距離を X
• 針の落ちた向きに関して,針と平行線のなす鋭角を Y
• 位置 X は,[0, L/2] 上の一様分布に従う.密度 f (x) =
• 向き Y は,[0, π/2] 上の一様分布に従う.密度 g(y) =
2/L 0 ≤ x ≤ L/2
0
otherwise
2/π 0 ≤ y ≤ π/2
0
otherwise
• X と Y は独立∼よって,結合密度関数は,f (x)g(y)
この時,{X ≤
r
sin Y } ⇔ { 針が平行線と交わる } なので,
2
r
4 Pr[X ≤ sin Y ] =
f (x)g(y)dxdy =
dxdy
2
Lπ x≤ 2r sin y, 0≤x≤ L2 , 0≤y≤ π2
x≤ r2 sin y
2
4
=
Lπ
2r
=
Lπ
π
2
0
r
2
sin y
0
4
dxdy =
Lπ
π
2
0
π
−2r
r
sin ydy =
[cos y]02
2
Lπ
実際,この実験を多数回 (N) 行い,針が平行線にかかった回数 (n) を数えると,
•
2r
2rN
n
が
に近づく,言い換えると,
が π に近づく
N
Lπ
Ln
ことが経験的に知られている.
Bertrand のパラドックス
半径1の円があり,その上に無作為に弦を引く(円を外れない範囲で無作為に直
√
線を置く).この弦の長さが 3(内接正三角形の辺の長さ)以上になる確率は?
弦と円の位置関係に関して,
• 円の中心から弦までの距離を X (0 ≤ X ≤ 1)
• 弦の端点(円周上)を通る直径と弦のなす鋭角を Y (0 ≤ Y ≤ π/2)
と置くと,どちらも単独で,弦と円の相対的な位置関係を決定する(それゆえ,X
と Y は独立ではない).
そこで2通りの考えをしてみよう:
案 A 無作為に弦を引くことから,X は,[0, 1] 上の一様分布に従う,と仮定.
√
1
– この時,{0 ≤ X ≤ } ⇔ { 弦の長さが 3 以上になる }
2
1
1
– Pr[{0 ≤ X ≤ }] =
2
2
案 B 無作為に弦を引くことから,Y は,[0, π/2] 上の一様分布に従う,と仮定.
√
π
– この時,{0 ≤ Y ≤ } ⇔ { 弦の長さが 3 以上になる }
6
1
π
– Pr[{0 ≤ Y ≤ }] =
6
3
「確率論」的にはどちらも正しい.
• この場合の問題は,
「円上に無作為に弦を引く(円を外れない範囲で無作為に
直線を置く)」という仮想的な操作において,どのような確率分布(確率モ
デル)を与えればよいかが,一意に決まらない点にある.
• より現実的(具体的)な操作を想定すれば,その物理的現象としての考察か
ら,
(一意な)確率モデルを当てはめることができる.例えば,
3
– ビュホンの針と同様に等間隔 (距離 2)に引いた多数の平行線の上から
輪を無作為に落とすと考えると,案 A は妥当なモデルといえる.
– 円周上の一点に支点(軸受け)を置き,そこに長さ 2 以上の棒を立て,
無作為に棒を倒すと考えると(ただし,支点から棒がずれない),案 B
は妥当なモデルといえる.
– 実は問題の「確率」が 1/3 と 1/2 の間のある任意の値になるように「モ
デル」化できる.これは円外の一点に支点を置き,そこに無限長の棒を
立て,無作為に棒を倒すと考えればよい.
10. 確率変数の関数
確率変数 X があるとき, |X|, X 2 , e−X なども確率変数(合成確率変数)にな
る.同様に,確率変数 X, Y があるとき(X, Y が独立とは限らない),
X + Y, XY, X/Y, X Y , max(X, Y ), min(X, Y )
なども確率変数になる.
Pr[|X| ≤ x] = Pr[−x < X ≤ x] = FX (x) − FX (−x)
Pr[eX ≤ x] = Pr[X ≤ log x] = FX (log x)
一般に,n 実変数実数値関数 f (x1, x2 , . . . , xn ) と,n 個の確率変数 X1, X2 , . . . , Xn
がある時,関数の引数に確率変数を代入したもの(定義域が整合している限り)
:
f (X1 , X2 , . . . , Xn ) は確率変数になる(厳密には f がボレル可測と呼ぶ条件を満た
す時).この事実を証明するには,確率測度と確率変数の定義に戻る必要があるの
で,ここでは省略する.そしてその分布関数は,(X1 , X2 , . . . , Xn ) の結合分布関数
(結合密度関数,結合確率関数)から導出できる.例えば,
Pr[min(X, Y ) ≤ x] = Pr[X ≤ x ∨ Y ≤ x]
= Pr[X ≤ x] + Pr[Y ≤ x] − Pr[X ≤ x, Y ≤ x]
= FX (x) + FY (x) − F(X,Y ) (x, x)
= FX (x) + FY (x) − FX (x)FY (x) (X, Y が独立な場合のみ)
例題 :確率変数 X が1次元正規分布 N (0, 1) に従う時の X 2 の分布関数は,
√
x
√
√
1
−t2 /2
Pr[X ≤ x] = Pr[− x ≤ X ≤ x] = √
dt
√ e
2π − x
√x
x
1
2
−t2 /2
e
dt = √
e−s/2 s−1/2 ds
= √
2π 0
2π 0
2
なので,X 2 の密度関数は,f (x) =
⎧
⎨ √1
⎩
0
2π
4
e−x/2 x−1/2 0 < x
.
0≥x
与えられた分布 F (x) に従う乱数の生成
X の分布関数 FX が逆関数 FX−1 を持つ場合,Z(ω) = FX (X(ω)) を考えると,Z
は [0, 1] に値を持つ確率変数であるが,その分布は一様分布になる:
def
Pr[Z ≤ x] = Pr[FX (X) ≤ x] = Pr[X ≤ FX−1 (x)] = FX (FX−1(x)) = x
これを逆に利用する.確率変数 Z が [0, 1] 上の一様分布に従うとする.一般の分
布関数 F が与えられた時(ただし逆関数を持つとする),確率変数 F −1 (Z) は,分
布 F に従う.なぜなら,
Pr[F −1 (Z) ≤ x] = Pr[Z ≤ F (x)] = F (x)
よって,一様分布に従う実現値の列(乱数)x1 , x2 , . . . を元に,分布 F に従う実
現値の列(乱数)F −1 (x1 ), F −1 (x2 ), . . . を生成できる.
練習1 (指数分布に従う乱数の生成)
C 言語の標準ライブラリには,
• drand48() という,[0.0, 1.0) の範囲の double 型乱数を返す関数
• log1p(x) という,double 値 x を貰って,double 値 log(1 + x)(ただし,e を
底)を返す関数
があり,それらを使って,パラメタ λ = 0.5 の指数分布に従う double 型乱数を生
成せよ.また,プログラムを実際に動かして実験せよ.
11. 独立な確率変数の和(参考書3.3,3.4章)
確率変数の和の分布(独立とは限らない一般の場合)
1. 離散型(非負整数値)
:(X, Y ) の結合確率関数を h(i, j) と置くと,
Pr[X + Y = n] =
n
Pr[X = n − k, Y = k] =
k=0
n
h(n − k, k)
k=0
2. 連続型:(X, Y ) の結合密度関数を h(x, y) と置くと,
Pr[X + Y ≤ z] =
=
h(x, y)dxdy =
x+y≤z
∞ z
−∞
−∞
∞ z−y
−∞
−∞
h(t − y, y)dt dy =
5
h(x, y)dx dy
z ∞
−∞
−∞
h(t − y, y)dy dt
独立な確率変数の和の分布
1. X, Y が独立で,各々確率関数 fX (n), fY (n) を持つ場合,結合確率関数 h(i, j) =
fX (i) × fY (j) になるので,X + Y の確率関数 f(X+Y ) (n) は,
f(X+Y ) (n) =
n
h(n − k, k) =
k=0
n
k=0
fX (n − k)fY (k) = (fX ∗ fY )(n)
2. X, Y が独立で,各々密度関数 fX (x), fY (x) を持つ場合,独立性より,結合密
度関数 h(x, y) = fX (x) × fY (y) になるので,X + Y の密度関数 f(X+Y ) (x) は,
f(X+Y ) (x) =
∞
−∞
h(x − y, y)dy =
∞
−∞
fX (x − y)fY (y)dy = (fX ∗ fY )(x)
つまり,X, Y が独立ならば,X + Y の密度/確率関数は,X と Y の各々の密
度/確率関数の畳み込みになる.
定義:関数の畳み込み(f ∗ g )
:
• 確率関数 f (n), g(n) に対して(簡単のために非負整数上で定義する),
def
(f ∗ g)(n) =
n
f (n − k)g(k)
k=0
def
• 密度関数 f (x), g(x) に対して,(f ∗ g)(x) =
∞
−∞
f (x − y)g(y)dy,
• 交換則、結合則、分配則が成り立つ(応用解析学の講義参照).
(f ∗ g)(x) = (g ∗ f )(x), ((f ∗ g) ∗ h)(x) = (f ∗ (g ∗ h))(x),
(f ∗ (αg + βh))(x) = (αf ∗ g)(x) + (βf ∗ h)(x) 例題 確率変数 X, Y は独立として,以下の X + Y の分布(密度関数)を求めよ.
1> どちらも [0, 1] 上の一様分布に従う時の,X + Y の密度関数.
X, Y の密度関数:f (x) =
(f ∗ f )(x) =
=
∞
f (x − y)f (y)dy =
−∞
min(x,1)
max(x−1,0)
=
1 0≤x≤1
0 otherwise
1 dy
より,
0≤y≤1, x−1≤y≤x
1 dy
min(x,1)
(0 ≤ x ≤ 2) = [y]max(x−1,0)
x
0≤x<1
2−x 1≤x≤2
6
(0 ≤ x ≤ 2)
2> 各々,パラメタ λ, μ (> 0) の指数分布に従う時の,X + Y の密度関数.
X, Y の密度関数: fλ (x) = λe−λx , fμ (x) = μe−μx (x ≥ 0) より,
(fλ ∗ fμ )(x) =
0≤y, 0≤x−y
λe−λ(x−y) × μe−μy dy = λμe−λx
x
e(λ−μ)y dy
0
• λ = μ の場合,(fλ ∗ fλ )(x) = λ2 e−λx [y]x0 = λ2 xe−λx ∼ Erlang 分布.
λμ −λx (λ−μ)y x
λμ −μx
e
• λ = μ の場合,(fλ ∗ fμ )(x) =
e
=
e
− e−λx
0
λ−μ
λ−μ
正規分布の再現性 2つの正規分布 N (0, μ), N (0, ν) の密度関数 fμ , fν の畳み込み(μ, ν > 0)は,
∞
1
1
(x − y)2
y2
√
√
exp −
exp −
(fμ ∗ fν )(x) =
dy
2πμ
2μ
2ν
−∞
2πν
∞
1
1
2
2
2
(μ(x − 2xy + y ) + νy ) dy
exp −
=
√
2π μν −∞
2μν
∞
1
exp −
=
((μ + ν)y 2 − 2xνy + x2 ν) dy
2π μν −∞
2μν
1
√
x2
= exp −
2(μ + ν)
2
x
− 2(μ+ν)
= e
2
x
− 2(μ+ν)
= e
1
√
2π μν
1
√
2π μν
⎛
∞
1
√
μ+ν
xν
exp ⎝−
y−
2π μν −∞
2μν
μ+ν
2μν
μ+ν
∞
−∞
−z 2
e
dz
z=
2 ⎞
⎠ dy
μ+ν
xν
y−
2μν
μ+ν
x2
2μν √
1
e− 2(μ+ν)
π = μ+ν
2π(μ + ν)
一般に,n 個の独立な確率変数 X1 , X2 , . . . Xn の各々が正規分布
N (mi , μi )(i =
1, 2, . . . , n)に従う場合,確率変数
n
i=1
Xi は正規分布 N
n
i=1
mi ,
n
i=1
μi
に従う.
これを正規分布の再現性と呼ぶ.
カイ2乗(χ2 )分布
確率変数 X1 , X2 , . . . , Xn が互いに独立ですべて同じ1次元正規分布 N (0, 1) に従
う時,X12 + X22 + . . . + Xn2 の従う分布を自由度 n のカイ2乗分布(χ2 分布)と呼
ぶ.密度関数は,
1
xn/2−1 e−x/2 (x ≥ 0)
Γ(n/2)2n/2
7
なお,前出のアーラン分布やこのカイ2乗分布は,
「ガンマ分布」と呼ばれる一
般形の特殊例になっている.試しに,n = 2 の場合のカイ2乗分布の密度関数を畳
み込み積分の計算によって導出する.各 Xj2 の密度関数 f は今回講義の前半の例題
参照.X12 + X22 の密度関数は,
(f ∗ f )(x) =
=
=
=
∞
1 x −(x−y)/2 −y/2
f (x − y)f (y)dy =
e
e
(x − y)−1/2 y −1/2 dy
2π 0
−∞
1 −x/2 x
e
(x − y)−1/2 y −1/2 dt
2π
0
1 −x/2 1
y
e
(1 − t)−1/2 t−1/2 dt (ただし,t =
と置いた)
2π
x
0
1 −x/2 Γ( 12 )Γ( 12 )
1
1 −x/2 1 1
e
e
= e−x/2
B( , ) =
2π
2 2
2π
Γ(1)
2
つまり,自由度 2 のカイ二乗分布は,実は,λ = 0.5 の指数分布になる.ただし,
ガンマ関数 Γ(x) とベータ関数 B(x, y) は,応用解析学等参照.n ≥ 3 の場合も同様
に導出できる.
ポアソン分布の再現性 離散分布の中では,ポアソン分布が再現性を持つ.すなわち,
• 確率変数 X, Y は独立で,各々,パラメタ λ, μ (> 0) のポアソン分布に従う
時の X + Y は,パラメラ (λ + μ) のポアソン分布に従う.
1
1
X, Y の確率関数: λk e−λ , μk e−μ かつ,X, Y は独立なので,X + Y の確率
k!
k!
関数は,それらの畳み込みになり,
Pr[X + Y = k] =
k
Pr[X = i] Pr[Y = k − i] = e−(λ+μ)
i=0
= e−(λ+μ)
k
λi μk−i
i=0 i! (k − i)!
k
(λ + μ)k −(λ+μ)
1 k!
λi μk−i =
e
k! i=0 i!(k − i)!
k!
• つまり,ポアソン分布に従う複数個の独立な確率変数の和は,またポアソン
分布になる.例えば,2つの道路の各々の毎分の通過車両数 X, Y が共にポ
アソン分布で近似できる場合,2つが合流する道路の毎秒通過数 X + Y も
ポアソン分布で近似できる.
練習2 def
前回練習<2>の確率を,Z = X − Y (A 君の待ち時間)と置き,Pr[Z ≥ 0]
として計算せよ.
ヒント:Z = X + (−Y ) で X, −Y は独立なので,その密度関数は畳み込み積分で
計算できる.
8