第08回

専攻科 応用数学 II
1
第 8 回 講義資料 多次元の確率変数1
2 次元確率変数と同時 · 周辺分布関数
(Ω, F, P ) を確率空間とするとき, X : Ω → R が確率変数であるとは, 任意の x ∈ R に対して
{ω ∈ Ω|X(ω) ≤ x} ∈ F
が成り立つことであった. X, Y を確率変数とするとき, X(ω) = (X(ω), Y (ω)) とすると X : Ω → R2
となるが, これを 2 次元の確率 (変数) ベクトルという. X, Y は確率変数であるので, 任意の x, y ∈ R
に対して
{ω ∈ Ω|X(ω) ≤ x}, {ω ∈ Ω|Y (ω) ≤ y} ∈ F
であるから, σ− 加法族の性質より
{ω ∈ Ω|X(ω) ≤ x かつ Y (ω) ≤ y} = {ω ∈ Ω|X(ω ≤ x)} ∩ {ω ∈ Ω|Y (ω) ≤ y} ∈ F
が成り立つ. よって上の事象の確率が定義される.
FX,Y (x, y) = P ({ω ∈ Ω|X(ω) ≤ x かつ Y (ω) ≤ y})
を確率ベクトル X = (X, Y ) の同時 (結合) 分布関数という. 上の確率を簡単に P (X ≤ x, Y ≤ y) と
書く. 同時分布関数の性質を述べよう. 証明は 1 変数の場合と同様である.
命題 (同時分布関数の性質) 2 次元同時分布関数 F (x, y) は次の性質を満たす.
(1) 任意の実数 x, y に対して
lim FX,Y (x, z) = 0, lim FX,Y (z, y),
z→−∞
z→−∞
lim
z→∞,w→∞
FX,Y (z, w) = 1
(2) x1 ≤ x2 , y1 ≤ y2 を満たす任意の実数 x1 , x2 , y1 , y2 に対して
FX,Y (x2 , y2 ) − FX,Y (x1 , y2 ) − FX,Y (x2 , y1 ) + FX,Y (x1 , y1 ) ≥ 0
(3) 任意の実数 x, y に対して
lim FX,Y (x + z, y) = lim FX,Y (x, y + z) = FX,Y (x, y)
z→+0
z→+0
問 上の性質 (3) の左辺は P (x1 < X ≤ x2 , y1 < Y ≤ y2 ) と等しいことを示せ.
上の性質をもつ 2 変数の関数 F (x, y) はある確率ベクトル X = (X, Y ) の同時分布関数になること
も知られているが, 証明は略す.
さて, X = (X, Y ) の分布関数 FX,Y に対し, X, Y の分布関数 FX , FY を周辺分布関数という. これ
らの関係を示そう.
命題 確率ベクトル X = (X, Y ) の同時分布関数を FX,Y , X と Y の周辺分布関数をそれぞれ
FX , FY とするとき
FX (x) = lim FX,Y (x, y), FY (x, y) = lim FX,Y (x, y)
y→∞
x→∞
1
証明 前半だけ示せば十分である. y1 ≤ y2 ≤ · · · ≤ yn ≤ yn+1 ≤, yn → ∞ (n → ∞) なる任意の数列
{yn } に対して
FX,Y (x, yn ) → FX (x) (n → ∞)
となればよい.
{ω ∈ Ω|X(ω) ≤ x} =
∞
∪
{ω ∈ Ω|X(ω) ≤ x, Y (ω) ≤ yn }
n=1
が成り立つ. 事象の列は {ω ∈ Ω|X(ω) ≤ x, Y (ω) ≤ yn } は n に関して単調増加であるので, 確率測度
の連続性により
FX (x) = lim P ({ω ∈ Ω|X(ω) ≤ x, Y (ω) ≤ yn }) = lim FX,Y (x, yn )
n→∞
n→∞
となり証明が終わる. 2.
さて, 我々は分布関数を用いることによって P (x1 < X ≤ x2 , y1 < Y ≤ y2 ) なる確率を求めること
はできる. これは言い換えると (X, Y ) が (x1 , x2 ] × (y1 , y2 ] なる長方形に入る確率である. しかし, 場
合によってはこの形だけでは不十分なこともある. X = (X, Y ) が確率ベクトルと呼ばれることから,
試行の結果 (X, Y ) は平面上の点が対応する. 例えば, 試行によっては, (X, Y ) が原点から r 以内の距
離である確率を知りたいこともあるであろう. つまり, より一般的な平面 R2 の部分集合 B に対して
{ω ∈ Ω|(X, Y ) ∈ B}
となる確率を知りたいのであるが, 問題はこの事象が F の元であるか否かということである. もちろ
ん, これは集合 B に大きく依存する. 実際 B がボレル集合とよばれる集合であればいつでも F の元
となる. 2 次元ボレル集合族 B(R2 ) とは (x1 , x2 ] × (y1 , y2 ] の形をしたすべての集合を含む最小の σ− 加
法族として定義される. ボレル集合族に属する集合をボレル集合と呼ぶが, これがどのような集合なの
かは本講義の内容を超えるので, 滑らかな閉曲線で囲まれた領域, 多角形など我々が通常よく考える集
合なら十分であることだけを申し添えておくことにする.
2
確率変数の独立性
離散型確率変数のときと同様に確率変数の独立性を定義しよう. (Ω, F, P ) を確率空間とし, X,
Y をその上の確率変数とする. X と Y が独立であるとは任意の実数 x, y に対して, 2 つの事象
{ω ∈ Ω|X(ω) ≤ x} と {ω ∈ Ω|Y (ω) ≤ y} が独立であること, つまり, 任意の実数 x, y に対して
P (X ≤ x, Y ≤ y) = P (X ≤ x)P (Y ≤ y)
が成り立つことである. これは同時分布関数 FX,Y と周辺分布関数 FX , FY を用いて
FX,Y (x, y) = FX (x)FY (y)
が成り立つこと言い換えられる.
問 X と Y が独立であるための必要十分条件は すべての x1 < x2 , y1 < y2 を満たす実数 x1 , x2 , y1 ,
y2 に対して
P (x1 < X ≤ x2 , y1 < Y ≤ y2 ) = P (x1 < X ≤ x2 )P (y1 < Y ≤ y2 )
2
が成り立つことであることを示せ.
2 つ以上の確率変数 X1 , X2 , · · · , Xn に対しても独立性は定義される. 任意の n 個の実数 x1 , x2 , · · · ,
xn に対して
P (X1 ≤ x1 , X2 ≤ x2 , · · · , Xn ≤ xn ) = P (X1 ≤ x1 )P (X2 ≤ x2 ) · · · · · P (Xn ≤ xn )
が成り立つとき, 独立であるといわれる. また, 可算無限個の確率変数からなる確率変数列 {Xn } が独
立であるとは, 任意の有限個の確率変数 Xi1 , Xi2 , · · · , Xin が独立であることである.
2 次元絶対連続分布と同時密度関数
3
定義 確率ベクトル X = (X, Y ) の同時分布関数 FX,Y がある非負可積分関数 fX,Y に対して
∫
FX,Y (x, y) =
y
∫
x
−∞ −∞
fX,Y (u, v)dudv
と書けるとき, X = (X, Y ) は絶対連続な分布に従うといわれる. このとき, fX,Y を (X, Y ) の同時
確率密度関数という. このとき, X, Y も絶対連続な分布に従い, それぞれのそれぞれの確率密度関
数 fX , fY は周辺確率密度関数と呼ばれ, 同時確率密度関数 fX,Y を用いて次の式で与えられる
∫ ∞
∫ ∞
fX (x) =
fX,Y (x, y)dy, fY (y) =
f (x, y)dx
−∞
−∞
同時確率密度関数は次の性質をもつ.
命題 FX,Y (x, y) を確率ベクトル X = (X, Y ) の同時分布関数, fX,Y を同時確率密度関数とする
とき次が成り立つ
(1) fX,Y (x, y) ≥ 0 (x, y ∈ R)
∫ ∞∫ ∞
(2)
fX,Y (x, y)dxdy = 1
−∞ −∞


∂ 2 F (x, y) (偏微分可能なとき)
∂x∂y X,Y
(3) fX,Y (x, y) =
 0
(その他)
X = (X, Y ) が絶対連続な分布に従うとき, ボレル集合 B ⊂ R2 に対して P ((X, Y ) ∈ B) は次の公
式で計算される. 証明は積分論の範疇であるので省略する. つまり, 長方形の測度を出発点にして密度
をもつ測度によりボレル集合の測度が密度の積分で表現されるという事実である.
公式
∫∫
P ((X, Y ) ∈ B) =
fX,Y (x, y)dxdy
B
確率密度関数を用いて独立性を判定することもできる.
3
命題 X = (X, Y ) が絶対連続な分布に従うとき, 確率変数 X, Y が独立であるための必要十分
条件は X = (X, Y ) の同時確率密度関数 fX,Y が次のように x の関数と y の関数の積として表現
されることである:
fX,Y (x, y) = g(x)h(y)
証明 まず必要性を示す. X, Y が独立であるとすると, FX,Y (x, y) = FX (x)FY (y) となる. FX , FY の
微分ができない点は (ルベーグ) 測度 0 の集合であるので, FX,Y は「ほとんどいたる所で」x と y につ
いて 1 回ずつ偏微分可能である. よって
∂ 2 FX,Y
(x, y) = ∂ FX (x) ∂ FY (y).
∂x∂y
∂x
∂y
上の式の左辺は fX,Y (x, y), 右辺は fX (x)fY (y) となる. よって示された.
逆に fX,Y (x, y) = g(x)h(y) と表されたとする. 両辺を x で R 上積分すると
∫ ∞
∫ ∞
fY (y) =
fX,Y (x, y)dxdy = h(y)
g(x)dx
−∞
−∞
また, y で積分すると
∫
fX (x) =
∫
∞
−∞
fX,Y (x, y)dxdy = g(x)
∞
h(y)dy
−∞
また x, y について積分すると
∫
∞∫ ∞
1=
g(x)h(y)dxdy
−∞ −∞
を得る. よって
fX,Y (x, y) = fX (x)fY (y)
この両辺を (−∞, x] × (−∞, y] 上で積分すれば
FX,Y (x, y) = FX (x)FY (y)
を得る. よって示された. 2
例 (一様分布) X = (X, Y ) の同時確率密度関数 fX,Y が a, b > 0 に対し
{
1 (0 < x < a かつ 0 < y < b),
fX,Y (x, y) =
ab
0
(その他),
となるとき, X = (X, Y ) は (0, a) × (0, b) 上の一様分布に従うといわれる.
問 X = (X, Y ) が (0, a) × (0, b) 上の一様分布に従うとき, 同時分布関数 FX,Y を具体的に書きなさい.
例 (ビュホンの針) 間隔 a の平行線の上から長さ l(< a) の針をランダムに落とす. 針の端が平行線の
間に落ちる位置を X, 針の向く方向を Θ とすると, (X, Θ) の同時確率密度関数 fX,Θ は次で与えられ
ることが知られている.
{
1 , 0 ≤ x ≤ a, 0 ≤ θ < 2π
fX,Θ (x, θ) =
2aπ
0,
その他
4
a
a
Θ
a
Θ
X
a
X
このとき, 針が平行線と交わる確率を求めよう. 針が交わる条件は 0 < Θ < π のとき X + l sin Θ > a,
π < Θ < 2π のとき X − l sin(Θ − π) = X + l sin Θ < 0 であるので (講義で説明), (確率密度関数が存
在するので P (Θ = 0) = P (Θ = π) = 0 に注意) 針が平行線と交わる確率は
∫ π∫
0
a
a−l sin θ
1 dxdθ +
2πa
∫
2π∫ −l sin θ
π
0
1 dxdθ = 2l
2πa
πa
となる. これより, 無数の針を平行線の書かれた紙の上に落とし, 落とした針と平行線と交わった針の
数の比から, 円周率の近似値を求めることが出来る.
4
確率変数の関数 · 確率変数の和の分布
確率空間 (Ω, F, P ) 上の確率変数 X, Y と, h : R2 → R について Z(ω) = h(X(ω), Y (ω)) を考える.
Z : Ω → R であるが, 一般には Z は確率変数であるとは限らない. しかし, ある性質をもつ関数 (ボレ
ル可側関数) であれば, 再び Z も確率変数となる. ここでは Z = X + Y なる確率変数の分布を調べる
ことにしよう. また, 後の講義にて Z = (X − a)(Y − b) なる形の確率変数を扱うことになるであろう.
X, Y は絶対連続な分布にしたがう確率変数とし, X = (X, Y ) の同時確率密度関数を fX,Y とする.
このとき Z = X + Y の従う分布の同時分布関数を FX+Y とする. このとき
∫∫
P (Z ≤ z) = P (X + Y ≤ z) =
fX,Y (x, y)dxdy
A
である. ここで A = {(x, y) ∈ R2 |x + y ≤ z} である.
y
z
z
O
5
x
累次積分に直すと
∫
P (Z ≤ z) =
∞ ∫ z−x
−∞ −∞
fX,Y (x, y)dxdy
ここで x = u, y = v − u と変数変換すると A は A˜ = {(u, v) ∈ R2 |v ≤ z} となるので
∫∫
∫ z∫ ∞
P (Z ≤ z) =
fX,Y (u, v − u)dudv =
fX,Y (u, v − u)dudv
−∞ −∞
˜
A
よって
∫
FX+Y (z) =
∫
z
−∞
∞
−∞
fX,Y (u, v − u)dudv
が得られる. この表示により X + Y も絶対連続な分布に従うことがわかり,
∫ z ∫ ∞
∫ ∞
d
d
fX+Y (z) =
F
(z) =
f (u, v − u)dudv =
fX,Y (u, z − u)du
dz X+Y
dz −∞ −∞ X,Y
−∞
となる. さらに X と Y が独立の場合, fX,Y (x, y) = fX (x)fY (y) と書けるので
∫ ∞
fX+Y (z) =
fX (u)fY (z − u)du
−∞
となる. この右辺は fX と fY のたたみ込みと呼ばれる.
命題 X と Y を絶対連続な分布に従う独立な確率変数とし, 確率密度関数をそれぞれ fX , fY と
する. このとき X + Y も絶対連続な分布に従い, 確率密度関数は
∫ ∞
fX+Y (z) =
fX (u)fY (z − u)du
−∞
解析学において, たたみ込みはラプラス変換やフーリエ変換によって, 積に移されることが知られて
いるが, 実際分布のラプラス変換やフーリエ変換に相当するモーメント母関数や特性関数が和の分布
を求めるのに重要な役割を果たす.
5
2 次元正規分布
X = (X, Y ) が次の同時確率密度関数をもつ確率ベクトルであるとき X は 2 次元正規分布に従うと
いわれる:
1√
fX,Y (x, y) =
2πσX σY 1 − ρ2
[
{
}]
(x − µX )2
(x − µX )(y − µY )
(y − µY )2
1
exp −
− 2ρ
+
2
σX σY
2(1 − ρ2 )
σX
σY2
(
ここで x = (x, y), µ = (µX , µY ), Σ =
t
t
fX,Y (x) =
)
ρσX σY
とおくと
σY2
}
{
exp − 1 (x − µ) · Σ−1 (x − µ)
2
2
σX
ρσX σY
1
2π(detΣ)1/2
6
と書ける. µ を平均ベクトル, Σ を分散共分散行列という
2
問 X の周辺密度関数はパラメータ µX , σX
の正規分布の確率密度関数であることを示せ (以下に Hint
有).
∫ ∞
(1) fX (x) =
fX,Y (x, y)dy である.
−∞
y − µy
とおくと σY dz = dy であり
σY
{
}
(x − µX )(y − µY )
(x − µX )2
(y − µY )2
1
− 2ρ
−
+
2
σX σY
2(1 − ρ2 )
σX
σY2
(
)2
2
x − µX
1
1 · (x − µX )
=−
z
−
ρ
−
2
σX
2
2(1 − ρ2 )
σX
(2) z =
より
[
{
}]
(x − µX )2
(y − µY )2
(x − µX )(y − µY )
1
exp −
− 2ρ
+
2
σX σY
2(1 − ρ2 )
σX
σY2
{
}
(
}
)2
{
(x − µX )2
x − µX
1
1
z−ρ
=exp −
exp − ·
2
σX
2
2(1 − ρ2 )
σX
{
}
(
)
(x − µX )2
x − µX
1
1
exp − ·
は積分に無関係なので外に出せる. さらに w = √
z−ρ
2
2
σX
σX
1 − ρ2
√
と置換すれば dz = 1 − ρ2 dw となる.
7