第06回 - 制御情報工学科

専攻科 応用数学 II
第 6 回 講義資料 一般の確率変数 · 分布関数
確率変数 · 分布関数
1
前回まで, 離散型確率変数を扱ってきた. しかし, 離散型確率変数 X の「X による Ω の像が R の
高々可算な部分集合である」という条件は強すぎる. そこで, 一般の確率変数の定義をしよう.
定義 確率空間 (Ω, F, P ) 上で定義された X : Ω → R が確率変数であるとは
任意の x ∈ R に対して {ω ∈ Ω|X(ω) ≤ x} ∈ F
が成り立つことである.
命題 X を (Ω, F, P ) 上の確率変数とする. このとき, 任意の x ∈ R に対して次が成り立つ.
(1) {ω ∈ Ω|X(ω) > x} ∈ F
(2) {ω ∈ Ω|X(ω) < x} ∈ F
(3) {ω ∈ Ω|X(ω) = x} ∈ F
証明
(1) {ω ∈ Ω|X(ω) ≤ x} ∈ F であり, {ω ∈ Ω|X(ω) > x} = {ω ∈ Ω|X(ω) ≤ x}c ∈ F
(2)
{ω ∈ Ω|X(ω) < x} =
{
で, 各 n に対して ω ∈ Ω|X(ω) ≤ x −
}
1
n
∞ {
∪
n=1
1
ω ∈ Ω|X(ω) ≤ x −
n
}
∈ F より {ω ∈ Ω|X(ω) < x} ∈ F.
(3) (2) より
{ω ∈ Ω|X(ω) = x} = {ω ∈ Ω|X(ω) ≤ x} ∩ {ω ∈ Ω|X(ω) < x}c ∈ F
2
注意 集合の記号を用いれば
• {ω ∈ Ω|X(ω) ≤ x} = X −1 ((−∞, x])
• {ω ∈ Ω|X(ω) > x} = X −1 (x, ∞))
• {ω ∈ Ω|X(ω) < x} = X −1 ((−∞, x))
• {ω ∈ Ω|X(ω) = x} = X −1 ({x})
例 離散型確率変数は当然, 一般の意味での確率変数になっている. 実際 X を離散型確率変数とし,
X(Ω) = {x1 , x2 , · · · } とすると,
∪
{ω ∈ Ω|X(ω) ≤ x} =
{ω ∈ Ω|X(ω) = xi }
i:xi ≤x
1
であり, X が離散型確率変数であることから 各 i につき {ω ∈ Ω|X(ω) = xi } ∈ F であり, 右辺は高々
可算個の和集合であるから σ− 加法族の定義より右辺は再び F の元である.
さて, X が確率変数であるとき, 任意の x ∈ F に対して {ω ∈ Ω|X(ω) ≤ x} ∈ F よりこの事象の確
率が定義される. これを FX (x) とかこう:
FX (x) = P ({ω ∈ Ω|X(ω) ≤ x})
これを X の分布関数という. 一般の確率変数ではこの分布関数が重要な役割を果たす. P ({ω ∈
Ω|X(ω) ≤ x}) はしばしば P (X ≤ x) と書かれる.
確率測度の性質である確率測度の連続性から, 分布関数の性質が導かれる. 確率測度の連続性 (第 2
回講義資料) とは, 次の事実をいう:
定理 (確率測度の連続性 (再掲載)) (Ω, F, P ) を確率空間とし, A1 , A2 , · · · , An , · · · ∈ F を事象の
増加列とする, つまり
A1 ⊂ A2 ⊂ · · · ⊂ An ⊂ An+1 ⊂ · · ·
が成り立つとする. このとき
∞
∪
A=
An
n=1
とおくと
P (A) = lim P (An )
n→∞
が成り立つ. 事象の減少列 B1 ⊃ B2 ⊃ · · · ⊃ Bn ⊃ Bn+1 ⊃ に対しても
B=
∞
∩
Bn
n=1
とおくと
P (B) = lim P (Bn )
n→∞
が成り立つ.
命題 X を確率空間 (Ω, F, P ) 上の確率変数とし, FX (x) を X の分布関数とする. このとき, 次
のことが成り立つ.
(1) x ≤ y ならば FX (x) ≤ FX (y)
(2) lim FX (x) = 1
x→∞
(3) lim FX (x) = 0
x→−∞
(4) FX は右連続な関数である. つまり, 任意の x に対して
lim FX (y) = F (x)
y→x+0
が成り立つ.
証明
(1) x ≤ y ならば {ω ∈ Ω|X(ω) ≤ x} ⊂ {ω ∈ Ω|X(ω) ≤ y} より P (X ≤ x) ≤ P (X ≤ y).
2
(2) x1 < x2 < · · · < xn < xn+1 < · · · , lim xn = ∞ を満たす任意の数列 {xn } に対して lim FX (xn ) =
n→∞
n→∞
∞ を示せばよい. このような数列 xn に対して An = {ω ∈ Ω|X(ω) ≤ xn }(∈ F) とおくと, An は
事象の増加列である. また, 任意の ω ∈ Ω に対して X(ω) < ∞ であることに注意すると
Ω=
∞
∪
An
n=1
が成り立つ (各自チェック). よって, 確率測度の連続性により
1 = P (Ω) = lim P (An ) = lim P (X ≤ xn ) = lim FX (xn )
n→∞
n→∞
n→∞
(3) (2) と同様に x1 > x2 > · · · > xn > xn+1 > · · · , lim xn = −∞ なる任意の数列 {xn } に対して
n→∞
lim FX (xn ) = 0 を示せばよい. Bn = {ω ∈ Ω|Xn (ω) ≤ xn }(∈ F ) とおくと, Bn は事象の減少列で
n→∞
あり,
∅=
∞
∩
Bn
n=1
が成り立つ (各自チェック). 確率測度の連続性により
0 = P (∅) = lim P (Bn ) = lim P (X ≤ xn ) = lim FX (xn )
n→∞
n→∞
n→∞
(4) 任意の x ∈ R と任意の x1 > x2 > · · · > xn > xn+1 > · · · > x, lim xn = x なる数列 {xn } に対し
n→∞
て lim FX (xn ) = FX (x) を示せばよい. Cn = {ω ∈ Ω|X(ω) ≤ xn } とおくと, 事象の減少列であり
n→∞
{ω ∈ Ω|X(ω) ≤ x} =
∞
∩
Cn
n=1
と書ける (各自チェック). よって, 確率測度の連続性により
FX (x) = P (X ≤ x) = lim P (Cn ) = lim P (X ≤ xn ) = lim FX (xn )
n→∞
n→∞
n→∞
2.
注
(1) 分布関数は必ずしも左連続ではない. 上と同じように証明しようとすると x1 < x2 < · · · < xn <
xn+1 < · · · < x, lim xn = x なる数列 {xn } に対して Dn = {ω ∈ Ω|Xn (ω) ≤ xn } とおくと事象の
n→∞
増加列であるが
∞
∪
Dn = {ω ∈ Ω|X(ω) < x}
n=1
しか得られない. したがって
P (X < x) = lim P (X ≤ xn ) = lim FX (xn )
n→∞
n→∞
となるだけである. したがって, P (X = x) > 0 であれば, P (X ≤ x) ̸= P (X < x) である. した
がって, 分布関数は一般には左連続ではない.
3
(2) F が上の命題の (1) から (4) を満たす関数ならば, ある確率空間とその上の確率変数 X があって,
X の分布関数が F となる. 証明は確率論の深い議論を必要とするので省略する.
(3) B(R) を R 上のボレル集合族とする. A ∈ B(R) に対して
{ω ∈ Ω|X(ω) ∈ A} ∈ F
が成り立つことが知られている. このとき
µ(A) = P ({ω ∈ Ω|X(ω) ∈ A})
は (Ω, B(R)) 上の確率測度となる. µ を X の分布という.
分布関数の定義と性質から次のことがわかる. 証明は数列を用いた議論によりできるので省略する.
命題 FX を X の分布関数とする. ただし F (a − 0) = lim F (x) である.
x→a−0
(1) P (X < a) = FX (a − 0)
(2) P (X > a) = 1 − FX (a)
(3) P (a < X ≤ b) = FX (b) − FX (a)
(4) P (a < X < b) = FX (b − 0) − FX (a)
(5) P (x = a) = FX (a) − FX (a − 0)
2
分布関数の例
いくつかの例をあげよう.
例
(1) X が非負整数値をとる確率変数とする. pX (k) = P (X = k) (k = 0, 1, 2, · · · ) とすると
{
0
(x < 0)
FX (x) =
pX (0) + pX (1) + · · · + p([x]) (x ≥ 0)
ただし [x] は x を越えない最大の整数を表す. FX (x) のグラフは以下のようになる.
1
pX (0) + pX (1) + pX (2)
pX (0) + pX (1)
pX (0)
O
4
1
2
3
4
5
(2) a, b ∈ R を a < b とする.


 0x − a (x < a),
(a ≤ x ≤ b),
F (x) =

 b−a
1
(x > b)
は分布関数の性質 (1) から (4) を満たす. この分布関数をもつ確率変数は区間 (a, b) で一様分布に
従うといわれる.
F (x)
1
O
a
b
x
(3) λ > 0 をパラメータとするとき
{
F (x) =
0
(x ≤ 0),
−λx
1−e
(x > 0)
は分布関数の性質 (1) から (4) を満たす. この分布関数をもつ確率変数はパラメータ λ の指数分布
に従うといわれる.
F (x)
1
x
O
3
確率変数の関数
X が確率空間 (Ω, F, P ) 上の確率変数とする. g : R → R に対し Y = g(X) は Ω から R への写像
となるが, 一般に確率変数であるとは言えない. g にある程度の条件を課すと確率変数となる. たとえ
ば, 単調な関数あるいは連続関数であると仮定すると Y = g(X) は確率変数となることが知られてい
る. このとき Y = g(X) の分布はどうなるのであろうか. まず簡単な例として g(x) = ax + b (a, b ∈ R,
a > 0) として考えてみよう. Y = aX + b とし, FY (y) を求めよう.
(
)
(
)
y−b
y−b
FY (y) = P (Y ≤ y) = P (aX + b ≤ y) = P X ≤
= FX
a
a
となる. h(x) = (x − a)/b は g の逆関数であることがわかる. g が狭義単調増加な関数であるときは次
のことが知られている.
5
命題 X を確率変数, g : R → R を狭義単調増加な関数とする. このとき, Y = g(X) も確率変数
であり Y の分布関数 FY (y) は次の式で与えられる
Fy (y) = FX (g −1 (y))
ただし, y ≤ inf g ならば FY (y) = 0, y ≥ sup g ならば FY (y) = 1 とする.
が単調増加な関数でない場合は, それぞれに応じて考えればよい.
g
例題 6.1 X を確率変数とするとき, Y = X 2 の分布関数 FY を X の分布関数 FX を用いて表せ.
解 y < 0 ならば FY (y) = P (Y ≤ y) = P (X ≤ y) = 0, 一方 y ≥ 0 のとき
2
√
√
√
√
FY (y) = P (Y ≤ y) = P (X 2 ≤ y) = P (− y ≤ X ≤ y) = FX ( y) − FX (− y − 0)
となる. よって
{
FY (y) =
0
y<0
√
√
FX ( y) − FX (− y − 0) y ≥ 0
連続分布
4
分布関数は各点で右連続であるが, 左連続であるとは限らない. しかし, 分布関数は増加関数である
ので, よく知られているようにその不連続点は高々可算個である. 分布関数が各点で連続であるとき X
は (広義の) 連続分布に従うといわれる.
命題 X が連続分布に従うとき, 任意の x に対して P (X = x) = 0. 逆も成り立つ.
連続分布の中で重要なのは次の絶対連続な分布である.
定義 確率変数 X の分布関数 FX が, ある非負の可積分関数 fX を用いて
∫
FX (x) =
x
−∞
fX (u)du
とかけるとき, X は絶対連続分布に従うと呼ばれる. また, fX を X の確率密度関数という.
上の積分は今までの積分と異なり, ルベーグ積分と呼ばれる積分である. ルベーグ積分についてここで
は詳しくは触れない. 分布関数の性質から, 次のことがわかる.
命題 確率密度関数 fX は次を満たす.
(1) fX (x) ≥ 0
∫ ∞
(2)
fX (x)dx = 1
−∞
逆に f が上の 2 つを満たせば f はある確率変数 X の確率密度関数となる. そのためには
∫ x
F (x) =
f (u)du
−∞
6
とおくと, F は分布関数の性質 (条件) を満たす. このことから, 確率空間とその上の確率変数 X があっ
て X の分布関数が F となるようにできる. しかし, 証明は確率論の深い議論が必要となるのでここで
は省略する.
絶対連続な確率分布の確率密度関数は, 分布関数から次のように求まる.
命題 X が絶対連続な分布に従い, FX をその分布関数, fX を確率密度関数とするとき
{
fX (x) =
d F (x) (微分が存在するとき)
dx X
0
(その他)
注 X が絶対連続な確率変数であるとき, FX が絶対連続関数と呼ばれる関数になる. 絶対連続な関数
は「ほとんど至るところ」微分が可能である. つまり長さが 0 の集合を除いて微分が可能である.
確率密度関数の例を述べよう.
例
(1) (一様分布) X が一様分布に従うとき,
{
fX (x) =
1
b−a
0
(a < x < b)
(その他)
1
b−a
a
O
b
x
(2) (指数分布) X がパラメータ λ の指数分布に従うとき
{ −λx
λe
(x > 0)
fX (x) =
0
(x ≤ 0)
x
O
(3) (正規分布) X が パラメータ µ と σ 2 の正規分布 (N (µ, σ 2 )) に従うとは, X の確率密度関数が
)
(
f (x) = √ 1 exp − 1 2 (x − µ)2
2σ
2πσ 2
となることである.
7
O
x
(4) (Cauchy 分布) X がコーシー分布に従うとは X の確率密度関数が
f (x) =
1
π(1 + x2 )
(−∞ < x < ∞)
となることである.
y
O
x
(5) (χ2 (カイ 2 乗) 分布) n = 1, 2, · · · に対して X が自由度 n の χ2 分布に従うとは, X の確率密度
関数が

(
) 12 n−1 1


(1 ) 1 x
e− 2 x (x > 0)
1
2
f (x) =
2Γ
n

2

0
(x ≤ 0)
となることである. ただし, Γ(z) はガンマ関数であり, 以下で定義される:
∫ ∞
Γ(z) =
xz−1 e−x dx
0
x
O
問 X がパラメータ 0, 1 の正規分布 (標準正規分布) に従うとき, X 2 は自由度 1 の χ2 分布に従うこ
とを以下の手順で示せ.
8
√
(1) Y = X 2 の分布関数を求めよ (Hint:例題 6.1). 正規分布は連続分布であるから FX (− y − 0) =
√
FX (− y) に注意せよ.
(2) 分布関数の微分が確率密度関数であることに注意して, Y の確率密度関数を求めよ.
( ) √
(3) Γ 1 = π であることを示せ. ガンマ関数の定義式で x = t2 と置換積分せよ.
2
(4) (2) で求めた確率密度関数が自由度 1 の χ2 分布の確率密度関数に一致することを確かめよ.
5
特異な分布の存在
2 点, 裏な
3k
ら 0 点であるとする. コイン投げを無限回行った後, もらえる得点 X は (3 進) カントール分布と呼ば
れる分布に従う. どのような分布かを見ていこう. (講義では説明できないので, 興味のある学生のみ
読んでくれればよい. しかし, このような奇妙な分布も物理など自然界には登場するようである. )
例 (カントール分布) コインを繰り返し投げる試行を考える. k 回目のコインが表ならば
(1) まず 0 ≤ X ≤ 1 である.
実際,
2
3
0 ≤ X ≤ 21 + 22 · · · + 2k + · · · =
3
3
1−
3
1
3
=1
からわかる. よって分布関数 FX は FX (x) = 0 (x < 0), FX (x) = 1 (x ≤ 1) を満たす.
(2) X のとりうる値の集合を調べる.
(a) 1 < X < 2 とはならない. 実際, 1 回目が裏なら X ≤ 1 であり, 1 回目が表なら X ≥ 2 だ
3
3
3
3
1
2
1
からである. したがって,
≤x<
のとき, FX (x) =
である. 現時点で残された可能性
3
3
2
[
] [
]
1 ∪ 2 , 1 である.
は 0,
3
3
(b) 次に
• 12 < X < 22 とはならない. 実際, 1 回目, 2 回目が裏なら X ≤ 12 であり, その他なら
3
3
3
2
1
2
X ≥ 2 だからである. したがって, 2 ≤ x < 2 のときは FX (x) = 1 ,
4
3
3
3
8
8
7
• 2 < X < 2 とはならない. 実際, 1 回目, 2 回目が表なら X ≥
であり, その他なら
9
3
3
X ≤ 72 だからである. したがって 72 ≤ x < 82 では FX (x) = 3 である. 現時点で残
4
3
] [
] [3
] [3
[
]
1
2
1
2
7
8
∪
∪
∪
された可能性は 0,
,
,
, 1 となる.
3
9 3
3 9
9
[
] [
]
[
]
1
1
2
(c) 以下, 繰り返すと, X の取り得る値の集合は, C1 = [0, 1], C2 = 0,
∪
, 1 , C3 = 0,
∪
3
3
9
[
] [
] [
]
2 , 1 ∪ 2 , 7 ∪ 8 , 1 と残された区間を 3 等分し, その真ん中を取り除くというという
9 3
3 9
9
操作を繰り返すと, 減少列 C1 ⊃ C2 ⊃ C3 ⊃ · · · を得る. ここで
C = lim Cn =
n→∞
9
∞
∩
n=1
Cn
C を (3 進) カントール集合という. 実は C は連続濃度であるが, 測度は 0 の集合である. 測度
が 0 とは任意の ε > 0 に対し, 区間の列 In (n = 1, 2, · · · ) があり
C⊂
∞
∪
In かつ
n=1
∞
∑
|In | < ε
n=1
) (
) (
) (
)
(
1, 2 , 1, 2 , 7, 8 ,
1 , 2 ,
となることである. 実際, 取り除かれた区間は
3 3
9 9
9 9
27 27
(
) (
) (
)
7 , 8 , 19 , 20 , 25 , 26 , · · · であり, 1 のものを 2k−1 個ずつ取り除いている
27 27
27 27
27 27
3k
ので, 長さの総和は
∞
∑
1 2k−1 = 1
3k
k=1
となるからである.
また, カントール集合は次のように定義することができる. x ∈ [0, 1] は次のように一通りに表現す
ることができる
∞
∑
ai
x=
= (0.a1 a2 a3 · · · ai · · · )3
3i
i=1
ただし, ai 0 か 1 か 2 である. また, 2 通りの表し方のあるもの ((例)
については前者を採用するものとする. このとき x ∈ C とは
1 = (0.1) = (0.022222 · · · ) )
3
3
3
∞
∑
ai
x=
i = (0.a1 a2 a3 · · · ai · · · )3
3
i=1
と表したとき ai が 0 か 2 のいずれかしか現れないものとして定義される.
(3) 分布関数を定義しよう. 先ほどの考察で取り除かれた区間上では定数であることがわかる. さて,
x ∈ C に対し,
∞
∑
bi
FX (x) =
2i
i=1
ai
である. また, x ∈ [0, 1]\C では FX (x) = sup{F (y)|y ∈ C, y < x} と定
2
義すると, 以下のようなグラフ1 をもつ関数となる.
とする. ただし, bi = 2
この関数は連続関数であることが知られている. 取り除かれた区間上では定数関数であるから, そ
れぞれの区間の内部で FX′ (x) = 0 である. 一方, 区間の端点では微分ができないことがわかる. 実
際 x = 0 では
( )
FX (0) − FX 2k
0 − 1k
( )k
3
1
2
· 3
→ ∞(as k → ∞)
=
=
2
2
2
2
0− k
0− k
3
3
となるからである. しかし取り除かれた区間の長さは 1 であるので, ほとんどいたるところで微分
可能であり, その導関数は 0, 長さ 0 の区間における関数の値は積分に影響を及ぼさないので, 積分
によって分布関数を復元できない. よって, この分布が確率密度関数を持たないことがわかる. こ
のような分布を特異分布という.
1
この図は沼津高専電子制御工学科江上親宏氏にご協力いただきました.
10
1.0
0.8
0.6
0.4
0.2
0.0
0.2
0.4
0.6
0.8
図 1: カントール分布の分布関数
以上で, 分布には 3 つの種類があることがわかった.
(1) 離散分布
(2) 絶対連続分布
(3) 特異連続分布
11
1.0