数学 II 第1回 確率変数と確率分布 確率変数とは, ある確率法則に従って

数学 II
第1回 確率変数と確率分布
確率変数とは, ある確率法則に従って変動する変量のことである. 確率変数 X は, 以下で
定義される分布関数 F (x) により特徴づけられる.
F (x) = P (X ≤ x),
x ∈ R.
定理(分布関数の性質)
(1) x1 < x2 ならば F (x1 ) ≤ F (x2 ).
(2) lim F (x) = 0.
x→−∞
(3)
(4)
lim F (x) = 1.
x→∞
lim F (x) = F (a).
x→a+0
確率変数は, そのとる値の種類により離散型と連続型の2種類に分けられる.
離散型確率変数
確率変数 X のとる値がトビトビでそれらに順番がつけられる場合, X を離散型確率変数
という. このとき X のとる値とその値をとる確率は次のような表にして表される.
X のとる値
x1 x2 · · · xn · · ·
その値をとる確率 p1 p2 · · · pn · · ·
∑∞
ここで {pi } は pi ≥ 0 (i = 1, 2, . . .), i=1 pi = 1 を満たす. 上の表の対応関係を X の確率分
布という. また
f (xi ) = P (X = xi ) = pi , i = 1, 2, . . .
を X の確率関数という. 分布関数と確率関数は次のようにして互いに他を定義できる.
∑

f (xi )
 F (x) =

{i:xi ≤x}
f (xi ) = F (xi ) − F (xi−1 ).
連続型確率変数
確率変数 X のとる値が連続的に並び X の分布関数 F (x) が積分
∫ x
∫ x
F (x) =
f (y)dy = lim
f (y)dy
M →∞
−∞
−M
∫
∞
で与えられるとき, X を連続型確率変数という. ただし, f (x) ≥ 0 かつ
f (x)dx = 1
−∞
∫ ∞
∫ ∞
∫ 0
を満たすとする. (ここで
f (x)dx (広義積分という)は
f (x)dx =
f (x)dx +
−∞
−∞
−∞
∫ ∞
∫ 0
∫ N
f (x)dx = lim
f (x)dx + lim
f (x)dx により定義される.)このとき f (x) を X
0
M →∞
−M
N →∞
0
の確率密度関数という. 任意の a, b (a < b) に対して
∫ b
P (a < X ≤ b) =
f (x)dx
a
1
が成立する. また
F ′ (x) = f (x)
であるから分布関数と確率密度関数は互いに他を定義できる.
確率変数の平均と分散
X の平均(または, 期待値)E[X] を離散型, 連続型に従って次のように定義する.
{ ∑∞
∑
|xi |f (xi ) < ∞),
i=1 xi f (xi ) (ただし
E[X] =
∫∞
∫∞
xf (x)dx (ただし −∞ |x|f (x)dx < ∞).
−∞
X の平均を E[X] = µ とするとき, (X − µ)2 の平均を X の分散といい V [X] で表す. V [X]
の負でない平方根を X の標準偏差といい σ[X] で表す. つまり
√
V [X] = E[(X − µ)2 ], σ[X] = V [X].
また
V [X] = E[X 2 ] − µ2
が成り立つ.
定理 a, b を定数とするとき, 以下が成立する.
(1) E[aX + b] = aE[X] + b.
(2) V [aX + b] = a2 V [X].
定理 g(x) を任意の関数とするとき, 以下が成立する.
{ ∑∞
∑
|g(xi )|f (xi ) < ∞),
i=1 g(xi )f (xi ) (ただし
E[g(X)] =
∫∞
∫∞
g(x)f (x)dx (ただし −∞ |g(x)|f (x)dx < ∞).
−∞
以下, 確率分布の例をあげる.
離散型確率分布の例
1.離散一様分布
1個のサイコロを投げる試行において出る目の数を X で表すと X は離散型確率変数で, そ
の確率関数は
1
f (i) = , i = 1, 2, . . . , 6,
6
となる. X の平均, 分散は次のようになる.
E[X] =
6
∑
E[X 2 ] =
7
if (i) = ,
2
i=1
6
∑
i2 f (i) =
i=1
91
V [X] =
−
6
91
6
( )2
7
35
= .
2
12
2
だから
2. 二項分布 B(n, p), 0 < p < 1
1回の試行で事象 A が起こる確率を p, 起こらない確率を q = 1 − p とする. この試行を独
立に n 回行ったとき, 事象 A が起こる回数を X で表すと X は離散型確率変数で, その確率関
数は
f (i) = n Ci pi q n−i , i = 0, 1, 2, . . . , n,
となる. このとき確率変数 X は二項分布 B(n, p) に従うといわれる. これについては
E[X] = np,
V [X] = npq
が成立する.
3. ポアソン分布 Po (λ), λ > 0
確率変数 X の確率関数が
f (i) = e−λ
λi
,
i!
i = 0, 1, 2, . . .
で与えられるとき X はポアソン分布 Po (λ) に従うといわれる. これは二項分布で平均 np を
一定値 λ として, n → ∞, p → 0 としたときに得られる極限分布である. ポアソン分布 Po (λ)
については
E[X] = λ, V [X] = λ
が成立する.
連続型確率分布の例
4. 一様分布 U (a, b), a < b
確率変数 X の確率密度関数が


1
, a≤x≤b
f (x) =
b−a
 0,
その他
で与えられるとき X は区間 [a, b] 上の一様分布 U (a, b) に従うといわれる. これについては
E[X] =
a+b
,
2
V [X] =
(a − b)2
12
が成立する.
5. 指数分布 EX (λ), λ > 0
確率変数 X の確率密度関数が
{
f (x) =
λe−λx , x ≥ 0
0,
その他
で与えられるとき X は指数分布 EX (λ) に従うといわれる. これについては
E[X] =
1
,
λ
V [X] =
3
1
λ2
が成立する.
6.正規分布 N (µ, σ 2 ), µ ∈ R, σ > 0
確率変数 X の確率密度関数が
(x−µ)2
1
e− 2σ2 ,
f (x) = √
2πσ
x ∈ R,
で与えられるとき X は正規分布 N (µ, σ 2 ) に従うといわれる. これについては
V [X] = σ 2
E[X] = µ,
が成立する. 特に µ = 0, σ = 1 のとき X は標準正規分布に従うといわれる.
定理 X が正規分布 N (µ, σ 2 ) に従うとすると以下が成立する.
(1) Y = aX + b (ただし a ̸= 0)は正規分布 N (aµ + b, a2 σ 2 ) に従う.
(2) Z = (X − µ)/σ は標準正規分布 N (0, 1) に従う.
問題
[1] 確率変数 X に対して E[X] = µ, V [X] = σ 2 > 0, Z =
E[Z] = 0, V [Z] = 1 となることを確かめよ.
X −µ
とおくとき,
σ
[2] 確率変数 X が二項分布 B(n, p) に従うとき, φ(t) = E[tX ], t ∈ R, という関数を考える.
φ(t) = (pt + q)n (ただし q = 1 − p)を示し, これを用いて E[X] = np, V [X] = npq となる
ことを確かめよ.
∞
∑
λi
[3] λ > 0 に対して
e−λ = 1 となることを認めて, 確率変数 X がポアソン分布 Po (λ)
i!
i=0
に従うとき, E[X] = λ, V [X] = λ となることを確かめよ.
∫ ∞
∫ 0
∫ T
[4] 一般に
f (x)dx = lim
f (x)dx + lim
f (x)dx と理解する. 指数分布 EX (λ)
S→∞ −S
T →∞ 0
−∞
∫ ∞
の確率密度関数 f (x) が実際に
f (x)dx = 1 を満たすことを確かめよ. また, X が EX (λ)
−∞
1
1
, V [X] = 2 となることを確かめよ. (ヒント: まず
λ
λ
lim T e−λT = lim T 2 e−λT = 0 を示し, これを用いる.)
T →∞
T →∞
√
[5] 確率変数 X が指数分布 EX (λ) に従うとき確率変数 Y = X の分布関数と確率密度
関数を求めよ.
に従う確率変数のとき, E[X] =
[6] 確率変数
( X )の密度関数が fX (x) のとき Y = aX + b (a ̸= 0) の確率密度関数は
1
fY (y) = |a| fX y−b
であることを示せ.
a
4
確率変数と確率分布:問題解答
[1] Z =
1
σX
−
µ
σ
1
σ,
だから最初の定理の (1) において a =
b = − σµ とすれば
1
µ
1
µ
µ µ
E[Z] = E[ X − ] = E[X] − = − = 0 .
σ
σ
σ
σ
σ σ
1
σ2 V
また定理 (2) より V [Z] =
σ2
σ2
[X] =
= 1.
[2] 2項定理より
n
∑
X
φ(t) = E[t ] =
n
∑
i
P (X = i)t =
i=0
i n−i
n Ci p
q
·t =
i
i=0
n
∑
i n−i
n Ci (pt) q
= (pt + q)n .
i=0
両辺を t で微分していくと
∑
d
φ(t) =
iP (X = i)ti−1 = np(pt + q)n−1 ;
dt
i=1
n
∑
d2
φ(t) =
i(i − 1)P (X = i)ti−2 = n(n − 1)p2 (pt + q)n−2 .
2
dt
i=2
∑n
第1の式で t = 1 とおくと, p + q = 1 より i=1 iP (X = i) = np, すなわち E[X] = np. 同様に第2式で t = 1
∑n
とすると i=2 i(i − 1)P (X = i) = E[X(X − 1)] = n(n − 1)p2 . したがって
n
V [X]
= E[X 2 ] − (E[X])2 = E[X(X − 1)] + E[X] − (E[X])2 = n(n − 1)p2 + np − (np)2
= np(1 − p) = npq
を得る。ここで用いた関数 φ(t) は2項分布の確率母関数とよばれる。ちなみに母関数を用いずに直接 E[X],
E[X(X − 1)] を計算すると次のようになる:
n
∑
E[X] =
i n Ci pi q n−i =
i=0
= np
i=0
n
∑
i=1
n−1
k=0
= np(p + q)
=
n
∑
∑ n(n − 1)!
n!
pi q n−i =
pi q n−i
i!(n − i)!
(i
−
1)!(n
−
i)!
i=1
n
i
∑
(n − 1)!
(n − 1)!
pi−1 q (n−1)−(i−1) = np
pk q n−1−k
(i − 1)!(n − i)!
k!(n − 1 − k)!
n−1
E[X(X − 1)]
n
∑
= np .
∑ n(n − 1)(n − 2)!
n!
pi q n−i =
pi q n−i
i!(n − i)!
(i
−
2)!(n
−
i)!
i=2
n
i(i − 1)
i=0
n−2
∑
= n(n − 1)p2
r=0
(n − 2)!
pr q n−2−r = n(n − 1)p2 (p + q)n−2 = n(n − 1)p2 .
r!(n − 2 − r)!
i
[3] X のとる値が i = 0, 1, 2, . . . で P (X = i) = e−λ λi! だから
E[X]
=
∞
∑
ie
i=0
E[X(X − 1)] =
i
−λ λ
i!
∞
∑
i=0
=e
−λ
∞
∞
∞
∑
∑
∑
λi
λi−1
λk
−λ
−λ
i
= λe
= λe
=λ.
i!
(i − 1)!
k!
i=1
i=1
i(i − 1) e
k=0
i
−λ λ
i!
2 −λ
=λ e
∞
∞
∑
∑
λi−2
λr
2 −λ
=λ e
= λ2 .
(i
−
2)!
r!
r=0
i=2
V [X] = E[X(X − 1)] + E[X] − (E[X])2 = λ2 + λ − λ2 = λ .
[4] 指数分布の密度関数は x < 0 において f (x) = 0 だから
∫
∫
∞
T
f (x)dx = lim
T →∞
−∞
f (x)dx
0
である。部分積分により
∫
∫
T
T
f (x)dx =
0
よって limT →∞
同様に
∫T
0
λe−λx dx = [−e−λx ]T0 = 1 − e−λT .
0
f (x)dx = 1.
}
{
1
1 −λT
−λT
+
,
E[X] = lim
λxe
dx = lim −T e
− e
T →∞ 0
T →∞
λ
λ
{
}
∫ T
2
2
E[X 2 ] = lim
λx2 e−λx dx = lim −T 2 e−λT − T e−λT + 2 (1 − e−λT )
T →∞ 0
T →∞
λ
λ
∫
T
−λx
となる。ところで x > 0 に対して ex > 1 + x > x であることは容易にわかる。これより 0 ≤
√
すなわち挟みうちにより limx→∞ xe−x = 0. したがって
lim T e−λT =
T →∞
√
x
ex
<
√
x
x
√
= 1/ x.
√
√
2
2
lim ( λT /2e−λT /2 )2 =
lim ( xe−x )2 = 0 ;
λ T →∞
λ x→∞
lim T 2 e−λT = lim (T e− 2 T )2 = 0 .
λ
T →∞
T →∞
さらに limT →∞ e−λT = 0 であるから
E[X] =
1
,
λ
E[X 2 ] =
2
.
λ2
従って
V [X] = E[X 2 ] − (E[X])2 =
[5] Y =
2
1
1
− ( )2 = 2 .
λ2
λ
λ
√
X の確率密度関数を fY (y) とすると明らかに y < 0 に対しては fY (y) = 0. また y > 0 に対しては
d
d
d
d
fY (y) =
FY (y) =
P (Y ≤ y) =
P (X ≤ y 2 ) =
dy
dy
dy
dy
∫
y2
λe−λx dx = 2λye−λy .
2
0
[6] 確率変数 X, Y の分布関数をそれぞれ FX (x), FY (y) とする. a > 0 ならば
(
(y − b)
y − b)
FY (y) = P (Y ≤ y) = P (aX + b ≤ y) = P X ≤
= FX
a
a
だから
fY (y) =
(y − b)
d
1 ′ (y − b)
1
FY (y) = FX
=
fX
.
dy
a
a
|a|
a
一方 a < 0 ならば
(
(
(
y − b)
y − b)
y − b)
FY (y) = P (aX + b ≤ y) = P X ≥
=1−P X <
=1−P X ≤
.
a
a
a
最後の等号は P (X = (y − b)/a) = 0 による. したがってこの場合も
fY (y) =
(y − b)
d
1 ′ (y − b)
1
FY (y) = − FX
=
fX
.
dy
a
a
|a|
a