1 平均

専攻科 応用数学 II
1
第 7 回 講義資料 平均
平均
X が (Ω, F, P ) 上の離散型確率変数であるとき, 任意の実数 x に対して定義される確率質量関数
p(x) = P ({ω ∈ Ω|X(ω) = x})
を用いて, X の平均は
∑
E(X) =
xP (X = x)
x∈X(Ω)
と定義された. 離散型確率変数は, X(Ω) が R の可算部分集合であるので, 上の和は可算個の和である.
しかし, 一般の確率変数の場合は上の式で定義することはできない. 一般の確率変数では次のように,
ルベーグ積分を用いて定義される. しかし, X が確率密度関数を持つような分布の場合は比較的容易
に E(X) が表現される. そのため, 1 回はルベーグ積分の方法で定義を行うが, 実際の問題では普通の
積分の計算によると思って差し支えない.
(1) X が有限個の値のみをとる場合, X は単純と呼ばれる. X ≥ 0 で単純な確率変数
X(ω) =
k
∑
ai χCi (ω), ai ≥ 0, Ci ∈ F,
i=1
k
∪
\ j)
Ci = Ω, Ci ∩ Cj = ∅(i =
(1)
i=1
と表されるとき, X の平均 E(X) を次のように定義する
E(X) =
k
∑
ai P (Ci )
i=1
右辺を
∫
X(ω)P (dω)
Ω
と書く. ここで a1 , a2 , · · · , ak の中には同じものがあってよいので X が単純であるとき, その表
し方 (1) には他の方法もありうる. E(X) は (1) を用いて定義されているので, どのような表し方
であってもその平均は変わらないことを示す必要がある, つまり
k
∑
ai χCi (ω) =
l
∑
i=1
j=1
k
∑
l
∑
bj χDj (ω)
であるとき,
ai P (Ci ) =
i=1
bj P (Dj )
j=1
であることが示されなければならない. 実際このことは正しく, 晴れて E(X) が定義される.
1
(2) X ≥ 0 であるとき Xn を
{
Xn (ω) =
i , i < X(ω) ≤ i + 1 (i = 0, 1, · · · , n2n − 1) のとき
2n
2n
2n
n,
X(ω) > n
とすると Xn は単純である. 実際
}
{ {
i < X(ω) ≤ i + 1
ω
∈
Ω|
(i = 0, 1, · · · , n2n − 1)
Cin =
2n
2n
{ω ∈ Ω|X(ω) ≥ n}
(i = n2n )
とおくと
Cin
∈ F であり
n
n2
∪
\ j) が成り立つ. このとき
Cin = Ω, Ci ∩ Cj = ∅ (i =
i=1
n2
∑
i χ n (ω)
Xn (ω) =
2n Ci
n
i=1
であるので
n2
∑
i P (C n )
E(Xn ) =
i
2n
n
=
=
i=1
n −1
n2
∑
i=1
n −1
n2
∑
i=1
i P
2n
(
i (F
2n X
i < X(ω) ≤ i + 1
2n
2n
(
i+1
2n
)
−F
(
)
+ nP (X(ω) > n)
)
i ) + n(1 − F (n))
X
2n
となる. すると, X1 (ω) ≤ X2 (ω) ≤ · · · ≤ Xn (ω) ≤ Xn+1 (ω) ≤ · · · X(ω) であり, n → ∞ のとき
Xn (ω) ↑ X(ω) である. E(X1 ) ≤ E(X2 ) ≤ · · · ≤ E(Xn ) ≤ E(Xn+1 ) ≤ · · · であるので, E(Xn ) は
n → ∞ のとき正の無限大か有限の実数に収束する. よって,
E(X) = lim E(Xn )
n→∞
と定義する. これを
∫
E(X) =
X(ω)P (dω)
Ω
と書く.
(3) 一般の X については X + (ω) = max{X(ω), 0}, X − (ω) = max{−X(ω), 0} のとすると X + ≥ 0,
X − ≥ 0 であり, X(ω) = X + (ω) − X − (ω) と書ける. (2) で定義したように E(X + ), E(X − ) がと
もに有限のとき, X は可積分であるといい,
E(X) = E(X + ) − E(X − )
と定義する. これを
∫
E(X) =
X(ω)P (dω)
Ω
2
確率変数 X が絶対連続な分布に従うとき, X の分布関数 FX は
∫ x
FX (x) =
f (u)du
−∞
と書ける. このとき X の平均は確率密度関数を用いて計算することができる. 証明にはルベーグ積分
論を必要とするので省略するが, 次の事実をまとめておこう.
公式 X が絶対連続な分布に従い, その確率密度関数を fX とすると, X の平均 E(X) は次のよう
に計算される
∫ ∞
E(X) =
xfX (x)dx
−∞
さらに, g(X) が確率変数となれば,
∫
∞
E(g(X)) =
−∞
g(x)fX (x)dx
と計算される.
正式な証明はルベーグ積分論が必要となるので省略する. 以下, X は絶対連続な分布に従う確率変数
とし, fX を確率密度関数とする. X の分散 Var(X) は E((X − E(X))2 ) で定義されるので
公式 E(X) = µ とするとき
∫
∞
Var(X) =
−∞
(x − µ)2 fX (x)dx
もちろん Var(X) = E(X 2 ) − E(X)2 も成り立つので
∫ ∞
2
E(X ) =
x2 fX (x)dx
−∞
を用いて計算してもよい. 具体的な分布について平均と分散を計算してみよう.
(1) X が区間 (a, b) 上の一様分布に従うとき, 確率密度関数は fX (x) =
他) であるので
1 (a < x < b), = 0 (その
b−a
[
]b
2
2
2
1
x
E(X) =
x
dx =
= b −a = a+b
b−a
2(b − a) a
2(b − a)
2
a
∫ b
3
3
2
2
E(X 2 ) =
x2 1 dx = b − a = b + ba + a
b−a
3(b − a)
3
a
∫
b
よって
2
2
(a + b)2
Var(X) = E(X 2 ) − E(X)2 = b + ba + a −
3
4
2
2
2
2
(b − a)2
= 4b + 4ba + 4a − 3a − 6ab − 3b =
12
12
3
(2) X がパラメータ λ の指数分布に従うとき, 確率密度関数は fX (x) = λe−λx (x ≥ 0), = 0 (x < 0) で
あるので
∫ ∞
∫ ∞
[
]
1
−λx
−λx ∞
E(X) =
x e dx = −xe
+
e−λx dx
0
λ
0
]∞
[0
1
1
−λx
= − e
=
λ
λ
0
∫ ∞
∫ ∞
[ 2 −λx ]∞
2
2 1 −λx
E(X ) =
x
e dx = −x e
+
2xe−λx dx
0
λ
0
0
∫ ∞
[
]∞
= − 1 2xe−λx
= 2
e−λx dx
λ
λ
0
0
2
= 2
λ
Var(X) = E(X 2 ) − E(X)2 = 22 − 12 = 12
λ
λ
λ
(3) X が Cauchy 分布に従うとき, E(X) は存在しない. 実際
∫ M
1
dx
lim
x
M →∞,N →∞ −N
π(1 + x2 )
を調べることになるが,
∫ M
1
∫
∫ M
x dx = 1
dx → ∞(M → ∞)
2
2π
x
π2x
1
1
∫ −1
x
1 dx → −∞(N → ∞)
dx ≤ 1
2π −N x
π(1 + x2 )
x
dx ≥
π(1 + x2 )
−1
−N
∫
M
よって上記の極限は存在しない.
問 X がパラメータ µ, σ 2 の正規分布に従うとき, X の確率密度関数は
(
)
1
1
2
fX (x) = √
exp − 2 (x − µ)
2σ
2πσ 2
x−µ
で置換積分せよ.)
σ
問 確率変数 X が, P (X > 0) = 1 を満たし, 分布関数と確率密度関数について
で与えられる. X の平均と分散を求めよ. (Hint:z =
fX (x)
= λ(> 0 一定)
1 − FX (x)
が成り立つとき, X はパラメータ λ の指数分布に従うことを示せ. 分母を払い, 両辺を微分して微分方
程式を導け. P (X ≤ 0) = 0 より FX (0) = 0 であるから, fX (x) = 0 (x ≤ 0) に注意せよ. 上の式は次の
ように解釈できる. X > x という条件のもとで, x < X ≤ x + ∆x である確率は
FX (x + ∆x) − FX (x)
1 − FX (x)
であるが, 条件より ∆x ∼ 0 のとき
FX (x + ∆x) − FX (x)
∼ λ∆x
1 − FX (x)
4
X をある部品が壊れるまでの時間とするとき λ∆x は寿命が x 時間以上という条件の下で, x + ∆x ま
でに故障する条件つき確率と考えることができる. 信頼性の理論では λ を故障率という.
X をある部品が故障するまでの時間とするとき, X の従う分布の分布を寿命分布という. 分布関数
FX (x) に対して RX (x) = 1 − FX (x) を信頼度という.
信頼性工学などではその他にも様々な分布が用いられる. あと 2 つほど紹介しよう.
(1) (ガンマ分布) 確率密度関数が

 λ(λx)α−1 e−λx
f (x) =
Γ(α)

0
(x ≥ 0)
(x < 0)
で与えられるような分布をパラメータ λ, α のガンマ分布という. ただし λ > 0, α > 0 である.
(2) (ワイブル分布) 確率密度関数が
{
f (x) =
λmxm−1 e−λx
0
m
(x = 0)
(x < 0)
で与えられるような分布をパラメータ λ, m のワイブル分布という. ただし, λ > 0, m > 0 である.
5