1 連続確率変数

1
連続確率変数
X を連続確率変数とする. ある特定の値をとる確率は P (X = a) = 0 である. それゆえ, ある区間に入る確
率 P (a < X ≤ b) を考える. この確率が
∫
b
f (x)dx
a
とあわらせるとき, 関数 f (x) を密度関数という. 密度関数は
∫
f (x) ≥ 0,
∞
f (x)dx = 1
−∞
である. f (x) のグラフの高さは確率でなく, 確率を与える密度の値であることに注意. また連続確率変数の場
合 P (a < X ≤ b) = P (a ≤ X ≤ b) = P (a ≤ X < b) = P (a < X < b) である点にも注意されたい.
例えば, 密度関数が
{
f (x) =
1/(b − a)
0
a≤x≤b
x < a, x > b
となる. 確率変数 X がこのような分布関数をもつとき, 一様分布にしたがうといい, X ∼ U [a, b] と表記する.
EXCEL の関数 rand() を実行すると, a = 0, b = 1 となる一様乱数を発生することができる.
確率変数 X の密度関数 f (x) に対して
∫
F (x) = P (X ≤ x) =
x
f (t)dt
−∞
を分布関数という. これは離散確率変数も (右連続な) 階段関数として定義できる.
分布関数 F (x) の導関数は密度関数となる. 分布関数をもちいて, 任意の区間を表すことができる.
P (a < X < b) = F (b) − F (a)
P (X > b) = 1 − F (b)
P (X < a, X > b) = 1 − F (b) + F (a)
である. なお, 連続確率変数の場合 P (X = a) = 0 となるので, 不等号の有無は関係ない.
密度関数 f (x) をもつ連続確率変数 X の期待値と分散は
∫
∞
E[X] =
xf (x)dx
−∞
∫ ∞
V [X] =
−∞
(x − E[X])2 f (x)dx
と定義される. 期待値と分散についての性質は離散のときと同じである. たとえば
• E[a + bX] = a + bE[X]
• V [X] = E[X 2 ] − E[X]
• V [a + bX] = b2 V [X]
などである.
1
X が一様分布 U [a, b] にしたがうとき, 期待値は
E[X] =
1 b2 − a2
1
= (a + b)
2 b−a
2
である. とくに, U [0, 1] のときは, E[X] = 1/2 で E[X 2 ] = 1/3 なので, V [X] = 1/12 である.
2 変数の連続確率変数 X, Y を考える. このときの
∫
b
∫
d
P (a < X ≤ b, c < Y ≤ d) =
f (x, y)dydx
a
c
となる関数 f (x, y) を同時密度関数という. 周辺密度関数は
∫
fx (x) =
∞
f (x, y)dy
−∞
∞
∫
fy (y) =
f (x, y)dx
−∞
で定められる.
いま, 同時密度関数が
f (x, y) = fx (x)fy (y)
とあわらせるとき, 独立という. 任意の関数 g1 (x) と g2 (y) を考える. g1 (X) と g2 (Y ) は確率変数である. 離
散確率変数のときと同様に, もし X と Y も独立なら g1 (X) と g2 (Y ) も独立である.
それぞれの期待値は
∫
∞
∫
∫
∞
E[X] =
∞
xf (x, y)dydx =
−∞
∞
∫
−∞
∞
∫
E[Y ] =
∫
−∞
∞
yf (x, y)dydx =
−∞
−∞
−∞
xfx (x)dx
yfy (y)dy
であり, 分散は
∫
∞
∫
∞
V [X] =
−∞
∫ ∞
−∞
∫ ∞
−∞
−∞
V [Y ] =
∫
(x − E[X])2 f (x, y)dydx =
(y − E[Y ])2 f (x, y)dydx =
である. 共分散を
∫
∞
∫
∞
Cov[X, Y ] =
−∞
−∞
∞
−∞
∫ ∞
−∞
(x − E[X])2 fx (x)dx
(y − E[Y ])2 fy (y)dy
(x − E[X])(y − E[Y ])f (x, y)dydx
で定義する. 平均, 分散, 共分散の性質は離散のときと同じである. たとえば
• Cov[X, Y ] = E[XY ] − E[X]E[Y ]
• Cov[a + bX, c + dY ] = bdCov[X, Y ]
• E[aX + bY ] = aE[X] + bE[Y ]
• V [aX + bY ] = a2 V [X] + b2 V [Y ] + 2abCov[X, Y ]
• X と Y が独立なら E[XY ] = E[X]E[Y ] で無相関であるが, 逆は必ずしも成り立たない.
• −1 ≤ Corr[X, Y ] ≤ 1
などである.
2
2
正規分布
確率変数 X の密度関数が, 2 つのパラメータ µ と σ 2 をつかって
{
}
1
(x − µ)2
f (x) = √
exp −
2σ 2
2πσ 2
のとき, 正規分布にしたがうという. このとき平均は E[X] = µ で, 分散は σ 2 であることが知られている. こ
のように正規分布にしたがう確率変数は, 2 つのパラメータ µ と σ 2 によって特徴付けれていて
X ∼ N (µ, σ 2 )
と表記される.
一次変換 Y = a + bX について, E[Y ] = a + bE[X} であり, V [Y ] = b2 V [X] であるので, X ∼ N (µ, σ 2 )
ならば
Y ∼ N (a + bµ, b2 σ 2 )
である
また, Z = (X − µ)/σ のとき, 平均 0 で分散 1 の正規分布になる. このとき標準正規分布といい, N (0, 1) と
あらわす. このときの密度関数を
( 2)
1
z
ϕ(z) = √ exp −
2
2π
と表す. その分布関数を Φ(z) と表す.
Z ∼ N (0, 1) とする. これが P (a < Z ≤ b) となる確率は P (Z < b) − P (Z < a) = Φ(b) − Φ(b) で
ある. 付表を用いるとき b > 0 について P (0 ≤ Z ≤ b) = Φ(b) − 0.5 となっていることに注意. また
X ∼ N (µ, σ 2 ) のとき, P (a < X < b) となる確率は, Z = (X − µ)/σ b′ = (b − µ)/σ, a′ = (a − µ)/σ とし
て, P (X < b) − P (X < a) = P (Z < b′ ) − P (Z < a′ ) = Φ(b′ ) − Φ(a′ ) である.
Z ∼ N (0, 1) とする. ある確率 α (0 < α < 0.5) について P (Z > z(α)) = 1 − P (Z ≤ z(α)) = α となる
z(α) を上側 100α% 点という. 分布関数から計算する場合, P (Z ≤ z(α)) = 1 − α となる点であり, 付表を使
う場合, P (0 ≤ Z ≤ z(α)) = 0.5 − α となる点である. α = 0.05 のときの上側 5% 点は 1.64 である. 一方,
P (|Z| ≥ z(α)) = α となる z(α) を両側 100α% 点という. α = 0.05 のときの両側 5% 点は上側 2.5% 点と等
しく, 1.96 である.
2 つの確率変数 X と Y の同時密度関数が
{
}
g(x, y)
1
√
exp −
2(1 − ρ2 )
2πσX σY 1 − ρ2
(
)2
)(
) (
)2
(
x − µX
y − µY
x − µY
x − µX
g(x, y) =
+
− 2ρ
σX
σX
σY
σY
f (x, y) =
2
のとき, それぞれ X ∼ N (µX , σX
), Y ∼ N (µY , σY2 ) で, 相関係数が ρ である. つまり 5 つのパラメータで記
述できる.
一般に 2 つの確率変数が独立なら無相関であるが, 逆は必ずしも成り立たない. しかしながら, 2 つの確率変
3
数が正規分布にしたがうとき, 無相関なら独立である. 実際 ρ = 0 のとき
{
(
)2
(
)2 }
1
1 x − µX
1 x − µY
f (x, y) =
exp −
−
2πσX σY
2
σX
2
σY
{
}
{
}
2
1
(x − µX )
1
(x − µY )2
√
=√
exp −
exp −
2
2
2σX
2σY2
2πσX
2πσY2
である.
2
), Y ∼ N (µY , σY2 ) であり, 相関係数を ρ
2 つの確率変数 X, Y が正規分布にしたがうとき, X ∼ N (µX , σX
とする. このとき,
2
X + Y ∼ N (µX + µY , σX
+ 2ρσX σY + σY2 )
2
+ σY2 ) である.
である. 無相関なら独立であり, X + Y ∼ N (µX + µY , σX
n 変 数 の 確 率 変 数 {Xi }ni=1 が 正 規 分 布 に し た が う と す る. n 個 の 定 数 ci を 加 重 と し た 加 重 和 は,
Cov[Xi , Xi ] = V [Xi ] として
n
∑


n
n ∑
n
∑
∑
ci Xi ∼ N 
ci E[Xi ],
ci cj Cov[Xi , Xj ]
i=1
i=1
i=1 j=1
である. 互いに無相関なら正規分布なので互いに独立を意味し,
n
∑
(
ci Xi ∼ N
i=1
n
∑
ci E[Xi ],
i=1
n
∑
)
c2i V
[Xi ]
i=1
2
である. n 変数の確率変数 {Xi }n
i=1 が同一の正規分布 N (µ, σ ) にしたがい, 無相関なら, 互いに独立な同一
分布 iid にしたがう. このとき
n
∑
(
c i Xi ∼ N
i=1
µ
n
∑
ci , σ
i=1
である.
課題
1. 付表より次の確率を求めよ..
a) X ∼ N (0, 1) のとき, P (1.5 < X < 2.2)
b) X ∼ N (0, 1) のとき, P (X 2 < 1)
c) X ∼ N (50, 102 ) のとき, P (X < 35)
補足
なお誤字脱字を訂正した配布資料は以下に置いてある.
http://www.t.hosei.ac.jp/~miya_ken/shutodai/
4
2
n
∑
i=1
)
c2i