1 ガンマ関数、ベータ関数、ガウス積分

数理統計学第 4 回 講義ノート
勝島 義史
2015/5/19
今回は連続の確率変数を紹介する。復習しておくと、連続の確率変数は確率密度関数
と呼ばれるものを持っていて、それはどのようなものであったかというと、確率変数
X : Ω → R の値に関する確率を以下のように表すような関数であった。
∫ x
F (x) = P ({ω ∈ Ω | X(ω) ≤ x} =
f (x)dx.
−∞
関数 f (x) を確率密度関数と呼び、また F (x) を累積分布関数と呼んでいた—–
今回の目標は代表的な連続確率変数
1. 指数分布
2. ガンマ分布
3. 正規分布
を定義し、その期待値と分散を計算することにある。ガンマ分布や正規分布の計算のため
に、「ガンマ関数」や「ベータ関数」の定義と命題を用意する。
1 ガンマ関数、ベータ関数、ガウス積分
ガンマ関数は階乗関数 n! の (ある意味での) 拡張である。階乗関数は自然数を定義域と
する関数で、以下の漸化式を満たす。
n! = n · (n − 1)!.
このような式を満たす関数を考えたい。以下の積分は、適当な x ∈ R で収束する。
∫
∞
Γ(x) =
e−t tx−1 dt.
(1)
0
収束の証明は面倒だが、かいつまんで言うと、被積分関数 e−t tx−1 の振る舞いが、原点の
近くでは tx−1 程度であり、+∞ の近くでは指数関数的に減少することから、x > 0 程度
の条件があれば収束する。正確な議論は解析学の教科書に載っていると思うので、参考に
してください。積分 (1) で定義される関数 Γ(x) を、ガンマ関数と呼ぶ。ガンマ関数は、
以下の関係式を満たす。
Γ(x + 1) = xΓ(x)
1
(2)
[証明] Γ(x + 1) の定義式で、部分積分をすると
∫
∞
−t x
e t dt =
[−e−t tx ]∞
0
∫
0
∞
=x
∫
+
∞
e−t xtx−1 dt
0
e−t tx−1 dt = xΓ(x)
0
となって、(Γ(x) が定義される場合には)Γ(x + 1) = xΓ(x) が示された。—–
ガンマ関数は、Γ(n + 1) = n! を満たす。何故ならば (2) を繰り返し用いることで
Γ(n + 1) が
Γ(n + 1) = nΓ(n) · · · = n(n − 1) · · · 1Γ(1) = n! · Γ(1)
を満たすことがわかる。ここで Γ(1) の値は
∫
∞
Γ(1) =
0
[
]∞
e−t dt = −e−t 0 = 1
であるので、結局 Γ(n + 1) = n! であることがわかる。念のため繰り返すが、ガンマ関数
は実数の区間 x > 0 で定義された関数である。積分表示を見る限り、特に x が自然数で
あることは必要ない。ガンマ関数のグラフを以下に示す。
ベータ関数を紹介する。ベータ関数は、以下のような積分で与えられる関数である。
∫
1
tx−1 (1 − t)y−1 dt.
B(x, y) =
0
2
この積分は、x > 0, y > 0 で収束する。ベータ関数は、ガンマ関数を用いて表示するこ
とができる。
∫
∞
Γ(x)Γ(y) =
∫
x−1 −t
e dt ·
t
0
∞
sy−1 e−s ds
0
である。この積分を多重積分と思い、変数を変換することを考える。変数 (t, s) を、
{
u=s+t
t
v = s+t
と変換する。t = uv, s = u(1 − v) となる。ここで、重積分の変数変換公式を用いる。
重積分
∫ ∫
f (x, y)dxdy
D
を考える。x, y の変数変換 Φ:
x = x(u, v), y = y(u, v)
が、適当な領域 E = {(u, v)} から積分領域 D への全単射で、(全) 微分可能であるとす
る。このとき、変換の ヤコビ行列
∂(x, y)
=
∂(u, v)
の行列式 (ヤコビアン)dΦ(u, v) =
∂x ∂y
∂u ∂v
∫ ∫
−
(
∂x
∂u
∂y
∂u
∂x ∂y
∂v ∂u
∂x
∂v
∂y
∂v
)
の絶対値 |dΦ| を用いて、
∫ ∫
f (x, y)dxdy =
D
f (x(u, v), y(u, v))|dΦ|dudv
(3)
E
と表される。
注 1.1
x
u
∂x
∂u
は、多変数関数 x(u, v) を (v を定数と思って)u について微分したものである。
を、x の u に関する偏微分という。
注 1.2 一変数の積分の変数変換公式は、x = x(t) と書くと
∫
∫
f (x)dx =
f (x(t))
であった。この公式の多変数版が、(3) である。
3
dx
(t)dt
dt
練習問題 1
1.
以下の二変数関数 f (x, y) の、x、y に関する偏微分
∂f
∂f
∂x 、 ∂y
をそれぞ
れ求めよ。
(1) f (x, y) = x3 y 2 , (2) f (x, y) = ex
2.
2
y
重積分の変数変換公式を用いて単位円板 ∆ = {(x, y) | x2 + y 2 ≤ 1} の面積を求め
たい。重積分
∫ ∫
1dxdy
x2 +y 2 ≤1
に、変数変換 x = r cos(θ)、y = r sin(θ) を施し、積分する。この変数変換のヤコ
ビ行列を求め、ヤコビアンを求めよ。また、積分を r と θ について、順をおって実
行することにより単位円板の面積を計算せよ。
解答 1 (1) 多変数関数の偏微分は、微分しない方の変数を定数と思って普通に微分するこ
とであった。関数 f (x, y) = x3 y 2 を x、y でそれぞれ偏微分すると以下のようになる。
∂f
(x, y) = 3x2 y 2
∂x
∂f
(x, y) = 2x3 y.
∂y
1. (2) 関数 f (x, y) = ex
2
y
も同様に偏微分すると、
2
2
∂f
∂
= ( x2 y)ex y = 2xyex y
∂x
∂x
2
2
∂f
∂
= ( x2 y)ex y = x2 e y .
∂y
∂y
2. 単位円板の面積を計算する。半径 1 の円の面積は π であるので、計算が正しければ π
と出るはずである。積分
∫ ∫
1dxdy
x2 +y 2 ≤1
に対し、変数変換 x = r cos(θ)、y = r sin(θ) を施す。ヤコビ行列は、x, y をそれぞれ r, θ
で偏微分したものを並べてできる行列なので、偏微分する。
∂x
∂r
= cos(θ),
∂x
∂θ
= −r sin(θ)
∂y
∂r
= sin(θ),
∂y
∂θ
= r cos(θ)
4
よってヤコビ行列 dΦ は
(
dΦ =
−r sin(θ)
r cos(θ)
cos(θ)
sin(θ)
)
となり、ヤコビアンを計算すると
|dΦ| = cos(θ) · r cos(θ) − (−r sin(θ)) · sin(θ) = r(cos2 (θ) + sin2 (θ)) = r
この、ヤコビアンの絶対値を用いて重積分の変数変換を計算するのであった。積分は
∫ ∫
∫
2π
{∫
1 · rdr dθ
1dxdy =
x2 +y 2 ≤1
}
1
∫
0
2π
[
=
∫
0
2π
=
0
0
1 2
r
2
]1
dθ
0
1
dθ = π
2
確かに、重積分を実行して、円の面積を計算することができた。
ベータ関数の話題に戻ろう。この場合、t = uv 、s = u(1 − v) なので、偏微分すると
∂t
∂u
∂s
∂u
= v,
= 1−v,
∂t
∂v
∂s
∂v
=u
= −u
であり、
dΦ = v · (−u) − u · (1 − v) = −u
となる。よってヤコビアンの絶対値は |dΦ| = u とわかる。何をやっているかと言うと、
元の積分領域 D = {(t, s) | t, s ≥ 0} に新しい座標を入れているのである。図で描くと以
下のようになる。
5
右肩下がりの直線が u = const で、右肩上がりの直線が v = const の直線である。この
座標系で元の積分を考えると、積分は
∫ ∫
t
x−1 −t y−1 −s
e s
e
∫
1
{∫
∞
dtds =
D
x−1 y−1 −t−s
t
0
∫
1
{∫
s
e
0
∞
=
x−1
(uv)
0
∫
1
{∫
(u(1 − v))
0
∞
=
x+y−1 −u
u
0
}
· udu dv
e
y−1 −u
e
}
· udu dv
}
du v x−1 (1 − v)y−1 dv
0
= Γ(x + y)B(x, y)
となる。つまり、ベータ関数の表式として
Γ(x)Γ(y)
Γ(x + y)
B(x, y) =
(2)
を得る。
ガウス積分は、以下の積分で定義される。
∫
∞
e−t dt
2
I=
−∞
この積分の値を、ガンマ関数、ベータ関数を用いて計算する。まず、被積分関数は偶関数
なので、I = 2
∫∞
0
e−t dt が成立する。さらに変数変換 s = t2 を取ると、dt =
2
ので、
∫
∞
I=2
0
1
1 e
−s
2s 2
∫
∞
ds =
0
1
1
s− 2 e−s ds = Γ( )
2
を得る。Γ(1/2) を、式 (2) を用いて計算しよう。
(
)
( )2
1
1 1
=B
,
Γ(1)
Γ
2
2 2
すでに Γ(1) = 1 と計算してある。ベータ関数の値を計算しよう。
1
B( ) =
2
∫
1
x− 2 (1 − x)− 2 dx
1
0
6
1
1
ds
2s1/2
な
変数変換 x = s2 を取ると、dx = 2sds であり、
∫
1
=
−1
s
0
1
√
2sds = 2
1 − s2
∫
1
1
√
ds
1 − s2
0
さらに、s = sin(θ) と取ることで、
∫
π
2
=2
0
1
· cos(θ)dθ = 2
cos(θ)
∫
π
2
1dθ = π
0
よって、ガンマ関数の値について
√
1
Γ( ) = π
2
が証明できた。ゆえにガウス積分は、
∫
∞
I=
e−t dt =
2
√
π
−∞
だとわかる。
2 指数分布、ガンマ分布、正規分布
数学的な補足 (蛇足) はこの程度にして、確率論に戻ろう。やりたいことは、連続の確
率変数の、代表的な例をあげることであった。
1. 指数分布
指数分布は、ある意味でポアソン分布の対になるような分布であり、幾何分布の極限と
も言える。幾何分布は、「表が出るまでコインを振り続けるゲームで、何度目のコイント
スで表がでるか」という確率変数の分布であった。一回ごとのコイントスで表の出る確率
を p としていた。設定をいじってみよう。一回のコイン投げに、微小な時間 δx だけ掛か
るとする。一回のコイン投げで表の出る確率を pδx とする。このとき、時刻 x までに表
が出る確率はいくらになるか。累積分布を考えると、
∑
[x/δx]
P ((表が出る時刻) ≤ x) =
n=1
7
(pδx)(1 − pδx)n−1
細かいことは気にせず、N =
1
δx
と置くと、区分求積法が使える。
xN
n−1
1 ∑
p
= p
{(1 − )N } N
N n=1
N
∫ x
∼p
e−px dx = 1 − e−px .
0
ここで ∼ は「大体」という意味だが、N → ∞ では収束する。このような累積分布関数
F (x) = 1 − e−px を持つ確率変数のことを、指数分布に従う確率変数 という。その確率密
度関数 f (x) は、
f (x) =
d
F (x) = pe−px
dx
となる。定義の形にすると
定義 2.1 確率密度関数 f (x) = pe−px を持つ確率変数 X を、指数分布 Ex(p) に従う確
率変数と呼ぶ。
幾何分布では、0 < p < 1 に限定されていたが、指数分布では p は 0 以上の実数であれば
よい。極限のスケール変換をすると、p が 1 以上になることもある。
期待値と分散を求めよう。期待値は
∫
∞
E(X) =
xf (x)dx
∫
0
=
∞
xpe
−xp
[
]∞
dx = −xe−xp 0 +
]∞
[0
1
1 −xp
=
= − e
p
p
0
∫
∞
e−xp dx
0
となる。ちなみにこの積分はガンマ関数を用いても直ちに計算できる。t = xp と置いて、
∫
∞
dt
1
1
= Γ(2) =
p
p
p
0
∫ 2
∫
分散の計算は、V (X) = x f (x)dx − ( xf (x)dx)2 であることを用いると計算できる。
∫∞
ここではガンマ関数を用いて 0 x2 f (x)dx を計算する。
∫ ∞
∫ ∞
1
1
2
2 −xp
x pe
dx = 2
t2 e−t dt = 2 · Γ(3) = 2
p 0
p
p
0
te−t ·
従って、分散 V (X) は
2
V (X) = 2 −
p
8
( )2
1
1
= 2
p
p
とわかる。ちなみにモーメント母関数 MX (t) は、以下のように計算できる。
∫
∞
MX (t) =
tx
−px
e pe
0
[
1 (t−p)x
dx =
e
t−p
]∞
0
1
.
=
p−t
当然、収束性を考えるとこの等式は t < p の範囲で成立する。
2. ガンマ分布
前項では幾何分布の極限として指数分布を得た。同様にしてガンマ分布は、負の二項分
布の極限として得ることができる。負の二項分布の確率分布は
n
n+x−1 Cx p (1
− p)x
であった。ここで、指数分布の場合と同様に、微小時間 δx の間に 1 回コイン投げをする
ことにして、p を pδx に置き換え、時刻 x までに n 回表がでる事象の累積分布を考えよ
う。N =
1
δx
と置く。
∑
[x/δx]
F (x) =
n
n+k−1 Ck (pδx) (1
− pδx)k
k=0
∑ (n + k − 1)(n + k − 2) · · · (k + 1) 1
p
(1 − )k
n
(n − 1)!
N
N
[xN ]
n
=p
k=0
∑ n+k−1 n+k−2
k
1
pn
k+1
p
(
=
·
)(
)···(
) · (1 − )N · N
N (n − 1)!
N
N
N
N
xN
k=0
k
この式で、 N
= t と置いて区分求積すると、 n+k−1
等は全て t と見做してもよいので、
N
pn
F (x) =
(n − 1)!
∫
x
tn−1 e−pt dt
0
と収束することがわかる。確率密度関数 f (x) =
pn
n−1 −px
e
(n−1)! x
(x > 0) を持つ確率変
数を、ガンマ分布 Ga(n, p) に従う確率変数と呼ぶ。一般には、n は自然数でなくても構
わない。正確には、
定義 2.2 正の実数 n、p を固定する。確率密度関数
pn n−1 −px
x
e
f (x) =
Γ(n)
をもつ確率変数 X を、ガンマ分布 Ga(n, p) に従う確率変数と呼ぶ。
9
ガンマ関数を用いると、limx→∞ F (x) = 1 がわかる。何となれば、t =
s
p
と置くことに
より
∫
∞
t
n−1 −pt
e
0
∫ ∞
1
dt = n
sn−1 e−s ds
p 0
1
= n Γ(n)
p
となる。確かにガンマ分布は、全体の確率が 1 となるので確率の要件を満たしている。さ
て、期待値と分散を求めよう。期待値 E(X) は
∫
∞
pn n−1 −px
x
e
dx
Γ(n)
0
pn Γ(n + 1)
=
Γ(n) pn+1
E(X) =
x·
となり、Γ(n + 1) = nΓ(n) が全ての実数 n > 0 について成立するので、E(X) =
り立つ。分散 V (X) の計算をしよう。例のごとくに
∫
∫
n
p
が成
x2 f (x)dx を計算する。
∞
pn n−1 −px
x
e
dx
x2 ·
Γ(n)
0
∫ ∞
pn
=
xn+1 e−px dx
Γ(n) 0
s = px と置いて
∫ ∞
1
Γ(n + 2)
= 2
sn+1 e−s ds = 2
p Γ(n) 0
p Γ(n)
n(n + 1)
=
.
p2
よって、分散 V (X) は
n
n(n + 1)
− ( )2
2
p
p
n
= 2
p
V (X) =
と計算できた。
練習問題 2
1. ガンマ分布 Ga(n, p) に従う確率変数 X の、モーメント母関数を求めよ。
また、求めたモーメント母関数の微分を計算することにより、X の期待値と分散を計算
せよ。
2. ガンマ分布 Ga(1, p) と Ga(2, p) の確率密度関数の凹凸を求め、概形を描け。
10
3. 正規分布
正規分布は色々な分布の和の極限として現れる (中心極限定理) が、今回は導出は行わ
ずに、天下り式に定義する。
定義 2.3 確率変数 X が確率密度関数
f (x) = √
(x−µ)2
1
e− 2σ2 (−∞ < x < ∞)
2πσ
(3)
をもつとき、X は期待値 µ、分散 σ 2 の正規分布 N (µ, σ 2 ) に従うという。
定義にある通り、期待値と分散はそれぞれ µ と σ である。実際に計算してみると
∫
∞
(x−µ)2
1
x· √
e− 2σ2 dx
2πσ
−∞
∫ ∞
∫ ∞
(x−µ)2
(x−µ)2
1
1
− 2σ2
√
=
(x − µ) √
e
dx + µ
e− 2σ2 dx
2πσ
2πσ
−∞
−∞
E(X) =
変数変換 s =
x−µ
√
2σ
を施す。
∫
∞
=
−∞
2√
s
√ e−s 2σds + µ
π
∫
∞
−∞
2√
1
√
e−s 2σds
2πσ
第一項は、被積分関数が奇関数であり、積分区間が対称なので積分は 0、第二項はガウス
積分になっているので、積分を実行すると E(X) = µ とわかる。分散の計算は面倒臭い。
テクニカルに計算する。関数 g(σ) を
∫
∞
g(σ) =
e−
(x−µ)2
2σ 2
−∞
dx =
√
2πσ
√
dg
と定める。当然、dσ
= 2π である。他方で g(σ) の積分表示式を σ について微分すると、
∫ ∞
(x−µ)2
d
e− 2σ2 dx
dσ −∞
∫ ∞
(x−µ)2
1
= 3
(x − µ)2 e− 2σ2 dx
σ −∞
√
∫∞
(x−µ)2
1
2 − 2σ2
これが 2π と一致する。一方で V (X) = √2πσ
dx であるので、
(x
−
µ)
e
−∞
∫ ∞
(x−µ)2
1
V (X) = √
(x − µ)2 e− 2σ2 dx
2πσ −∞
(
)
d
1
3
=√
σ
g(σ)
dσ
2πσ
√
1
=√
σ 3 2π = σ 2
2πσ
11
とわかる。
練習問題 3
1. 正規分布 N (µ, σ) に従う確率変数 X のモーメント母関数を求め、モーメ
ント母関数の微分を計算することにより期待値、分散を求めよ。
2. 正規分布 N (µ, σ) の確率密度関数の凹凸を求めよ。また、概形を描け。
以下、オマケ。
R 言語には、ガンマ関数やベータ関数の (近似的な) 値を求める関数が含まれている。
今回紹介した分布の密度関数を求める関数と合わせて紹介する。
gamma(x) : Γ(x) の値を返す関数
beta(x,y) : B(x, y) の値を返す関数
dexp(x,p) : Ex(p) の、x における確率密度関数を返す関数
dgamma(x,n,1/p) : Ga(n, p) の x における確率密度関数を返す関数(第三引数が 1/p と
なっていることに注意。定義の違いがある。)
dnorm(x,mu,sigma) : N (µ, σ) の x における確率密度関数を返す関数
12