カイ2乗分布

χ2 分布
確率変数 u が標準正規分布 N (0, 1) に従うとき、x = u2 の従う分布を T1 (x) と書くことにしよ
2
1
う。これは、標準正規分布の確率密度関数 f (u) = √ e−u /2 を用いて表すと、
2π
δ(u2 − x)f (u) du
T1 (x) =
(1)
となる。ところでデルタ関数の基本的な関係式によれば、
√
√
1
δ(u2 − x) = √ δ(u − x) + δ(u + x)
2 x
√
となる。これは、x の値が与えられた場合に、対応する u の値は、u = ± x の 2 通りがあること
を意味している。上記の関係式を (1) 式に代入すると、
T1 (x)
√
√
1
√ f ( x) + f (− x)
2 x
1
√ x−1/2 e−x/2 (x > 0)
2π
=
=
(2)
となる。
次に、x = u21 + u22 = x1 + x2 の従う分布 T2 (x) を求める。
T2 (x) =
δ(x1 + x2 − x)T1 (x1 )T1 (x2 ) dx1 dx2
x
=
0
T1 (x − x2 )T1 (x2 ) dx2
1 −x/2
e
2π
=
x
0
−1/2
(x − x2 )−1/2 x2
dx2
ここで、t = x2 /x とおくと、
T2 (x) =
1 −x/2
e
2π
1
0
(1 − t)−1/2 t−1/2 dt
となるが、最後の積分は、t = sin2 θ とおくと、
1
0
(1 − t)−1/2 t−1/2 dt = 2
となるので、結局、
T2 (x) =
1 −x/2
e
2
π/2
0
dθ = π
(x > 0)
(3)
を得る。
一般に、n コの変数 u1 , u2 , · · · , un が互いに独立で、それぞれ N (0, 1) に従うとき、x = u21 + u22 + · · · + u2n
の分布 Tn (x) は、
Tn (x) =
n
2 −1
1
x
2Γ(n/2) 2
x
e− 2
となる。この分布を自由度 n のカイ 2 乗 (χ2 ) 分布という。
1
(x > 0)
(4)
証明
証明は数学的帰納法による。すなわち、xn−1 = u21 + u22 + · · · + u2n−1 の分布が Tn−1 (x) と表され
たとすると、Tn (x) は、
Tn (x) =
δ(xn−1 + x1 − x)Tn−1 (xn−1 )T1 (x1 ) dxn−1 dx1
x
=
=
=
=
0
Tn−1 (x − x1 )T1 (x1 ) dx1
1
n−3
1
x 2 −1 e− 2
(1 − t) 2 t− 2 dt
2 Γ((n − 1)/2)Γ(1/2) 0
n
x
x 2 −1 e− 2
Γ((n − 1)/2)Γ(1/2)
n
Γ(n/2)
2 2 Γ((n − 1)/2)Γ(1/2)
x n2 −1 − x2
1
e
2Γ(n/2) 2
n
x
n
2
となる。これは、(4) に一致する。
χ2 分布の平均と分散
平均
=
=
=
分散
=
=
=
∞
∞
∞
1
x n2 −1 − x
x
e 2 dx
2Γ(n/2) 0
2
0
∞
∞
2
2
n
x n2 − x
x
=
e 2 d
t( 2 +1)−1 e−t dt
Γ(n/2) 0
2
2
Γ(n/2) 0
2(n/2)Γ(n/2)
2Γ(n/2 + 1)
=
=n
Γ(n/2)
Γ(n/2)
xTn (x) dx =
∞
x n2 −1 − x2
1
x2
e
dx − n2
2Γ(n/2) 0
2
0
∞
∞
n
4
4
x n2 +1 − x2
x
− n2 =
e
d
t( 2 +2)−1 e−t dt − n2
Γ(n/2) 0
2
2
Γ(n/2) 0
4Γ(n/2 + 2)
n
n
− n2 = 4
+1
− n2 = 2n
Γ(n/2)
2
2
x2 Tn (x) dx − n2 =
標本分散の標本分布
確率変数 u1 , u2 が互いに独立で、それぞれ標準正規分布 N (0, 1) に従うときに、標本平均
u
¯=
1
(u1 + u2 )
2
(5)
をもちいて、
x = (u1 − u¯)2 + (u2 − u
¯)2
(6)
を作る。ここで、x の従う分布を求めたい。ところが、(u1 − u
¯)2 と (u2 − u
¯)2 は、条件 (5) がある
ために、互いに独立ではない。したがって、x の従う分布は自由度 2 の χ2 分布とはならない。(5)
を (6) に代入して整理すると、
x=
1
(u1 − u2 )2
2
2
√
となる。ここで、t = (u1 − u2 )/ 2 と書くことにすると、変数 t は、正規分布の一次結合の平均と
分散の関係式から、
平均 µt
=
分散 σt2
=
1
1
√ ×0− √ ×0=0
2
2
1
√
2
×1+
1
−√
2
×1=1
となり、平均 0、分散 1 の正規分布に従うことがわかる。そこで、t を 2 乗した x = 12 (u1 − u2 )2
は、自由度1の χ2 分布に従うことがわかる。
もう少し別の見方をしてみよう。新しい変数
v1 = u1 − u
¯,
v2 = u2 − u
¯
を導入すると、
x = v12 + v22
となる。ところが、
v1
v2
v1 + v2 = (1, 1)
=0
の関係がある。これは、ベクトル (v1 , v2 ) の (1, 1) 方向成分が 0 であることを表している。そこ
で、v1 、v2 を直交変換した、
v1
v2
=
√1
2
√1
2
− √12
v1
√1
2
v2
を用いると、
x = v12 + v22
√
となる。ここで、v2 = (v1 + v2 )/ 2 = 0 なので、
v1 − v2
√
2
x = v12 =
2
=
(u1 − u2 )2
2
を得る。変数 v1 は標準正規分布に従うので、変数 x は自由度 1 の χ2 分布に従う。
この方法は、もっと一般の場合にも使えそうである。今度は、三つの互いに独立な変数 u1 , u2 , u3
の標本平均
u
¯=
1
(u1 + u2 + u3 ) 3
(7)
をもちいて表される分散
x = (u1 − u
¯)2 + (u2 − u
¯)2 + (u3 − u
¯)2
の従う分布関数を求めてみよう。
ここで、
v1 = u1 − u
¯,
v2 = u2 − u¯,
とおくと、(8) 式は、
x = v12 + v22 + v32
となり、 条件 (7) は、
v1 + v2 + v3 = 0
3
v3 = u3 − u
¯
(8)
√
√
√
と書き直すことができる。そこで、(v1 , v2 , v3 ) 空間で、基底ベクトル (0, 0, 1) が (1/ 3, 1/ 3, 1/ 3)
となるような直交変換、例えば、
⎛ ⎞ ⎛ 1
√
v1
⎜ ⎟ ⎜ √12
⎝ v2 ⎠ = ⎝ 6
√1
v3
3
− √12
√1
6
√1
3
⎞
v1
⎟⎜ ⎟
− √26 ⎠ ⎝ v2 ⎠
0
⎞⎛
√1
3
v3
を考える。すると、
x = v12 + v22 + v32
√
となるが、v3 = (v1 + v2 + v3 )/ 3 = 0 なので、
x = v12 + v22 =
(u1 + u2 − 2u3 )2
(u1 − u2 )2
+
2
6
である。ゆえに、x は自由度 2 の χ2 分布にしたがう。
同様にして、一般の n の場合にも証明できる。標本平均
u
¯=
1
(u1 + u2 + · · · + un )
n
から
v1 = u1 − u
¯, v2 = u2 − u
¯, · · · , vk = uk − u¯, · · · , vn = un − u
¯
をつくると、これらの間には、
v1 + v2 + v3 + · · · + vn = 0
なる関係がある。ここで、
x = v12 + v22 + · · · + vn2
√
√
√
とおく。n 次元 (v1 , v2 , · · · , vn ) 空間で、基底ベクトル (0, 0, · · · , 1) が、(1/ n, 1/ n, · · · , 1/ n) と
なるような直交変換
⎛
v1
v2
..
.
⎞
⎛
√1
2
√1
6
⎜
⎟ ⎜
⎜
⎟ ⎜
⎜
⎟ ⎜
..
⎜
⎟=⎜
.
⎜
⎟ ⎜
⎜
⎟ ⎜
⎜
1
⎝ vn−1 ⎠ ⎝ √
vn
n(n−1)
√1
n
− √12
√1
6
..
.
1
n(n−1)
√1
n
√
0
− √26
..
.
1
√
n(n−1)
√1
n
···
···
..
.
···
···
0
⎞⎛
v1
v2
..
.
⎞
⎟⎜
⎟
⎟⎜
⎟
⎟⎜
⎟
⎟⎜
⎟
⎟⎜
⎟
⎟⎜
⎟
⎝
⎠
v
− √ n−1 ⎟
n−1
⎠
n(n−1)
vn
√1
0
..
.
n
をおこなうと、vn = 0 なので、
x
2
= v12 + v22 + · · · + vn−1
=
(u1 + u2 − 2u3 )2
(u1 + u2 + · · · + un−1 − (n − 1)un )2
(u1 − u2 )2
+
+ ··· +
2
6
n(n − 1)
を得る。
以上のことから、N (0, 1) に従う正規母集団から大きさ n の標本 u1 , u2 , · · · , un を無作為抽出
1
¯ = (u1 + u2 + · · · + un ) から、
し、標本平均 u
n
x = (u1 − u
¯)2 + (u2 − u
¯)2 + · · · + (un − u
¯)2
を作ると、 x は自由度 n − 1 の χ2 分布に従うことが分かる。
4
N (µ, σ 2 ) に従う正規母集団から大きさ n の標本 x1 , x2 , · · · , xn を無作為抽出し、標本平均
1
x
¯ = (x1 + x2 + · · · + xn ) を作る。標本 xi に標準化変換 ui = (xi − µ)/σ をほどこすと、
n
u
¯
=
=
=
1
(u1 + u2 + · · · + un )
n
1
(x1 + x2 + · · · + xn − nµ)
nσ
1
(¯
x − µ)
σ
だから
x
=
=
=
(u1 − u
¯)2 + (u2 − u¯)2 + · · · + (un − u
¯)2
1
(x1 − x
¯)2 + (x2 − x
¯)2 + · · · + (xn − x
¯) 2
σ2
(n − 1)s2
σ2
は、自由度 n − 1 の χ2 分布に従う。
x の期待値 E(x) と分散 V (x) は、それぞれ、
E(x) =
n−1
V (x)
2(n − 1)
=
である。
図 (1) に χ2 分布の様子を示す。
0.5
T1(x)
T2(x)
T3(x)
T4(x)
T5(x)
0.4
0.3
0.2
0.1
0
0
2
4
6
図 1: χ2 分布
5
8
10