補足プリント18:平均の差の検定(母集団の分散が異なる場合)

補足プリント 18:平均の差の検定(母集団の分散が異なる場合)
松井宗也 南山大学経営学部
平成 27 年 10 月 29 日
母分散が等しくないとき平均の差の検定には工夫が必要である。今回は「統計学入門(基礎統計
学)」東京大学教養部統計学教室 編、東京大学出版会を参考にその方法を説明する。方法自体は簡
単である。
1
平均の差の検定
2つの母集団 X ∼ N (µx , σx2 ) と Y ∼ N (µy , σy2 ) から,標本サイズが nx と ny の標本 (X1 , X2 , . . . , Xnx )
と (Y1 , Y2 , . . . , Yny ) を得たとする。このとき平均の差の検定
H0 : µx − µy = 0,
, H1 : µx − µy ̸= 0
を行う。分散の不偏推定量である不偏標本分散
x
1 ∑
=
(Xi − X)2 ,
nx − 1
1 ∑
=
(Yj − Y )2
ny − 1
ny
n
Sx2
Sy2
i=1
j=1
を用いる。母集団の分散が等しくない場合は、等しい場合と同様の考え方(教科書 8.2 節)をする。
つまり X − Y ∼ N (µx − µy , σx2 /nx + σy2 /ny ) だから、標準化するときは母平均と母分散を用いいれ
ば良いが、2つの母分散は未知なので標本分散を使うというもの。平均の差は帰無仮説で 0 が正しい
とおくので推定する必要はない。すると検定統計量
X −Y
T =√ 2
Sy2
Sx
nx + ny
を考えればよいが、この統計量は母集団の未知の分散比 σx2 /σy2 の影響を受ける。つまり統計量の分布
がある一定の分布に従うのではなく、未知のパラメータの影響を受ける。この問題をベーレンスフィッ
シャー問題 (Behrens-Fisher’s problem) という。
ここではウェルチの検定という近似解を用いる方法を紹介する。それは検定統計量 T の分布は、自
由度が
(Sx2 /nx + Sy2 /ny )2
nw = 2
(Sy2 /ny )2
(Sx /nx )2
nx −1 + ny −1
にもっtも近い整数 n∗w の t 分布に従うとして検定を行うものである。
1