第2日目第4時限の学習目標

第3日目第1時限の学習目標
 平均値の差の検定について学ぶ(続き)。
(1)平均値の差の検定における帰無仮説の採
択・
棄却の意味を知る。
(2)統計量 t の分布の形の違いと母分散の違
い
の関係
(3)分散の等質性の検定のための統計量 F
(4)2種類の検定を逐次的に行う時の危険率
(5)平均値の差の検定に先立つ分散の検定
平均値の差の検定(18)
帰無仮説の採択とは(1)
 一方、帰無仮説のもとでは、標本か
ら計算される上記の t の値が上の図
の下限値から上限値の範囲に入る可
能性は 1-αである。
 通常、ここでの α は 0.05 か 0.01 な
ので、1-α の値は、通常 0.95 か 0.99
である。
平均値の差の検定(19)
帰無仮説の採択とは(2)
 そこで、帰無仮説のもとで、標本
から計算された t-値が下限値から
上限値の範囲の値を取ったならば、
われわれは帰無仮説のもとでは起
こりえそうなことが起こったとし
て、帰無仮説を受け入れる。統計
では、帰無仮説を採択するという。
平均値の差の検定(20)
帰無仮説の採択とは(3)
 平均値の差の検定で、帰無仮説を
採択することは、両条件の平均値
に差がないことを意味する。
 なぜならば、この場合の帰無仮説
は先ほど示したように、
H 0 :  x=y
であるから。
平均値の差の検定(21)
t-分布の自由度(1)
 一般に t-分布の形を決めるパラ
メータは、自由度と呼ばれる量で
表される。
 ただし、平均の区間推定のところ
での t-分布の自由度νはサンプル
数 N に対して、 ν=N-1 であった。
平均値の差の検定(22)
t-分布の自由度(2)
 これに対して、平均値の差の検定に
おける t-分布の形は、区間推定の時
のそれとは異なる。その値は、つぎ
に述べる、ある条件の違いにより、
  N x  N y  2 となったり、
平均値の差の検定(23)
t-分布の自由度(3)

(Wx  Wy )
2
W /( N x  1)  W ( N y  1)
2
x
2
y
となったりするので、注意せよ。
平均値の差の検定(24)
自由度の違いの規定因
 実は、両者の違いは、2つの母分散の分散(母分
散)が等しいかどうかに依存することが分かって
いる。
 つまり、 2群の母集団が正規分布に従うとみなさ
れる時、われわれは平均値の差の検定に先立ち、
2つの母集団の分布の分散が等しいかどうかの検
定を行わないといけないのである。
 分散の等質性の帰無仮説は、それぞれの母分散を
σx2 及び σy2 として、 2
2
H0 :  x   y
平均値の差の検定(25)
母分散の等質性の検定(1)
 この検定は、母分散の等質性の検定と
呼ばれ、つぎに示すF は F-分布に従う
ことが知られている。
X群の標本分散
X群の標本数
2
U x s x N x ( N y  1)
F
 2
U y s y N y ( N x  1)
Y群の標本分散
Y群の標本数
平均値の差の検定(26)
F-分布の自由度
 F-分布の形は、t-分布と異なり2つの
自由度により決まる。上式の F-分布
の自由度は、2群の標本のサンプル数
をそれぞれ Nx, Ny とすると、
 x  N x 1,  y  N y 1
平均値の差の検定(27)
F-分布の標準的な形状
 F-分布の標準的な形状は、つぎのとおりであ
る:
F-分布
α/2
α/2
上側α/2%点
 
F1  
2
2
平均値の差の検定(28)
F-統計量の実際の計算方法(1)
 実際のF-統計量の計算には、数表を用いる場合、
うえの式ではなく、次式を用いる、すなわち
s N1 ( N 2  1)
F
s N 2 ( N1  1)
2
1
2
2
平均値の差の検定(29)
F-統計量の実際の計算方法(2)
 この式の分子の分散と分母の分散は、順に
s , s ,
2
1
2
2
であるが、前者は、2群の標本での分散のうち、
その不偏分散が大きい方でないといけないので、
注意が必要である。
平均値の差の検定(30)
F-統計量の実際の計算方法(3)
 うえの F は、両群のサンプル数 N1 及
び N2 が等しい時、さらに簡略化でき、
2
1
2
2
s
F s
となり、前者(分子)は、両群のサンプル
での標本分散のうち大きい方でよい。
平均値の差の検定(31)
一連の検定の危険率(1)
 平均値の差の検定では、多くの場合分散の
等質性の有無が不明であるので、平均値の
差の検定に先立ち、分散の等質性の検定を
行う必要がある。
 この時、両母集団の分散が等しい場合には
、分散の等質性の検定統計量 F と、平均値
の差の通常の検定統計量 t とは、互いに独
立であることが知られている(Hogg, 1961)
、
平均値の差の検定(32)
一連の検定の危険率(2)
 この時、両検定をそれぞれ危険率 α
で行うと、全体的な危険率 α* は、
  1  (1   ) ,
*
となる。
2
平均値の差の検定(33)
一連の検定の危険率(3)
例えば、それぞれの検定の危険率を 0.01
とすると、
 *  1  (1   ) 2 ,
 1  (1  0.01)  0.0199
2
 0.02
となり、危険率のインフレをまねく。
平均値の差の検定(34)
一連の検定の危険率(4)
これを避けるには、個々の検定の危険率 α
は、全体の危険率を α* として、
  1 1 ,
*
にすればよい。これを実現するには、全体
の危険率α* =0.05 ならば、個々の危険率を
およそ 0.025 に、α*=0.01 ならば、個々の
危険率をおよそ 0.005 に取ればよい。
平均値の差の検定(35)
分散の等質性の検定の手順(1)
 もし諸君の標本での F-値が、例えば2群の標本
数が共に10の場合、棄却点の値
  0.05  F (0.025/ 2)  4.5552,
*
9
9
( *  0.01 F9 (0.005/ 2)  6.9875)
9
未満ならば、等分散仮説を採択する。こ
の場合、分散は等しいとみなされる。
平均値の差の検定(36)
分散の等質性の検定の手順(2)
 それに対して、もし諸君の標本での F-値が、演
習時に指定された危険率に対応する棄却点の値
  0.05  F (0.025/ 2)  4.5552,
*
9
9
(  0.01 F9 (0.005/ 2)  6.9875)
*
9
以上ならば、等分散仮説を棄却する。こ
の場合、分散は異なるとみなされる。