第3日目第1時限の学習目標 平均値の差の検定について学ぶ(続き)。 (1)平均値の差の検定における帰無仮説の採 択・ 棄却の意味を知る。 (2)統計量 t の分布の形の違いと母分散の違 い の関係 (3)分散の等質性の検定のための統計量 F (4)2種類の検定を逐次的に行う時の危険率 (5)平均値の差の検定に先立つ分散の検定 平均値の差の検定(18) 帰無仮説の採択とは(1) 一方、帰無仮説のもとでは、標本か ら計算される上記の t の値が上の図 の下限値から上限値の範囲に入る可 能性は 1-αである。 通常、ここでの α は 0.05 か 0.01 な ので、1-α の値は、通常 0.95 か 0.99 である。 平均値の差の検定(19) 帰無仮説の採択とは(2) そこで、帰無仮説のもとで、標本 から計算された t-値が下限値から 上限値の範囲の値を取ったならば、 われわれは帰無仮説のもとでは起 こりえそうなことが起こったとし て、帰無仮説を受け入れる。統計 では、帰無仮説を採択するという。 平均値の差の検定(20) 帰無仮説の採択とは(3) 平均値の差の検定で、帰無仮説を 採択することは、両条件の平均値 に差がないことを意味する。 なぜならば、この場合の帰無仮説 は先ほど示したように、 H 0 : x=y であるから。 平均値の差の検定(21) t-分布の自由度(1) 一般に t-分布の形を決めるパラ メータは、自由度と呼ばれる量で 表される。 ただし、平均の区間推定のところ での t-分布の自由度νはサンプル 数 N に対して、 ν=N-1 であった。 平均値の差の検定(22) t-分布の自由度(2) これに対して、平均値の差の検定に おける t-分布の形は、区間推定の時 のそれとは異なる。その値は、つぎ に述べる、ある条件の違いにより、 N x N y 2 となったり、 平均値の差の検定(23) t-分布の自由度(3) (Wx Wy ) 2 W /( N x 1) W ( N y 1) 2 x 2 y となったりするので、注意せよ。 平均値の差の検定(24) 自由度の違いの規定因 実は、両者の違いは、2つの母分散の分散(母分 散)が等しいかどうかに依存することが分かって いる。 つまり、 2群の母集団が正規分布に従うとみなさ れる時、われわれは平均値の差の検定に先立ち、 2つの母集団の分布の分散が等しいかどうかの検 定を行わないといけないのである。 分散の等質性の帰無仮説は、それぞれの母分散を σx2 及び σy2 として、 2 2 H0 : x y 平均値の差の検定(25) 母分散の等質性の検定(1) この検定は、母分散の等質性の検定と 呼ばれ、つぎに示すF は F-分布に従う ことが知られている。 X群の標本分散 X群の標本数 2 U x s x N x ( N y 1) F 2 U y s y N y ( N x 1) Y群の標本分散 Y群の標本数 平均値の差の検定(26) F-分布の自由度 F-分布の形は、t-分布と異なり2つの 自由度により決まる。上式の F-分布 の自由度は、2群の標本のサンプル数 をそれぞれ Nx, Ny とすると、 x N x 1, y N y 1 平均値の差の検定(27) F-分布の標準的な形状 F-分布の標準的な形状は、つぎのとおりであ る: F-分布 α/2 α/2 上側α/2%点 F1 2 2 平均値の差の検定(28) F-統計量の実際の計算方法(1) 実際のF-統計量の計算には、数表を用いる場合、 うえの式ではなく、次式を用いる、すなわち s N1 ( N 2 1) F s N 2 ( N1 1) 2 1 2 2 平均値の差の検定(29) F-統計量の実際の計算方法(2) この式の分子の分散と分母の分散は、順に s , s , 2 1 2 2 であるが、前者は、2群の標本での分散のうち、 その不偏分散が大きい方でないといけないので、 注意が必要である。 平均値の差の検定(30) F-統計量の実際の計算方法(3) うえの F は、両群のサンプル数 N1 及 び N2 が等しい時、さらに簡略化でき、 2 1 2 2 s F s となり、前者(分子)は、両群のサンプル での標本分散のうち大きい方でよい。 平均値の差の検定(31) 一連の検定の危険率(1) 平均値の差の検定では、多くの場合分散の 等質性の有無が不明であるので、平均値の 差の検定に先立ち、分散の等質性の検定を 行う必要がある。 この時、両母集団の分散が等しい場合には 、分散の等質性の検定統計量 F と、平均値 の差の通常の検定統計量 t とは、互いに独 立であることが知られている(Hogg, 1961) 、 平均値の差の検定(32) 一連の検定の危険率(2) この時、両検定をそれぞれ危険率 α で行うと、全体的な危険率 α* は、 1 (1 ) , * となる。 2 平均値の差の検定(33) 一連の検定の危険率(3) 例えば、それぞれの検定の危険率を 0.01 とすると、 * 1 (1 ) 2 , 1 (1 0.01) 0.0199 2 0.02 となり、危険率のインフレをまねく。 平均値の差の検定(34) 一連の検定の危険率(4) これを避けるには、個々の検定の危険率 α は、全体の危険率を α* として、 1 1 , * にすればよい。これを実現するには、全体 の危険率α* =0.05 ならば、個々の危険率を およそ 0.025 に、α*=0.01 ならば、個々の 危険率をおよそ 0.005 に取ればよい。 平均値の差の検定(35) 分散の等質性の検定の手順(1) もし諸君の標本での F-値が、例えば2群の標本 数が共に10の場合、棄却点の値 0.05 F (0.025/ 2) 4.5552, * 9 9 ( * 0.01 F9 (0.005/ 2) 6.9875) 9 未満ならば、等分散仮説を採択する。こ の場合、分散は等しいとみなされる。 平均値の差の検定(36) 分散の等質性の検定の手順(2) それに対して、もし諸君の標本での F-値が、演 習時に指定された危険率に対応する棄却点の値 0.05 F (0.025/ 2) 4.5552, * 9 9 ( 0.01 F9 (0.005/ 2) 6.9875) * 9 以上ならば、等分散仮説を棄却する。こ の場合、分散は異なるとみなされる。
© Copyright 2025 ExpyDoc