第13回授業 (1/8)の学習目標 第5章平均値の差の検定の復習 を行う。 平均値の差の検定の実習をおこ なう。 平均値の差の検定の目的 心理学では、検査や実験により得られた得 点に、あらかじめ設定した2つの条件間で 差が見られるかどうかを検討することがよ くある。 例えば、ミラーリエル錯視実験の30度30 mm条件と30度45mm 条件の2条件間の錯 視量に差がみられるであろうか。 あるいは、30度30mmの条件での錯視量に、 男女差は見られるのであろうか。 平均値の差の検定のデータの一般形 例えば、ミラーリエル錯視のある条件下での男 子と女子の錯視量がそれぞれ Nx 人、Ny 人づつ 無作為に得られたとすると、2群の標本は、一 般的には、それぞれつぎのように書ける: x1 , x2 , , x N x (男子) y1 , y2 , , y N y (女子) 平均値の差の検定のデータの具体例 例えば、2群の標本の値が、それぞれ10名づ づで、つぎのようであったとする: 第1群(男子) 10、96、26、12、97、18、 96、57、15、54 第2群(女子) 10、76、61、15、40、17、 14、03、14、55 平均値の差の検定の大枠 平均値の差の検定の一連の手順はつぎのとお り: (1)最初に、両群の分散の等質性の検定を 行う。 (2)その結果、両群の分散が等しいと見な さ れる場 合は、(5.9) 式の t の値による平均値の差 の検定 を行う。 (3)もし、両群の分散が等しいとみなせな い場合は、 平均値の差の検定に先立つ 分散の等質性の検定ー1 平均値の差の検定に先立つ、分散の等質性の検定 を 行うには、テキスト p.26 の上部にあるように、 (1)2組の標本の平均を、それぞれ求める。 (2)2組の標本の分散を、それぞれ求める。 (3)一般には(5.4) 式により F-値を計算する。 (4)サンプル数が共に20の場合は、テキス ト p.24 の 下方の、F-検定の危険率に対応する棄却点 の値 と上の F-値を比較する。 両群のデータの平均の計算 第1群(男子)のデータの平均 x (10 96 26 54) / 10 48.1 第2群(女子)のデータの平均 y (10 76 61 55) / 10 30.5 両群のデータの分散の計算 第1群(男子)のデータの分散 s (10 96 54 ) / 10 (48.1) 1233.89 2 x 2 2 2 2 第2群(女子)のデータの分散 s (10 76 55 ) / 10 (30.5) 583.45 2 y 2 2 2 2 平均値の差の検定に先立つ 分散の等質性の検定ー2 ただし、実際のF-統計量の計算には、数表を用 いる場合、通常の F-分布表の特徴から、(5.4) 式ではなく (5.5) 式を用いる、すなわち s N1 ( N 2 1) F s N 2 ( N1 1) 2 1 2 2 (3)平均値の差の検定に先立つ 分散の等質性の検定ー3 しかし、F は両群のサンプル数 N1 及び N2 が等 しい時には、テキスト p.22 の (5.6) 式、すなわ ち、 2 1 2 2 s F (5.6) s となり、両群のサンプルでの標本分散の比の形に 書ける。そこで、(5.6)式で計算すればよい。 平均値の差の検定に先立つ 分散の等質性の検定ー4 ここで、この式の分子の分散と分母の分散は、 順に 2 2 s1 , s2 , であるが、前者は、2群の標本での不偏分散の 大きい方に対応する分散でないといけないので 、注意が必要である。ただし、2群のサンプル数 が等しい場合は、単純に分散の大きい方を分子 に、小さい方を分母に取ればよい。 F 統計量の計算 そこで、上記2群の分散の大きい方を 分子にすると、 1233 .89 F 2.11 583 .45 平均値の差の検定に先立つ 分散の等質性の検定ー5 つぎに、分散の等質性の検定を行い、つぎ に平均の差の検定を行う場合、両検定の全 体的危険率の考慮が必要である。 とりわけ、両母集団の分散が等しい場合に は、分散の等質性の検定統計量 F と、平均 値の差の通常の検定統計量 t とは、互いに 独立であることが知られている(Hogg, 1961)。 この独立性が成り立つ場合には、両検定の 全体的危険率は、個々の危険率を α とする と、ほぼ2倍にインフレする。 平均値の差の検定に先立つ 分散の等質性の検定ー6 これを避けるには、個々の検定の危険率 α は、全体の危険率を α* として、 1 1 , * にすればよい。これを実現するには、 (1)α* =0.05 ならば、αはおよそ 0.025 に、 (2)α*=0.01 ならば、 αはおよそ 0.005 に、 それぞれ取ればよい。 平均値の差の検定に先立つ 分散の等質性の検定ー7 両群の標本数が共に10の場合、標本での F-値 が、つぎの棄却点の値(いずれか一方) 0.05 F (0.025/ 2) 4.5552, * 9 9 0.01 F (0.005/ 2) 6.9875 * 9 9 未満ならば、等分散仮説を採択する。この場合、 分散は等しいとみなされる。 平均値の差の検定に先立つ 分散の等質性の検定ー8 それに対して、標本での F-値が、演習時に指定 された危険率に対応する棄却点の値(いずれか一 方) 0.05 F (0.025/ 2) 4.5552, * 9 9 * 0.01 F (0.005/ 2) 6.9875 9 9 以上ならば、等分散仮説を棄却する。この場 合、分散は異なるとみなされる。 具体的な分散の等質性の検定 そこで、既に計算した標本での F 統計量と 5%水準での棄却点の値を比較すると、 F 2.11 F9 (0.025/ 2) 4.5552 9 このことは、等分散仮説は5%水準で採 択されることを意味する。 等分散性採択の場合の 平均値の差の検定ー1 (1)両群での分散が等しいとみなされる場合 テキスト pp.22-23 の t-統計量と対応する以下 に示した自由度を計算する。 すなわち、 t X Y N x S x2 N y S y2 ここで、自由度は、 N x N y 2. N x N y ( N x N y 2) Nx Ny , 当該標本での具体的な 平均値の差の検定結果 当該標本では、等分散仮説が採択され たので、その場合の t 統計量を計算す ると、 48.1 30.5 1010 (10 10 2) t , 10 10 101233.89 10 583.45 1.24, また、 10 10 2 18. 等分散性採択の場合の 平均値の差の検定ー2 t-統計量を計算し自由度を計算したら、標本 で の t の値が、演習時に指定された危険率に対 応するつぎの棄却点の値(いずれか一方) * 0.05 t18 (0.025/ 2) 2.4450, 0.01 t18 (0.005/ 2) 3.1966 * 未満ならば、等平均仮説を採択する。この 場合、両群の平均値は等しいとみなされる。 等分散性採択の場合の 平均値の差の検定ー3 一方、標本での t の値が、授業中に指定された危 険 率に対応するつぎの棄却点の値(いずれか一方) 0.05 t18 (0.025/ 2) 2.4450, * 0.01 t18 (0.005/ 2) 3.1966 * 以上ならば、等平均仮説を棄却する。この 場合、両群の平均値に差があることを意味す る。 等分散性採択の場合の 具体例での平均値の差の検定 上記標本での t 統計量の値と5%水準 での棄却点の値を比較すると、 t 1.24 t18 (0.025/ 2) 2.4450, となり、等平均仮説は5%水準で採択され ることを意味する。 等分散性棄却の場合の 平均値の差の検定ー1 (2)両群の分散が異なるとみなされる場合 テキスト p.20 に書いたように、べーレン ス・フィッシャー問題と呼ばれており、そのよう な場合に平均値の差の検定を行うこと自体に無理 があると言う研究者もいる。 また、この場合、F-統計量と t’-統計量は互いに独 立ではないので、2つの検定を続けて行う場合の 全体としての危険率の計算は困難であり、ここで は危険率のコントロールは行わず、通常の F 分布 表の制約から次善の策として、t’ 検定の危険率は α で行うこととする。 等分散性棄却の場合の 平均値の差の検定ー2 両群での分散が異なるとみなされる場合は、テ キスト pp.22-23 の t-統計量と対応する自由度を 計算する。すなわち、 t' X Y , Wx Wy (5.9) ここで、 Uy S y2 Ux S x2 Wx , Wy . Nx N x 1 Ny N y 1 等分散性棄却の場合の 具体的な平均値の差の検定 当該標本の場合、等分散仮説は採択されたので、 ここでの計算は不要であるが、棄却されるよう なデータであれば、うえの W は、つぎのように 計算する: 2 Sx 1233.89 Wx 137.10, N x 1 10 1 S y2 583.45 Wy 64.83 N y 1 10 1 等分散性棄却の場合の 平均値の差の検定ー3 つぎに、この場合の t’-分布の自由度は、テキスト p.23 の下方にいろいろな方法が紹介してあるが、 その中で、SAS が標準として用いているところの (b) Satterthwaite (1946) の方法による自由 度を計算すること、すなわち: (Wx Wy ) 2 Wx2 W N x 1 N y 1 2 y . (5.12) 等分散性棄却の場合の 具体的な自由度の計算 当該標本の場合、等分散仮説は採択された ので、ここでの計算は不要であるが、棄却 されるようなデータであれば、うえの 自 由度 は、つぎのように計算する: (137.10 64.83) 15.956 16 2 2 137.10 64.83 10 1 10 1 2 等分散性棄却の場合の 平均値の差の検定ー4 t’-統計量を計算し、自由度を計算したら、最後 に岩原の副読本の p.434 を開き、 (1)授業中に指定された危険率 α と (2) (5.12) 式で計算した自由度に対応す る棄却点の値を読み取る。 標本での t’-値がこの棄却点の値未満ならば、等 平均仮説を採択する。この場合、平均値の差が ないことを意味する。 等分散性棄却の場合の 平均値の差の検定ー5 それに対して、標本での t’-値がこの棄却点の 値以上ならば、等平均仮説を棄却する。この 場合、両群の平均値に差があることを意味す る。 (5)平均値の差の検定の再実習 岩原テキスト末尾の乱数表から、各自のデータ を抽出し、平均値の差の検定をおこなってみよ う。 今日は、標本数は各群とも10とし、各自の学 籍に対応する岩原テキストの乱数の位置から数 えて6つ下から始まるデータを用いよ。 第1群の10個は p.445から、第2群の10 個はp.446の同位置から取り出すこと。 検定の全体的危険率 α* は、0.05とせよ。
© Copyright 2024 ExpyDoc