心理統計学 II 第9回 (11/27) 授業の目標 先週紹介した2×3分割表のデータ例をもとに、一般の r×s 分割表の場合のカイ二乗統計量及び期待度数の概念を理 解する。 一般の分割表の特殊形としての2×2分割表の場合のカイ 二乗統計量の形を知る。 2×2分割表の場合のカイ二乗検定の手順を理解する。 具体例による、 2×2分割表の場合のカイ二乗検定の手順 のまとめ 岩原テキストの乱数表からの分割表の作成方法 具体例での期待度数 の計算例1(復習) 同検定では、期待度数 という重要な概念があ る(テキスト、p.33)。 例えば、右表の第2行 第1列すなわち(2、1) セルの実度数 3 に対 する期待度数は、 137 30 7.996 514 もっと 厳しく 男 27 女 3 計 30 と計算した。 適当 厳しす ぎた 275 75 124 10 399 85 計 377 137 514 具体例での期待度数 の計算例1(復習)(続き) このことは、第2行第1 列の期待度数を次のよ うに計算することを意 味する: 第2行の 合計 第1列の 合計 137 30 7.996 514 総合計 もっと 厳しく 男 27 女 3 計 30 適当 厳しす ぎた 275 75 124 10 399 85 計 377 137 514 各セルの度数を一般的な記号で 表した場合の期待度数の計算例1 つぎに、上記の(2,1) セルの実度数 3 に対し て、これを一般的に表 すと第2行第1列なの で、f21 と書くと、 右表の実度数 f21 に対 する期待度数 g21は、 f 2 f 1 g 21 N もっと 厳しく 男 女 計 f11 f21 f•1 と計算される。 適 当 f12 f22 f•2 厳しす ぎた 計 f13 f23 f•3 f1• f2• N 一般的な記号で表した場合の 期待度数の計算例1(続き) このことは、第2行第1 列の期待度数を次のよ うに計算することを意 味する: 第2行の 合計 第1列の 合計 f 2 f 1 g 21 N 総合計 もっと 厳しく 男 女 計 f11 f21 f•1 適 当 f12 f22 f•2 厳しす ぎた 計 f13 f23 f•3 f1• f2• N 具体例での期待度数 の計算例2(復習) 同様に、右表の(1、3) セルの実度数75 に対 する期待度数は、 377 85 62.344 , 514 と計算した。 もっと 厳しく 男 27 女 3 計 30 適当 厳しす ぎた 275 75 124 10 399 85 計 377 137 514 各セルの度数を一般的な記号で 表した場合の期待度数の計算例2 ここで、上記の(1, 3)セ ルの実度数75に対し て、これを一般的に表 すと第1行第3列なの で、f13 と書くと、 右表の実度数 f13 に対 する期待度数 g13 はど う書けるか? もっと 厳しく 男 女 計 f11 f21 f•1 適 当 f12 f22 f•2 厳しす ぎた 計 f13 f23 f•3 f1• f2• N 期待度数の計算例2(続き) 右表の実度数 f13 に対 する期待度数 g13 は、 f1 f 3 g13 , N と計算される。 もっと 厳しく 男 女 計 f11 f21 f•1 適 当 f12 f22 f•2 厳しす ぎた 計 f13 f23 f•3 f1• f2• N r×s 分割表の場合のカイ二乗統計量 テキスト p.31 の表 7.1 の分割表は、r 行 s 列 分割表の場合のデータ を示す。 行や列それぞれの合 計 f1•, f2•, …, fr•, 及び f•1, f•2, …, f•s は、す べて周辺度数と呼ばれ る。 B1 B2 … Bs 計 A1 f11 f12 … f1s f1• A2 f21 f22 … f2s f2• : : : : : : Ar fr1 fr2 … frs fr• 計 f•1 f•2 … f•s N r×s 分割表の第 i 行第 j 列の実度数 fij に対する期待度数の計算方法 上記期待度数は、テキスト p.33 の (7.2) 式に あるように、 第 i 行の合計 g ij f i f j 総合計 N 第 j 列の合計 セルカイ二乗の定義とその意味 つぎに、上記第 i 行第 j 列の実度数 fij と、 それに対する期待度数 gij を用いたセルカ イ二乗は、テキスト p.33 の (7.3) 式で定義 される: hij ( fij gij ) / gij . 2 カイ二乗統計量と セルカイ二乗との関係(1) テキスト p.33 の (7.1) 式で表される r×s 分割 表の場合のカイ二乗統計量は、上記セルカイ二 乗を、すべてのセルについて計算し、足し合わ せたものである。すなわち、 r s 2 ( f ij gij ) 2 / g ij , i 1 j 1 ( f11 g11 ) / g11 ( f12 g12 ) / g12 2 2 ( f ij g ij ) 2 / g ij ( f rs g rs ) 2 / g rs . カイ二乗統計量と セルカイ二乗との関係(2) あるいは、(7.3) 式のセルカイ二乗 hij を用いれ ば、つぎのようにも表せる: 2 ( f11 g11 ) 2 / g11 ( f12 g12 ) 2 / g12 ( f ij g ij ) 2 / g ij ( f rs g rs ) 2 / g rs , h11 h12 hij hrs . セルカイ二乗の役割(1) すなわち、セルカイ二乗値は、テキスト p.33 の中ほどに書いたように、 全体的なカイ二乗に対する各セルの寄与の程 度を表している。 一方、分割表のカイ二乗検定で我々が検討す べき帰無仮説は、 「2つの属性(定性的変数)間に関連がない」 というものである。 セルカイ二乗の役割(2) そこで、テキスト p.33 中ほどにあるように、 帰無仮説が棄却された場合には、上の期待 度数とこの量(セルカイ二乗) hij を同時に出 力できていれば、2つの属性 A, B のどこに、 とりわけ大きな独立性(関連無し)からのずれ が、どの方向にあるのかを検討できる。 2×2 分割表の場合の検定 これまでは、一般の r×s 分割表のカイ二乗 検定について述べてきたが、ここからは、そ の特別な場合としての 2×2 分割表のカイ二 乗検定の方法を述べる。 この場合には、一般の場合に定義されたテキ スト p.33 の (7.1) 式のカイ二乗統計量は非 常に簡単になる。 2×2 分割表の一般形 まず、 2×2 分割表 の一般形を示すと、 右の表のような、テ キスト p.31 表7.2 の形のものになる。 ここで、セル内の度 数は、fij のような形 でなく、簡単に a, b, c, d と書くとする。 A/B B1 B2 計 A1 a b a+b A2 c d c+d a+c b+d N 計 2×2 分割表の場合の カイ二乗統計量の形 2×2 分割表の場合、(7.1) 式で定義される カイ二乗統計量は、より簡単な形に書くこと ができる。これが、テキスト p.33 の (7.4) 式 の統計量である: N (ad bc) . (a c)(b d )(a b)(c d ) 2 2 2×2 分割表の具体例 例えば、右の表 のような分割表 では、 A/B A1 B1 13 B2 7 計 20 A2 計 12 25 18 25 30 50 50 (1318 7 12) . 25 25 20 30 2 2 イエーツの修正(1) ただし、いずれか1つのセルにでも、期待度 数5以下のセルがある場合には、テキスト p.33 の (7.4) 式のすぐ下に書いたように、う えのカイ二乗統計量を修正する必要がある。 この修正は、イエーツの修正と呼ばれ、つぎ のようにカイ二乗統計量を修正するものであ る(テキスト、p.33 下参照)。すなわち、 イエーツの修正(2) (1)ad-bc > N/2 の時、(7.4) 式の分子の ad-bc を ad-bc-(N/2) と修正する。 (2)-N/2 ≤ ad-bc ≤ N/2 の時、(7.4) 式の右 辺 をゼロ、すなわち χ2 = 0.0 とする。 (3)ad-bc < -N/2 の時、(7.4) 式の分子の ad-bc を ad-bc+(N/2) と修正する。 イエーツの修正の具体例(1-1) 例えば、右の表の ような分割表では、 まずカイ二乗統計 量計算の前に、各 セルの期待度数 を計算する必要 がある。 A/B B1 計 B2 A1 3 6 9 A2 6 5 11 計 9 11 20 イエーツの修正の具体例(1-2) 例えば、右の表のような 分割表では、まずカイ二 乗統計量計算の前に、 各セルの期待度数を計 算する必要がある。例え ば、(1,2) セルの実度 数 6 に対して、期待度 数は、 9 11 g12 4.95 20 A/B B1 計 B2 A1 3 6 9 A2 6 5 11 計 9 11 20 イエーツの修正の具体例(1-3) このようにして、カ イ二乗統計量計算 の前に、この表の 各セルの期待度数 をすべて計算する と、右の赤印の数 値となる。 A/B B1 A1 3 6 4.05 4.95 6 5 4.95 6.05 9 11 A2 計 B2 計 9 11 20 イエーツの修正の具体例(2) これらより、セル内の期待度数が5以下のセルが1 つ以上存在することがわかる。 さらに、イエーツの修正の条件を検討するために、 ad-bc の値を計算すると、 ad bc 3 5 6 6 21. すなわち、-N/2 (=-20/2) =-10 より も小さい。 イエーツの修正の具体例(3) これは修正の条件の 3.にあたり、我々は (7.4) 式の分子の ad-bc を ad-bc+(N/2) と修正する必要があると言える。すなわち、 ad bc ( N / 2) 3 5 6 6 (20 / 2), 21 10 11. イエーツの修正の具体例(4) そこで、最後に、このケースにおける修正 後のカイ二乗統計量を計算すると、 N ad bc ( N / 2) , (a c)(b d )(a b)(c d ) 2 2 20 11 0.2469. 9 11 9 11 2 岩原テキストの表の見方 このようにカイ二乗値を計算したら、われわ れはこの検定のカイ二乗値の棄却点の値を 、岩原のテキスト、p.432-433 とりわけ p.433 の自由度1に対する5%棄却点の値を読み 取り、上で計算したカイ二乗値が棄却点の値 以上ならば帰無仮説を棄却する。さもなけれ ば、採択する。 検定の結論 標本でのカイ二乗値が棄却点の値以上なら ば、帰無仮説を棄却するが、そのことは、 2つの属性間には有意な関連があることを 意味する。 もし、カイ二乗値が棄却点の値未満ならば、 帰無仮説を採択するが、そのことは、 2つの属性間には有意な関連がないことを 意味する。 演習時の、データの作成方法 演習では、岩原テキスト pp.445-446 の乱数 表から、学籍番号に対応する各ページの先 頭から順に、 (p.445 の数値、p.446 の数値) として20対取り出し、 それぞれの対の2つの数値を、すべて (1)数値が50未満なら1に、 (2)数値が50以上なら2に 変換せよ。 演習時の検定手順(1) このようにして得られた20対のデータを もとに、2×2分割表を作成し、20対の データが当該分割表の4つのセルのど こに該当するかをカウントし、最終的な 分割表を作成する(講義テキスト、p.33 参照のこと)。 演習時の検定手順(2) 作成が完了したら、まず4つのセルそれ ぞれの期待度数を計算する。 期待度数を見て、5以下のものが1つで もあれば、イエーツの修正によるカイ二 乗統計量を、そうでなければ通常のカイ 二乗統計量を計算し、検定する。 WEB 用のデータは? WEB 宿題では、入力データは分割表の各セ ルのデータではなく、うえのようにして変換さ れた20対のデータである: (1、1)、(2、2)、(1、2)、… 、(1、2) 20対の架空データ 架空データの仮の解釈 このようにして得られた各対のデータは、仮に各被 験者の2つの属性、 1.性別(1.男子、2.女子) 2.向性(1.外交的、2.内向的)、 から成るとしよう。つまり、データは、 (性別、向性) この時、分析の目的は、性別と向性の間に統計的 に有意な関連があるかを調べることである。
© Copyright 2024 ExpyDoc