第8回授業の目標

心理統計学 II
第9回 (11/27) 授業の目標





先週紹介した2×3分割表のデータ例をもとに、一般の r×s
分割表の場合のカイ二乗統計量及び期待度数の概念を理
解する。
一般の分割表の特殊形としての2×2分割表の場合のカイ
二乗統計量の形を知る。
2×2分割表の場合のカイ二乗検定の手順を理解する。
具体例による、 2×2分割表の場合のカイ二乗検定の手順
のまとめ
岩原テキストの乱数表からの分割表の作成方法
具体例での期待度数
の計算例1(復習)


同検定では、期待度数
という重要な概念があ
る(テキスト、p.33)。
例えば、右表の第2行
第1列すなわち(2、1)
セルの実度数 3 に対
する期待度数は、
137  30
 7.996
514
もっと
厳しく
男 27
女 3
計 30
と計算した。
適当
厳しす
ぎた
275 75
124 10
399 85
計
377
137
514
具体例での期待度数
の計算例1(復習)(続き)
このことは、第2行第1
列の期待度数を次のよ
うに計算することを意
味する:
第2行の
合計
第1列の
合計
137  30
 7.996
514
総合計
もっと
厳しく
男 27
女 3
計 30
適当
厳しす
ぎた
275 75
124 10
399 85
計
377
137
514
各セルの度数を一般的な記号で
表した場合の期待度数の計算例1


つぎに、上記の(2,1)
セルの実度数 3 に対し
て、これを一般的に表
すと第2行第1列なの
で、f21 と書くと、
右表の実度数 f21 に対
する期待度数 g21は、
f 2  f 1
g 21 
N
もっと
厳しく
男
女
計
f11
f21
f•1
と計算される。
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
一般的な記号で表した場合の
期待度数の計算例1(続き)
このことは、第2行第1
列の期待度数を次のよ
うに計算することを意
味する:
第2行の
合計
第1列の
合計
f 2  f 1
g 21 
N
総合計
もっと
厳しく
男
女
計
f11
f21
f•1
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
具体例での期待度数
の計算例2(復習)
同様に、右表の(1、3)
セルの実度数75 に対
する期待度数は、
377  85
 62.344 ,
514
と計算した。
もっと
厳しく
男 27
女 3
計 30
適当
厳しす
ぎた
275 75
124 10
399 85
計
377
137
514
各セルの度数を一般的な記号で
表した場合の期待度数の計算例2


ここで、上記の(1, 3)セ
ルの実度数75に対し
て、これを一般的に表
すと第1行第3列なの
で、f13 と書くと、
右表の実度数 f13 に対
する期待度数 g13 はど
う書けるか?
もっと
厳しく
男
女
計
f11
f21
f•1
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
期待度数の計算例2(続き)

右表の実度数 f13 に対
する期待度数 g13 は、
f1  f 3
g13 
,
N
と計算される。
もっと
厳しく
男
女
計
f11
f21
f•1
適
当
f12
f22
f•2
厳しす
ぎた
計
f13
f23
f•3
f1•
f2•
N
r×s 分割表の場合のカイ二乗統計量
テキスト p.31 の表 7.1
の分割表は、r 行 s 列
分割表の場合のデータ
を示す。
 行や列それぞれの合
計 f1•, f2•, …, fr•, 及び
f•1, f•2, …, f•s は、す
べて周辺度数と呼ばれ
る。

B1 B2 … Bs 計
A1 f11
f12 … f1s f1•
A2 f21 f22 … f2s f2•
:
:
:
:
:
:
Ar fr1
fr2 … frs
fr•
計 f•1
f•2 … f•s
N
r×s 分割表の第 i 行第 j 列の実度数
fij に対する期待度数の計算方法

上記期待度数は、テキスト p.33 の (7.2) 式に
あるように、
第 i 行の合計
g ij 
f i f  j
総合計
N
第 j 列の合計
セルカイ二乗の定義とその意味

つぎに、上記第 i 行第 j 列の実度数 fij と、
それに対する期待度数 gij を用いたセルカ
イ二乗は、テキスト p.33 の (7.3) 式で定義
される:
hij  ( fij  gij ) / gij .
2
カイ二乗統計量と
セルカイ二乗との関係(1)

テキスト p.33 の (7.1) 式で表される r×s 分割
表の場合のカイ二乗統計量は、上記セルカイ二
乗を、すべてのセルについて計算し、足し合わ
せたものである。すなわち、
r
s
 2   ( f ij  gij ) 2 / g ij ,
i 1 j 1
 ( f11  g11 ) / g11  ( f12  g12 ) / g12  
2
2
 ( f ij  g ij ) 2 / g ij    ( f rs  g rs ) 2 / g rs .
カイ二乗統計量と
セルカイ二乗との関係(2)

あるいは、(7.3) 式のセルカイ二乗 hij を用いれ
ば、つぎのようにも表せる:
 2  ( f11  g11 ) 2 / g11  ( f12  g12 ) 2 / g12  
 ( f ij  g ij ) 2 / g ij    ( f rs  g rs ) 2 / g rs ,
 h11  h12  
 hij    hrs .
セルカイ二乗の役割(1)
すなわち、セルカイ二乗値は、テキスト p.33
の中ほどに書いたように、
 全体的なカイ二乗に対する各セルの寄与の程
度を表している。
 一方、分割表のカイ二乗検定で我々が検討す
べき帰無仮説は、
「2つの属性(定性的変数)間に関連がない」
というものである。

セルカイ二乗の役割(2)

そこで、テキスト p.33 中ほどにあるように、
帰無仮説が棄却された場合には、上の期待
度数とこの量(セルカイ二乗) hij を同時に出
力できていれば、2つの属性 A, B のどこに、
とりわけ大きな独立性(関連無し)からのずれ
が、どの方向にあるのかを検討できる。
2×2 分割表の場合の検定
これまでは、一般の r×s 分割表のカイ二乗
検定について述べてきたが、ここからは、そ
の特別な場合としての 2×2 分割表のカイ二
乗検定の方法を述べる。
 この場合には、一般の場合に定義されたテキ
スト p.33 の (7.1) 式のカイ二乗統計量は非
常に簡単になる。

2×2 分割表の一般形


まず、 2×2 分割表
の一般形を示すと、
右の表のような、テ
キスト p.31 表7.2
の形のものになる。
ここで、セル内の度
数は、fij のような形
でなく、簡単に a, b,
c, d と書くとする。
A/B
B1
B2
計
A1
a
b
a+b
A2
c
d
c+d
a+c
b+d
N
計
2×2 分割表の場合の
カイ二乗統計量の形

2×2 分割表の場合、(7.1) 式で定義される
カイ二乗統計量は、より簡単な形に書くこと
ができる。これが、テキスト p.33 の (7.4) 式
の統計量である:
N (ad  bc)
 
.
(a  c)(b  d )(a  b)(c  d )
2
2
2×2 分割表の具体例
 例えば、右の表
のような分割表
では、
A/B
A1
B1
13
B2
7
計
20
A2
計
12
25
18
25
30
50
50 (1318  7 12)
 
.
25 25 20 30
2
2
イエーツの修正(1)
ただし、いずれか1つのセルにでも、期待度
数5以下のセルがある場合には、テキスト
p.33 の (7.4) 式のすぐ下に書いたように、う
えのカイ二乗統計量を修正する必要がある。
 この修正は、イエーツの修正と呼ばれ、つぎ
のようにカイ二乗統計量を修正するものであ
る(テキスト、p.33 下参照)。すなわち、

イエーツの修正(2)
(1)ad-bc > N/2 の時、(7.4) 式の分子の
ad-bc を ad-bc-(N/2) と修正する。
 (2)-N/2 ≤ ad-bc ≤ N/2 の時、(7.4) 式の右
辺 をゼロ、すなわち χ2 = 0.0 とする。
 (3)ad-bc < -N/2 の時、(7.4) 式の分子の
ad-bc を ad-bc+(N/2) と修正する。

イエーツの修正の具体例(1-1)

例えば、右の表の
ような分割表では、
まずカイ二乗統計
量計算の前に、各
セルの期待度数
を計算する必要
がある。
A/B
B1
計
B2
A1
3
6
9
A2
6
5
11
計
9
11
20
イエーツの修正の具体例(1-2)

例えば、右の表のような
分割表では、まずカイ二
乗統計量計算の前に、
各セルの期待度数を計
算する必要がある。例え
ば、(1,2) セルの実度
数 6 に対して、期待度
数は、
9 11
g12 
 4.95
20
A/B
B1
計
B2
A1
3
6
9
A2
6
5
11
計
9
11
20
イエーツの修正の具体例(1-3)

このようにして、カ
イ二乗統計量計算
の前に、この表の
各セルの期待度数
をすべて計算する
と、右の赤印の数
値となる。
A/B
B1
A1
3
6
4.05 4.95
6
5
4.95 6.05
9
11
A2
計
B2
計
9
11
20
イエーツの修正の具体例(2)


これらより、セル内の期待度数が5以下のセルが1
つ以上存在することがわかる。
さらに、イエーツの修正の条件を検討するために、
ad-bc の値を計算すると、
ad  bc  3  5  6  6  21.
すなわち、-N/2 (=-20/2) =-10 より
も小さい。
イエーツの修正の具体例(3)

これは修正の条件の 3.にあたり、我々は
(7.4) 式の分子の ad-bc を ad-bc+(N/2)
と修正する必要があると言える。すなわち、
ad  bc  ( N / 2)
 3  5  6  6  (20 / 2),
 21 10  11.
イエーツの修正の具体例(4)

そこで、最後に、このケースにおける修正
後のカイ二乗統計量を計算すると、
N  ad  bc  ( N / 2)
 
,
(a  c)(b  d )(a  b)(c  d )
2
2
20  11

 0.2469.
9 11 9 11
2
岩原テキストの表の見方

このようにカイ二乗値を計算したら、われわ
れはこの検定のカイ二乗値の棄却点の値を
、岩原のテキスト、p.432-433 とりわけ p.433
の自由度1に対する5%棄却点の値を読み
取り、上で計算したカイ二乗値が棄却点の値
以上ならば帰無仮説を棄却する。さもなけれ
ば、採択する。
検定の結論
標本でのカイ二乗値が棄却点の値以上なら
ば、帰無仮説を棄却するが、そのことは、
2つの属性間には有意な関連があることを
意味する。
 もし、カイ二乗値が棄却点の値未満ならば、
帰無仮説を採択するが、そのことは、
2つの属性間には有意な関連がないことを
意味する。

演習時の、データの作成方法
演習では、岩原テキスト pp.445-446 の乱数
表から、学籍番号に対応する各ページの先
頭から順に、
(p.445 の数値、p.446 の数値)
として20対取り出し、
 それぞれの対の2つの数値を、すべて
(1)数値が50未満なら1に、
(2)数値が50以上なら2に
変換せよ。

演習時の検定手順(1)
 このようにして得られた20対のデータを
もとに、2×2分割表を作成し、20対の
データが当該分割表の4つのセルのど
こに該当するかをカウントし、最終的な
分割表を作成する(講義テキスト、p.33
参照のこと)。
演習時の検定手順(2)
 作成が完了したら、まず4つのセルそれ
ぞれの期待度数を計算する。
 期待度数を見て、5以下のものが1つで
もあれば、イエーツの修正によるカイ二
乗統計量を、そうでなければ通常のカイ
二乗統計量を計算し、検定する。
WEB 用のデータは?

WEB 宿題では、入力データは分割表の各セ
ルのデータではなく、うえのようにして変換さ
れた20対のデータである:
(1、1)、(2、2)、(1、2)、… 、(1、2)
20対の架空データ
架空データの仮の解釈
このようにして得られた各対のデータは、仮に各被
験者の2つの属性、
1.性別(1.男子、2.女子)
2.向性(1.外交的、2.内向的)、
から成るとしよう。つまり、データは、
(性別、向性)
 この時、分析の目的は、性別と向性の間に統計的
に有意な関連があるかを調べることである。
