PowerPoint プレゼンテーション

●2変数間の関連の強さに関する検定
(1)相関係数の検定
<標本抽出実験>
母集団 : 母相関係数ρ=0の1000個のデータ
無作為に10個の標本を抽出
1000回の実験を行う
範囲
-1.0 ~ -0.9
-0.9 ~ -0.7
-0.7 ~ -0.5
-0.5 ~ -0.3
-0.3 ~ -0.1
-0.1 ~ 0.1
0.1 ~ 0.3
0.3 ~ 0.5
0.5 ~ 0.7
0.7 ~ 0.9
0.9 ~ 1.0
頻度
1
143
589
1293
1942
2051
1939
1286
587
162
7
相対頻度
0.01
1.43
5.89
12.93
19.42
20.51
19.39
12.86
5.87
1.62
0.07
母相関0を中
心に散布
±0.7を越える
値も得られる
可能性がある
●標本数と相関係数の分布との関連
標
本
数
が
増
加
す
る
-1
0
1
標本数10
標本数20
標本数50
標本数100
標本数200
散
布
度
が
小
さ
く
な
る
理論的には
母相関係数ρ=0の母集団から無作為に抽出したn個の標本に基づく標本相関係数r
t
r n2
自由度n-2の t分布
1  r2
標本数500
標本相関係数の分布
標本数100
標本数50
-0.8
-0.4
0
0.4
0.8
●標本相関係数の分布と検定の考え方
<ケース1>標本数30
-0.8
-0.4
棄却域
確率0.025
相関係数0.3
0
0.4
0.8
棄却域
仮説採択域
確率0.95
確率0.025
<ケース2>標本数100
相関係数0.3
-0.8
棄却域
確率0.025
-0.4
0
仮説採択域
確率0.95
0.4
棄却域
確率0.025
0.8
●有意水準5%、1%における帰無仮説採択の上限値
標本数
10
20
30
50
75
100
150
200
300
500
1000
有意水準5% 有意水準1%
0.6319
0.7646
0.4438
0.5614
0.3610
0.4629
0.2787
0.3610
0.2272
0.2957
0.1966
0.2565
0.1603
0.2097
0.1388
0.1818
0.1133
0.1485
0.0877
0.1151
0.0620
0.0814
●カイ2乗の独立性の検定
<標本抽出実験>
データ
観測度数
運動系
男子学生
60
性
女子学生
20
別
合計
80
所属クラブ
文科系 所属無し 合計
40
20 120
30
30
80
70
50 200
実験の前提
①2つの変数(性別、クラブ)は相互に無関連である
②母集団における性別比は、120:80=60%:40%であり
クラブ比は80:70:50=40%:35%:25%である
実験の手続き
①「男子」が0.6(=120/200)、「女子」が0.4(=80/200)の確率で出現するサイコロを用意する
②「運動系」が0.4(=80/200)、「文科系」が0.35(=70/200)、「所属無し」が0.25(=50/200)の
確率で出現するサイコロを用意する
③2つのサイコロを振ることによって標本を抽出し、これを200回繰り返すことによって200
人の無作為標本を得る
サイコロを振る
性別によって異なった所属クラブ傾向を示すことはない
●抽出実験例
<抽出データ例>
運動系 文科系 所属無し 合計
男子学生
50
45
30 125
女子学生
30
35
10
75
合計
80
80
40 200
<無関連の場合とのずれ>
運動系 文科系 所属無し
男子学生
0
0.5
1
女子学生
0 0.8333 1.666667
<無関連の場合の度数>
運動系 文科系 所属無し 合計
男子学生
50
50
25 125
女子学生
30
30
15
75
合計
80
80
40 200
合計
カイ2乗値=4
●10000回の抽出実験
度数
→ 10000万個のカイ2乗値
0
2
4
6
8
10
●標本データのカイ2乗値
観測度数
男子学生
性
女子学生
別
合計
運動系
60
20
80
所属クラブ
文科系 所属無し 合計
40
20 120
30
30
80
70
50 200
無関連な場合とのずれ
運動系 文科系 所属無し
男子学生
3 0.095238 3.333333
女子学生
4.5 0.142857
5
独立の場合の
所属クラブ
期待度数
運動系 文科系 所属無し 合計
男子学生
性
女子学生
別
合計
48
32
80
42
28
70
30
20
50
120
80
200
カイ2乗値=16.07
自由度2
自由度4
自由度6
度数
理論分布
第1変数:c1カテゴリ
第2変数:c2カテゴリ
0
2
4 2 値
6
8
10
0
自由度: (c1-1)×(c2-1)のt分布
5
10
15
20
●クロス表の独立性の検定 (カイ2乗検
定)