カイ二乗検定

1
市場調査の手順
問題の設定
調査方法の決定
データ収集方法の決定
データ収集の実行
データ分析と解釈
1.
2.
3.
4.
5.
–
–
6.
マーケティング・リサーチ
データ分析手法1
質的データの集計
データ入力
データ分析
報告書の作成
2
3
データ分析とは
„
4
測定尺度の分類
記述統計
例
サンプル内での要約
„ 大量 or 複雑なデータ
„
„
質 名義尺度 JANコード、性別 ○ × × ×
的 順序尺度 選好順序
○ ○ × ×
推測統計
„
= < + ×
≠ > − ÷
推定・予測・制御
量 間隔尺度 温度、SD尺度
的 比例尺度 購買量
○ ○ ○ ×
○ ○ ○ ○
5
測定尺度の選択基準
回答者の負担
„ 情報量
„ 適用可能な分析手法
6
データ分析手法の分類
„
一変数の
集計
質的データ
量的データ
最頻値
レンジ
平均
分散
t検定 相関係数
多変数間の
χ2検定
関連性
分散分析 回帰分析
1
7
8
質的データの例
データ分析の手順
回答者番号 性別
1
男性
2
男性
3
女性
…
99
女性
100
男性
購買
○
×
×
„
各変数について
„
データの整理
„
代表値の計算
„
„
ソート、分布
複数の変数を同時に
データの整理
„ 関連性の計算・・・
„
○
○
9
10
データの整理(一変数)
度数分布表(ヒストグラム)
性別
度数
男性
女性
60
40
購買
度数
○
×
60
40
100
100
80
80
60
60
40
40
20
20
合計
100
合計
0
100
男性
女性
0
性別
○
×
購買
11
12
データの代表値
データを1つの情報で表現する
„ 最頻値(モード)
最も度数の大きいもの
„ 「性別」の最頻値:男性
„ 「購買」の最頻値:○
二変数間の関連性
„
二変数間の関連性は、各変数の情報
からだけでは分からない
„
„
„
クロス集計表
母集団における関連性は、標本にお
ける関連性からすぐには分からない
„
χ2検定・・・例4で説明
2
13
クロス集計表
14
クロス集計表(例1)
性別
性別
購買
購買
男性
女性
合計
男性
女性
合計
○
60
○
60
0
60
×
40
×
0
40
40
100
合計
60
40
100
合計
60
40
15
16
クロス集計表(例3)*
クロス集計表(例2)
性別
性別
購買
購買
男性
女性
合計
男性
女性
合計
○
20
40
60
○
36
24
60
×
40
0
40
×
24
16
40
合計
60
40
100
合計
60
40
100
17
クロス集計表(例4)*
18
クロス集計表(例5)*
性別
性別
購買
購買
男性
女性
合計
男性
女性
合計
○
44
16
60
○
33
27
60
×
16
24
40
×
27
13
40
合計
60
40
100
合計
60
40
100
3
19
20
クロス集計表(例6)
性別
購買
男性
女性
合計
100
80
○
35
25
60
×
25
15
40
合計
60
40
100
60
40
買わない
20
0
買った
男性
女性
21
22
問題
性別と購買という二つの変数間に
関連性があるか?
„
100
これは標本調査の結果であって
標本を変えたり増やしたりしたら
結果が違ってくるかもしれない・・・
80
60
40
買わない
20
0
買った
男性
女性
23
24
説得力を付ける方法
„
論理(logic)
三段論法
„ 帰納法
„ 演繹法
„ 背理法
„
„
証拠(evidence)
„
統計的仮説検定
「あした晴れる」かどうか?
「晴れるかどうか」を調べる代りに
„ 「雨が降る」確率(降雨確率)を
(天気予報で)調べる
„ 降雨確率が一定の基準
(例えば40%)以下かどうか?
„
4
25
26
仮説検定(test)
降雨確率≦40%の時
„
„
「雨は降らない」(=晴れる)
と解釈する
「関連がある」事を直接証明せずに
「関連がない」という逆の仮説
(帰無仮説)が成立しないことを
証明する
「雨が降る」という帰無仮説が
40%の有意水準で棄却された
27
28
帰無仮説が成立しないことを
証明する方法
„
帰無仮説が成立する確率が、ある値
(有意水準)より小さければ良い
„
„
1.
2.
有意水準は一般には5%とする
3.
「帰無仮説が成立する確率≦有意水
準」の場合
4.
→帰無仮説は成立しない(棄却される)
→関連がある
5.
6.
証明すべき命題:「今日は晴れる」
帰無仮説:「今日は雨が降る」
有意確率:40%
(降雨)確率は天気予報で調べる
降雨確率≦有意水準 ?
傘を持っていく ?
29
仮説検定の手順
仮説および帰無仮説の設定
有意水準の設定(マーケティングでは普通は5%)
帰無仮説が成立する確率の計算
有意水準と確率の比較
1.
2.
3.
4.
確率≦有意水準→帰無仮説は棄却
1.
„
仮説が支持される
確率>有意水準→帰無仮説は棄却されない
2.
„
仮説が支持されるかどうかは分からない
30
カイ二乗(χ2)検定
質的データ同士の関連性の検定
1.
χ2値の計算
2.
自由度の計算
3.
帰無仮説が成立する確率の計算
4.
有意水準と比較
5
31
期待値(expectation)
„
32
期待値の計算
帰無仮説が正しいと仮定した場合の
理論値
性別
購買
男性が全体の60%
„ 購買した人が全体の60%
„ 性別と購買に関連がなければ、
購買した男性は全体の36%(36人)
男性
女性
計
○
36
24
60
×
24
16
40
計
60
40
100
„
33
カイ二乗値の計算
(O-E)2/E
O : 実際の値、E : 期待値
χ
2
(O 1
=
+
(O 3
− E1 )
+
E1
2
− E3 )
+
E3
2
34
(O 2
(O 4
性別
− E2
E2
− E4
E4
)
)
購買
2
男性
女性
○
1.3
5.3
×
2
8
2
35
36
自由度の計算
例
1 16.00
2 7.11
3 0.00
4 1.78
5 0.25
6 0.03
24.00
10.67
0.00
2.67
0.38
0.04
24.00
10.67
0.00
2.67
0.38
0.04
36.00
16.00
0.00
4.00
0.56
0.06
χ2
p0
100.00 0.00
44.44 0.00
0.00 1.00
11.11 0.00
1.56 0.21
0.17 0.68
n = ( 表 頭 の 選 択 肢 数 − 1)
∗ ( 表 側 の 選 択 肢 数 − 1) = 1
6
37
38
χ2分布表
帰無仮説が成立する確率の計算
„
Excelの関数を使って計算
„
„
=CHIDIST(χ2値,自由度)
自由度
1
2
3
4
5
χ2分布表を使って計算
90%
0.02
0.21
0.58
1.06
1.61
帰無仮説が成立する確率
50%
20%
10%
5%
0.45
1.64
2.71
3.84
1.39
3.22
4.61
5.99
2.37
4.64
6.25
7.81
3.36
5.99
7.78
9.49
4.35
7.29
9.24 11.07
1%
6.63
9.21
11.34
13.28
15.09
39
χ2分布表(右上端)
a
n
自由度
1
2
40
χ2分布表の読み方
確率
„
0.050
0.025
0.010
0.005
χ2値
3.841
5.991
5.024
7.378
6.635
9.210
χ2値と自由度から、帰無仮説が成立する
確率を求める
χ2値 自由度
7.879
10.60
確率
7.38
2
2.5%
6.00
1
1∼2.5%
16.7
1
0.5%以下
41
42
有意確率の計算と結論
小
χ2
大
類似
O,E
非類似
大
H0の
確率
小
「性別と購買には関連がない」という
帰無仮説のχ2値は16.7であり、成立
する確率は0.5%以下
„ 帰無仮説は5%の有意水準で棄却さ
れる。
„ 性別と購買には関連がある
„
7
43
44
参考図書
注意
朝野煕彦 『いきなりわかる経営数学の基
礎』 講談社サイエンティフィク
„ 朝野煕彦 『いきなりわかる多変量解析の
基礎』 講談社サイエンティフィク
„ 大村 平 『多変量解析のはなし』 日科
技連
„ 内田治 『すぐわかるEXCELによる統計解
析』 東京図書
算数の基礎的な知識が必要
„ 参考書
„
„
中学・高校時代の教科書
„ 土田昭司『社会調査のためのデータ分
析入門』有斐閣。
„ 朝野煕彦『入門多変量解析の実際』講
談社
„
46
47
分数と小数
自乗和、二乗和、平方和
„ sum of squares
2
2
2
2
2
„ Σzn = z1 +z2 +・・・+zN-1 +zN
分数
„
足し算(加法)の答え、和、sum、Σ
„ かけ算(乗法)の答え、積、product、Π
メリット
小数
答えが正確 計算ルールが簡単
ワープロ打ちが簡単
デメリット 色々なルール 計算誤差
„
8