第11回 社会学の方法(3) 文献 サンプリングの重要性 サンプリングの重要

2015年度
文献
第11回 社会学の方法(3)
盛山和夫著
『社会調査法』
(有斐閣)
計量的アプローチ(1)
2
1
サンプリングの重要性
サンプリングの重要性
質的データ
意味解釈的アプローチ
量的データ
計量的アプローチ
サンプリングの基本
サンプリングのやりかた
3
サンプリングの重要性
4
サンプリングの重要性
• 量的データを、どうやって収集するか
社会調査の重要性
社会の全体像を描き出す
仮説の妥当性をテストする
社会調査
5
6
1
2015年度
サンプリングの重要性
サンプリングの重要性
社会調査の重要性
社会調査の重要性
数字はしばしば強い説得力をも
つがゆえに、かえってデータに
騙されることがある
7
サンプリングの重要性
8
サンプリングの重要性
• 最初に注意すること!
社会調査の重要性
標本(回答者)が偏ってないか?
数字はしばしば強い説得力をも
つがゆえに、かえってデータに
騙されることがある
母集団(調査対象)は何か?
9
サンプリングの重要性
10
サンプリングの重要性
• 1936年米大統領選の予測
• 1936年米大統領選の予測
リテラティ・ダイジェスト
ギャラップ
ランドンの勝利を予測
回答者
ルーズベルトの勝利を予測
名(読者等)
回答者
11
名(割当法)
12
2
2015年度
サンプリングの重要性
サンプリングの重要性
• 1936年米大統領選の予測
• 1936年米大統領選の予測
回答者数に差があるので、
ギャラップ
L誌の予測の方が信頼性が
あるようにみえる・・・
回答者数に差があるので、
ギャラップ
しかし、実際の結果は
L誌の予測の方が信頼性が
あるようにみえる・・・
ルーズベルトの勝利を予測
回答者
ルーズベルトの勝利を予測
名(割当法)
回答者
名(割当法)
13
サンプリングの重要性
なぜ、
14
サンプリングの重要性
は外れたのか?
標本調査
全員を調査するわけでないので、誤差がでる
回答者(標本)が偏っていたから
標本誤差
15
サンプリングの重要性
16
サンプリングの重要性
全体をよく反映した標本(回答者)で
あれば、標本調査の方が正確になる
全数調査
非標本誤差≧標本誤差
非標本誤差
17
18
3
2015年度
サンプリングの重要性
サンプリングの重要性
なぜ、くじなのか?
標本を抽出する方法
• できるだけ、全体から満遍なく選択する
基準を作ると思いがけない偏りが
でるかもしれない
19
サンプリングの重要性
20
サンプリングの重要性
くじ引きの考え方で標本を
なぜ、くじなのか?
選択することを、
無作為抽出の基本
と呼ぶ
全対象者が等しい確率で標本(回答者)
として選択される
基準を作ると思いがけない偏りが
でるかもしれない
21
22
サンプリングの基本
サンプリングの重要性
無作為抽出の問題点
サンプリングの基本
くじで選んでも、
が生じうる場合がある
サンプリングのやりかた
23
24
4
2015年度
サンプリングの基本
サンプリングの基本
無作為抽出の問題点
無作為抽出の利点
標本(回答者全員)が横浜DeNA
ベイスターズのファンになる可能
性も0ではない!!
対象者が等確率で選択されていれ
ば、
を利用できる
25
サンプリングの基本
26
サンプリングの基本
すごく小さい
無作為抽出の利点
推定
標本がDeNAファンだけになる確
率を計算できる
すること
27
サンプリングの基本
28
サンプリングの基本
推定
検定
例えば、標本の視聴率から、母集
団全体の視聴率を推測する
すること
29
30
5
2015年度
サンプリングの基本
サンプリングの基本
標本の大きさはどれくらいがよいのか?
検定
95%の確率
で誤差は右
の範囲内に
収まる
例えば、「韓流ブームだ(韓国の
ドラマは視聴率が高い)」という
仮説が正しいか、標本の回答で判
断する
400人
・・ ±約5%
1000人
・・ ±約3%
10000人 ・・ ±約1%
31
サンプリングの基本
サンプリングの基本
誤差の範囲を2%程度改善するた
標本の大きさはどれくらいがよいのか?
調査データに騙されないために・・
めには、10倍の調査コストをかけな
ければいけない
400人
・・ ±約5%
1000人
・・ ±約3%
32
サンプリングの手続きを確認する
10000人 ・・ ±約1%
33
サンプリングの基本
34
サンプリングの基本
調査データに騙されないために・・
無作為抽出も完全ではない
母集団が何であるかを理解する
信頼度95%なら、20回に1回は許容
誤差を超えている
母集団が異なれば、
結果を一般化できない
35
36
6
2015年度
サンプリングのやり方
サンプリングの重要性
実施上の問題点
サンプリングの基本
コストの問題
名簿の問題
回答拒否の問題
サンプリングのやりかた
37
サンプリングのやり方
38
サンプリングのやり方
実施上の問題点
抽出台帳
・・・
・・・
無作為抽出を、直接、全国調査に
適用することは無理
サンプリング用の名簿
全員を網羅し、かつ
正確でなければいけない
39
サンプリングのやり方
40
サンプリングのやり方
系統抽出
抽出台帳の例
台帳に通し番号をつける
住民基本台帳
選挙人名簿
任意にスタート地点を決める
一定の間隔(ただし、大きい素数)で、
機械的に抽出していく
41
42
7
2015年度
サンプリングのやり方
サンプリングのやり方
多段抽出
多段抽出
いきなり標本を抽出せず、いくつか段
階を分けて、抽出を行なう
1
まず、投票区を抽出する
2
選択された投票区から、名簿を
使って個人を抽出する
43
サンプリングのやり方
44
サンプリングのやり方
層別抽出
層別抽出
必要な指標が明らかであれば、
男性と女性の違いを比較したいので
あれば、男性と女性を分けて抽出し
た方がよい
45
46
サンプリングのやり方
Random Digit Dialing
電話調査の際、利用される。
から無作為に選び出す。
47
8