集計と分析

調査結果の集計
集計と尺度
1
集計とは
• 計画段階において解明すべき課題が細分
化
• 調査票によって調査課題はより細かく分け
られる。
• その細かく分けられたデータを統合するの
が集計
• 再統合により集団の特性を明らかにするこ
とが集計の役割
2
集計の基本
• 集計の基本は分類と積算
• 標本数・分類項目が多くなると手集計では
困難
• 昔は集計機が利用されていたが、現在は
コンピュータで集計される
• 簡単な集計やFAでは依然として手作業
3
集計作業のプロセス
集計計画
素データの審査
集計対象数の確認
作業規模の確定
集計
統計表の作成
4
統計表の形態
• GT表
– 調査アイテムに関する全ての回答者
• クロス集計表
– ブレイクダウン項目ごとの回答者
– 原因と結果の分析のために利用
– ブレイクダウン項目には、年齢・職業・性別お
よび調査項目に大きく影響を与えそうな項目
が採用される
5
各部の名称
表頭
カテゴリー
全体
表側
サンプル数
出席
欠席
400人
135人
265人
GT
性別
男
250人
75人
175人
女
150人
60人
90人
ブレイクダウン項目
6
カテゴリー数
• 集団の特性をみるときに見やすい数
• 調査を行いやすい数
• 大体10個前後が望ましい
7
カテゴリーの作り方
•
•
•
•
•
•
•
数を多くしすぎない
境界に注意する
カテゴリーの間隔
正規分布になるようにする
同一次元を保つ
全てを網羅する
カテゴリーの重複を避ける
8
個々の集計表の想定
• 表側に並ぶ項目によりセグメントが一目で
わかる
• 各質問をどの項目でブレイクダウンする
か?
• 行方向の比率をとるか、列方向の比率をと
るか
• 表頭・表側の項目は報告者が決定
9
パーセントのとり方
出席
欠席
男
56%
66%
女
44%
34%
出席 欠席 合計
男
女
30% 70%
40% 60%
100
%
100
%
合計 100% 100%
10
データチェック
• マルチ・チェック
– SAの弧設問に複数回答しているか?
• オフ・コード・チェック
– カテゴリー数を超えて回答されているか?
• 論理チェック
– 分岐設問後の回答が正しいか?
11
尺度の種類
• 名義尺度
• 順位尺度
• 間隔尺度
• 比例尺度
12
分析
情報の集約
集計と分析
• 多数の変数間の関係を集計表で表現する
と煩雑
• どの程度から「差」があるのかの基準があ
いまい
• 変数間の関係を統計技法を用いて表現
相関表
体重1
体重2
体重3
体重4
合計
身長1
20
9
0
0
29
身長2
16
29
9
2
56
身長3
0
17
38
9
64
身長4
0
0
6
3
9
合計
36
55
53
14
158
相関図
85
80
75
70
65
体
重 60
男
女
55
50
45
40
140.0
145.0
150.0
155.0
160.0
165.0
身長
170.0
175.0
180.0
185.0
有名な統計量
• 平均
• 分散
• 共分散
• 相関係数
統計学の活用
• 変数間の関係を数字として表現
• 因果関係は統計学では分からない
• 因果関係のためには論理的妥当性が必
要
• 操作可能な変数を原因とするとより好まし
い
関係があるといえるには
• 論理的な妥当性(ロジック)
• 客観的な証拠(エビデンス)
分析とは
• データを集約
• 客観的な判断基準によりデータの関係を
表現