計量的手法入門 人材開発コース・ワークショップ(IV)

計量的手法入門
人材開発コース・ワークショップ(IV)
2000年6月29日、7月6・13日
奥西 好夫
([email protected])
講義概要
0.研究計画(proposal)の手順
1.研究計画とデータの対応
2.データの収集、利用
3.データのチェック、検討
4.データの分析 --- 統計手法の利用
参考文献
統計ソフトの案内
0.研究計画(proposal)の手順
0-1.何を明らかにしたいのか?
<研究課題>
一般的な問い(general question)
 具体的な問い(specific questions)

0-2.その問題を明らかにするこ
とにどういう意義があるのか?
<研究意義、問題意識>
既存研究との関連
--- これまでの学問的蓄積への貢献
 個人的、社会的、政策的関心等

0-3.その問題をどのように明ら
かにするのか?
<研究方法>
研究対象、研究方法の選択
 実行可能性と正当化
--- なぜ上記の選択を行ったのか
--- 「位置づけ」の明確化

0-4.どのような結果が予想され
るのか?
<研究内容>
研究仮説の設定
 どこまでやれば、当初提示した「研究課題」
に答えたことになるのか

1.研究計画とデータの対応
1-1.研究課題の解明や理論仮
説の検証に必要な変数が含ま
れているか
研究課題とデータの調査対象、時期、内容
等との整合性
 被説明変数、説明変数はそれぞれ何か
 データでわかること、わからないこと

1-2.データ上の変数と理論変
数の関連はどうか、どのような
測定尺度を用いるか
データ解釈の多義性(context依存性)
 主観と客観(共通尺度設定の困難さ)
 意識と行動

2.データの収集、利用
2-1.自分でデータを集める
調査対象の選定、協力獲得
 調査票の設計
 調査票の配布、回収、点検
 使用する統計ソフトに応じたデータの入力

2-2.既存データを利用する
官庁統計調査の結果報告書
 各種統計調査の個票データ(マイクロ・デー
タ) --- 日本では「統計法」の制約

*東大社研データ・アーカイブ
*ミシガン大学データ・アーカイブ
各種業務統計の利用(企業の人事データ
等)
 使用する統計ソフトに応じたデータの変換

3.データのチェック、検討
3-1.サンプルの特性
調査対象、抽出法
 サンプル・サイズ、回収率
 標本誤差と非標本誤差
 サンプル・セレクション・バイアス

3-2.欠損値、誤記入値、異常値
変数の特性値(特に最大値・最小値)、分布
状況をチェック
 サンプルから除外、または置き換え

3-3.各変数の特性値、変数間
の相関関係
データの特徴を掴んだり、モデル推計に用
いる変数の選択に有効
 データ・マイニング、プリテスト --- pros
and cons

4.データの分析 --- 統計手法
の利用
4-1.記述統計 --- サンプル・
データの「縮約」
代表値(平均、最大・最小値、n分位数、中
位数、最頻値)
 ばらつき(標準偏差、範囲、変動係数、n分
位分散係数)
 ゆがみ(歪度)
 相関係数
 グラフの活用

4-2.推測統計 --- サンプル・
データから「真の特性」を推測
確率論が基礎
 母集団の分布、標本、標本平均の分布
 それぞれの特性値(平均と分散)
 推定(点推定、区間推定、標準誤差)
 検定(帰無仮説と対立仮説、p-値)
 ランダム・サンプリング、ランダム・アサイン
メントの重要性

4-3.応用例
クロス集計表
 平均値の差の検定
 線形回帰分析
 プロビット・モデル
・・・

参考文献
統計ソフトの案内
エクセル統計2000
 SPSS
 STATA
・ ・ ・
