データと計量経済学について

データと計量経済学について
宮﨑憲治
2015 年度前期
宮﨑憲治
データと計量経済学について
2015 年度前期
1 / 16
データ
計量経済学 (Econometrics) は, データをもちいて経済学を検証す
る手法を研究する学問である.
データ とは, 何らかの調査のための事実や資料のことであり, 複
数個の数値や事象で構成されている.
手法として統計学をもちいる.
統計学において, 調査対象を 母集団 (population) といい, 母集団の
一部をデータまたは標本 (sample) という.
数理統計学において, 母集団は確率にしたがう事象もしくは確率
変数であり, 標本はその実現した事象もしくは数値である.
実現した事象もしくは数値の個数は, 標本サイズまたは 観測数
(number of observations) といわれる.
母集団が k 個の確率変数なら, 観測数 (標本サイズ) n のもと, デ
ータ (標本) は n × k の数値である.
宮﨑憲治
データと計量経済学について
2015 年度前期
2 / 16
データの種類
データには視点によって以下のように分類できる.
自分で実験してデータをつくりだせるかどうかによって, 実験デ
ータと観測データにわけられる.
社会科学においては観測データが中心である.
観測数がどのように得られたかによって, 横断面データ, 時系列デ
ータ, パネルデータにわけられる.
母集団が値をとるかどうかによって, 数値データとカテゴリカル
データにわけられる.
宮﨑憲治
データと計量経済学について
2015 年度前期
3 / 16
データの種類 (観測数の得られかたによる分類)
複数個の主体の属性がある時点で観測できたとき, 横断面データ
を構成する.
ミクロデータともいわれる.
公表されたデータは, プライバシーの問題で集計データであること
が多く, オリジナルのデータを入手するのが学生だと難しい.
例: ある年の上場企業の財務データ, ある時期に収集した労働者の
賃金および属性のデータ
ある主体の属性が複数の時点で観測できたとき, 時系列データ を
構成する.
マクロデータともいわれる.
ミクロデータに比べ, 入手が容易であるが, 分析が難しい.
例: 国民経済計算, 株価データ
複数の主体の属性が複数の時点で観測できたとき, パネルデータ
を構成する.
例: 複数年の上場企業の財務データ, 都道府県別データ, 国別マクロ
データ
上記以外について, 日本でようやくデータの収集がはじまったば
かり.
宮﨑憲治
データと計量経済学について
2015 年度前期
4 / 16
データの種類 (値をとるかどうかによる分類)
とりうる値が数値のとき, 数値データ (numerical data) という.
とりうる値がトビトビならば, 離散データ (discrete data) といい, そ
うでなければ 連続データ (continuous data) という.
例: 海外旅行回数は離散データであり, 気温などは連続データであ
る.
離散データで, 数学的にはトビトビに値をとっていても, その数が
多ければ連続データとして扱える.
例: 所得は 1 円単位なので厳密にいえば, 離散データとも考えられ
るが, その取り得る値の数が無限にあり, 連続データと考えられる
ことができる.
とりうる値が数値でないとき, カテゴリカルデータ (Categorical
data) という.
宮﨑憲治
データと計量経済学について
2015 年度前期
5 / 16
カテゴリカルデータ
カテゴリカルデータのうち, 順序がつけられるものを 順序データ
(ordinal data) といい, そうでないものを 名義データ (nominal
data) という.
5 段階評価は順序データであり, 男女, 人種などは名義データで
ある.
順序データはそれぞれのカテゴリーに数字をあてはめて, 離散デ
ータとして扱える.
5 段階評価で, 評価 1 から 5 を離散データ 1 から 5 に割り当てるこ
とができる.
名義データでカテゴリーの数が 2 つの場合, それぞれのカテゴリ
ーに 0 と 1 を割り当てて, 離散データとして扱える.
男女かどうかで, 男性を 0, 女性を 1 とすれば, 2 つの数値をとる離
散データとすることができる.
逆に数値データを, 範囲を指定することでカテゴリカルデータに
変換することもできる.
年齢という数値データを 20 歳以上かどうかで, 成年かどうかのカ
テゴリカルデータを作成することができる.
宮﨑憲治
データと計量経済学について
2015 年度前期
6 / 16
データ
1
2
3
4
5
6
7
8
9
10
11
12
13
14
wage education experience age ethnicity occupation
5.10
8
21 35 hispanic
worker
6.67
12
1 19
cauc
worker
4.00
12
4 22
cauc
worker
7.50
12
17 35
cauc
worker
13.07
13
9 28
cauc
worker
4.45
10
27 43
cauc
worker
19.47
12
9 27
cauc
worker
13.28
16
11 33
cauc
worker
8.75
12
9 27
cauc
worker
11.35
12
17 35
cauc
worker
11.50
12
19 37
cauc
worker
6.50
8
27 41
cauc
worker
6.25
9
30 45
cauc
worker
19.98
9
29 44
cauc
worker
宮﨑憲治
データと計量経済学について
2015 年度前期
7 / 16
円グラフ (pie chart / circle graph)
management
sales
worker
office
technical
services
宮﨑憲治
データと計量経済学について
2015 年度前期
8 / 16
0
50
100
150
棒グラフ (bar graph)
worker
宮﨑憲治
technical
services
office
データと計量経済学について
sales
management
2015 年度前期
9 / 16
ヒストグラム (histogram)
100
50
0
Frequency
200
Histogram of CPS1985[, "wage"]
0
10
20
30
40
wage
宮﨑憲治
データと計量経済学について
2015 年度前期
10 / 16
散布図 (scatter plot)
●
●●
●
●●
●
●
●●
●
●● ●
●
●
●
●
●
●
●
●
●
● ●
● ●
● ● ●
●
●
● ●●
●
●
●
●●●
● ●
● ● ●● ●
●
●
●
●
●
●
●
●
●
●●●
● ●
●● ●●
●●● ●
●
●●●
● ●●
●●●
●
●●
●●●
●
●●
●
●●
●●● ●●● ●●
●
●●● ●●●●
●
●●
● ● ●●
●
●●
● ●●●● ●
●●
●●●
●
●●
●●
●●●
●
●●
●●●
● ●●●
●●●●
●
●
●
●●
●●●
●
●●
●●
●●
●●
●
●● ●●●
● ●●
●●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●●●
●
●●●●●●●●●●● ●●●
●
●●
●●●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●
●
●
●
●
●
●
●
●
●●●
●●●●●
●●● ●● ● ●● ●●●●
●●
●●
●
●●
●●●●
●●●
●●
●
●
●
●●
●●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●
●●●
●
●●
●●● ●● ●●●●●
●●●●●●
● ●●●
●●● ●● ●●●●●●
●●
●
●
●
●
●
10
20
●
0
wage
30
40
●
●●
●●
20
30
40
50
60
age
宮﨑憲治
データと計量経済学について
2015 年度前期
11 / 16
80 100
60
40
20
Output
折線グラフ (Line chart)
1950
1960
1970
1980
1990
2000
Time
宮﨑憲治
データと計量経済学について
2015 年度前期
12 / 16
どのデータにどのグラフで整理するか?
名義データは円グラフや棒グラフでまとめられる.
円グラフは相対的な割合しかわからないので, 学術的にあまり使わ
れない.
順序データは, とりうる値の数が少なければ円グラフや棒グラフ
で, 多ければヒストグラムでまとめられる.
離散データは, とりうる値の数が少なければ棒グラフで, 多ければ
ヒストグラムでまとめられる.
連続データ (横断面データ) はヒストグラムでまとめられる.
2 つの連続データ (横断面データ) は散布図でまとめられる.
時系列データは折線グラフでまとめられる.
3 次元グラフは学術的にあまり使われない.
宮﨑憲治
データと計量経済学について
2015 年度前期
13 / 16
計量経済学
計量経済学はデータをもちいて, 経済学を検証する手法を研究す
る学問である.
データとして観測データであることが多く, 観測データゆえの問
題を考慮している分析手法が開発されている.
経済学の検証として, 因果関係を検証することが多く, そのための
モデルとして回帰モデルという線形モデルがよく使われる.
回帰モデルをもちいた分析を, 回帰分析 (Regression Analysis) とい
う.
授業では, 横断面データを中心に講義する.
前期予定:
1
2
3
4
確率変数を考えないデータ分析および回帰分析
確率変数を考える 1 変数データ分析
被説明変数が確率変数で, 説明変数が確率変数でない回帰分析
被説明変数と説明変数が確率変数である回帰分析
講義ノートは以下でダウンロード可能
http://www.t.hosei.ac.jp/~miya_ken/shutodai/
宮﨑憲治
データと計量経済学について
2015 年度前期
14 / 16
確率変数を考えないデータ分析および回帰分析
1
データ分析
平均・分散・標準偏差
尖度・歪度
共分散・相関係数
2
単回帰分析
単回帰モデル
最小二乗法
残差二乗和・回帰変動・全変動
決定係数
3
重回帰分析
重回帰モデル
FWL 定理
修正済み決定係数
多重共線性
4
EXCEL の実習
宮﨑憲治
データと計量経済学について
2015 年度前期
15 / 16
参考書
鳥居泰彦『はじめての統計学』日本経済新聞社
小島寛之『完全独習統計学入門』ダイヤモンド社
山本拓・竹内明香『入門計量経済学』新世社
白砂堤津耶『初歩からの計量経済学』日本評論社
山本拓『計量経済学』新世社
森田果『実証分析入門』日本評論社
アングリスト・ピスケ『「ほとんど無害」な計量経済学』エヌティ
ティ出版
Stock and Watson, Introduction to Econometrics, Pearson Edu
Wooldridge, Introductory Econometrics, South-Western Pub
宮﨑憲治
データと計量経済学について
2015 年度前期
16 / 16