データと計量経済学について 宮﨑憲治 2015 年度前期 宮﨑憲治 データと計量経済学について 2015 年度前期 1 / 16 データ 計量経済学 (Econometrics) は, データをもちいて経済学を検証す る手法を研究する学問である. データ とは, 何らかの調査のための事実や資料のことであり, 複 数個の数値や事象で構成されている. 手法として統計学をもちいる. 統計学において, 調査対象を 母集団 (population) といい, 母集団の 一部をデータまたは標本 (sample) という. 数理統計学において, 母集団は確率にしたがう事象もしくは確率 変数であり, 標本はその実現した事象もしくは数値である. 実現した事象もしくは数値の個数は, 標本サイズまたは 観測数 (number of observations) といわれる. 母集団が k 個の確率変数なら, 観測数 (標本サイズ) n のもと, デ ータ (標本) は n × k の数値である. 宮﨑憲治 データと計量経済学について 2015 年度前期 2 / 16 データの種類 データには視点によって以下のように分類できる. 自分で実験してデータをつくりだせるかどうかによって, 実験デ ータと観測データにわけられる. 社会科学においては観測データが中心である. 観測数がどのように得られたかによって, 横断面データ, 時系列デ ータ, パネルデータにわけられる. 母集団が値をとるかどうかによって, 数値データとカテゴリカル データにわけられる. 宮﨑憲治 データと計量経済学について 2015 年度前期 3 / 16 データの種類 (観測数の得られかたによる分類) 複数個の主体の属性がある時点で観測できたとき, 横断面データ を構成する. ミクロデータともいわれる. 公表されたデータは, プライバシーの問題で集計データであること が多く, オリジナルのデータを入手するのが学生だと難しい. 例: ある年の上場企業の財務データ, ある時期に収集した労働者の 賃金および属性のデータ ある主体の属性が複数の時点で観測できたとき, 時系列データ を 構成する. マクロデータともいわれる. ミクロデータに比べ, 入手が容易であるが, 分析が難しい. 例: 国民経済計算, 株価データ 複数の主体の属性が複数の時点で観測できたとき, パネルデータ を構成する. 例: 複数年の上場企業の財務データ, 都道府県別データ, 国別マクロ データ 上記以外について, 日本でようやくデータの収集がはじまったば かり. 宮﨑憲治 データと計量経済学について 2015 年度前期 4 / 16 データの種類 (値をとるかどうかによる分類) とりうる値が数値のとき, 数値データ (numerical data) という. とりうる値がトビトビならば, 離散データ (discrete data) といい, そ うでなければ 連続データ (continuous data) という. 例: 海外旅行回数は離散データであり, 気温などは連続データであ る. 離散データで, 数学的にはトビトビに値をとっていても, その数が 多ければ連続データとして扱える. 例: 所得は 1 円単位なので厳密にいえば, 離散データとも考えられ るが, その取り得る値の数が無限にあり, 連続データと考えられる ことができる. とりうる値が数値でないとき, カテゴリカルデータ (Categorical data) という. 宮﨑憲治 データと計量経済学について 2015 年度前期 5 / 16 カテゴリカルデータ カテゴリカルデータのうち, 順序がつけられるものを 順序データ (ordinal data) といい, そうでないものを 名義データ (nominal data) という. 5 段階評価は順序データであり, 男女, 人種などは名義データで ある. 順序データはそれぞれのカテゴリーに数字をあてはめて, 離散デ ータとして扱える. 5 段階評価で, 評価 1 から 5 を離散データ 1 から 5 に割り当てるこ とができる. 名義データでカテゴリーの数が 2 つの場合, それぞれのカテゴリ ーに 0 と 1 を割り当てて, 離散データとして扱える. 男女かどうかで, 男性を 0, 女性を 1 とすれば, 2 つの数値をとる離 散データとすることができる. 逆に数値データを, 範囲を指定することでカテゴリカルデータに 変換することもできる. 年齢という数値データを 20 歳以上かどうかで, 成年かどうかのカ テゴリカルデータを作成することができる. 宮﨑憲治 データと計量経済学について 2015 年度前期 6 / 16 データ 1 2 3 4 5 6 7 8 9 10 11 12 13 14 wage education experience age ethnicity occupation 5.10 8 21 35 hispanic worker 6.67 12 1 19 cauc worker 4.00 12 4 22 cauc worker 7.50 12 17 35 cauc worker 13.07 13 9 28 cauc worker 4.45 10 27 43 cauc worker 19.47 12 9 27 cauc worker 13.28 16 11 33 cauc worker 8.75 12 9 27 cauc worker 11.35 12 17 35 cauc worker 11.50 12 19 37 cauc worker 6.50 8 27 41 cauc worker 6.25 9 30 45 cauc worker 19.98 9 29 44 cauc worker 宮﨑憲治 データと計量経済学について 2015 年度前期 7 / 16 円グラフ (pie chart / circle graph) management sales worker office technical services 宮﨑憲治 データと計量経済学について 2015 年度前期 8 / 16 0 50 100 150 棒グラフ (bar graph) worker 宮﨑憲治 technical services office データと計量経済学について sales management 2015 年度前期 9 / 16 ヒストグラム (histogram) 100 50 0 Frequency 200 Histogram of CPS1985[, "wage"] 0 10 20 30 40 wage 宮﨑憲治 データと計量経済学について 2015 年度前期 10 / 16 散布図 (scatter plot) ● ●● ● ●● ● ● ●● ● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ●●● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ● ●●● ● ● ●● ●● ●●● ● ● ●●● ● ●● ●●● ● ●● ●●● ● ●● ● ●● ●●● ●●● ●● ● ●●● ●●●● ● ●● ● ● ●● ● ●● ● ●●●● ● ●● ●●● ● ●● ●● ●●● ● ●● ●●● ● ●●● ●●●● ● ● ● ●● ●●● ● ●● ●● ●● ●● ● ●● ●●● ● ●● ●● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ●●● ● ●●●●●●●●●●● ●●● ● ●● ●●●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ● ● ● ● ● ● ● ● ● ●●● ●●●●● ●●● ●● ● ●● ●●●● ●● ●● ● ●● ●●●● ●●● ●● ● ● ● ●● ●● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●●● ● ●● ●●● ●● ●●●●● ●●●●●● ● ●●● ●●● ●● ●●●●●● ●● ● ● ● ● ● 10 20 ● 0 wage 30 40 ● ●● ●● 20 30 40 50 60 age 宮﨑憲治 データと計量経済学について 2015 年度前期 11 / 16 80 100 60 40 20 Output 折線グラフ (Line chart) 1950 1960 1970 1980 1990 2000 Time 宮﨑憲治 データと計量経済学について 2015 年度前期 12 / 16 どのデータにどのグラフで整理するか? 名義データは円グラフや棒グラフでまとめられる. 円グラフは相対的な割合しかわからないので, 学術的にあまり使わ れない. 順序データは, とりうる値の数が少なければ円グラフや棒グラフ で, 多ければヒストグラムでまとめられる. 離散データは, とりうる値の数が少なければ棒グラフで, 多ければ ヒストグラムでまとめられる. 連続データ (横断面データ) はヒストグラムでまとめられる. 2 つの連続データ (横断面データ) は散布図でまとめられる. 時系列データは折線グラフでまとめられる. 3 次元グラフは学術的にあまり使われない. 宮﨑憲治 データと計量経済学について 2015 年度前期 13 / 16 計量経済学 計量経済学はデータをもちいて, 経済学を検証する手法を研究す る学問である. データとして観測データであることが多く, 観測データゆえの問 題を考慮している分析手法が開発されている. 経済学の検証として, 因果関係を検証することが多く, そのための モデルとして回帰モデルという線形モデルがよく使われる. 回帰モデルをもちいた分析を, 回帰分析 (Regression Analysis) とい う. 授業では, 横断面データを中心に講義する. 前期予定: 1 2 3 4 確率変数を考えないデータ分析および回帰分析 確率変数を考える 1 変数データ分析 被説明変数が確率変数で, 説明変数が確率変数でない回帰分析 被説明変数と説明変数が確率変数である回帰分析 講義ノートは以下でダウンロード可能 http://www.t.hosei.ac.jp/~miya_ken/shutodai/ 宮﨑憲治 データと計量経済学について 2015 年度前期 14 / 16 確率変数を考えないデータ分析および回帰分析 1 データ分析 平均・分散・標準偏差 尖度・歪度 共分散・相関係数 2 単回帰分析 単回帰モデル 最小二乗法 残差二乗和・回帰変動・全変動 決定係数 3 重回帰分析 重回帰モデル FWL 定理 修正済み決定係数 多重共線性 4 EXCEL の実習 宮﨑憲治 データと計量経済学について 2015 年度前期 15 / 16 参考書 鳥居泰彦『はじめての統計学』日本経済新聞社 小島寛之『完全独習統計学入門』ダイヤモンド社 山本拓・竹内明香『入門計量経済学』新世社 白砂堤津耶『初歩からの計量経済学』日本評論社 山本拓『計量経済学』新世社 森田果『実証分析入門』日本評論社 アングリスト・ピスケ『「ほとんど無害」な計量経済学』エヌティ ティ出版 Stock and Watson, Introduction to Econometrics, Pearson Edu Wooldridge, Introductory Econometrics, South-Western Pub 宮﨑憲治 データと計量経済学について 2015 年度前期 16 / 16
© Copyright 2024 ExpyDoc