平成 26 年度 計量経済分析演習 「 R による計量経済分析 (3)」 . ∼ R による重回帰分析 ∼ 原 尚幸 . 新潟大・経済 http://www.econ.niigata-u.ac.jp/˜hara/grad-ecm/ [email protected] H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 1 / 56 Contents 1 都道府県別コンビニ数のデータ 記述統計 回帰分析 2 物価と為替レート の関係 3 賃金関数の推定 4 たばこの価格と消費量のデータ 5 レポート 課題 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 2 / 56 Outline 1 都道府県別コンビニ数のデータ 記述統計 回帰分析 2 物価と為替レート の関係 3 賃金関数の推定 4 たばこの価格と消費量のデータ 5 レポート 課題 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 3 / 56 Outline 1 都道府県別コンビニ数のデータ 記述統計 回帰分析 2 物価と為替レート の関係 3 賃金関数の推定 4 たばこの価格と消費量のデータ 5 レポート 課題 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 4 / 56 データのダウンロード 講義のサイト からデータ”cv.csv” をダウンロード して Rdata に保存 http://www.econ.niigata-u.ac.jp/˜hara/grad-ecm/ H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 5 / 56 データと分析の目的 都道府県別のコンビニの数とその要因と 考えられる変数のデータ (2005 年) このデータを用いてコンビニ件数を説明 する最適なモデルの探索 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 6 / 56 データに含まれる変数 car : 1000 人あたりの自家用車の台数 conv : コンビニ件数 divorce : 離婚率 gpp : 県内総生産額 (億円) gsm : 総合スーパーの件数 (イオンなど ) income : 1ヶ月の平均月収 (勤労者世帯のみ) nm_m_30 : 未婚者割合 (30∼34 歳男性) nm_f_30 : 未婚者割合 (30∼34 歳女性) pop : 人口 (1000 人) sm : 専門スーパーの件数 (ウオロク , ニト リなど ) w_pop : 生産年齢人口割合 (15∼64 歳) H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 7 / 56 データの読み込み データをオブジェクト cvdata に読み込む > cvdata <- read.csv("D:/Rdata/cv.csv") pop, gpp, conv のデータを cvdata3 に代入 > cvdata3 <- cvdata[,c("pop","gpp","conv")] H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 8 / 56 基礎統計量の計算 gpp の最小値, 最大値, 平均値, 中央値, 四分位点 を計算 > gpp <- cvdata$gpp 最小値:min(gpp) 最大値:max(gpp) 平均値:mean(gpp) 中央値:median(gpp) 四分位点:quantile(gpp) これらをまとめて計算 > summary(gpp) H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 9 / 56 基礎統計量の計算 gpp の分散・標準偏差を計算 不偏分散:var(gpp) 標準偏差:sd(gpp) データを X1 , . . . , Xn としたときに, 不偏分散 var, 標準偏差 sd はそれぞれ 1 ∑ ¯ 2, (Xi − X) n − 1 i=1 n H. Hara (Niigata U.) R による計量経済分析 1 ∑ ¯ 2 (Xi − X) n − 1 i=1 n Nov 11-, 2014 10 / 56 基礎統計量の計算 pop, gpp, conv の基本統計量を計算 > summary(cvdata3) pop gpp Min. : 607 Min. : 20057 1st Qu.: 1164 1st Qu.: 37327 Median : 1753 Median : 59248 Mean : 2718 Mean :109823 3rd Qu.: 2762 3rd Qu.:104927 Max. :12577 Max. :922694 H. Hara (Niigata U.) R による計量経済分析 conv Min. : 142.0 1st Qu.: 366.5 Median : 493.0 Mean : 909.3 3rd Qu.: 896.5 Max. :5453.0 Nov 11-, 2014 11 / 56 基本統計量の計算 pop, gpp, conv の分散と共分散を計算 > var(cvdata3) pop gpp conv pop 6739226 356392802 2518575.1 gpp 356392802 21998634289 141292516.9 conv 2518575 141292517 991169.4 分散共分散行列 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 12 / 56 基本統計量の計算 pop, gpp の相関係数を計算 > cor(pop,gpp) [1] 0.9256057 pop, gpp, conv の相関係数をまとめて計算 > cor(cvdata3) pop gpp conv pop 1.0000000 0.9256057 0.9744868 gpp 0.9256057 1.0000000 0.9568577 conv 0.9744868 0.9568577 1.0000000 この行列を相関行列という. H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 13 / 56 Outline 1 都道府県別コンビニ数のデータ 記述統計 回帰分析 2 物価と為替レート の関係 3 賃金関数の推定 4 たばこの価格と消費量のデータ 5 レポート 課題 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 14 / 56 単回帰モデル コンビニ数を被説明変数, 人口を説明変数とした 単回帰モデルを OLS で推定する. convi = α + βpopi + ui コンビニ数は人口に比例することが予想できる. ⇒β>0 まずは縦軸:コンビニ数, 横軸:人口でプロット . > plot(conv ˜ pop, data = cvdata) > H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 15 / 56 3000 0 1000 2000 conv 4000 5000 推定結果 2000 4000 6000 8000 10000 12000 pop 単回帰モデルがよくあてはまりそうだ H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 16 / 56 単回帰分析 OLS で推定 > sr <- lm(conv ˜ pop, data=cvdata) > result.sr <- summary(sr) > result.sr 推定結果 > result.sr$coefficients Estimate Std. Error t value Pr(>|t|) (Intercept) -106.6232310 47.98637570 -2.221948 3.135850e-02 pop 0.3737187 0.01283136 29.125422 7.649012e-31 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 17 / 56 推定結果 散布図に推定直線を引く > abline(sr) R2 3000 0 1000 2000 conv 4000 5000 > result.sr$r.squared [1] 0.9496244 2000 4000 6000 8000 10000 12000 pop H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 18 / 56 推定結果 残差二乗和の計算 > rd <- sr$residuals > rss <- sum(rdˆ2) > rss [1] 2296813 > rd : 残差ベクト ル (残差の系列) sum(rdˆ2) : 残差二乗和 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 19 / 56 重回帰モデル コンビニ数を被説明変数とし 人口 自家用自動車台数 女性未婚者割合 を説明変数とした重回帰モデルを OLS で推定. convi = α + β2 popi + β3 cari + β4 nm_f_30i + ui β2 > 0, β3 > 0, β4 > 0 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 20 / 56 重回帰分析 OLS で推定 > mr <- lm(conv ˜ pop + car + nm_f_30, data=cvdata) > result.mr <- summary(mr) > result.mr H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 21 / 56 推定結果 推定結果の見方は単回帰モデルのときと同じ 回帰係数 > result.mr$coefficients Estimate Std. Error t value Pr(>|t|) (Intercept) -2355.8703190 652.1889897 -3.612251 7.890445e-04 pop 0.3814832 0.0161185 23.667415 2.744634e-26 car 2.1778204 0.7345106 2.964995 4.922102e-03 nm_f_30 47.1853806 14.0482351 3.358812 1.648456e-03 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 22 / 56 推定結果 result.mr に含まれる情報 > attributes(result.mr) $names [1] "call" "terms" [4] "coefficients" "aliased" [7] "df" "r.squared" [10] "fstatistic" "cov.unscaled" "residuals" "sigma" "adj.r.squared" $class [1] "summary.lm" fstatistic : H0 : β1 = β2 = β3 = 0 の検定の F 統計量 adj.r.squared : 自由度調整済 R2 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 23 / 56 演習 1:線形制約の検定 演習 1 重回帰モデル convi = α + β2 popi + β3 cari + β4 nm_f_30i + ui において, H0 : β3 = β4 = 0 の線形制約の検定を行え. F 統計量 F の F (a, b) 分布における p 値の計算は 1 − pf(F, a, b) . pf() : 下側パーセント 点の計算 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 24 / 56 パッケージ ”AER”のインスト ール Kleiber and Zeileis の教科書の付属のパッケージ パッケージをインスト ールして読み込む > install.packages("AER") > library("AER") R には AER に限らずさまざまなパッケージが用意 されている. H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 25 / 56 線形制約の検定 線形制約の検定は AER に組み込まれている linear.hypothesis() という関数を用いてもできる. > lh <- linear.hypothesis(mr,c("car=0","nm_f_30=0")) linear.hypothesis(H1 の推定結果, 線形制約) H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 26 / 56 線形制約の検定 > lh Linear hypothesis test Hypothesis: car = 0 nm_f_30 = 0 Model 1: restricted model Model 2: conv ˜ pop + car + nm_f_30 Res.Df RSS Df Sum of Sq F Pr(>F) 1 45 2296813 2 43 1783227 2 513586 6.1922 0.004333 ** --Signif. codes: 0 ‘ *** ’ 0.001 ‘ ** ’ 0.01 ‘ * ’ 0.05 ‘ . ’ 0.1 ‘ H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 ’1 27 / 56 AIC, BIC の計算 AIC, BIC は回帰分析の結果からそれぞれ AIC(mr), BIC(mr) によって計算できる > AIC(mr) [1] 638.9382 > BIC(mr) [1] 648.189 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 28 / 56 複数のモデルの推定 方法 1 : 今までの作業をくりかえす ひとつひとつモデルを手作業で推定していく このような方法を対話式という 方法 2 : バッチファイルを用いる 必要なコマンド をファイルに書きこむ 結果をまとめて最後に出力するコマンド も ファイルに書いておく ファイルを実行する このようなファイルをバッチファイルという H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 29 / 56 バッチファイルによる方法 ファイル → 新しいスクリプト エディターに次のように書きこむ cvdata <- read.csv("D:/Rdata/cv.csv") model1 <- lm(conv ˜ pop + car + nm_f_30, data=cvdata) aic1 <- AIC(model1) model2 <- lm(conv ˜ pop + gpp + divorce, data=cvdata) aic2 <- AIC(model2) model3 <- lm(conv ˜ pop + sm + w_pop, data=cvdata) aic3 <- AIC(model3) print(c(aic1,aic2,aic3)) 適当なファイル名で適当な場所に保存 編集 → 全て実行 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 30 / 56 演習 2:コンビニ件数のモデル 演習 2 すべての変数を用いてコンビニ件数のモデルとし て, AIC, あるいは BIC の意味で最適なものを探索 し , 結果選択されたモデルについて考察せよ. . H. Hara (Niigata U.) R による計量経済分析 .Nov 11-, 2014 31 / 56 Outline 1 都道府県別コンビニ数のデータ 記述統計 回帰分析 2 物価と為替レート の関係 3 賃金関数の推定 4 たばこの価格と消費量のデータ 5 レポート 課題 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 32 / 56 データのダウンロード 講義のサイト からデータ”cpi.csv” をダウンロード して Rdata に保存 http://www.econ.niigata-u.ac.jp/˜hara/grad-ecm/ H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 33 / 56 データと分析の目的 1973 年∼2013 年までの日本の . . . 1 2 . 3 CPI : 消費者物価指数 EXP : 円 /ド ルレート WAGE : 賃金指数 データ元 . . 1 消費者物価指数:総務省統計局 http://www.stat.go.jp/data/cpi/ 2 円 /ド ルレート :日銀時系列データ検索サイト http://www.stat-search.boj.or.jp/ . . 3 賃金指数 : 毎月勤労統計調査 (厚労省) http://www.mhlw.go.jp/toukei/list/30-1.html 長期時系列表 就業形態別現金給与総額 就業形態計 (30 人以上) . H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 34 / 56 データの読み込み データを cpidata に読み込む > cpidata <- read.csv("D:/Rdata/cpi.csv") 各変数をオブジェクト に入力 > cpi <- cpidata$CPI > exr <- cpidata$EXR > wage <- cpidata$WAGE H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 35 / 56 物価と為替レート の関係 通常の経済理論によれば・ ・ ・ 円高 (ド ル安) ⇒ 輸入品物価の下落 ⇒ 国産品の物価も下落 円高 (ド ル安) ⇔ 円 /ド ルレート は小 円 /ド ルレート と消費者物価指数は比例的であること が予想できる cpii : 消費者物価指数 (CPI), exri : 円 /ド ルレート cpii = α + βexpi + ui という単回帰モデルを推定すると , β > 0 となるはず . H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 36 / 56 単回帰分析 OLS で推定 > cpi.sr <- lm(cpi ˜ exr) > result.sr <- summary(cpi.sr) 散布図と推定直線を描く > plot(cpi ˜ exr) > abline(cpi.sr,col=’’red’’) H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 37 / 56 推定結果 βˆOLS < 0 で有意 理論が誤りなのか? cpi 40 50 60 70 80 90 100 Estimate Std. Error t value Pr(>|t|) (Intercept) 123.89027 2.87927 43.03 < 2e-16 *** exr -0.21354 0.01672 -12.77 1.65e-15 *** 100 150 200 250 300 exr H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 38 / 56 物価と為替レート の関係 物価は為替レート だけでなく他の要因にも依存 賃金指数 (単位時間当の賃金を指数化したもの) 賃金率高 → 物価上昇 WAGEi : i 年の賃金指数 cpii = α + β2 exri + β3 wagei + ui を推定してみよ H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 39 / 56 重回帰分析 OLS で推定 > cpi.mr <- lm(cpi ˜ exr + wage) > result.mr <- summary(cpi.mr) > result.cpi$coefficients 推定結果 Estimate Std. Error t value Pr(>|t|) (Intercept) 18.12786174 5.99872038 3.0219548 4.478012e-03 exr 0.00919046 0.01364285 0.6736465 5.046132e-01 wage 0.78348265 0.04387526 17.8570502 4.471507e-20 βˆ2 > 0 単回帰モデルは過少定式化だったことが疑われる H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 40 / 56 演習 3:モデルの評価 演習 3 推定した 2 つのモデルの AIC, BIC を計算して, そ の結果について考察せよ. . . H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 41 / 56 Outline 1 都道府県別コンビニ数のデータ 記述統計 回帰分析 2 物価と為替レート の関係 3 賃金関数の推定 4 たばこの価格と消費量のデータ 5 レポート 課題 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 42 / 56 データのロード R には多数のサンプルデータが用意されている. そのリスト は > data() で見ることができる. AER の CPS1988 をロード > data(CPS1988) > CPS1988 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 43 / 56 CPS1988 データ Current population survey 1988 in US 18 歳∼70 歳で $5 以上の収入のある 28,155 人の 男性の wage : 賃金 education : 教育年数 experience : 就業年数 ethnicity : 人種 (白人 or 黒人) smsa : 居住地が大都市統計地域か否か region : 居住地域 (北西部, 中西部, 南部 or 西部) parttime : 常勤 or 非常勤 下の 4 つは質的変数 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 44 / 56 賃金関数の推定 以下のモデルを推定してみよう. log(wage) = α + β2 experience + β3 experience2 + β4 education + β5 ethnicity + ui > cps_lm <- lm(log(wage) ˜ experience + I(experienceˆ2) + education + ethnicity, data=CPS1988) > H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 45 / 56 推定結果 > result.cps_lm <- summary(cps_lm) > result.cps_lm$coefficients Estimate Std. Error t value Pr(>|t|) (Intercept) 4.321394996 1.917421e-02 225.37534 0.000000e+00 experience 0.077473231 8.800466e-04 88.03310 0.000000e+00 I(experienceˆ2) -0.001316066 1.898751e-05 -69.31223 0.000000e+00 education 0.085672819 1.272186e-03 67.34298 0.000000e+00 ethnicityafam -0.243364296 1.291812e-02 -18.83898 1.104188e-78 > ethnicity は { ethnicityafam = 1, 黒人 0, 白人 というダミー変数に変換される. H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 46 / 56 賃金関数の推定 以下のモデルを推定してみよう. log(wage) = α + β2 experience + β4 education + ui > cps_lm2 <- lm(log(wage) ˜ experience + education, data=CPS1988) > H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 47 / 56 anova を用いた線形制約の検定 H0 : β3 = β5 = 0 の検定 > anova(cps_lm2,cps_lm) Analysis of Variance Table Model 1: log(wage) ˜ experience + education Model 2: log(wage) ˜ experience + I(experienceˆ2) + education + ethnicity Res.Df RSS Df Sum of Sq F Pr(>F) 1 28152 11357.5 2 28150 9598.6 2 1758.9 2579.2 < 2.2e-16 *** --Signif. codes: 0 ‘ *** ’ 0.001 ‘ ** ’ 0.01 ‘ * ’ 0.05 ‘ . ’ 0.1 ‘ 1 > ’ RRSS = 11357.5, U RSS = 9598.6 RRSS − U RSS = 1758.9 F = 2579.2 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 48 / 56 演習 4:賃金関数の推定 演習 4 他の変数も用いて, 賃金関数として適切なモデル を探索し , 結果について考察せよ. . region を用いると, 3 つ以上のグループを持つ ダミー変数の変換のされ方がわかる. . H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 49 / 56 Outline 1 都道府県別コンビニ数のデータ 記述統計 回帰分析 2 物価と為替レート の関係 3 賃金関数の推定 4 たばこの価格と消費量のデータ 5 レポート 課題 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 50 / 56 たばこ消費の価格弾性値の推定 講義のサイト からデータ”US-CigarCons.csv” を DL して, D:/Rdata/に保存 http://www.econ.niigata-u.ac.jp/˜hara/grad-ecm/ H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 51 / 56 たばこ消費の価格弾性値の推定 1985 年から 1995 年までのアメリカの 48 州 (アラ スカ, ハワイ以外) のたばこの価格と消費量に関す るデータ アメリカは州ごとにたばこ税も消費税も異なる たばこ消費量の価格弾性値が推定できる データの出典は Stock and Waton の計量経済の 教科書のサポート サイト http://wps.aw.com/aw_stock_ie_3/178/45691/11696965. cw/index.html H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 52 / 56 データに含まれる変数 state : 州 year : 年 (1985∼1995) cpi : 消費者物価指数 pop : 州の人口 packpc : 一人当の消費量 (パック数) income : 州の総個人所得 tax : excise tax(たばこ税, $ 0.01) avgprs : たばこ 1 パックの平均価格 (含消費税, $ 0.01) taxs : 消費税 (含たばこ税, $ 0.01) H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 53 / 56 演習 5:たばこ消費の価格弾性値の推定 演習 5 1 弾性値モデル log packpci = α + β log avgprs + ui 2 を推定して, 結果について考察せよ. 他に説明変数を加えて, AIC, BIC の意味でより好 ましいモデルを探索し , 結果選ばれたモデルに基 づいて, たばこ消費と価格の関係について考察 . せよ. H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 54 / 56 Outline 1 都道府県別コンビニ数のデータ 記述統計 回帰分析 2 物価と為替レート の関係 3 賃金関数の推定 4 たばこの価格と消費量のデータ 5 レポート 課題 H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 55 / 56 課題 課題 Baltagi の教科書 p.90 の問 15 を R を用いて解答 せよ データは講義のサイト の usgas.csv を用いよ. Baltagi の教科書 p.90 の問 16 を R を用いて解答 せよ. データは講義のサイト の natural.csv を用いよ. . H. Hara (Niigata U.) R による計量経済分析 Nov 11-, 2014 56 / 56
© Copyright 2024 ExpyDoc