パネル・データの分析 内容 • パネル・データとは • パネル・データの分析方法 – fixed effects model • ダミー変数による方法,階差方程式による方法 – random effects model • パネル分析の実際 – データ・セットの作成 – 推定 パネル・データとは • クロスセクション・データ • 時系列データ • パネル・データ – クロスセクション・データ ×時系列 • クロスセクションデータを時系列的にプールしたデータ – 例) • 都道府県別データ(県民所得,物価,地価等のデータ)を数 年分あつめたデータ • 個票データ×時系列 (調査対象の個人,世帯を数年にわ たって追跡したデータ) • balanced panel と unbalanced panel パネル・データとは(2) nr wagepan.raw 賃金や労働時 間についてのパ ネル・データ 個人の識別 番号 year black 13 1980 13 1981 13 1982 13 1983 13 1984 13 1985 13 1986 13 1987 17 1980 17 1981 17 1982 17 1983 17 1984 17 1985 17 1986 17 1987 18 1980 18 1981 18 1982 18 1983 exper 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 hisp 1 2 3 4 5 6 7 8 4 5 6 7 8 9 10 11 4 5 6 7 hours lwage married 0 2672 1.19754 0 0 2320 1.85306 0 0 2940 1.344462 0 0 2960 1.433213 0 0 3071 1.568125 0 0 2864 1.699891 0 0 2994 -0.72026 0 0 2640 1.669188 0 0 2484 1.675962 0 0 2804 1.518398 0 0 2530 1.559191 0 0 2340 1.72541 0 0 2486 1.622022 0 0 2164 1.608588 0 0 2749 1.572385 0 0 2476 1.820334 0 0 2332 1.515963 1 0 2116 1.735379 1 0 2500 1.631744 1 0 2474 1.998229 1 特定の個人に ついての複数 年のデータ: 人種ダミー,経 験年数,労働 時間,賃金,結 婚ダミー 時間を通じて変 化しない変数も ある(人種ダ ミー等)。 労働時間,賃 金は年によって 異なる値。 パネル・データ利用の利点 • サンプル数の増加,変数の変動性が大きくなる – 推計値の信頼度が高まる • クロスセクション・データやマクロ時系列データでは 個々の主体の異質性をうまく捉えられない。 – パネル・データを利用することで克服できる場合もある • 動学的効果を捉えることができるかもしれない – マクロ時系列データ • 集計された経済主体の行動(個々の主体の意思決定がうまく捉 えられない) – 社会資本整備の効果地価に反映される社会資本整 備計画のアナウンスの前後のデータがあれば パネル・データの分析方法 • 次のモデルを考える。 – i : 個人i – t : 時点t – yit : 被説明変数 個人i,時点t – xj,it : 説明変数xj(j=1,2,...,k) 個人i,時点t – uit : 誤差項 個人i,時点t yit 0 1 x1,it 2 x2,it k xk ,it uit uit の想定 pooling dataでのOLS, fixed effects model, random effects model fixed effects model yit 0 1 x1,it 2 x2,it k xk ,it uit uit i vit i : individual effect Evit 0, varvit , covvit , x j ,it 0 2 but covi , xi ,kt 0 covuit , x j ,it 0 individual effects は個人iの説明変数と相関があるかもしれない 例) 賃金方程式の推計 個人の生来の資質は観察できない individual effects に反映 しかし,個人の生来の資質は学歴と相関があるかもしれない random effects model yit 0 1 x1,it 2 x2,it k xk ,it uit uit i vit i : individual effect covi , xi ,kt 0 fixed effects model random effects model は ミスリーディングな用語 もともとは,文字通りの意味:fixed effects は 非確率変数(固定値),random effectsは確率 変数という想定だった。 パネル分析 その他 • 一般的には,individual effects は個々の主体(ク ロスセクション)に関連 • 場合によっては,時点特有のショックをコント ロールするために,時点に関連させる場合もあ る • unobserved effects model – 個々の主体に特徴的な,観察されない変数の影響を うまく処理するための手法 – 狭い意味でのパネル・データの分析に限定されない fixed effects model yit 0 1 x1,it 2 x2,it k xk ,it i vit 各変数のtに関しての平均を求め,平均からの乖離をとる yit 1 x1,it 2 x2,it k xk ,it vit yit yi ,t yi , xit xi ,t xi あるいは,1階の階差モデルを考える yit 1x1,it 2 x2,it k xk ,it vit where yit yit yit 1 , x j ,it x j ,it x j ,it 1 こうした変形で,individual effectを表す項は消去され,他のパラメータを推 定できる。個別の主体 i ごとのダミー変数を作って,推計するのと同じ。 (注意)t=1,2,..,T ; i= 1,2,..,nのとき,fixed effects modelの自由度は n(T-1) – k であることに注意: i ごとの平均を求めるために,その分自由 度は失われる パネル分析の実際 • wagepan.raw をEviews に読み込む • 賃金と教育等の関係についてのパネル・データ – クロスセクションデータでimport,その後,パネル・ データに変換する方法 – パネル・データとしてimportする方法 • 回帰式の推定 – 単純な回帰(プールされたデータで) – fixed effects model • ダミー変数を用いる • 1階の階差方程式 – random effects model wagepan.des 4360個のオブ ザベーション =545のクロス セクション×8 年 最初に空のデータセットを 作成 Eviewsを起動し,cross section data として読み込 むための準備を行う menuからFile New Workfile を選択 左の画面で workfile structure typeとし てUnstructured/ Undated を選択し,Observationsを 4360とする OKをクリック これで空のワークファイル が完成 wagepan.desから変数名を ペースト テキストデータ のインポート 最初に wagepan.desを 秀丸等で読み込 んでおく(変数名 をコピーするた め) File Import Read と進んで, wagepan.rawを 読み込む 左上の欄(赤で 囲った部分)に 変数名をペース ト OKをクリックして データセット読み 込みの完了 うまく読み込 むことができ れば左のよう になる クロスセクション データをパネル データに変換す るためには,こ のあたりをクリッ クするか,menu からProc Structute/ Resize Current.... を選択 データセットが できたら適当 な名前をつけ て保存する 注意: Eviews 7の画面なの で,バージョン によってはメ ニューや画面 が異なること がある パネル・データへの変換 : 前頁の操作を行うと次の画面が表れる workfile structure で Dated Panelを 選択 個人を識別す る変数を入力 時点を表 す変数を 入力 Frequency や Start date , End dateも入 力した方がいい場合 もある(このデータで は自動的に判別さ れた) パネルデータと して識別された 1980-87年 ×545人のデー タ=4360obs パネルデータ から通常の undated cross sectionデータ への変換もで きる Proc Structure/Resiz e ..とたどるか, 左の赤で囲っ た部分(Range あたり)をクリッ ク 最初からパネルデータとしてimportする方法 Workfile structure typeとし てBalanced Panelを選択 Frequency: Annualを選択 (データの期間の指定:月 次、四半期などあり) Start date, End date, No. of Cross sectionsを指 定 ここで用いるデータは、 1980年から1987年の データで、各年545の固 体のデータ 545 x 8 = 4360 obs. 最初からパネルデータとしてimportする方法(2) MenuからFile Import Read を選択し、 wagepan.rawを importする Wagepan.desから 変数名をコピーし てペースト Cross section id Date id は自動 的に作成される 最初からパネルデータとしてimportする方法(3) ここをクリックすれば、structure type を変更できる Cross section id が 作成された(nr と は別に) Date id が作成さ れた(yearとは 別に) パネル分析 パネル分析のオプ ションはこのタブか ら選択できる 左のような回帰式を 推計する パネル分析のオプション cross section None Fixed Effects Random Effects Period None Fixed Effects Random Effects が選択できる 次の方程式を推計 • wagepan.raw • lwage = f( educ, black, hisp, exper, married, union) – educ(教育年数), black(黒人ダミー), hisp(ヒス パニックダミー)は一定の値 – exper(labor market experience) • labor market から撤退していなければ(出産等?),基 本的にはyearと同じく,1年ずつ増えていく パネル分析 • 通常のOLS • プールデータでのOLSと同じ • Cross Section : None Period : Fixed – プールデータで年ダミーを入れたOLS • Cross Section : Fixed Period : None – プールデータで個人ダミーを入れたOLS – 普通のfixed effects model • Cross Section : Fixed Period : Fixed – 自由度が不足する • Cross Section : Radom Period : None – 普通のrandom effects model • Cross Section : Radom Period : Fixed OLS experを外したOLS OLS(2) experを説明変数 に加えた場合 OLS(3) 時点ダミー(d81d87)を加えた場合 period fixed effects model と同 じ Period : Fixed Effects Cross Section: None 前のモデルの固定効 果: estimation outputの画 面から view Fixed / Random Effects を選択していく cross section : Fixed Effects period: None 時間を通じて一 定の変数は説明 変数に加えるこ とはできない educ, 人種ダ ミー 1階の階差モデ ルと同じ cross section: random effects 問題1 • Crime2.raw – 46市の失業率(unem)と犯罪発生率(crmrte),1982年 と1987年 – crmrte を被説明変数,unemを説明変数にしてOLSを, 各年ごと,およびプールしたデータで行え。 – 各都市の犯罪発生率に結び付く観察不可能な変数 があるかもしれない。これを考慮して,fixed effects model でcrmrteとunemの関係を推計せよ(2時点の データなので,階差モデルで推計すればよい: crmrte,unemの2時点間の変化はデータセットに変数 として含まれている)。 問題2 • kielmc.raw – 1978年,81年の2時点のデータ – 1978年時点では焼却場の建設の噂なし,81年時点 ではあり(実際には85年に建設) 被説明変数: 住宅価格(rprice: 1978年実質) 説明変数: nearinc(住宅がゴミ焼却場の近くなら1), y81(81年なら1) y81* nearinc を説明変数にして,OLSを行え。 – 住宅の質(広さ,築年数等),住宅の周辺環境を表す その他の変数も住宅価格に影響を与える。このこと を考慮して(他の適切な説明変数を加えて),焼却場 建設の予定が住宅価格を低下させたかどうかを調べ よ。 問題3 • wagepan.raw • 1980年から87年の8時点のデータ • 賃金,教育年数,経験年数,人種ダミー,結婚ダミー,... 1. 次のモデルをpooled OLSで推定せよ 1. 被説明変数 lwage (賃金の対数値) 2. 説明変数 educ(教育年数), black(黒人ダミー), hisp (ヒスパニック・ダミー) 2. random effects model で推計し,pooled OLSとの結果 と比較せよ。 3. 説明変数を追加して,.1.と2.の回帰を行え 4. fixed effects model + フルセットの説明変数で回帰を 行え(注意:学歴,人種ダミー等を説明変数に加える ことはできない)。
© Copyright 2025 ExpyDoc