panel

パネル・データの分析
内容
• パネル・データとは
• パネル・データの分析方法
– fixed effects model
• ダミー変数による方法,階差方程式による方法
– random effects model
• パネル分析の実際
– データ・セットの作成
– 推定
パネル・データとは
• クロスセクション・データ
• 時系列データ
• パネル・データ
– クロスセクション・データ ×時系列
• クロスセクションデータを時系列的にプールしたデータ
– 例)
• 都道府県別データ(県民所得,物価,地価等のデータ)を数
年分あつめたデータ
• 個票データ×時系列 (調査対象の個人,世帯を数年にわ
たって追跡したデータ)
• balanced panel と unbalanced panel
パネル・データとは(2)
nr
wagepan.raw
賃金や労働時
間についてのパ
ネル・データ
個人の識別
番号
year
black
13 1980
13 1981
13 1982
13 1983
13 1984
13 1985
13 1986
13 1987
17 1980
17 1981
17 1982
17 1983
17 1984
17 1985
17 1986
17 1987
18 1980
18 1981
18 1982
18 1983
exper
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
hisp
1
2
3
4
5
6
7
8
4
5
6
7
8
9
10
11
4
5
6
7
hours
lwage
married
0
2672
1.19754
0
0
2320
1.85306
0
0
2940 1.344462
0
0
2960 1.433213
0
0
3071 1.568125
0
0
2864 1.699891
0
0
2994 -0.72026
0
0
2640 1.669188
0
0
2484 1.675962
0
0
2804 1.518398
0
0
2530 1.559191
0
0
2340
1.72541
0
0
2486 1.622022
0
0
2164 1.608588
0
0
2749 1.572385
0
0
2476 1.820334
0
0
2332 1.515963
1
0
2116 1.735379
1
0
2500 1.631744
1
0
2474 1.998229
1
特定の個人に
ついての複数
年のデータ:
人種ダミー,経
験年数,労働
時間,賃金,結
婚ダミー
時間を通じて変
化しない変数も
ある(人種ダ
ミー等)。
労働時間,賃
金は年によって
異なる値。
パネル・データ利用の利点
• サンプル数の増加,変数の変動性が大きくなる
– 推計値の信頼度が高まる
• クロスセクション・データやマクロ時系列データでは
個々の主体の異質性をうまく捉えられない。
– パネル・データを利用することで克服できる場合もある
• 動学的効果を捉えることができるかもしれない
– マクロ時系列データ
• 集計された経済主体の行動(個々の主体の意思決定がうまく捉
えられない)
– 社会資本整備の効果地価に反映される社会資本整
備計画のアナウンスの前後のデータがあれば
パネル・データの分析方法
• 次のモデルを考える。
– i : 個人i
– t : 時点t
– yit : 被説明変数 個人i,時点t
– xj,it : 説明変数xj(j=1,2,...,k) 個人i,時点t
– uit : 誤差項 個人i,時点t
yit   0  1 x1,it   2 x2,it     k xk ,it  uit
uit の想定  pooling dataでのOLS,
fixed effects model, random effects model
fixed effects model
yit   0  1 x1,it   2 x2,it     k xk ,it  uit
uit  i  vit
i : individual effect
Evit   0, varvit    , covvit , x j ,it   0
2
but covi , xi ,kt   0
 covuit , x j ,it   0
individual effects は個人iの説明変数と相関があるかもしれない
例) 賃金方程式の推計
個人の生来の資質は観察できない individual effects に反映
しかし,個人の生来の資質は学歴と相関があるかもしれない
random effects model
yit   0  1 x1,it   2 x2,it     k xk ,it  uit
uit  i  vit
i : individual effect
covi , xi ,kt   0
fixed effects model random effects model は
ミスリーディングな用語
もともとは,文字通りの意味:fixed effects は
非確率変数(固定値),random effectsは確率
変数という想定だった。
パネル分析 その他
• 一般的には,individual effects は個々の主体(ク
ロスセクション)に関連
• 場合によっては,時点特有のショックをコント
ロールするために,時点に関連させる場合もあ
る
• unobserved effects model
– 個々の主体に特徴的な,観察されない変数の影響を
うまく処理するための手法
– 狭い意味でのパネル・データの分析に限定されない
fixed effects model
yit   0  1 x1,it   2 x2,it     k xk ,it  i  vit
各変数のtに関しての平均を求め,平均からの乖離をとる
yit  1 x1,it   2 x2,it     k xk ,it  vit
yit  yi ,t  yi , xit  xi ,t  xi
あるいは,1階の階差モデルを考える
yit  1x1,it   2 x2,it     k xk ,it  vit
where yit  yit  yit 1 , x j ,it  x j ,it  x j ,it 1
こうした変形で,individual effectを表す項は消去され,他のパラメータを推
定できる。個別の主体 i ごとのダミー変数を作って,推計するのと同じ。
(注意)t=1,2,..,T ; i= 1,2,..,nのとき,fixed effects modelの自由度は
n(T-1) – k であることに注意: i ごとの平均を求めるために,その分自由
度は失われる
パネル分析の実際
• wagepan.raw をEviews に読み込む
• 賃金と教育等の関係についてのパネル・データ
– クロスセクションデータでimport,その後,パネル・
データに変換する方法
– パネル・データとしてimportする方法
• 回帰式の推定
– 単純な回帰(プールされたデータで)
– fixed effects model
• ダミー変数を用いる
• 1階の階差方程式
– random effects model
wagepan.des
4360個のオブ
ザベーション
=545のクロス
セクション×8
年
最初に空のデータセットを
作成
Eviewsを起動し,cross
section data として読み込
むための準備を行う
menuからFile New 
Workfile を選択
左の画面で
workfile structure typeとし
てUnstructured/ Undated
を選択し,Observationsを
4360とする OKをクリック
これで空のワークファイル
が完成
wagepan.desから変数名を
ペースト
テキストデータ
のインポート
最初に
wagepan.desを
秀丸等で読み込
んでおく(変数名
をコピーするた
め)
File Import 
Read
と進んで,
wagepan.rawを
読み込む
左上の欄(赤で
囲った部分)に
変数名をペース
ト
OKをクリックして
データセット読み
込みの完了
うまく読み込
むことができ
れば左のよう
になる
クロスセクション
データをパネル
データに変換す
るためには,こ
のあたりをクリッ
クするか,menu
からProc 
Structute/
Resize Current....
を選択
データセットが
できたら適当
な名前をつけ
て保存する
注意: Eviews
7の画面なの
で,バージョン
によってはメ
ニューや画面
が異なること
がある
パネル・データへの変換 : 前頁の操作を行うと次の画面が表れる
workfile structure
で Dated Panelを
選択
個人を識別す
る変数を入力
時点を表
す変数を
入力
Frequency や Start
date , End dateも入
力した方がいい場合
もある(このデータで
は自動的に判別さ
れた)
パネルデータと
して識別された
1980-87年
×545人のデー
タ=4360obs
パネルデータ
から通常の
undated cross
sectionデータ
への変換もで
きる
Proc 
Structure/Resiz
e ..とたどるか,
左の赤で囲っ
た部分(Range
あたり)をクリッ
ク
最初からパネルデータとしてimportする方法
Workfile structure typeとし
てBalanced Panelを選択
Frequency: Annualを選択
(データの期間の指定:月
次、四半期などあり)
Start date, End date,
No. of Cross sectionsを指
定
ここで用いるデータは、
1980年から1987年の
データで、各年545の固
体のデータ
545 x 8 = 4360 obs.
最初からパネルデータとしてimportする方法(2)
MenuからFile
Import Read
を選択し、
wagepan.rawを
importする
Wagepan.desから
変数名をコピーし
てペースト
Cross section id
Date id は自動
的に作成される
最初からパネルデータとしてimportする方法(3)
ここをクリックすれば、structure type を変更できる
Cross section id が
作成された(nr と
は別に)
Date id が作成さ
れた(yearとは
別に)
パネル分析
パネル分析のオプ
ションはこのタブか
ら選択できる
左のような回帰式を
推計する
パネル分析のオプション
cross section
None
Fixed Effects
Random Effects
Period
None
Fixed Effects
Random Effects
が選択できる
次の方程式を推計
• wagepan.raw
• lwage = f( educ, black, hisp, exper, married,
union)
– educ(教育年数), black(黒人ダミー), hisp(ヒス
パニックダミー)は一定の値
– exper(labor market experience)
• labor market から撤退していなければ(出産等?),基
本的にはyearと同じく,1年ずつ増えていく
パネル分析
• 通常のOLS
• プールデータでのOLSと同じ
• Cross Section : None Period : Fixed
– プールデータで年ダミーを入れたOLS
• Cross Section : Fixed Period : None
– プールデータで個人ダミーを入れたOLS
– 普通のfixed effects model
• Cross Section : Fixed Period : Fixed
– 自由度が不足する
• Cross Section : Radom Period : None
– 普通のrandom effects model
• Cross Section : Radom Period : Fixed
OLS
experを外したOLS
OLS(2)
experを説明変数
に加えた場合
OLS(3)
時点ダミー(d81d87)を加えた場合
period fixed
effects model と同
じ
Period : Fixed
Effects
Cross Section:
None
前のモデルの固定効
果:
estimation outputの画
面から
view 
Fixed / Random Effects
を選択していく
cross section :
Fixed Effects
period: None
時間を通じて一
定の変数は説明
変数に加えるこ
とはできない
educ, 人種ダ
ミー
1階の階差モデ
ルと同じ
cross section:
random effects
問題1
• Crime2.raw
– 46市の失業率(unem)と犯罪発生率(crmrte),1982年
と1987年
– crmrte を被説明変数,unemを説明変数にしてOLSを,
各年ごと,およびプールしたデータで行え。
– 各都市の犯罪発生率に結び付く観察不可能な変数
があるかもしれない。これを考慮して,fixed effects
model でcrmrteとunemの関係を推計せよ(2時点の
データなので,階差モデルで推計すればよい:
crmrte,unemの2時点間の変化はデータセットに変数
として含まれている)。
問題2
• kielmc.raw
– 1978年,81年の2時点のデータ
– 1978年時点では焼却場の建設の噂なし,81年時点
ではあり(実際には85年に建設)
被説明変数: 住宅価格(rprice: 1978年実質)
説明変数: nearinc(住宅がゴミ焼却場の近くなら1),
y81(81年なら1)
y81* nearinc
を説明変数にして,OLSを行え。
– 住宅の質(広さ,築年数等),住宅の周辺環境を表す
その他の変数も住宅価格に影響を与える。このこと
を考慮して(他の適切な説明変数を加えて),焼却場
建設の予定が住宅価格を低下させたかどうかを調べ
よ。
問題3
• wagepan.raw
• 1980年から87年の8時点のデータ
• 賃金,教育年数,経験年数,人種ダミー,結婚ダミー,...
1. 次のモデルをpooled OLSで推定せよ
1. 被説明変数 lwage (賃金の対数値)
2. 説明変数 educ(教育年数), black(黒人ダミー), hisp
(ヒスパニック・ダミー)
2. random effects model で推計し,pooled OLSとの結果
と比較せよ。
3. 説明変数を追加して,.1.と2.の回帰を行え
4. fixed effects model + フルセットの説明変数で回帰を
行え(注意:学歴,人種ダミー等を説明変数に加える
ことはできない)。