パネルデータ分析の方法

企業のパネルデータ分析
同志社大学 中尾ゼミ
印刷用
目的
例①複数年度のデータたとえば,2001年から
2004年で,食品産業の企業で売上高1000億円
以上の大企業と1000億円未満の企業群の利潤
率のばらつきの原因を比較分析する
例②複数年度のデータで,食品産業の企業で広
告をしている企業を対象に広告が利潤率に与
える影響を明らかにする
パネルデータ分析の方法
複数の企業の時系列データを収集する
例:食品産業の企業30社
2001年から2004年
30社×4年=120→総データ数
この120社の4年のデータを使って分析する.
例えば,4社の30年のデータを使って分析してもよい.
データ収集
食品産業の企業30社の2001年から2004年のデータ
として 例えば,
資産合計,売上高,営業利益
を収集し,food0104.txtに書き込む
パネルデータの収集方法の説明は
http://xplala.aa0.netvolante.jp/class/zaimuPNL.pdf
これを読むにはパスワードが必要!クリック後に表れる
パスワード入力画面はこの画面の後かも...
注意:決算月を変更した企業は採用しない
XTSP起動
XTSPを起動する.
初期画面の使い方は以下にあります。
http://xplala.aa0.netvolante.jp/class/HowToUseXXTSP.mht
『新しいTSPファイル』ボタンをクリック,必要な情報を入
力する
入力方法の説明は以下にあります。
http://xplala.aa0.netvolante.jp/class/HowToTSPPNL.mht
プログラム例
TSPプログラムを編集する画面で例えば,以下のように書き換え
ます.
OPTIONS CRT;
SMPL 1 120;
30社で4年のデータ=120
コード 年 決算月 資産合計 売上高 利潤
READ(file=‘food0104.CSV’) cd y m k u r ;
Freq(panel,ID=cd);
データがパネルデータと指定
rjr=r/k;
利潤率計算
gr=u/u(-1);
成長率計算
panel rjr c gr u;
パネルデータで統計分析
END;
4種類の計算結果
 TSPでパネルデータを計算すると4種類の計算結果が表
示されます.
 上から順に
①データプールモデル
②平均値モデル
③固定効果モデル
④ランダム効果モデル
です.
①データプールモデル
 食品産業の企業30社の2001年から2004年のケー
スであれば
企業30社×4年=120のデータすべてを使って最
小自乗法で縦軸切片と係数を推定する.
例:被説明変数が利潤率r,説明変数が広告aとして
r=5+0.5a
となったとすれば,
広告aがゼロのときには利潤率rは5.
広告aが1増加すれば利潤率は0.5増加する
②平均値モデル
 食品産業の企業30社の2001年から2004年のケース
であれば
企業30社の各社について
4年間の利潤率と広告の平均値を計算する.
その結果30個のデータが得られる.
この30のデータを用いて最小自乗法で縦軸切片と係数
を推定する.
③固定効果モデル
食品産業の企業30社の2001年から2004年の例
縦軸切片は各社で異なると想定して最小自乗法で縦軸
切片と係数を推定する.
例:被説明変数が利潤率r,説明変数が広告aとして
a社:r=5+0.5a
b社:r=7+0.5a
c社:r=-3+0.5a,....後27社分
ただし,縦軸切片の推定結果は表示されない
④ランダム効果モデル
食品産業の企業30社の2001年から2004年の例
各企業の被説明変数に影響を与える変数が抜けている
と想定して推定する.
4種類の計算結果のうち固定効果モデ
ルを利用する
推定結果1:データプールの分析結果
TOTAL (plain OLS) Estimates:
Dependent variable: RJR
Mean of dep. var. = .027310
Std. dev. of dep. var. = .024685
...........略........
R-squared = .031180
Adjusted R-squared = .890805E-02
...........略........
Estimated Standard
Variable Coefficient Error
t-statistic P-value
GR
.012883
.776528E-02 1.65911
[.101]
U
-.319329E-08 .238200E-07 -.134059 [.894]
C
.014404
.860072E-02 1.67479
[.098]
これはすべてのデータを同時に用いた推定結果.
推定結果2:固定効果モデルの分析結果
WITHIN (fixed effects) Estimates:
Dependent variable: RJR
Mean of dep. var. = .027310
Std. dev. of dep. var. = .024685
...........略........
R-squared = .787187
Adjusted R-squared = .673442
...........略........
Estimated Standard
Variable Coefficient Error
t-statistic P-value
GR
.905597E-03 .548220E-02 .165189
[.869]
U
-.162025E-06 .234358E-06 -.691356 [.492]
これは縦軸切片が企業によって異なるとして推定した結果.
データチェック
プログラムを赤字のように訂正して実行してください。
OPTIONS CRT;
SMPL 1 120;
READ(file='food0104.CSV') cd y m k u r;
Print cd y m k u r; データの印刷
Freq(panel,ID=CD);
rjr=r/k;
gr=u/u(-1);
panel rjr c gr u; END;
企業に複数データがあるケース
同じ企業で,単一年に2あるいは3以上のデータがある
ケースがある場合,例えば,
企業コード,年,月,売上高,営業利益のケースで
CD
Y
M
k
u
r
216
2001
3
2548 256 55
216
2001
9
1445
93 21
となっているケースでは,同一企業が単一年に2回財務
データを公表しています.このような場合には,この企業
をサンプルから削除して,データ収集をやりなおしてくだ
さい。
欠損データ1
エクセルでデータを見て空白があれば欠損データです.
全企業でデータがない場合にはそのデータを除いてデー
タ収集をやりなおしてください.
一部の企業で欠損データがある場合には
(1)エクセルで空白欄をすべてゼロにし
(2)TPSプログラムで,ゼロにしたデータを分析対象から
除いてください.例えば,ADに欠損データがある場合には
Select AD>0 ;
としてください。
欠損データ2
OPTIONS CRT;
SMPL 1 120;
READ(file='food0104.CSV') cd y m k u r AD RD ;
Freq(panel,ID=CD);
ADとRDに欠損データがある場合には
Select AD>0 & RD>0;
Panel u c AD RD r;
とします.
大企業の分析
OPTIONS CRT;
SMPL 1 120;
READ(file='food0104.CSV') cd y m k u r ;
Print cd y m k u r ; データの印刷
Freq(panel,ID=CD);
rjr=r/k; gr=u/u(-1);
売上高1000億円以上の企業を選択
Select u>=100000 ; 単位は100万円
Panel rjr c gr U;
売上高1000億円以下の企業を選択
Select u<100000 ;
Panel rjr c gr u;
利潤がプラスの大企業の分析
OPTIONS CRT;
SMPL 1 120;
READ(file='food0104.CSV') cd y m k u r ;
Freq(panel,ID=CD);
rjr=r/k; gr=u/u(-1);
売上高1000億円以上での企業を選択
Select u>=100000 & r> 0; 単位は100万円
Panel rjr c gr U;
マクロ経済データの収集
①企業行動はマクロ経済状況の影響を受けるため,
パネルデータ分析でもマクロ経済データを収集して説明
変数とする必要がある.
②マクロ経済データは財務データの1年前のものを収集.
財務データが2001年決算から2004年決算であれば,マ
クロ経済データは2000年度から2003年度の年度データ
を収集する.これは企業決算は3月が多いため.
③収集したマクロ経済データ使って,財務データファイル
に追加する→次のスライド参照.
マクロ経済データの利用
例えば,マクロ経済データとしてGDPを収集し,財務
データに追加する場合は以下のように変更する
-----財務データ-----
コード 年 月 財務データ
マクロデータ
年 データ
マクロ経済データの利用のプログラム
プログラムを赤字のように訂正して実行してください。
OPTIONS CRT;
SMPL 1 120;
READ(file=‘food0104.CSV’) cd y m k u r y2 GDP;
Print cd y m k u r y2 GDP;
Freq(panel,ID=CD);
rjr=r/k;
gr=u/u(-1);
panel rjr c gr u gdp; END;