企業のパネルデータ分析 同志社大学 中尾ゼミ 印刷用 目的 例①複数年度のデータたとえば,2001年から 2004年で,食品産業の企業で売上高1000億円 以上の大企業と1000億円未満の企業群の利潤 率のばらつきの原因を比較分析する 例②複数年度のデータで,食品産業の企業で広 告をしている企業を対象に広告が利潤率に与 える影響を明らかにする パネルデータ分析の方法 複数の企業の時系列データを収集する 例:食品産業の企業30社 2001年から2004年 30社×4年=120→総データ数 この120社の4年のデータを使って分析する. 例えば,4社の30年のデータを使って分析してもよい. データ収集 食品産業の企業30社の2001年から2004年のデータ として 例えば, 資産合計,売上高,営業利益 を収集し,food0104.txtに書き込む パネルデータの収集方法の説明は http://xplala.aa0.netvolante.jp/class/zaimuPNL.pdf これを読むにはパスワードが必要!クリック後に表れる パスワード入力画面はこの画面の後かも... 注意:決算月を変更した企業は採用しない XTSP起動 XTSPを起動する. 初期画面の使い方は以下にあります。 http://xplala.aa0.netvolante.jp/class/HowToUseXXTSP.mht 『新しいTSPファイル』ボタンをクリック,必要な情報を入 力する 入力方法の説明は以下にあります。 http://xplala.aa0.netvolante.jp/class/HowToTSPPNL.mht プログラム例 TSPプログラムを編集する画面で例えば,以下のように書き換え ます. OPTIONS CRT; SMPL 1 120; 30社で4年のデータ=120 コード 年 決算月 資産合計 売上高 利潤 READ(file=‘food0104.CSV’) cd y m k u r ; Freq(panel,ID=cd); データがパネルデータと指定 rjr=r/k; 利潤率計算 gr=u/u(-1); 成長率計算 panel rjr c gr u; パネルデータで統計分析 END; 4種類の計算結果 TSPでパネルデータを計算すると4種類の計算結果が表 示されます. 上から順に ①データプールモデル ②平均値モデル ③固定効果モデル ④ランダム効果モデル です. ①データプールモデル 食品産業の企業30社の2001年から2004年のケー スであれば 企業30社×4年=120のデータすべてを使って最 小自乗法で縦軸切片と係数を推定する. 例:被説明変数が利潤率r,説明変数が広告aとして r=5+0.5a となったとすれば, 広告aがゼロのときには利潤率rは5. 広告aが1増加すれば利潤率は0.5増加する ②平均値モデル 食品産業の企業30社の2001年から2004年のケース であれば 企業30社の各社について 4年間の利潤率と広告の平均値を計算する. その結果30個のデータが得られる. この30のデータを用いて最小自乗法で縦軸切片と係数 を推定する. ③固定効果モデル 食品産業の企業30社の2001年から2004年の例 縦軸切片は各社で異なると想定して最小自乗法で縦軸 切片と係数を推定する. 例:被説明変数が利潤率r,説明変数が広告aとして a社:r=5+0.5a b社:r=7+0.5a c社:r=-3+0.5a,....後27社分 ただし,縦軸切片の推定結果は表示されない ④ランダム効果モデル 食品産業の企業30社の2001年から2004年の例 各企業の被説明変数に影響を与える変数が抜けている と想定して推定する. 4種類の計算結果のうち固定効果モデ ルを利用する 推定結果1:データプールの分析結果 TOTAL (plain OLS) Estimates: Dependent variable: RJR Mean of dep. var. = .027310 Std. dev. of dep. var. = .024685 ...........略........ R-squared = .031180 Adjusted R-squared = .890805E-02 ...........略........ Estimated Standard Variable Coefficient Error t-statistic P-value GR .012883 .776528E-02 1.65911 [.101] U -.319329E-08 .238200E-07 -.134059 [.894] C .014404 .860072E-02 1.67479 [.098] これはすべてのデータを同時に用いた推定結果. 推定結果2:固定効果モデルの分析結果 WITHIN (fixed effects) Estimates: Dependent variable: RJR Mean of dep. var. = .027310 Std. dev. of dep. var. = .024685 ...........略........ R-squared = .787187 Adjusted R-squared = .673442 ...........略........ Estimated Standard Variable Coefficient Error t-statistic P-value GR .905597E-03 .548220E-02 .165189 [.869] U -.162025E-06 .234358E-06 -.691356 [.492] これは縦軸切片が企業によって異なるとして推定した結果. データチェック プログラムを赤字のように訂正して実行してください。 OPTIONS CRT; SMPL 1 120; READ(file='food0104.CSV') cd y m k u r; Print cd y m k u r; データの印刷 Freq(panel,ID=CD); rjr=r/k; gr=u/u(-1); panel rjr c gr u; END; 企業に複数データがあるケース 同じ企業で,単一年に2あるいは3以上のデータがある ケースがある場合,例えば, 企業コード,年,月,売上高,営業利益のケースで CD Y M k u r 216 2001 3 2548 256 55 216 2001 9 1445 93 21 となっているケースでは,同一企業が単一年に2回財務 データを公表しています.このような場合には,この企業 をサンプルから削除して,データ収集をやりなおしてくだ さい。 欠損データ1 エクセルでデータを見て空白があれば欠損データです. 全企業でデータがない場合にはそのデータを除いてデー タ収集をやりなおしてください. 一部の企業で欠損データがある場合には (1)エクセルで空白欄をすべてゼロにし (2)TPSプログラムで,ゼロにしたデータを分析対象から 除いてください.例えば,ADに欠損データがある場合には Select AD>0 ; としてください。 欠損データ2 OPTIONS CRT; SMPL 1 120; READ(file='food0104.CSV') cd y m k u r AD RD ; Freq(panel,ID=CD); ADとRDに欠損データがある場合には Select AD>0 & RD>0; Panel u c AD RD r; とします. 大企業の分析 OPTIONS CRT; SMPL 1 120; READ(file='food0104.CSV') cd y m k u r ; Print cd y m k u r ; データの印刷 Freq(panel,ID=CD); rjr=r/k; gr=u/u(-1); 売上高1000億円以上の企業を選択 Select u>=100000 ; 単位は100万円 Panel rjr c gr U; 売上高1000億円以下の企業を選択 Select u<100000 ; Panel rjr c gr u; 利潤がプラスの大企業の分析 OPTIONS CRT; SMPL 1 120; READ(file='food0104.CSV') cd y m k u r ; Freq(panel,ID=CD); rjr=r/k; gr=u/u(-1); 売上高1000億円以上での企業を選択 Select u>=100000 & r> 0; 単位は100万円 Panel rjr c gr U; マクロ経済データの収集 ①企業行動はマクロ経済状況の影響を受けるため, パネルデータ分析でもマクロ経済データを収集して説明 変数とする必要がある. ②マクロ経済データは財務データの1年前のものを収集. 財務データが2001年決算から2004年決算であれば,マ クロ経済データは2000年度から2003年度の年度データ を収集する.これは企業決算は3月が多いため. ③収集したマクロ経済データ使って,財務データファイル に追加する→次のスライド参照. マクロ経済データの利用 例えば,マクロ経済データとしてGDPを収集し,財務 データに追加する場合は以下のように変更する -----財務データ----- コード 年 月 財務データ マクロデータ 年 データ マクロ経済データの利用のプログラム プログラムを赤字のように訂正して実行してください。 OPTIONS CRT; SMPL 1 120; READ(file=‘food0104.CSV’) cd y m k u r y2 GDP; Print cd y m k u r y2 GDP; Freq(panel,ID=CD); rjr=r/k; gr=u/u(-1); panel rjr c gr u gdp; END;
© Copyright 2024 ExpyDoc