Aufgaben zur Ökonometrie I 5. Heteroskedastizität 5.1 Was versteht man unter Heteroskedastizität und wodurch kann dieser Modelldefekt verursacht werden? Lösung: Die Annahme A.2 lautete, dass die Störgrößen in jeder Periode die gleiche Varianz besitzen, d.h. homoskedastisch sind: Var u 2t 2 , für t = 1, 2, …, n. Man spricht von Heteroskedastizität, wenn die Varianz der Störgröße nicht konstant ist, sondern in den einzelnen Perioden oder in Abhängigkeit von den Querschnittseinheiten (z.B. Unternehmen, Regionen) verändert. Heteroskedastizität liegt auch dann vor, wenn die Varianz der Störgröße gruppenweise variiert, innerhalb der Grupppen aber konstant ist (z.B. Streuungsunterschiede zwischen West und Ost, aber nicht innerhalb west- und ostdeutscher Regionen). Potenzielle Gründe für Heteroskedastität: bei Zeitreihendaten: Unterliegen die exogenen Variablen einen Trend, so kann sich dieser Trend auch in der Störgrößenvarianz niederschlagen. bei Querschnittsdaten: Bei Gruppen von statistischen Einheiten (z.B. Haushalte), die im oberen Wertebereich bei einer oder mehreren exogenen Variablen wie z.B. dem Einkommen liegen, weist die abhängige Variable wie z.B. der Konsum häufig ebenfalls eine größere Streuung auf. In unserem Beispiel spiegelt sie die größeren Konsummöglichkeiten von Haushalten mit höheren Einkommen wieder. Größere Konsummöglichkeiten zeigen sich darin, dass bei einem gegebenen Einkommen überdurchschnittlich viel konsumiert oder gespart werden kann. Dies bedeutet aber, dass die Abweichungen (Residuen) von der Regressionsgeraden tendenziell größer sind als bei geringen Einkommen, bei denen der Konsumspielraum begrenzt ist. Hierdurch wird ausgedrückt, dass die Störgrößenvarianz bei hohen Einkommen größer ist als bei geringen Einkommen. 5.2 Welche inferenzstatistischen Konsequenzen ergeben sich für die OLS-Parameterschätzer eines multiplen Regressionsmodells im Falle von Heteroskedastizität? Lösung: Die OLS-Schätzer der Regressionskoeffizienten bleiben bei Heteroskedastizität zwar erwartungstreu; sie sind aber nicht mehr effizient. Das bedeutet, dass die Standardfehler (=Wurzel aus den Varianzen) der geschätzten Regressionskoeffizienten Schätzer verzerrt sind. Die Folge ist, dass die Signifikanztests über die Regressionskoeffizienten ungültig werden. Außerdem können die Konfidenzintervalle für die Regressionskoeffzienten nicht mehr valide berechnet werden. Erläutern Sie die Grundidee der verallgemeinerten Methode der kleinsten Quadrate (GLS-Methode) zur Beseitigung der Heteroskedastizität! 5.3 Lösung: Liegt Heteroskedastizität vor, dann unterscheiden sich die Hauptdiagonalelemente der Kovarianzmatrix der Störgrößen: 12 0 0 0 22 0 Cov(u) Euu 0 0 2 n bzw. bei 2t 2 t 2 z t (t: Skalierungsvariable, für die in der Regel eine quadrierte exogene Variable z 2t gewählt wird) 1 2 0 2 2 Cov(u) Euu 0 0 0 1 0 0 0 0 2 0 2 . 0 0 2 n n 0 Ω Es wird eine Transformationsmatrix T: 1 1 0 T 0 0 1 2 0 0 0 1 n bestimmt, so dass gilt: T T Ω1 . Durch Multiplikation der Regressionsgleichung von links mit T erhält man die transformierte Regressionsgleichung: Ty β Tu . TX y* X* u* Die Beobachtungswerte werden also mit den Werten der Transformationsmatrix multipliziert oder gewichtet (deshalb wird das Verfahren auch WLS-Schätzung genannt). Wie gezeigt werden kann, erfüllt die transformierte Störgröße die Standardannahmen des multiplen Regressionsmodells. Wie kann T bestimmt werden? Ansatz 1: Gruppenspezifische Heteroskedastizität Es werden für alle m Gruppen OLS-Schätzer separat berechnet: Mit den OLS-Schätzern für die te-Gruppe: βˆ X X -1 X ' y werden die OLS-Residuen: uˆ y Xβˆ . und die geschätzte Störgrößenvarianz (=Residualvarianz) uˆ uˆ ˆ 2 nk für die te-Gruppe bestimmt. Die geschätzten gruppenspezifischen Störgrößenvarianzen werden zur Definition der Transformationsmatrix T herangezogen: 1 0 0 0 0 ˆ 1 1 0 0 0 0 ˆ 1 0 0 1 0 0 T ˆ 1 1 0 0 0 0 ˆ m 1 0 0 0 0 ˆ m Der Ansatz ist allerdings nur eingeschränkt anwendbar, da die m Gruppen bekannt sein müssen (z.B. West/Ost-Regime). die Schätzung in der Regel nur bei geringer Gruppenzahl durchführbar sein wird, da die Schätzung der Störgrößenvarianz wenig präzise ist, wenn sie auf einer zu geringen Zahl von Beobachtungen basiert. Ansatz 2: Heteroskedastizität in Abhängigkeit der Skalierungsvariablen Die Skalierungsvariable wird durch die Potenz eine exogene Variable z vorgegeben, die im Allgemeinen eine erklärende Variable xj des Regressionsmodells ist (z könnte auch eine exogene Variable sein, die nicht in das Modell zur Erklärung der y-Variablen herangezogen wird wie z.B eine Trendvariable). Im einfachsten Fall wird z mit der j-ten x-Variablen gleichgesetzt. Negative Werte werden von vornherein ausgeschaltet, wenn die x-Werte quadriert werden: t z 2t x 2jt bzw. 2t z 2t 2 x 2jt 2 . Die Elemente werden in die Transformationmatrix eingetragen: 1 0 0 x j1 0 1 0 . T x j2 1 0 0 x jn Die transformierte Regressionsgleichung lässt sich dann auch folgendermaßen darstellen: yt x jt y*t ˆ 1 1 x jt x1t* ˆ 2 x 2t x jt x*2t ˆ j x jt x jt x 1 * jt ˆ k x kt x jt x *kt uˆ t x jt . uˆ *t 5.4 Testen Sie die Störterme des Modells der Erdgasnachfrage in Abhängigkeit vom Gaspreis (= Energiemodell Ia, Daten s. Aufg. 2.3) mit dem GoldfeldQuandt-Test auf Heteroskedastizität (=0,05)! Lösung: 1. Schritt Ordnen der Beobachtungsdaten nach den aufsteigenden Werten des j-ten Regressors, auf den die Heteroskedastizität zurückgeführt wird. Hier ist nur ein echter Regressor vorhanden. Die Beobachtungswerte werden nach dem Gaspreis xt geordnet: 2. Schritt t xt yt 5 7 1 6 4 3 2 12,2 12,5 12,9 12,9 13,2 13,7 13,8 1,2 1,4 1,0 1,1 0,9 0,7 0,8 Aufteilung der Beobachtungsdaten in 2 gleich große Gruppen Aufgrund der geringen und ungeraden Anzahl von Beobachtungen setzen wir c=1, so dass der mittlere Wert (t=6) des geordneten Datensatzes nicht verwendet wird. Er ist in der folgenden Tabelle grau unterlegt dargestellt. Oberhalb befinden sich die Perioden der ersten Stichprobe und unterhalb der zweiten Stichprobe. 1. Stichprobe 2. Stichprobe 3. Schritt t xt yt 5 12,2 1,2 7 12,5 1,4 1 6 4 12,9 12,9 13,2 1,0 1,1 0,9 3 13,7 0,7 2 13,8 0,8 Hypothesenformulierung: H0 : 12 22 2 und H1 : 12 22 4. Schritt Festlegung des Signifikanzniveaus : = 0,05 5. Schritt Durchzuführende Regressionen 1. Stichprobe: y1t = 11 + 12·x1t + u1t a) OLS-Schätzer ˆ 11 und ˆ 12 t 5 7 1 xt 12,2 12,5 12,9 37,6 xt2 148,84 156,25 166,41 471,50 yt 1,2 1,4 1,0 3,6 xt·yt 14,64 17,50 12,90 45,04 OLS-Schätzer der Regressionskoeffizienten 1 und 2: n x1t y1t x1t y1t 3 45,04 37,6 3,6 0,24 ˆ 12 1 0,324 0,74 n1 x12t ( x1t ) 2 3 471,5 37,6 2 37,6 y1t ˆ x1t 3,6 ˆ 11 12 (0,324) n1 n1 3 3 1,2 0 ,324 12 ,533 5,261 4,061 OLS-geschätzte Nachfragefunktion für Erdgas: yˆ 1t = 5,261 – 0,324·x1t, t=5,7,1 b) Regressionswerte t=5: t=7: t=1: yˆ 15 = 5,261 – 0,324·(x5t=12,2) = 1,308 yˆ 17 = 5,261 – 0,324·(x7t=12,5) = 1,211 yˆ 11 = 5,261 – 0,324·(x1t=12,9) = 1,801 c) Residuen t=5: t=7: t=1: uˆ 15 = y15 – yˆ 15 = 1,2 – 1,308 = –0,108 uˆ 17 = y17 – yˆ 17 = 1,4 – 1,211 = 0,189 uˆ 11 = y11 – yˆ 11 = 1,0 – 1,081 = –0,081 d) Quadratsumme der Residuen uˆ 1' uˆ 1 0,108 0,189 0,108 0,081 0,189 0,0539 0,081 2. Stichprobe: y2t = 21 + 22·x2t + u2t ˆ und ˆ a) OLS-Schätzer 12 11 t 4 3 2 xt 13,2 13,7 13,8 40,7 yt 0,9 0,7 0,8 2,4 xt2 174,24 187,69 190,44 552,37 xt·yt 11,88 9,59 11,04 32,51 OLS-Schätzer der Regressionskoeffizienten 1 und 2: n x 2 t y 2 t x 2 t y 2 t 3 32,51 2,4 40,7 ˆ 22 2 n 2 x 22 t ( x 2 t ) 2 3 552,37 40,7 2 0,15 0,242 0,62 40,7 y 2t ˆ x 2 t 2,4 ˆ 21 22 (0,242) n2 n2 3 3 0,8 0 ,242 13 ,567 4,083 3,283 OLS-geschätzte Nachfragefunktion für Erdgas: yˆ 2 t = 4,083 – 0,242·x2t, t=6,5,7 b) Regressionswerte t=4: t=3: t=2: yˆ 14 = 4,083 – 0,242·(x4t=13,2) = 0,889 yˆ 13 = 4,083 – 0,242·(x3t=13,7) = 0,768 yˆ 12 = 4,083 – 0,242·(x2t=13,8) = 0,743 c) Residuen t=4: t=3: t=2: uˆ 24 = y24 – yˆ 24 = 0,9 – 0,889 = 0,011 uˆ 23 = y23 – yˆ 23 = 0,7 – 0,768 = –0,068 uˆ 22 = y22 – yˆ 22 = 0,8 – 0,743 = 0,057 d) Quadratsumme der Residuen uˆ '2 uˆ 2 0,011 6. Schritt 0,068 0,011 0,057 0,068 0,0080 0,057 Berechnen der Prüfgröße: uˆ uˆ 0,0539 1/ GQ 1 1 6,738 uˆ 2 uˆ 2 0,0080 7. Schritt Tabellarische Ermittlung des kritischen Wertes (=0,05): Fn c 2 k;n c 2 k;1 F7 1 2 2;7 1 2 2;0,95 F1;1;0,95 161 8. Schritt Testentscheidung: 1/ GQ 6,738 F1;1;0,95 161 H0 annehmen Der Goldfeld-Quandt-Test weist nicht auf Heteroskedastizität der Störgröße hin. Schätzen Sie die Nachfragefunktion nach Erdgas in Abhängigkeit vom Gaspreis (= Energiemodell Ia) unter Verwendung der Spezifikation 5.5 2t 2 GASPt2 der Störtermvarianz mit der gewichteten Methode der kleinsten Quadrate (WLS-Methode)! Hinweis: Berechnen Sie die WLS-Schätzer für 1 und 2 unter Verwendung der Formeln für die OLS-Schätzer mit y t y*t , x t x1*t . Verwenden Sie die transformíerten Variablen sowie ( x1*t ) 2 und x1*t y*t mit drei Dezimalstellen! Lösung: Die Spezifikation der Störvarianz in der Form 2t 2 GASPt2 führt zu dem transformierten ökonometrischen Nachfragemodell nach Erdgas (GASVt = yt, GASPt = xt): ^ GASVt GASPt 1 1 1 2 u *t 1 2 u *t GASP GASP GASP GASP t t t t * x1 x* y* t 2t 1 t Bei der Berechnung der WLS-Schätzer für 1 und 2 können die Formeln der OLS-Schätzer in folgender Form unter Verwendung der transformierten Variablen verwendet werden: yt y*t , x t x1*t Arbeitstabelle: t xt yt x1*t 1 / x t y*t y t / x t ( x1*t ) 2 x1*t y*t 1 2 3 4 5 6 7 12,9 13,8 13,7 13,2 12,2 12,9 12,5 91,2 1,0 0,8 0,7 0,9 1,2 1,1 1,4 7,1 0,078 0,072 0,073 0,076 0,082 0,078 0,080 0,539 0,078 0,058 0,051 0,068 0,098 0,085 0,112 0,550 0,0061 0,0052 0,0053 0,0058 0,0067 0,0061 0,0064 0,0416 0,0061 0,0042 0,0037 0,0052 0,0080 0,0066 0,0090 0,0428 WLS-Schätzer der Regressionskoeffizienten 1 und 2: n x1*t y*t x1*t y*t 7 0,0428 0,539 0,550 0,00315 ˆ 1, WLS 4,632 0,00068 n ( x1*t ) 2 ( x1*t ) 2 7 0,0416 0,539 2 * * 0,539 yt ˆ x1t 0,550 ˆ 2, WLS 1, WLS 4,632 0,079 4 ,632 ,077 0 0,278 n n 7 7 0,357 WLS-geschätzte Nachfragefunktion für Erdgas: ^ GASV t 4,632 0,278 GASPt Der White-Test hat für das Energiemodell III folgendes Resultat erbracht: 5.6 White Heteroskedasticity Test: F-statistic Obs*R-squared 0.829402 5.696925 Probability Probability 0.575525 0.457982 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 01/25/07 Time: 15:39 Sample: 1980 1995 Included observations: 16 Variable Coefficient Std. Error t-Statistic Prob. C GASPR GASPR^2 FERNWPR FERNWPR^2 VEINKR VEINKR^2 -29.74777 -25.04399 17.07002 -21.22605 8.174083 0.068311 -2.23E-05 58.70411 28.17182 15.58422 89.98156 44.31804 0.062335 2.03E-05 -0.506741 -0.888973 1.095340 -0.235893 0.184441 1.095866 -1.097094 0.6245 0.3972 0.3018 0.8188 0.8578 0.3016 0.3011 R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood Durbin-Watson stat 0.356058 -0.073237 0.706851 4.496743 -12.54913 2.894434 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic Prob(F-statistic) 0.376351 0.682307 2.443642 2.781649 0.829402 0.575525 a) Erläutern Sie die Grundidee des White-Tests mit Bezug auf die durchgeführte Hilfsregression! Lösung: Grundidee des White-Tests: Heteroskedastizität, die auf - die erklärenden Variablen, die quadrierten Werte der erklärenden Variablen ( Varianzkonzept) zurückgeführt werden kann, wird modelliert und getestet. b) Geben Sie die Testentscheidung des hier wiedergegebenen White-Testes unter Verwendung des kritischen Wertes und des p-Wertes an (α=0,10)! Interpretieren Sie das Ergebnis! Lösung: Nullhypothese des White-Tests: H0: 2t = 2 für alle t (Homoskedastizität) Prüfgröße: W = nR2 = 160,356058 = 5,697 (R2 aus Hilfsregression) Kritischer Wert (=0,10): 2r;0,90 = 26;0,90 = 10,6 Testentscheidung: W = 5,697 < 26;0,90 = 10,6 H0 beibehalten oder p = 0,458 > =0,10 H0 beibehalten Interpretation: Der White-Test hat keine Heteroskedastizität aufgedeckt. c) Geben Sie die Hilfsregression des vollständigen White-Testes für das Energiemodell III an und interpretieren Sie den hierzu gehörenden verkürzten EViews-Output: White Heteroskedasticity Test: F-statistic Obs*R-squared 0.679076 8.073769 Probability Probability 0.711392 0.526730 Lösung: Vollständige Hilfsregression des White-Tests uˆ 2t 0 1 GASPR t 2 FERNWPR t 3 VEINKR t 11 GASPR 2t 22 FERNWPR 2t 33 VEINKR 2t 12 GASPR t FERNWPR t 13 GASPR t VEINKR t 23 FERNWPR t VEINKR t v t mit uˆ t als Residuum der Nachfragefunktion nach Erdgas Prüfgröße: W = n·R2 = 8,074 Testentscheidung: Da p = 0,527 größer ist als alle gängigen Signifikanzniveaus (=0,01, =0,05. =0,10), kann die Nullhypothese einer homoskedastischen Störvarianz, H0: 2t 2 für alle t, nicht abgelehnt werden kann. Bei einer Regression der Erdgasnachfrage auf den Gaspreis (= Energiemodell Ia, Daten s. Aufg. 2.3) ergeben sich folgende OLS-Residen: 5.7 t 1 uˆ t -0,062 2 0,069 3 4 5 -0,067 -0,051 -0,119 6 0,038 7 0,191 a) Vergleichen Sie den Standardfehler des Regressionskoeffizienten des Gaspreises unter Annahme homoskedastischer Störterme mit Whites Heteroskedastizität-konsistentem Schätzer! Hinweis: Verwenden Sie zur Berechnung der beiden Standardfehler die jeweiligen Summenformeln! Lösung: Gaspreis: xt t xt uˆ t xt x x t x 2 1 2 3 4 5 6 7 12,9 13,8 13,7 13,2 12,2 12,9 12,5 91,2 -0.062 0,069 -0,067 -0,051 -0,119 0,038 0,191 -0,0010 -0,129 0,771 0,671 0,171 -0,829 -0,129 -0,529 -0,0030 0,016641 0,594441 0,450241 0,029241 0,687241 0,016641 0,279841 2,074287 x uˆ 2t 0,003844 0,004761 0,004489 0,002601 0,014161 0,001444 0,036481 0,067781 1 7 1 x t 91,2 13,029 7 t 1 7 • Standardfehler von βˆ 2 bei homoskedastischen Störtermen: ˆ 2 1 1 2 0,067781 0,013556 uˆ t nk 72 ^ Var ˆ 2 1 2 x t x ˆ 2 1 0,013556 0,006535 2,074287 ˆ ˆ 0,006535 0,080839 2 • Whites Heteroskedastizitäts-konsistenter Standardfehler von βˆ 2 : 2 2 0,024956 x t x uˆ t Var ˆ 2 =0,005800 2 2 2 2 , 074287 x t x ^ ˆ ˆ 0,005800 0,076158 2 x t x 2 uˆ 2t 0,000064 0,002830 0,002021 0,000076 0,009732 0,000024 0,010209 0,024956 b) Geben Sie Whites Heteroskedastizität-konsistente Schätzer der Standardfehler der ^ beiden Regressionskoeffizienten mit Hilfe der Kovarianzmatrix Cov(βˆ ) an! Lösung: ^ Whites Heteroskedastizität-konsistente Schätzer Kovarianzmatrix Cov(βˆ ) : ^ Cov(βˆ ) ( X' X) 1 X' diag (uˆ 12 , uˆ 22 ,..., uˆ 2n ) X( X' X) 1 Beobachtungsmatrix X: 1 1 1 X 1 1 1 1 12,9 13,8 13,7 13,2 12,2 12,9 12,5 Produktmatrix X’X: 1 1 1 1 1 1 1 1 1 1 X' X 1 12,9 13,8 13,7 13,2 12,2 12,9 12,5 1 1 1 12,9 13,8 13,7 91,2 7 13,2 91,2 1190,28 12,2 12,9 12,5 Inverse der Produktmatrix X’X: 81,975207 6,280992 6,280992 0,482094 X' X 1 Geschätzte Kovarianzmatrix der Störterme: ^ Cov(u ) diag (uˆ 12 , uˆ 22 ,..., uˆ 2n ) 0 0 0 0 0 0 0,003844 0 0,004761 0 0 0 0 0 0 0 0,004489 0 0 0 0 0 0 0 0,002601 0 0 0 0 0 0 0 0,014161 0 0 0 0 0 0 0 0,001444 0 0 0 0 0 0 0 0,036481 ^ Whites Heteroskedastizität-konsistente Schätzer Kovarianzmatrix Cov(βˆ ) : ^ Cov(βˆ ) ( X' X) 1 X' diag (uˆ 12 , uˆ 22 ,..., uˆ 2n ) X( X' X) 1 81,975207 6,280992 1 1 1 1 1 1 1 12 , 9 13 , 8 13 , 7 13 , 2 12 , 2 12 , 9 12 ,5 6,280992 0,482094 0 0 0 0 0 0 0,003844 0 0,004761 0 0 0 0 0 0 0 0,004489 0 0 0 0 0 0 0 0,002601 0 0 0 0 0 0 0 0,014161 0 0 0 0 0 0 0 0,001444 0 0 0 0 0 0 0 0,036481 1 1 1 1 1 1 1 12,9 13,8 13,7 81,975207 6,280992 1,032797 0,077475 13,2 6,280992 0,482094 0,077475 0,005817 12,2 12,9 12,5 Heteroskedastizität-konsistente Standardfehler der Regressionskoeffizienten: ˆ ˆ 1,032797 1,016266 1 ˆ ˆ 0,005817 0,076269 2
© Copyright 2024 ExpyDoc