Was versteht man unter Heteroskedastizität und wodurch kann

Aufgaben zur Ökonometrie I
5. Heteroskedastizität
5.1
Was versteht man unter Heteroskedastizität und wodurch kann dieser
Modelldefekt verursacht werden?
Lösung:
Die Annahme A.2 lautete, dass die Störgrößen in jeder Periode die gleiche Varianz besitzen,
 
d.h. homoskedastisch sind: Var u 2t   2 , für t = 1, 2, …, n. Man spricht von
Heteroskedastizität, wenn die Varianz der Störgröße nicht konstant ist, sondern in den
einzelnen Perioden oder in Abhängigkeit von den Querschnittseinheiten (z.B. Unternehmen,
Regionen) verändert. Heteroskedastizität liegt auch dann vor, wenn die Varianz der Störgröße
gruppenweise variiert, innerhalb der Grupppen aber konstant ist (z.B. Streuungsunterschiede
zwischen West und Ost, aber nicht innerhalb west- und ostdeutscher Regionen).
Potenzielle Gründe für Heteroskedastität:
 bei Zeitreihendaten:
 Unterliegen die exogenen Variablen einen Trend, so kann sich dieser Trend auch in der
Störgrößenvarianz niederschlagen.
 bei Querschnittsdaten:
 Bei Gruppen von statistischen Einheiten (z.B. Haushalte), die im oberen Wertebereich
bei einer oder mehreren exogenen Variablen wie z.B. dem Einkommen liegen, weist die
abhängige Variable wie z.B. der Konsum häufig ebenfalls eine größere Streuung auf. In
unserem Beispiel spiegelt sie die größeren Konsummöglichkeiten von Haushalten mit
höheren Einkommen wieder. Größere Konsummöglichkeiten zeigen sich darin, dass bei
einem gegebenen Einkommen überdurchschnittlich viel konsumiert oder gespart werden
kann. Dies bedeutet aber, dass die Abweichungen (Residuen) von der
Regressionsgeraden tendenziell größer sind als bei geringen Einkommen, bei denen der
Konsumspielraum begrenzt ist. Hierdurch wird ausgedrückt, dass die Störgrößenvarianz
bei hohen Einkommen größer ist als bei geringen Einkommen.
5.2
Welche inferenzstatistischen Konsequenzen ergeben sich für die OLS-Parameterschätzer eines multiplen Regressionsmodells im Falle von Heteroskedastizität?
Lösung:
Die OLS-Schätzer der Regressionskoeffizienten bleiben bei Heteroskedastizität zwar
erwartungstreu; sie sind aber nicht mehr effizient. Das bedeutet, dass die Standardfehler
(=Wurzel aus den Varianzen) der geschätzten Regressionskoeffizienten Schätzer verzerrt
sind. Die Folge ist, dass die Signifikanztests über die Regressionskoeffizienten ungültig
werden. Außerdem können die Konfidenzintervalle für die Regressionskoeffzienten nicht
mehr valide berechnet werden.
Erläutern Sie die Grundidee der verallgemeinerten Methode der kleinsten
Quadrate (GLS-Methode) zur Beseitigung der Heteroskedastizität!
5.3
Lösung:
Liegt Heteroskedastizität vor, dann unterscheiden sich die Hauptdiagonalelemente der
Kovarianzmatrix der Störgrößen:
 12  0 0 


 0  22  0 
Cov(u)  Euu   

 

 
 0 0  2 
n

bzw. bei  2t   2  t    2  z t (t: Skalierungsvariable, für die in der Regel eine quadrierte
exogene Variable z 2t gewählt wird)
 1   2



0 2   2
Cov(u)  Euu   




0
0


0 
 1  0 0 



0

0
2  0 2 
.
  

 





 0 0   
2
 n   
n



0
Ω
Es wird eine Transformationsmatrix T:
 1

 1

0
T




0


 0
1

2
 
0 

0


0


1 

n 
bestimmt, so dass gilt:
T  T  Ω1 .
Durch Multiplikation der Regressionsgleichung von links mit T erhält man die transformierte
Regressionsgleichung:
Ty
  β  Tu
.
  TX
y*
X*
u*
Die Beobachtungswerte werden also mit den Werten der Transformationsmatrix multipliziert
oder gewichtet (deshalb wird das Verfahren auch WLS-Schätzung genannt). Wie gezeigt
werden kann, erfüllt die transformierte Störgröße die Standardannahmen des multiplen
Regressionsmodells. Wie kann T bestimmt werden?
Ansatz 1: Gruppenspezifische Heteroskedastizität
Es werden für alle m Gruppen OLS-Schätzer separat berechnet:
Mit den OLS-Schätzern für die  te-Gruppe:
βˆ   X X  -1 X ' y 
werden die OLS-Residuen:
uˆ   y   Xβˆ  .
und die geschätzte Störgrößenvarianz (=Residualvarianz)
uˆ  uˆ
ˆ 2   
nk
für die  te-Gruppe bestimmt. Die geschätzten gruppenspezifischen Störgrößenvarianzen
werden zur Definition der Transformationsmatrix T herangezogen:
 1

0  0 
0 
0

 ˆ 1



1
 0
 0 
0 
0


ˆ
  1 
 



 0 0  1 
0 
0

T
ˆ 1



 


 


1

0
 0 0  0 
ˆ m


 


 


1 
0 
 0 0  0 



ˆ

m

Der Ansatz ist allerdings nur eingeschränkt anwendbar, da
 die m Gruppen bekannt sein müssen (z.B. West/Ost-Regime).
 die Schätzung in der Regel nur bei geringer Gruppenzahl durchführbar sein wird, da die
Schätzung der Störgrößenvarianz wenig präzise ist, wenn sie auf einer zu geringen Zahl
von Beobachtungen basiert.
Ansatz 2: Heteroskedastizität in Abhängigkeit der Skalierungsvariablen 
Die Skalierungsvariable  wird durch die Potenz eine exogene Variable z vorgegeben, die im
Allgemeinen eine erklärende Variable xj des Regressionsmodells ist (z könnte auch eine
exogene Variable sein, die nicht in das Modell zur Erklärung der y-Variablen herangezogen
wird wie z.B eine Trendvariable). Im einfachsten Fall wird z mit der j-ten x-Variablen
gleichgesetzt. Negative Werte werden von vornherein ausgeschaltet, wenn die x-Werte
quadriert werden:
t  z 2t  x 2jt bzw. 2t  z 2t  2  x 2jt  2 .
Die Elemente werden in die Transformationmatrix eingetragen:
 1

 0
0

 x j1



 0 1 
0
.
T
x j2


 

 
1 

0 
 0


x jn 


Die transformierte Regressionsgleichung lässt sich dann auch folgendermaßen darstellen:
yt
x jt

y*t
 ˆ 1
1
x jt

x1t*
 ˆ 2
x 2t
x jt

x*2t
  ˆ j
x jt
x jt

x 1
*
jt
   ˆ k
x kt
x jt

x *kt

uˆ t
x jt
 .
uˆ *t
5.4
Testen Sie die Störterme des Modells der Erdgasnachfrage in Abhängigkeit
vom Gaspreis (= Energiemodell Ia, Daten s. Aufg. 2.3) mit dem GoldfeldQuandt-Test auf Heteroskedastizität (=0,05)!
Lösung:
1. Schritt
Ordnen der Beobachtungsdaten nach den aufsteigenden Werten des j-ten
Regressors, auf den die Heteroskedastizität zurückgeführt wird.
Hier ist nur ein echter Regressor vorhanden. Die Beobachtungswerte werden nach
dem Gaspreis xt geordnet:
2. Schritt
t
xt
yt
5
7
1
6
4
3
2
12,2
12,5
12,9
12,9
13,2
13,7
13,8
1,2
1,4
1,0
1,1
0,9
0,7
0,8
Aufteilung der Beobachtungsdaten in 2 gleich große Gruppen
Aufgrund der geringen und ungeraden Anzahl von Beobachtungen setzen wir
c=1, so dass der mittlere Wert (t=6) des geordneten Datensatzes nicht verwendet
wird. Er ist in der folgenden Tabelle grau unterlegt dargestellt. Oberhalb befinden
sich die Perioden der ersten Stichprobe und unterhalb der zweiten Stichprobe.
1. Stichprobe
2. Stichprobe
3. Schritt
t
xt
yt
5
12,2
1,2
7
12,5
1,4
1
6
4
12,9
12,9
13,2
1,0
1,1
0,9
3
13,7
0,7
2
13,8
0,8
Hypothesenformulierung:
H0 : 12  22  2
und H1 : 12  22
4. Schritt
Festlegung des Signifikanzniveaus :  = 0,05
5. Schritt
Durchzuführende Regressionen
1. Stichprobe:
y1t = 11 + 12·x1t + u1t
a) OLS-Schätzer ˆ 11 und ˆ 12
t
5
7
1

xt
12,2
12,5
12,9
37,6
xt2
148,84
156,25
166,41
471,50
yt
1,2
1,4
1,0
3,6
xt·yt
14,64
17,50
12,90
45,04
OLS-Schätzer der Regressionskoeffizienten 1 und 2:
n   x1t y1t   x1t  y1t 3  45,04  37,6  3,6  0,24
ˆ 12  1


 0,324
0,74
n1   x12t  ( x1t ) 2
3  471,5  37,6 2
37,6
 y1t ˆ
 x1t 3,6
ˆ 11 
 12 

 (0,324) 
n1
n1
3
3
 1,2  0
,324
12
,533




  5,261
 4,061
OLS-geschätzte Nachfragefunktion für Erdgas:
yˆ 1t = 5,261 – 0,324·x1t, t=5,7,1
b) Regressionswerte
t=5:
t=7:
t=1:
yˆ 15 = 5,261 – 0,324·(x5t=12,2) = 1,308
yˆ 17 = 5,261 – 0,324·(x7t=12,5) = 1,211
yˆ 11 = 5,261 – 0,324·(x1t=12,9) = 1,801
c) Residuen
t=5:
t=7:
t=1:
uˆ 15 = y15 – yˆ 15 = 1,2 – 1,308 = –0,108
uˆ 17 = y17 – yˆ 17 = 1,4 – 1,211 = 0,189
uˆ 11 = y11 – yˆ 11 = 1,0 – 1,081 = –0,081
d) Quadratsumme der Residuen
uˆ 1' uˆ 1   0,108
0,189
  0,108 


 0,081 0,189   0,0539
  0,081


2. Stichprobe:
y2t = 21 + 22·x2t + u2t
ˆ und ˆ
a) OLS-Schätzer 
12
11
t
4
3
2

xt
13,2
13,7
13,8
40,7
yt
0,9
0,7
0,8
2,4
xt2
174,24
187,69
190,44
552,37
xt·yt
11,88
9,59
11,04
32,51
OLS-Schätzer der Regressionskoeffizienten 1 und 2:
n   x 2 t y 2 t   x 2 t  y 2 t 3  32,51  2,4  40,7
ˆ 22  2

n 2   x 22 t  ( x 2 t ) 2
3  552,37  40,7 2

 0,15
 0,242
0,62
40,7
 y 2t ˆ
 x 2 t 2,4
ˆ 21 
  22 

 (0,242) 
n2
n2
3
3
 0,8  0
,242
13
,567




  4,083
 3,283
OLS-geschätzte Nachfragefunktion für Erdgas:
yˆ 2 t = 4,083 – 0,242·x2t, t=6,5,7
b) Regressionswerte
t=4:
t=3:
t=2:
yˆ 14 = 4,083 – 0,242·(x4t=13,2) = 0,889
yˆ 13 = 4,083 – 0,242·(x3t=13,7) = 0,768
yˆ 12 = 4,083 – 0,242·(x2t=13,8) = 0,743
c) Residuen
t=4:
t=3:
t=2:
uˆ 24 = y24 – yˆ 24 = 0,9 – 0,889 = 0,011
uˆ 23 = y23 – yˆ 23 = 0,7 – 0,768 = –0,068
uˆ 22 = y22 – yˆ 22 = 0,8 – 0,743 = 0,057
d) Quadratsumme der Residuen
uˆ '2 uˆ 2  0,011
6. Schritt
 0,068
 0,011 


0,057   0,068   0,0080
 0,057 


Berechnen der Prüfgröße:
uˆ  uˆ
0,0539
1/ GQ  1 1 
 6,738
uˆ 2 uˆ 2 0,0080
7. Schritt
Tabellarische Ermittlung des kritischen Wertes (=0,05):
Fn  c 2  k;n  c 2  k;1   F7 1 2  2;7 1 2  2;0,95  F1;1;0,95  161
8. Schritt
Testentscheidung:
1/ GQ  6,738  F1;1;0,95  161  H0 annehmen
Der Goldfeld-Quandt-Test weist nicht auf Heteroskedastizität der Störgröße hin.
Schätzen Sie die Nachfragefunktion nach Erdgas in Abhängigkeit vom
Gaspreis (= Energiemodell Ia) unter Verwendung der Spezifikation
5.5
 2t   2  GASPt2 der Störtermvarianz mit der gewichteten Methode der
kleinsten Quadrate (WLS-Methode)!
Hinweis: Berechnen Sie die WLS-Schätzer für 1 und 2 unter Verwendung
der Formeln für die OLS-Schätzer mit y t  y*t , x t  x1*t . Verwenden Sie
die transformíerten Variablen sowie ( x1*t ) 2 und x1*t  y*t mit drei Dezimalstellen!
Lösung:
Die Spezifikation der Störvarianz in der Form
 2t   2  GASPt2
führt zu dem transformierten ökonometrischen Nachfragemodell nach Erdgas (GASVt = yt,
GASPt = xt):
^
 GASVt 
GASPt
1
1

  1 
 2 
 u *t  1 
  2  u *t
GASP
GASP
GASP
GASP
t 
t



t


t
*
x1
x*
y*
t
2t 1
t
Bei der Berechnung der WLS-Schätzer für 1 und 2 können die Formeln der OLS-Schätzer
in folgender Form unter Verwendung der transformierten Variablen verwendet werden:
yt
 y*t , x t
 x1*t
Arbeitstabelle:
t
xt
yt
x1*t  1 / x t
y*t  y t / x t
( x1*t ) 2
x1*t  y*t
1
2
3
4
5
6
7

12,9
13,8
13,7
13,2
12,2
12,9
12,5
91,2
1,0
0,8
0,7
0,9
1,2
1,1
1,4
7,1
0,078
0,072
0,073
0,076
0,082
0,078
0,080
0,539
0,078
0,058
0,051
0,068
0,098
0,085
0,112
0,550
0,0061
0,0052
0,0053
0,0058
0,0067
0,0061
0,0064
0,0416
0,0061
0,0042
0,0037
0,0052
0,0080
0,0066
0,0090
0,0428
WLS-Schätzer der Regressionskoeffizienten 1 und 2:
n   x1*t y*t   x1*t  y*t 7  0,0428  0,539  0,550 0,00315
ˆ 1, WLS 


 4,632
0,00068
n   ( x1*t ) 2  ( x1*t ) 2
7  0,0416  0,539 2
*
*
0,539
 yt ˆ
 x1t 0,550
ˆ 2, WLS 
 1, WLS 

 4,632 
 0,079  4
,632
,077

  0
  0,278
n
n
7
7
 0,357
WLS-geschätzte Nachfragefunktion für Erdgas:
^
GASV t  4,632  0,278  GASPt
Der White-Test hat für das Energiemodell III folgendes Resultat erbracht:
5.6
White Heteroskedasticity Test:
F-statistic
Obs*R-squared
0.829402
5.696925
Probability
Probability
0.575525
0.457982
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 01/25/07 Time: 15:39
Sample: 1980 1995
Included observations: 16
Variable
Coefficient
Std. Error
t-Statistic
Prob.
C
GASPR
GASPR^2
FERNWPR
FERNWPR^2
VEINKR
VEINKR^2
-29.74777
-25.04399
17.07002
-21.22605
8.174083
0.068311
-2.23E-05
58.70411
28.17182
15.58422
89.98156
44.31804
0.062335
2.03E-05
-0.506741
-0.888973
1.095340
-0.235893
0.184441
1.095866
-1.097094
0.6245
0.3972
0.3018
0.8188
0.8578
0.3016
0.3011
R-squared
Adjusted R-squared
S.E. of regression
Sum squared resid
Log likelihood
Durbin-Watson stat
0.356058
-0.073237
0.706851
4.496743
-12.54913
2.894434
Mean dependent var
S.D. dependent var
Akaike info criterion
Schwarz criterion
F-statistic
Prob(F-statistic)
0.376351
0.682307
2.443642
2.781649
0.829402
0.575525
a) Erläutern Sie die Grundidee des White-Tests mit Bezug auf die durchgeführte
Hilfsregression!
Lösung:
Grundidee des White-Tests:
Heteroskedastizität, die auf
-
die erklärenden Variablen,
die quadrierten Werte der erklärenden Variablen ( Varianzkonzept)
zurückgeführt werden kann, wird modelliert und getestet.
b) Geben Sie die Testentscheidung des hier wiedergegebenen White-Testes unter
Verwendung des kritischen Wertes und des p-Wertes an (α=0,10)! Interpretieren Sie das
Ergebnis!
Lösung:
Nullhypothese des White-Tests:
H0: 2t = 2 für alle t (Homoskedastizität)
Prüfgröße:
W = nR2 = 160,356058 = 5,697
(R2 aus Hilfsregression)
Kritischer Wert (=0,10):
2r;0,90 = 26;0,90 = 10,6
Testentscheidung:
W = 5,697 < 26;0,90 = 10,6  H0 beibehalten
oder
p = 0,458 > =0,10  H0 beibehalten
Interpretation:
Der White-Test hat keine Heteroskedastizität aufgedeckt.
c) Geben Sie die Hilfsregression des vollständigen White-Testes für das Energiemodell
III an und interpretieren Sie den hierzu gehörenden verkürzten EViews-Output:
White Heteroskedasticity Test:
F-statistic
Obs*R-squared
0.679076
8.073769
Probability
Probability
0.711392
0.526730
Lösung:
Vollständige Hilfsregression des White-Tests
uˆ 2t   0  1  GASPR t   2  FERNWPR t   3  VEINKR t  11  GASPR 2t
  22  FERNWPR 2t   33  VEINKR 2t  12  GASPR t  FERNWPR t
 13  GASPR t  VEINKR t   23  FERNWPR t  VEINKR t  v t
mit uˆ t als Residuum der Nachfragefunktion nach Erdgas
Prüfgröße: W = n·R2 = 8,074
Testentscheidung:
Da p = 0,527 größer ist als alle gängigen Signifikanzniveaus (=0,01, =0,05. =0,10), kann
die Nullhypothese einer homoskedastischen Störvarianz, H0:  2t   2 für alle t, nicht
abgelehnt werden kann.
Bei einer Regression der Erdgasnachfrage auf den Gaspreis (= Energiemodell Ia, Daten s. Aufg. 2.3) ergeben sich folgende OLS-Residen:
5.7
t
1
uˆ t
-0,062
2
0,069
3
4
5
-0,067
-0,051
-0,119
6
0,038
7
0,191
a) Vergleichen Sie den Standardfehler des Regressionskoeffizienten des Gaspreises
unter Annahme homoskedastischer Störterme mit Whites Heteroskedastizität-konsistentem Schätzer!
Hinweis: Verwenden Sie zur Berechnung der beiden Standardfehler die jeweiligen
Summenformeln!
Lösung:
Gaspreis: xt
t
xt
uˆ t
xt  x
x t  x 2
1
2
3
4
5
6
7

12,9
13,8
13,7
13,2
12,2
12,9
12,5
91,2
-0.062
0,069
-0,067
-0,051
-0,119
0,038
0,191
-0,0010
-0,129
0,771
0,671
0,171
-0,829
-0,129
-0,529
-0,0030
0,016641
0,594441
0,450241
0,029241
0,687241
0,016641
0,279841
2,074287
x
uˆ 2t
0,003844
0,004761
0,004489
0,002601
0,014161
0,001444
0,036481
0,067781
1 7
1
 x t   91,2  13,029
7 t 1
7
• Standardfehler von βˆ 2 bei homoskedastischen Störtermen:
ˆ 2 
1
1
2
 0,067781  0,013556
 uˆ t 
nk
72
 
^
Var ˆ 2 
1
2
 x t  x 
 ˆ 2 
1
 0,013556  0,006535
2,074287
ˆ ˆ  0,006535  0,080839
2
• Whites Heteroskedastizitäts-konsistenter Standardfehler von βˆ 2 :
2 2
0,024956
 x t  x  uˆ t
Var ˆ 2 

=0,005800
2
2 2
2
,
074287
 x t  x 
 
^


ˆ ˆ  0,005800  0,076158
2
x t  x 2  uˆ 2t
0,000064
0,002830
0,002021
0,000076
0,009732
0,000024
0,010209
0,024956
b) Geben Sie Whites Heteroskedastizität-konsistente Schätzer der Standardfehler der
^
beiden Regressionskoeffizienten mit Hilfe der Kovarianzmatrix Cov(βˆ ) an!
Lösung:
^
Whites Heteroskedastizität-konsistente Schätzer Kovarianzmatrix Cov(βˆ ) :
^
Cov(βˆ )  ( X' X) 1 X' diag (uˆ 12 , uˆ 22 ,..., uˆ 2n ) X( X' X) 1
Beobachtungsmatrix X:
1
1

1
X  1
1

1
1
12,9 
13,8 

13,7 
13,2 
12,2

12,9 
12,5
Produktmatrix X’X:
1
1

1
1
1
1
1
1
1
1

 
X' X  


 1
12,9 13,8 13,7 13,2 12,2 12,9 12,5 1

1
1
12,9
13,8 

13,7 
91,2 
 7
13,2  
91,2 1190,28
12,2 

12,9
12,5
Inverse der Produktmatrix X’X:
81,975207  6,280992

 6,280992 0,482094 
X' X 1  
Geschätzte Kovarianzmatrix der Störterme:
^
Cov(u )  diag (uˆ 12 , uˆ 22 ,..., uˆ 2n )
0
0
0
0
0
0
0,003844



0
0,004761
0
0
0
0
0


0
0
0,004489
0
0
0
0



0
0
0
0,002601
0
0
0



0
0
0
0
0,014161
0
0


0
0
0
0
0
0,001444
0



0
0
0
0
0
0
0,036481
^
Whites Heteroskedastizität-konsistente Schätzer Kovarianzmatrix Cov(βˆ ) :
^
Cov(βˆ )  ( X' X) 1 X' diag (uˆ 12 , uˆ 22 ,..., uˆ 2n ) X( X' X) 1
 81,975207  6,280992  1
1
1
1
1
1
1 



12
,
9
13
,
8
13
,
7
13
,
2
12
,
2
12
,
9
12
,5
 6,280992 0,482094  
0
0
0
0
0
0
0,003844



0
0,004761
0
0
0
0
0


0
0
0,004489
0
0
0
0



0
0
0
0,002601
0
0
0



0
0
0
0
0,014161
0
0


0
0
0
0
0
0,001444
0



0
0
0
0
0
0
0,036481
1
1

1
 1
1

1
1
12,9 
13,8 

13,7 
81,975207 6,280992 1,032797 0,077475

13,2   
6,280992 0,482094 0,077475 0,005817


12,2

12,9 
12,5
Heteroskedastizität-konsistente Standardfehler der Regressionskoeffizienten:
ˆ ˆ  1,032797  1,016266
1
ˆ ˆ  0,005817  0,076269
2