Statistik II
V. Asymptotische Eigenschaften von OLS
Martin Huber
1/9
Übersicht
Konsistenz
Asymptotische Normalität
2/9
Konsistenz
Bisher haben wir über die Eigenschaften des OLS Schätzers in
begrenzten/kleinen Stichproben (Grösse N) gesprochen, in welchen
besagte Eigenschaften von der Stichprobengrösse abhängen.
Nachfolgend beschäftigen wir uns mit den Eigenschaften in grossen
Stichproben: asymptotische Eigenschaften wenn N → ∞
Konsistenz:
P(|β̂j − βj | > ) → 0 für irgendein > 0 wenn N → ∞
plim(β̂j ) = βj
3/9
4/9
Unter Annahme von MLR.1-MLR.4 ist der OLS Schätzer β̂j ein
konsistenter Schätzer für βj für alle j = 0, 1, ..., k.
PN
rˆij ui
plim(β̂j ) = βj + plim Pi=1
N
2
i=1 rˆij
wobei rˆij das (geschätzte) Residuum der Regression von xj auf alle anderen
Regressoren und Konstante in der Stichprobe ist
Gesetz der grossen Zahl (Law of large numbers)
plim a = α, wobei a dem Schätzer in der Stichprobe für das Moment α in
der Population entspricht.
Annahme MLR.4 E (u|x1 , x2 , ..., xk ) = 0 impliziert:
E (u) = 0 und Cov (rj , u) = 0 ∀ j = 0, 1, ..., k - wobei rj das Residuum der
Regression von xj auf alle anderen Regressoren und Konstante in der
Population ist
⇒
plim(β̂j ) = βj +
Cov (rj , u)
= βj
Var (rj )
5/9
Inkonsistenz des OLS Schätzers β̂j :
plim(β̂j − βj ) =
Cov (rj , u)
wenn Cov (rj , u) 6= 0
Var (rj )
Asymptotisches Analog zur Verzerrung aufgrund unberücksichtigter
Kontrollvariablen (“omitted variable bias”):
Populationsmodell: y = β0 + β1 x1 + β2 x2 + u
Geschätztes Modell: y̌ = β̌0 + β̌1 x1
(x1 ,x2 )
Inkonsistenz: plim(β̌1 ) = β1 + δ1 β2 wobei δ1 = Cov
Var (x1 )
⇒ Richtung der Inkonsistenz hängt von δ1 und β2 ab.
6/9
Asymptotische Normalität (1)
Y1 , Y2 , Y3 , . . . sei eine Folge von unabhängigen Zufallsvariablen mit
identischer Verteilung (u.i.v. = unabhängig und identisch verteilt,
i.i.d. = independent and identically distributed), deren
Erwartungswert E (Y ) und Varianz var (Y ) existieren und endlich sind.
Sei SN die n-te Teilsumme dieser Zufallsvariablen (bestehend aus n
Zufallsvariablen), SN = Y1 + Y2 + · · · + YN . Der Erwartungswert von
SN ist N · E (Y ) und die Varianz ist N · var (Y ).
7/9
Asymptotische Normalität (2)
Zentraler Grenzwertsatz (Central Limit Theorem):
SN − N · E (Y ) a
√ ∼ N(0, 1),
ZN = p
Var (Y ) N
d.h., Verteilungsfunktion von ZN konvergiert zur
Standardnormalverteilung, wenn N gegen ∞ geht. Dies impliziert:
ZN =
SN
N√− E (Y )
Var (Y )
√
N
∼a N(0, 1),
SN
N√ der Mittelwert von Y in der Stichprobe der N Zufallsvariablen
Var (Y )
und √N
die Standardabweichung des Mittelwerts.
wobei
ist
Dies impliziert:
SN
N
∼a N E (Y ), VarN(Y )
8/9
Asymptotische Normalität (3)
Der zentrale Grenzwertsatz lässt sich auch auf den OLS Schätzer
übertragen, der wie der Mittelwert eine Funktion von Zufallsvariablen ist:
β̂j − βj
q
∼a N(0, 1) ∀j = 1, 2, ..., k, wobei
Var (β̂j )
q
Var (β̂j ) = se(β̂j )
β̂j ∼a N βj , Var (β̂j )
Var (β̂j ) =
σ2
σ2
≈
SSTj (1 − Rj2 )
N · Var (xj ) · (1 − Rj2 )
P
SSTj = ni=1 (xij − x̄j )2 und Rj2 = R 2 der Regression von xj auf alle
anderen Regressoren und Konstante
Var (β̂j ) geht mit der Rate
1
N,
se(β̂j ) mit der Rate
√1
N
gegen Null
Grössere Stichproben führen zu effizienteren Schätzern
9/9