Arbeitsblatt I Einfaches lineares Regressionsmodell

Arbeitsblatt I
Als Grundlage für die Vorlesung dient das Lehrbuch Wooldridge, Jeffrey M. (2009): Introductory
Econometrics: A Modern Approach. Fourth Edition, South-Western, Cengage Learning. Frühere
Auflagen sind für den Zweck dieses Kurses ebenso geeignet. Folgende Aufgaben stammen aus dem
Lehrbuch und sollen zum Selbststudium und zur Klausurvorbereitung dienen.
Einfaches lineares Regressionsmodell
Aufgabe 1
Nennen wir kids die Anzahl aller Kinder, die eine Frau je zur Welt gebracht hat. Die Variable educ
beschreibt die Anzahl der Jahre an Ausbildung der jeweiligen Frau. Ein einfaches Modell zur Darstellung des Zusammenhangs von Fertilität und Bildungsgrad ist:
kids = β0 + β1 educ + u
mit u als Fehlerterm.
1. Welche Faktoren beinhaltet u? Sind diese mit dem Ausbildungsgrad korreliert?
2. Kann eine einfache lineare Regression den ceteris paribus Effekt (also den kausalen Zusammenhang) zwischen Bildungsgrad und Fertilität aufdecken? Erläutern Sie!
Aufgabe 2
Nehmen Sie an, dass im einfachen linearen Regressionsmodell y = β0 + β1 x + u gilt und E(u) 6= 0.
Zeigen Sie formal, dass das Modell immer mit identischem Steigungsparameter aber neuem Achsenabschnitt (Konstante) und Fehlerterm geschrieben werden kann, wenn α0 = E(u) gilt und der neue
Fehlerterm einen Erwartungswert von Null hat.
Aufgabe 3
Für die lineare Konsumfunktion cons
ˆ = βˆ0 + βˆ1 inc entspricht die geschätzte marginale Konsumquote
der Steigung β1 und die durchschnittliche Konsumquote ist cons/inc
ˆ
= βˆ0 /inc + βˆ1 . Das Einkommen
und der Konsum (beides in US Dollar) wurden für 100 Familien beobachtet und die Schätzung ergab:
cons
ˆ = −124, 84 + 0, 853inc
n = 100
R2 = 0, 692
1. Interpretieren Sie die Konstante und kommentieren Sie das Vorzeichen sowie die Höhe.
2. Wie hoch ist der geschätzte Konsum bei einem Familieneinkommen von 30.000 USD?
3. Skizzieren Sie den Verlauf der geschätzten marginalen Konsumquote und der durchschnittlichen Konsumquote in einem Diagramm, in dem inc auf der x-Achse abgetragen ist.
Aufgabe 4
Für eine Untersuchung des Kompromisses zur Nutzung von Zeit zum Schlafen (sleep) und bezahltem
Arbeiten (totwrk) (beides in Minuten pro Woche) unterstellen wir folgenden Zusammenhang:
sleep = β0 + β1totwrk + u.
Die Schätzung lieferte:
sleep = 3.586, 4 − 0, 101totwrk
n = 706
R2 = 0, 103
1. Was bedeutet der Achsenabschnitt?
2. Um wie viele Minuten wird sich die Schlafenszeit bei einer Erhöhung der Arbeitszeit um 2
Stunden verändern? Ist das ein großer Effekt?
Multiples lineares Regressionsmodell
Aufgabe 5
Eine Stichprobe von arbeitenden Männern wurde zur Schätzung folgender Gleichung genutzt:
ˆ = 10, 36 − 0, 094sibs + 0, 131meduc + 0, 210 f educ
educ
n = 722,
R2 = 0, 214
wobei educ die Anzahl der Jahre der Schulausbildung eines Mannes abbildet, sibs die Anzahl der
Geschwister, meduc ist die Anzahl der Jahre der Schulausbildung der Mutter und f educ die Anzahl
der Jahre der Schulausbildung des Vaters.
1. Hat sibs den erwarteten Effekt? Erläutern Sie! Wenn meduc und f educ festgehalten werden
muss sich sibs um wie viel erhöhen, damit sich die vorhergesagte Anzahl der Jahre der Schulausbildung um ein Jahr verringert?
2. Diskutieren Sie die Interpretation des Koeffizienten für meduc.
3. Nehmen Sie an, dass Mann A keine Geschwister hat und seine Eltern jeweils beide 12 Jahre
Schulausbildung genossen. Mann B habe ebenfalls keine Geschwister und seine Eltern jeweils
beide 16 Jahre Schulausbildung. Wie groß ist die geschätzte Differenz in Jahren Schulausbildung von Mann A und Mann B?
Aufgabe 6
Unterstellen Sie ein lineares Regressionsmodell mit drei unabhängigen Variablen unter den Annahmen MLR1 bis MLR4:
y = β0 + β1 x1 + β2 x2 + β3 x3 + u.
Sie möchten die Summe der Koeffizienten für die Variablen x1 und x2 schätzen. Nennen wir das
θ1 = β1 + β2 .
1. Zeigen Sie formal, dass θˆ1 = βˆ1 + βˆ2 ein unverzerrter Schätzer für θ1 ist.
2. Leiten Sie Var(θˆ1 ) formal als Funktion von Var(βˆ1 ), Var(βˆ2 ) und Corr(βˆ1 , βˆ1 ) her.
Aufgabe 7
Welcher der folgenden Punkte kann zu einer Verzerrung der OLS-Schätzer führen?
1. Heteroskedastizität
2. Fehlen relevanter Variablen
3. Stichprobenkorrelationskoeffizient von 0,95 zweier unabhängiger Variablen, die beide im Modell enthalten sind.
Aufgabe 8
Ein Datensatz beinhaltet Informationen zu Hauspreisen price in Tausend US Dollar. Die Schätzung
einer linearen Regression liefert folgendes Ergebnis:
price = −19, 32 + 0, 128sqr f t + 15, 20bdrms
n = 88 R2 = 0, 632
wobei sqr f t die Größe des Hauses und bdrms die Anzahl der Zimmer im Haus angeben.
1. Wie verändert sich der geschätzte Hauspreis bei einem zusätzlichen Zimmer und konstanter
Hausgröße?
2. Wie verändert sich der geschätzte Hauspreis bei einem zusätzlichen Zimmer welches 140 sqr f t
groß ist? Vergleichen Sie mit Ihrer Antwort aus 1.
3. Welcher prozentuale Anteil der Preisvariation wird durch sqr f t und bdrms erklärt?
4. Das erste beobachtete Haus im Datensatz hat sqr f t = 2.483 und bdrms = 4. Was ist der
geschätzte Verkaufspreis für dieses Haus auf Grundlage einer OLS-Regression?
5. Der tatsächliche Verkaufspreis des Hauses aus Teilaufgabe 4 war 300.000 USD (also price =
300). Bestimmen Sie das Residuum für dieses Haus. Hat der Käufer zu viel oder zu wenig für
das Haus gezahlt?