Aufgabe 16 Im Datensatz gpa2.raw 1 liegen u.a. folgende Merkmale

Statistik III für Nebenfachstudierende
Ludwig Bothmann, Sabrina Enzinger
Tutoriumsblatt 7
WiSe 2015/16
Aufgabe 16
Im Datensatz gpa2.raw1 liegen u.a. folgende Merkmale zu 4137 College-Studierenden vor:
colgpa
sat
hsize
hsrank
hsperc
white
black
GPA (grade point average) nach dem ersten Herbstsemester [0, 4]
Kombinierter SAT-Score (Eignungstest vor dem Studium) [470, 1540]
Größe des Abschlussjahrgangs an der Highschool, in 100
Rangplatz des Studierenden im Abschlussjahrgang an der Highschool
100 · (hsrank/hsize): Perzentil des Rangplatzes im Abschlussjahrgang
1, falls weiße Hautfarbe, 0 sonst
1, falls schwarze Hautfarbe, 0 sonst
Der Zusammenhang des GPA mit anderen Variablen soll mithilfe der multiplen linearen
Regression untersucht werden.
4
4
3
3
colgpa
colgpa
(a) Für die Variablen sat bzw. hsperc ergeben sich mit colgpa folgende Streudiagramme. Was
lässt sich aufgrund der Diagramme über den Zusammenhang der Merkmale aussagen?
2
1
2
1
0
0
500
750
1000
1250
1500
0
25
sat
50
75
hsperc
(b) Betrachtet werden zunächst die folgenden Modelle:
(1)
colgpai = β0 + β1 · sati + β2 · hsperci + i
(2)
colgpai = β0 + β1 · sati + β2 · hsperci + β3 · (hsperci )2 + i
(3)
colgpai = β0 + β1 · sati + β2 · (hsperci )−1 + i
Für diese Modelle ergeben sich die folgenden Parameterschätzungen:
Modell
(1)
(2)
(3)
β̂0
β̂1
β̂2
β̂3
1.39175672
1.65940065
0.96484572
0.0014762
0.0013488
0.0015631
-0.01351923
-0.02923041
0.42095264
0.0002573
(i) Wie lassen sich die Parameter jeweils interpretieren?
(ii) Haben βˆ2 und βˆ3 in Modell (2) die erwarteten Vorzeichen? Begründen Sie Ihre
Meinung. Was lässt sich über die Form des geschätzten Effekts von hsperc in Modell
(2) aussagen?
1
vgl. Wooldridge, J. (2013): Introductory Econometrics, 5. Aufl. Mason: South-Western Cengage Learning.
Datum: 13.01.2016
Seite 1 von 2
(c) Könnte es sinnvoll sein, hsrank als Kovariable aufzunehmen?
(d) Im folgenden Modell wird die Hautfarbe als dummykodierte Kovariable in Modell (2)
aufgenommen:
(4)
colgpai = β0 + β1 · sati + β2 · hsperci + β3 · (hsperci )2 + β4 · whitei + β5 · blacki + i
(i) Wie verändert sich die Interpretation der anderen Parameter?
P
P
(ii) Es zeigt sich, dass ni=1 whitei = 3829 und ni=1 blacki = 229.
Ist die Dummykodierung der Kovariablen Hautfarbe aus Ihrer Sicht in diesem Fall
geglückt?
Datum: 13.01.2016
Seite 2 von 2