Regressionsverfahren Dr. Johannes Bauer und Dr. Christiane

INSTITUT FÜR SOZI OLOGIE
Regressionsverfahren
Dr. Johannes Bauer und Dr. Christiane Bozoyan
Sommersemester 2016
Freitag, 10-12 und 12-14 Uhr in 409
1
Inhalt der Vorlesung und der Übung
Die Kenntnis von Regressionsverfahren ist eine zentrale Fähigkeit bei der Analyse quantitativer
Daten. Regressionen werden in der Forschung genutzt, um die Stärke und Relevanz verschiedener Einflussfaktoren zu ermitteln. Die Methodik wird für ein breites Spektrum an wissenschaftlichen und wirtschaftlichen Fragestellungen verwendet. Solche Fragestellungen sind zum Beispiel:
 In welchem Ausmaß sind Leistungsunterschiede von Schülern auf die soziale Herkunft
rückführbar?
 Werden Übergewichtige aufgrund ihres Übergewichts im Lohn diskriminiert, oder ist dies
auf eine geringere Leistungsfähigkeit zurückzuführen?
 Welche Faktoren beeinflussen die Lebenszufriedenheit in Deutschland?
 Unterscheidet sich die politische Einstellung in verschiedenen Altersgruppen? Inwiefern
wirkt der ökonomische Status auf die Unterschiede in den Alterskohorten?
Ziel des Kurses ist die theoretischen und praktischen Herausforderungen von Regressionen zu
vermitteln. Studierende sollen in die Lage versetzt werden, gängige Datensituationen analysieren
zu können. Behandelt werden insbesondere lineare Modelle, nichtlineare Modelle, Zähldatenmodelle und Modelle für binäre, ordinale und mehrkategoriale Daten.
Die Vorlesung wird von einer Übung begleitet, welche den praktischen Umgang mit den erlernten Verfahren vermittelt. Schwerpunkt der Übung ist die Anwendung der Software Stata sowie
die korrekte Durchführung und Interpretation eigener Analysen.
Voraussetzung für eine aktive Teilnahme sind Kenntnisse grundlegender Mathematik und Statistik (z.B. Ableiten, Varianzen, Skalenniveaus,... ).
2
Stata
Stata stellt auf der Homepage (http://www.stata.com) diverse Links und Hilfeleistungen für die
Anwender zur Verfügung (siehe hierzu auch die FAQs): www.stata.com/support/faqs/
Auf der Homepage der Princeton University findet man ein einführendes Tutorial:
http://data.princeton.edu/stata.
Eine Stata-Lizenz erhalten Sie sofern notwendig in der Vorlesung.
Literatur: Kohler, Ulrich und Frauke Kreuter, 2012: Datenanalyse mit Stata. Allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. München: Oldenbourg.
3
Terminübersicht
Datum
Thema der Vorlesung/Übung
15.04.2016
Lineare Regressionsmodelle: Grundlagen
Raum
409
Literatur: Fahrmeir, Ludwig, Kneib, Thomas und Lang, Stefan (2007):
Regression. Modelle, Methoden und Anwendungen. Springer. S. 59-111,
160/161.
22.04.2016
Lineare Regressionsmodelle: Variablenbildung und Linearität
409
Literatur: Fahrmeir, Ludwig, Kneib, Thomas and Lang, Stefan (2007):
Regression. Modelle, Methoden und Anwendungen. Springer. S. 59-111.
29.04.2016
Lineare Regressionsmodelle: Modellierung nichtlinearer Zusammenhänge
409
Literatur: Fahrmeir, Ludwig, Kneib, Thomas and Lang, Stefan (2007):
Regression. Modelle, Methoden und Anwendungen. Springer. S. 292316..
06.05.2016
Lineare Regressionsmodelle: Hypothesentests und Fehlerverteilung
409
Literatur: Fahrmeir, Ludwig, Kneib, Thomas and Lang, Stefan (2007):
Regression. Modelle, Methoden und Anwendungen. Springer. S. 111146.
13.05.2016
Lineare Regressionsmodelle: Kriterien der Modellwahl
409
Literatur: Fahrmeir, Ludwig, Kneib, Thomas and Lang, Stefan (2007):
Regression. Modelle, Methoden und Anwendungen. Springer. S. 111146.
20.05.2016
Lineare Regressionsmodelle: Spezielle Verfahren der Linearen Regression
409
Literatur: Morgan, Stephen L. and Winship, Christopher (2010): Counterfactuals and Causal Inference. Cambridge University Press.
Rubin, Donald (1984): Incomplete Data in Sample Surveys (Volume 2):
Theory and Bibliographies. New York:Academic Press.
Fahrmeir, Ludwig, Kneib, Thomas and Lang, Stefan (2007): Regression.
Modelle, Methoden und Anwendungen. Springer. S. 146-159.
27.05.2016
Lineare Regressionsmodelle: LPM, ML-Schätzung und Logit Modelle
Literatur: Best, Henning, and Christof Wolf (2010): Logistische Regression. S. 827-854 in: Best, Henning, and Christof Wolf (Hrsg.): Handbuch der sozialwissenschaftlichen Datenanalyse. Wiesbaden: VS Verlag.
409
03.06.2016
Kategoriale Modelle: Logit Modelle und Interpretationsmöglichkeiten
409
Literatur: Long, Scott J., and Jeremy Freese, (2006): Chapter 6 “Models
for binary outcomes: Interpretation” S. 227-260 in: Regression Models
for Categorical Dependent Variables Using Stata. College Station, Texas:
Stata Press.
10.06.2016
Kategoriale Modelle: Gruppen- und Modellvergleiche
409
Literatur: Auspurg, Katrin und Hinz, Thomas (2011): Gruppenvergleiche bei Regressionen mit binären abhängigen Variablen – Probleme und
Fehleinschätzungen am Beispiel von Bildungschancen im Kohortenverlauf. Zeitschrift für Soziologie 40, 62-73.
17.06.2016
Kategoriale Modelle: Modelle für ordinale abhängige Variablen
409
Literatur: Long, Scott J., and Jeremy Freese, (2006): Chapter 7 “Models
for ordinal outcomes” S. 309-350 in: Regression Models for Categorical
Dependent Variables Using Stata. College Station, Texas: Stata Press.
24.06.2016
Kategoriale Modelle: Modelle für nominale abhängige Variablen
409
Literatur: Long, Scott J., and Jeremy Freese, (2006): Chapter 8 “Models
for nominal outcomes” S. 385-444 in: Regression Models for Categorical
Dependent Variables Using Stata. College Station, Texas: Stata Press.
01.07.2016
Zähldatenmodelle
409
Literatur: Long, Scott J., and Jeremy Freese, (2006): Chapter 9 “Models
for count outcomes” S. 481-516 in: Regression Models for Categorical
Dependent Variables Using Stata. College Station, Texas: Stata Press.
08.07.2016
Fragestunde und Klausurvorbereitung
409
E-Mail mit Fragen bis zum 06.07.2016, 12:00 senden an:
[email protected] und [email protected]
15.07.2016
4
Abschlussklausur
409
Leistungsnachweis
Der formale Leistungsnachweis besteht aus einer Abschlussklausur sowie einer etwa 10-seitigen
Hausarbeit, welche die Analyse einer vorgegebenen Hypothese beinhaltet. Beide Teilleistungen
müssen mit mindestens 4 bewertet werden, damit der Kurs als bestanden gilt.
Klausurtermin: 15.07.2016 (50% der Note)
Abgabe der Hausarbeit: 15.09.2016 (50% der Note)
Die Klausur beinhaltet Verständnisfragen und die Interpretation von Regressionsoutputs. Die
Hausarbeit senden Sie am 15.09.2016 bis spätestens 12:00 Uhr an [email protected] und [email protected]. Unentschuldigtes zu spätes Abgeben führt zum Ausschluss aus dem Kurs. Es soll keine schriftliche Arbeit in Printform abgegeben werden, sondern nur ein PDF, das die Auswertung, den Do-File sowie eine gescannte Selbstständigkeitserklärung enthält.
Beachten Sie in der Hausarbeit alle Formalia und Zitationsregeln, wie Sie es im Kurs „Einführung in das wissenschaftliche Arbeiten“ gelernt haben. Zur Erinnerung:








Alphabetische Ordnung des Quellenverzeichnisses
Times New Roman, Schriftgröße 12 pt
Blocksatz; 1,5 Zeilenabstand
Seitenzahlen und Silbentrennung
Tabellen und Abbildungen beschriften
Tabellen haben keine vertikalen Linien
Regressionsoutputs müssen in Tabellen übertragen werden (außer natürlich Grafiken)
Jede Grafik und jede Tabelle muss für sich (inklusive etwaiger „Bemerkungen“) lesbar
sein, aber jeweils ein Verweis im Fließtext ist notwendig.
Auch eine Hausarbeit sollte ein Deckblatt und ein Inhalts- sowie Abbildungs- und Tabellenverzeichnis haben. Das Deckblatt enthält die Angaben zu Ihrer Person (Name, Vorname, Matrikelnummer, Anschrift, E-Mail-Adresse), den Titel der Hausarbeit und die Angaben zu diesem Kurs
(Universität, Institut, Titel des Seminars, Dozenten, Semester). Das Inhaltsverzeichnis muss automatisch erstellt werden.
Bitte gewöhnen Sie sich die „amerikanische Zitationsweise“ an, d.h. zitiert wird durch den Namen + Jahr, evtl. Seite im Text, also z.B. (Coleman 1990: 25), die Literaturangabe steht dann im
Literaturverzeichnis. Fußnoten sind nur für inhaltliche Anmerkungen da, nicht für die Literaturangabe.
In der Literaturliste taucht nur auf, was im Text zitiert bzw. erläutert wurde. Nicht zitationswürdig ist: Wikipedia, Vorlesungsfolien etc. Als Faustregel gilt: Internetquellen sind nur dann zulässig, wenn die entsprechende Information nicht anders zugänglich ist.