INSTITUT FÜR SOZI OLOGIE Regressionsverfahren Dr. Johannes Bauer und Dr. Christiane Bozoyan Sommersemester 2016 Freitag, 10-12 und 12-14 Uhr in 409 1 Inhalt der Vorlesung und der Übung Die Kenntnis von Regressionsverfahren ist eine zentrale Fähigkeit bei der Analyse quantitativer Daten. Regressionen werden in der Forschung genutzt, um die Stärke und Relevanz verschiedener Einflussfaktoren zu ermitteln. Die Methodik wird für ein breites Spektrum an wissenschaftlichen und wirtschaftlichen Fragestellungen verwendet. Solche Fragestellungen sind zum Beispiel: In welchem Ausmaß sind Leistungsunterschiede von Schülern auf die soziale Herkunft rückführbar? Werden Übergewichtige aufgrund ihres Übergewichts im Lohn diskriminiert, oder ist dies auf eine geringere Leistungsfähigkeit zurückzuführen? Welche Faktoren beeinflussen die Lebenszufriedenheit in Deutschland? Unterscheidet sich die politische Einstellung in verschiedenen Altersgruppen? Inwiefern wirkt der ökonomische Status auf die Unterschiede in den Alterskohorten? Ziel des Kurses ist die theoretischen und praktischen Herausforderungen von Regressionen zu vermitteln. Studierende sollen in die Lage versetzt werden, gängige Datensituationen analysieren zu können. Behandelt werden insbesondere lineare Modelle, nichtlineare Modelle, Zähldatenmodelle und Modelle für binäre, ordinale und mehrkategoriale Daten. Die Vorlesung wird von einer Übung begleitet, welche den praktischen Umgang mit den erlernten Verfahren vermittelt. Schwerpunkt der Übung ist die Anwendung der Software Stata sowie die korrekte Durchführung und Interpretation eigener Analysen. Voraussetzung für eine aktive Teilnahme sind Kenntnisse grundlegender Mathematik und Statistik (z.B. Ableiten, Varianzen, Skalenniveaus,... ). 2 Stata Stata stellt auf der Homepage (http://www.stata.com) diverse Links und Hilfeleistungen für die Anwender zur Verfügung (siehe hierzu auch die FAQs): www.stata.com/support/faqs/ Auf der Homepage der Princeton University findet man ein einführendes Tutorial: http://data.princeton.edu/stata. Eine Stata-Lizenz erhalten Sie sofern notwendig in der Vorlesung. Literatur: Kohler, Ulrich und Frauke Kreuter, 2012: Datenanalyse mit Stata. Allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. München: Oldenbourg. 3 Terminübersicht Datum Thema der Vorlesung/Übung 15.04.2016 Lineare Regressionsmodelle: Grundlagen Raum 409 Literatur: Fahrmeir, Ludwig, Kneib, Thomas und Lang, Stefan (2007): Regression. Modelle, Methoden und Anwendungen. Springer. S. 59-111, 160/161. 22.04.2016 Lineare Regressionsmodelle: Variablenbildung und Linearität 409 Literatur: Fahrmeir, Ludwig, Kneib, Thomas and Lang, Stefan (2007): Regression. Modelle, Methoden und Anwendungen. Springer. S. 59-111. 29.04.2016 Lineare Regressionsmodelle: Modellierung nichtlinearer Zusammenhänge 409 Literatur: Fahrmeir, Ludwig, Kneib, Thomas and Lang, Stefan (2007): Regression. Modelle, Methoden und Anwendungen. Springer. S. 292316.. 06.05.2016 Lineare Regressionsmodelle: Hypothesentests und Fehlerverteilung 409 Literatur: Fahrmeir, Ludwig, Kneib, Thomas and Lang, Stefan (2007): Regression. Modelle, Methoden und Anwendungen. Springer. S. 111146. 13.05.2016 Lineare Regressionsmodelle: Kriterien der Modellwahl 409 Literatur: Fahrmeir, Ludwig, Kneib, Thomas and Lang, Stefan (2007): Regression. Modelle, Methoden und Anwendungen. Springer. S. 111146. 20.05.2016 Lineare Regressionsmodelle: Spezielle Verfahren der Linearen Regression 409 Literatur: Morgan, Stephen L. and Winship, Christopher (2010): Counterfactuals and Causal Inference. Cambridge University Press. Rubin, Donald (1984): Incomplete Data in Sample Surveys (Volume 2): Theory and Bibliographies. New York:Academic Press. Fahrmeir, Ludwig, Kneib, Thomas and Lang, Stefan (2007): Regression. Modelle, Methoden und Anwendungen. Springer. S. 146-159. 27.05.2016 Lineare Regressionsmodelle: LPM, ML-Schätzung und Logit Modelle Literatur: Best, Henning, and Christof Wolf (2010): Logistische Regression. S. 827-854 in: Best, Henning, and Christof Wolf (Hrsg.): Handbuch der sozialwissenschaftlichen Datenanalyse. Wiesbaden: VS Verlag. 409 03.06.2016 Kategoriale Modelle: Logit Modelle und Interpretationsmöglichkeiten 409 Literatur: Long, Scott J., and Jeremy Freese, (2006): Chapter 6 “Models for binary outcomes: Interpretation” S. 227-260 in: Regression Models for Categorical Dependent Variables Using Stata. College Station, Texas: Stata Press. 10.06.2016 Kategoriale Modelle: Gruppen- und Modellvergleiche 409 Literatur: Auspurg, Katrin und Hinz, Thomas (2011): Gruppenvergleiche bei Regressionen mit binären abhängigen Variablen – Probleme und Fehleinschätzungen am Beispiel von Bildungschancen im Kohortenverlauf. Zeitschrift für Soziologie 40, 62-73. 17.06.2016 Kategoriale Modelle: Modelle für ordinale abhängige Variablen 409 Literatur: Long, Scott J., and Jeremy Freese, (2006): Chapter 7 “Models for ordinal outcomes” S. 309-350 in: Regression Models for Categorical Dependent Variables Using Stata. College Station, Texas: Stata Press. 24.06.2016 Kategoriale Modelle: Modelle für nominale abhängige Variablen 409 Literatur: Long, Scott J., and Jeremy Freese, (2006): Chapter 8 “Models for nominal outcomes” S. 385-444 in: Regression Models for Categorical Dependent Variables Using Stata. College Station, Texas: Stata Press. 01.07.2016 Zähldatenmodelle 409 Literatur: Long, Scott J., and Jeremy Freese, (2006): Chapter 9 “Models for count outcomes” S. 481-516 in: Regression Models for Categorical Dependent Variables Using Stata. College Station, Texas: Stata Press. 08.07.2016 Fragestunde und Klausurvorbereitung 409 E-Mail mit Fragen bis zum 06.07.2016, 12:00 senden an: [email protected] und [email protected] 15.07.2016 4 Abschlussklausur 409 Leistungsnachweis Der formale Leistungsnachweis besteht aus einer Abschlussklausur sowie einer etwa 10-seitigen Hausarbeit, welche die Analyse einer vorgegebenen Hypothese beinhaltet. Beide Teilleistungen müssen mit mindestens 4 bewertet werden, damit der Kurs als bestanden gilt. Klausurtermin: 15.07.2016 (50% der Note) Abgabe der Hausarbeit: 15.09.2016 (50% der Note) Die Klausur beinhaltet Verständnisfragen und die Interpretation von Regressionsoutputs. Die Hausarbeit senden Sie am 15.09.2016 bis spätestens 12:00 Uhr an [email protected] und [email protected]. Unentschuldigtes zu spätes Abgeben führt zum Ausschluss aus dem Kurs. Es soll keine schriftliche Arbeit in Printform abgegeben werden, sondern nur ein PDF, das die Auswertung, den Do-File sowie eine gescannte Selbstständigkeitserklärung enthält. Beachten Sie in der Hausarbeit alle Formalia und Zitationsregeln, wie Sie es im Kurs „Einführung in das wissenschaftliche Arbeiten“ gelernt haben. Zur Erinnerung: Alphabetische Ordnung des Quellenverzeichnisses Times New Roman, Schriftgröße 12 pt Blocksatz; 1,5 Zeilenabstand Seitenzahlen und Silbentrennung Tabellen und Abbildungen beschriften Tabellen haben keine vertikalen Linien Regressionsoutputs müssen in Tabellen übertragen werden (außer natürlich Grafiken) Jede Grafik und jede Tabelle muss für sich (inklusive etwaiger „Bemerkungen“) lesbar sein, aber jeweils ein Verweis im Fließtext ist notwendig. Auch eine Hausarbeit sollte ein Deckblatt und ein Inhalts- sowie Abbildungs- und Tabellenverzeichnis haben. Das Deckblatt enthält die Angaben zu Ihrer Person (Name, Vorname, Matrikelnummer, Anschrift, E-Mail-Adresse), den Titel der Hausarbeit und die Angaben zu diesem Kurs (Universität, Institut, Titel des Seminars, Dozenten, Semester). Das Inhaltsverzeichnis muss automatisch erstellt werden. Bitte gewöhnen Sie sich die „amerikanische Zitationsweise“ an, d.h. zitiert wird durch den Namen + Jahr, evtl. Seite im Text, also z.B. (Coleman 1990: 25), die Literaturangabe steht dann im Literaturverzeichnis. Fußnoten sind nur für inhaltliche Anmerkungen da, nicht für die Literaturangabe. In der Literaturliste taucht nur auf, was im Text zitiert bzw. erläutert wurde. Nicht zitationswürdig ist: Wikipedia, Vorlesungsfolien etc. Als Faustregel gilt: Internetquellen sind nur dann zulässig, wenn die entsprechende Information nicht anders zugänglich ist.
© Copyright 2025 ExpyDoc