Institut für Soziologie Werner Fröhlich Methoden 2 Ziele, Organisatorisches und Einführung in Stata Programm § Ziele des Teilmoduls „Methoden 2“ § Organisatorisches § Literatur zur Veranstaltung § Vorstellung des Projekts „Gesellschaftliche und politische Einstellungen“ § Erste Schritte mit Stata • • • • • • Die Fenster in Stata Befehlssyntax allgemein und Abkürzungsregeln Öffnen eines Datenfiles Do- und log-Files Missings Hilfreiche Befehle § Übungsaufgabe Werner Fröhlich 2 Ziele Teilmodul „Methoden 2“ § Inhalte und Lernziele von „Methoden 1“ • • • • Theoriegeleitete Konkretisierung einer Forschungsfrage Wahl des Untersuchungsdesigns Wahl und Entwicklung geeigneter Messinstrumente Durchführung einer eigenen Datenerhebung § Inhalte und Lernziele von „Methoden 2“ • • • • Wiederholung und Anwendung von Auswertungsverfahren Wahl geeigneter statistischer Analyseverfahren Kritische Interpretation (eigener) statistischer Ergebnisse Bedienung eines gängigen statistischen Softwarepakets (Stata) Werner Fröhlich 3 Organisatorisches Methoden 2-Veranstaltungen § Gemeinsame Übung (Tafelübung im Hörsaal C123, Theresienstr. 41) • • • • Vorstellung der statistischen Verfahren Hinweise zur praktischen Umsetzung mit Stata Vergabe von Übungsaufgaben (wöchentlich) Folien sind jeweils ab Freitag vor der jeweiligen Sitzung auf der Homepage zu den Methoden 2-Übungen abrufbar: http://www.ls4.soziologie.uni-muenchen.de/studium_lehre § Übung • • • • Konradstr. 6, CIP-Labor; Mo., 14 – 18 Uhr und Di., 16 – 18 Uhr (frei wählbar) Oettingenstr. 67, Raum L055; Di., 12 – 14 Uhr (barrierefrei) Eigenständige Lösung der Übungsaufgaben mittels Stata Hilfe bei Schwierigkeiten durch Kursleiter bzw. Tutoren § Tutorien: geblockt vor Zwischen- und Endklausur (Termine siehe Folie #7) Werner Fröhlich 4 Organisatorisches Leistungsanforderungen § Zu erbringende Leistungen • Bestehen der Zwischenklausur • Bestehen der Abschlussklausur • Fristgerechte Abgabe und Bestehen einer Gruppenhausarbeit § Benotung • Hauptfach Soziologie: Die Gesamtnote berechnet sich aus dem arithm. Mittel von Zwischenklausur, Gruppenhausarbeit und Abschlussklausur • Hauptfach Statistik: Zwischenklausur und Gruppenhausarbeit • Für Anrechnung von ECTS-Punkten oder Scheinerwerb müssen Zwischenklausur, Abschlussklausur und Hausarbeit jeweils bestanden werden (Note jeweils ≤4) § Inhaltliche Anforderungen sowie formale Kriterien bzgl. der Gruppenhausarbeiten finden sich im Programm (S. 2f.) Werner Fröhlich 5 Organisatorisches Termine: Klausuren und Hausarbeit § Zwischenklausur: Montag, 23.05.16, Theresienstr. 41, Hörsaal C123; Dauer: 45 Min.; Beginn: 10.15 Uhr § Abgabe der Gruppenhausarbeit: 25.07.16, 23.00 Uhr Abgabeform: PDF-Datei (Einverständniserklärung nicht vergessen) § Abschlussklausur: Montag, 11.07.16, Theresienstr. 41, Hörsaal C123; 10.00 – 12.00 Uhr § Wiederholungszwischenklausur: 07.10.2016 § Wiederholungsabschlussklausur: 14.10.2016 Werner Fröhlich 6 Organisatorisches Termine: Tutorien § Tutorien finden jeweils in der Woche vor der Zwischenklausur und Abschlussklausur statt (CIP-Labor: Konradstr. 6, Raum 409). § Vor der Zwischenklausur: Do., 19.05.2016, 12 – 16 Uhr § Vor der Abschlussklausur: Do., 07.07.2016, 12 – 16 Uhr Werner Fröhlich 7 Literatur § Wiederholung der statistischen Grundlagen: • Diaz-Bone, Rainer (2013): Statistik für Soziologen. Konstanz. • Jann, Ben (2005): Einführung in die Statistik. 2. Aufl. München. § Einführende Stata-Bücher: • Acock, Alan C. (2012): A Gentle Introduction to Stata. College Station: Stata Press. • Kohler, Ulrich und Frauke Kreuter (2012): Datenanalyse mit Stata. Allgemeine Konzepte der Datenanalyse und ihre praktische Anwendung. München. • Pollock, Philip H. (2015): A Stata Companion to Political Analysis. London. § Wiederholung der Grundlagen empirischer Sozialforschung: • Diekmann, Andreas (2012): Empirische Sozialforschung. Reinbek. § Literatur zu den theoretischen Grundlagen der Erhebung: • Kursbegleitende Homepage (Passwort: M2GMF) Werner Fröhlich 8 Projekt: Gesellschaftliche Einstellungen Design und Erhebung Im Frühjahr 2016 werden bayerische und Münchner Bürgerinnen und Bürger zu „gruppenbezogener Menschenfeindlichkeit (GMF)“ befragt. Die Befragung wird dabei zu Teilaspekten des Konstrukts GMF durchgeführt. Ausgehend von Befunden einer inhaltlich ähnlich gelagerten Studie im Jahr 2013 sollen insbesondere nicht behandelte Aspekte abgedeckt werden. Es werden Daten zu folgenden Themenbereichen erhoben: § § § § § § § Antiziganismus Abwertung aufgrund sozialer Position Abwertung aufgrund von Homosexualität Abwertung von Flüchtlingen Rassismus Muslimenfeindlichkeit Antisemitismus Grundgesamtheit: Werner Fröhlich BewohnerInnen des Freistaat Bayerns und der Stadt München 9 Projekt: Gesellschaftliche Einstellungen Design und Erhebung Stichprobenziehung Telefonisches Screening der Beteiligungsbereitschaft durch externes Institut mittels Zufallsstichprobe und Geburtstagsmethode (Stufe 1 zur Auswahl von Haushalten und Stufe 2 zur Auswahl von Befragten è E-Mail und Wohnadressen) Erhebungsinstrument Durchführung Online- und schriftlicher Fragebogen Querschnitterhebung im Frühjahr 2016 Online und postalischer Versand von 2.600 Fragebögen an Beteiligungsbereite Erinnerungspostkarte nach zwei bis vier Wochen; falls notwendig: 2. Erinnerungspostkarte Werner Fröhlich 10 Projekt: Lebenszufriedenheit in München Motivation und Ziele Bei der anstehenden Datenauswertung werden u.a. folgende Ziele verfolgt: § Deskription: Bestimmung der durchschnittlichen Einstellungen zu bestimmten Gruppen in Bayern bzw. der Stadt München insgesamt und für bestimmte soziale Gruppen (z.B. Frauen-Männer; Hoch- bzw. Niedriggebildete usw.) § Zusammenhangsanalyse: Auffinden systematischer Zusammenhänge zwischen möglichen Einflussvariablen (z.B. Alter, Bildung, sozioökonomischer Status) und dem Ausmaß der gruppenbezogenen Einstellungen § Prüfung theoretisch vermuteter Zusammenhänge Werner Fröhlich 11 Erste Schritte mit Stata Die Daten § Die Daten, die der Übung zugrunde liegen • sind entweder in der Software „Stata“ integriert oder • auf der kursbegleitende Homepage zu finden (Das Passwort zu diesen Daten lautet: M2GMF) Werner Fröhlich 12 Erste Schritte mit Stata Das Programm § Stata ist ein Softwarepaket für Datenmanagement und -analyse, das für verschiedene Betreibssysteme erhältlich ist. § Neue Versionen werden in der Regel alle zwei Jahre veröffentlicht. § In Stata ist eine Vielzahl statistischer Modelle implementiert und das Programm kann durch eigene Software erweitert werden. § Vorteile von Stata sind des Weiteren: • mit Stata sind druckreife Grafiken erstellbar und • es ist darüber hinaus vor allem ein Daten-Management für komplexe Datensätze (Panel, Mehrebenen) sehr gut möglich § Man hat in Stata verschiedene Fenster zur Verfügung, die unterschiedliche Funktionen erfüllen. Werner Fröhlich 13 Erste Schritte mit Stata Ansicht nach Öffnen von Stata Werner Fröhlich 14 Erste Schritte mit Stata Verschiedene Fenster: Command-Fenster Das Command-Fenster ist für Stata-Befehle. Hier können Sie Stata-Befehle schreiben und die Befehle mit „ENTER“ abschicken. Werner Fröhlich 15 Erste Schritte mit Stata Verschiedene Fenster: Review-Fenster Das Review-Fenster zeigt alle bisher ausgeführten Stata-Befehle. Sie können die entsprechenden Stata-Befehle nochmals laufen lassen, ohne sie erneut zu tippen. Klicken Sie auf die gewünschte Befehlszeile, dann erscheint diese Zeile erneut im Stata Command-Fenster und sie können den Befehle mit „ENTER“ erneut abschicken. Werner Fröhlich 16 Erste Schritte mit Stata Verschiedene Fenster: Result-Fenster Das Result-Fenster zeigt die Befehle und die dazugehörenden Ergebnisse. Werner Fröhlich 17 Erste Schritte mit Stata Verschiedene Fenster: Variables-Fenster Das Variables-Fenster listet alle Variablen des derzeit geladenen Datensatzes auf. Werner Fröhlich 18 Erste Schritte mit Stata Verschiedene Fenster: Properties-Fenster Das Properties-Fenster bietet Informationen zu den einzelnen Variablen und zum Datensatz. Werner Fröhlich 19 Erste Schritte mit Stata Verschiedene Fenster: Dateneditor Der Dateneditor (Data Editor) erlaubt die manuelle Eingabe oder Korrektur von Daten. Das DateneditorFenster kann auch über das CommandFenster mit dem Befehl . edit aufgerufen werden Werner Fröhlich 20 Erste Schritte mit Stata Verschiedene Fenster: Datenbrowser Im Datenbrowser (Data Browser) kann man sich die Daten lediglich ansehen, aber nicht bearbeiten. Das DatenbrowserFenster kann auch über das CommandFenster mit dem Befehl . browse aufgerufen werden Werner Fröhlich 21 Erste Schritte mit Stata Exkurs: Struktur eines Datensatzes Jede Zeile enthält die Angaben eines Befragten Jede Spalte repräsentiert eine Variable String-Variablen sind im Datensatz rot dargestellt; nummerische Variablen schwarz. Werner Fröhlich 22 Erste Schritte mit Stata Verschiedene Fenster: Do-File Editor Im Do-File Editor kann man einen „Befehlsdatensatz“ (mit Kommentaren) erstellen und diesen abspeichern. Werner Fröhlich 23 Erste Schritte mit Stata Verschiedene Fenster: Variables Manager Im Variables Manager Fenster kann man manuell Variablen- und Wertelabels verändern. Werner Fröhlich 24 Erste Schritte mit Stata Befehlssyntax § Befehle in Stata sind (mit wenigen Ausnahmen) immer gleich aufgebaut: • Zunächst wird der Befehl an sich eingegeben • Dann folgt eine Anweisung, die vom Befehl verarbeitet werden soll (zum Beispiel der Name einer auszuwertenden Variable) • Danach können meist zusätzliche Optionen angegeben werden, die mit einem Komma vom Befehl abgetrennt werden • Veranschaulichung: [prefix:] command [varlist][=exp][if][in][weight] [using filename] [, options] Werner Fröhlich 25 Erste Schritte mit Stata Hilfefunktionen § Ähnlich wie andere Statistiksoftwarepakete bietet auch Stata unterschiedliche Hilfefunktionen für die Befehlssyntax: • Um die Hilfe für einen bestimmten Befehl aufzurufen, geben Sie im CommandFenster help „command name“ ein z.B.: . help regression • Um alle Hinweise/Empfehlungen für ein bestimmtes statistisches Auswertungsverfahren aufzurufen, geben Sie im Command-Fenster search „topic“ ein z.B.: . search ols • Zudem ist noch eine online Hilfe implementiert; diese rufen Sie auf, indem Sie im Comand-Fenster findit „topic“ eingeben z.B.: . findit ols Werner Fröhlich 26 Erste Schritte mit Stata Befehle: Abkürzungsregeln § Ähnlich wie andere Statistiksoftwarepakete erlaubt auch Stata die Abkürzung von Befehlen; zusätzlich können in Stata auch noch Variablennamen und Optionen abgekürzt werden § Allgemeine Regel: Befehle, Optionen und Variablennamen können soweit abgekürzt werden, dass sie eineindeutig identifiziert werden können § Die kürzeste erlaubte Abkürzung für einen Befehl oder eine Option können Sie auch herausfinden, indem Sie sich den Befehl über die Hilfefunktion anzeigen lassen. Die kürzest mögliche Abkürzung ist unterstrichen. § § Betrachten wir z.B. den Befehl, um sich den Mittelwert einer Variablen ausgeben zu lassen: . summarize myvar, detail Dieser Befehl kann auch wie folgt eingegeben werden: . sum myv, d Werner Fröhlich 27 Erste Schritte mit Stata Laden, öffnen und speichern von Datenfiles § Datensätze werden in der Regel mit dem Change directory Befehl geöffnet: . cd [“]directory_name[“] § Z.B.: . cd “C:\uf341io\Uni\WiSe2015_16\Methoden1\GMF“ § Um einen bereits existierenden Stata-Datensatz zu öffnen ist folgender Befehl zu verwenden: . use “[datasetname.dta]“ [, clear] § Zum Öffnen des von uns verwendeten Stata Beispieldatensatzes „auto“ ist benötigen wir folgenden Befehl: . sysuse auto.dta , clear Werner Fröhlich 28 Erste Schritte mit Stata Typen von Datenformaten Suffix Datenformat *.dta Datenfile (data file) *.do Syntax-File, das die eigenen Befehle und Anmerkungen enthält (Do-File) *ado Zusätzliche Programme, die von Nutzern geschrieben wurden *.gph Grafiken *.txt Textfiles, z.B. Log-File Werner Fröhlich 29 Erste Schritte mit Stata Weitere nützliche Befehle § Beschreibung des Datensatzes (mit Anzahl der Fälle und Variablen, Variablenname und -label usw.): . describe § Ausgabe eines Codeplans des Datensatzes (u.a. Angabe der Werte und deren Labels, z.B. Mittelwert; Percentile, Anteile usw.) : . codebook § Auflistung der Werte für jeden Fall: . list [varlist], z.B. list price § Auflistung der Werte für bestimmte Fälle mit der in-Option, z.B. Auflistung des Preises der ersten zehn Fälle oder der letzten zehn Fälle: . list price in 1/10 bzw. list price in -10/-1 § Auflistung der Werte für bestimmte Fälle mit der if-Option, z.B. Auflistung des Preises für die ausländischen Automarken: . list price if foreign == 1 Werner Fröhlich 30 Erste Schritte mit Stata Missing values § Missing values werden in Stats mit einem “.“ gekennzeichnet. Es gibt z.B. 5 missing values bei der Variablen „rep78“. . tabulate rep78, missing nolabel Werner Fröhlich 31 Erste Schritte mit Stata Missing values § Warnung: Missings werden in Stata mit einem Wert von + ∞!!! behandelt è diese Fälle werden bei der Auswahl von Beobachtungen mit > oder >= mit berücksichtigt, z.B.: . summarize price if rep78 => 4 § Der Preis für 34 Autos wird ausgegeben, obwohl laut Häufigkeitsauszählung nur 29 Autos mit einem Reparaturauftrag vorhanden sind è Grund: Bei den verbleibenden 5 Autos wurde keine Angabe zum Reparaturauftrag gemacht (=missing) è + ∞ und damit zulässiger Wert Werner Fröhlich 32 Erste Schritte mit Stata Missing values § è Definition von missing values: . mvencode rep78, mv (-1) § è Häufigkeitsauszählung: . summarize price if rep78 => 4 Werner Fröhlich 33 Übungsaufgaben § Laden Sie den Beispieldatensatz auto.dta in Stata. § Überprüfen Sie mit einem geeigneten Befehl die Datenstruktur: • Wie viele Beobachtungen und wie viele Variablen befinden sich im Datensatz? • Wie viele Variablen sind nummerisch und wie viele Variablen sind StringVariablen? § § § § Lassen Sie sich einen Codeplan für den Datensatz ausgeben Wie viele missings weist die Variable „rep78“ auf? Vergeben Sie für die missings der Variablen „rep78“ den Wert -77. Lassen Sie sich für die letzten 10 Fälle der Variablen „weight“ die Werte auflisten. Werner Fröhlich 34
© Copyright 2024 ExpyDoc