Methoden 2

Institut für Soziologie
Werner Fröhlich
Methoden 2
Ziele, Organisatorisches und
Einführung in Stata
Programm
§ Ziele des Teilmoduls „Methoden 2“
§ Organisatorisches
§ Literatur zur Veranstaltung
§ Vorstellung des Projekts „Gesellschaftliche und politische Einstellungen“
§ Erste Schritte mit Stata
•
•
•
•
•
•
Die Fenster in Stata
Befehlssyntax allgemein und Abkürzungsregeln
Öffnen eines Datenfiles
Do- und log-Files
Missings
Hilfreiche Befehle
§ Übungsaufgabe
Werner Fröhlich
2
Ziele
Teilmodul „Methoden 2“
§ Inhalte und Lernziele von „Methoden 1“
•
•
•
•
Theoriegeleitete Konkretisierung einer Forschungsfrage
Wahl des Untersuchungsdesigns
Wahl und Entwicklung geeigneter Messinstrumente
Durchführung einer eigenen Datenerhebung
§ Inhalte und Lernziele von „Methoden 2“
•
•
•
•
Wiederholung und Anwendung von Auswertungsverfahren
Wahl geeigneter statistischer Analyseverfahren
Kritische Interpretation (eigener) statistischer Ergebnisse
Bedienung eines gängigen statistischen Softwarepakets (Stata)
Werner Fröhlich
3
Organisatorisches
Methoden 2-Veranstaltungen
§ Gemeinsame Übung (Tafelübung im Hörsaal C123, Theresienstr. 41)
•
•
•
•
Vorstellung der statistischen Verfahren
Hinweise zur praktischen Umsetzung mit Stata
Vergabe von Übungsaufgaben (wöchentlich)
Folien sind jeweils ab Freitag vor der jeweiligen Sitzung auf der
Homepage zu den Methoden 2-Übungen abrufbar:
http://www.ls4.soziologie.uni-muenchen.de/studium_lehre
§ Übung
•
•
•
•
Konradstr. 6, CIP-Labor; Mo., 14 – 18 Uhr und Di., 16 – 18 Uhr (frei wählbar)
Oettingenstr. 67, Raum L055; Di., 12 – 14 Uhr (barrierefrei)
Eigenständige Lösung der Übungsaufgaben mittels Stata
Hilfe bei Schwierigkeiten durch Kursleiter bzw. Tutoren
§ Tutorien: geblockt vor Zwischen- und Endklausur (Termine siehe Folie #7)
Werner Fröhlich
4
Organisatorisches
Leistungsanforderungen
§ Zu erbringende Leistungen
• Bestehen der Zwischenklausur
• Bestehen der Abschlussklausur
• Fristgerechte Abgabe und Bestehen einer Gruppenhausarbeit
§ Benotung
• Hauptfach Soziologie: Die Gesamtnote berechnet sich aus dem arithm.
Mittel von Zwischenklausur, Gruppenhausarbeit und Abschlussklausur
• Hauptfach Statistik: Zwischenklausur und Gruppenhausarbeit
• Für Anrechnung von ECTS-Punkten oder Scheinerwerb müssen
Zwischenklausur, Abschlussklausur und Hausarbeit jeweils bestanden
werden (Note jeweils ≤4)
§ Inhaltliche Anforderungen sowie formale Kriterien bzgl. der
Gruppenhausarbeiten finden sich im Programm (S. 2f.)
Werner Fröhlich
5
Organisatorisches
Termine: Klausuren und Hausarbeit
§ Zwischenklausur: Montag, 23.05.16, Theresienstr. 41, Hörsaal C123;
Dauer: 45 Min.; Beginn: 10.15 Uhr
§ Abgabe der Gruppenhausarbeit: 25.07.16, 23.00 Uhr
Abgabeform: PDF-Datei (Einverständniserklärung nicht vergessen)
§ Abschlussklausur: Montag, 11.07.16, Theresienstr. 41, Hörsaal C123;
10.00 – 12.00 Uhr
§ Wiederholungszwischenklausur: 07.10.2016
§ Wiederholungsabschlussklausur: 14.10.2016
Werner Fröhlich
6
Organisatorisches
Termine: Tutorien
§ Tutorien finden jeweils in der Woche vor der Zwischenklausur und
Abschlussklausur statt (CIP-Labor: Konradstr. 6, Raum 409).
§ Vor der Zwischenklausur:
Do., 19.05.2016, 12 – 16 Uhr
§ Vor der Abschlussklausur:
Do., 07.07.2016, 12 – 16 Uhr
Werner Fröhlich
7
Literatur
§
Wiederholung der statistischen Grundlagen:
• Diaz-Bone, Rainer (2013): Statistik für Soziologen. Konstanz.
• Jann, Ben (2005): Einführung in die Statistik. 2. Aufl. München.
§
Einführende Stata-Bücher:
• Acock, Alan C. (2012): A Gentle Introduction to Stata. College Station: Stata
Press.
• Kohler, Ulrich und Frauke Kreuter (2012): Datenanalyse mit Stata. Allgemeine
Konzepte der Datenanalyse und ihre praktische Anwendung. München.
• Pollock, Philip H. (2015): A Stata Companion to Political Analysis. London.
§
Wiederholung der Grundlagen empirischer Sozialforschung:
• Diekmann, Andreas (2012): Empirische Sozialforschung. Reinbek.
§
Literatur zu den theoretischen Grundlagen der Erhebung:
• Kursbegleitende Homepage (Passwort: M2GMF)
Werner Fröhlich
8
Projekt: Gesellschaftliche Einstellungen
Design und Erhebung
Im Frühjahr 2016 werden bayerische und Münchner Bürgerinnen und Bürger zu
„gruppenbezogener Menschenfeindlichkeit (GMF)“ befragt.
Die Befragung wird dabei zu Teilaspekten des Konstrukts GMF durchgeführt.
Ausgehend von Befunden einer inhaltlich ähnlich gelagerten Studie im Jahr 2013
sollen insbesondere nicht behandelte Aspekte abgedeckt werden. Es werden Daten
zu folgenden Themenbereichen erhoben:
§
§
§
§
§
§
§
Antiziganismus
Abwertung aufgrund sozialer Position
Abwertung aufgrund von Homosexualität
Abwertung von Flüchtlingen
Rassismus
Muslimenfeindlichkeit
Antisemitismus
Grundgesamtheit:
Werner Fröhlich
BewohnerInnen des Freistaat Bayerns und der Stadt München
9
Projekt: Gesellschaftliche Einstellungen
Design und Erhebung
Stichprobenziehung
Telefonisches Screening der Beteiligungsbereitschaft
durch externes Institut mittels Zufallsstichprobe und
Geburtstagsmethode (Stufe 1 zur Auswahl von
Haushalten und Stufe 2 zur Auswahl von Befragten
è E-Mail und Wohnadressen)
Erhebungsinstrument
Durchführung
Online- und schriftlicher Fragebogen
Querschnitterhebung im Frühjahr 2016
Online und postalischer Versand von 2.600 Fragebögen an
Beteiligungsbereite
Erinnerungspostkarte nach zwei bis vier Wochen;
falls notwendig: 2. Erinnerungspostkarte
Werner Fröhlich
10
Projekt: Lebenszufriedenheit in München
Motivation und Ziele
Bei der anstehenden Datenauswertung werden u.a. folgende Ziele verfolgt:
§
Deskription: Bestimmung der durchschnittlichen Einstellungen zu bestimmten Gruppen in
Bayern bzw. der Stadt München insgesamt und für bestimmte soziale Gruppen (z.B.
Frauen-Männer; Hoch- bzw. Niedriggebildete usw.)
§
Zusammenhangsanalyse: Auffinden systematischer Zusammenhänge zwischen möglichen
Einflussvariablen (z.B. Alter, Bildung, sozioökonomischer Status) und dem Ausmaß der
gruppenbezogenen Einstellungen
§
Prüfung theoretisch vermuteter Zusammenhänge
Werner Fröhlich
11
Erste Schritte mit Stata
Die Daten
§ Die Daten, die der Übung zugrunde liegen
• sind entweder in der Software „Stata“ integriert oder
• auf der kursbegleitende Homepage zu finden (Das Passwort zu
diesen Daten lautet: M2GMF)
Werner Fröhlich
12
Erste Schritte mit Stata
Das Programm
§ Stata ist ein Softwarepaket für Datenmanagement und -analyse, das
für verschiedene Betreibssysteme erhältlich ist.
§ Neue Versionen werden in der Regel alle zwei Jahre veröffentlicht.
§ In Stata ist eine Vielzahl statistischer Modelle implementiert und das
Programm kann durch eigene Software erweitert werden.
§ Vorteile von Stata sind des Weiteren:
• mit Stata sind druckreife Grafiken erstellbar und
• es ist darüber hinaus vor allem ein Daten-Management für komplexe
Datensätze (Panel, Mehrebenen) sehr gut möglich
§ Man hat in Stata verschiedene Fenster zur Verfügung, die
unterschiedliche Funktionen erfüllen.
Werner Fröhlich
13
Erste Schritte mit Stata
Ansicht nach Öffnen von Stata
Werner Fröhlich
14
Erste Schritte mit Stata
Verschiedene Fenster: Command-Fenster
Das Command-Fenster ist für Stata-Befehle. Hier können Sie Stata-Befehle schreiben und die Befehle
mit „ENTER“ abschicken.
Werner Fröhlich
15
Erste Schritte mit Stata
Verschiedene Fenster: Review-Fenster
Das Review-Fenster zeigt alle bisher ausgeführten Stata-Befehle. Sie können die entsprechenden
Stata-Befehle nochmals laufen lassen, ohne sie erneut zu tippen. Klicken Sie auf die gewünschte
Befehlszeile, dann erscheint diese Zeile erneut im Stata Command-Fenster und sie können den
Befehle mit „ENTER“ erneut abschicken.
Werner Fröhlich
16
Erste Schritte mit Stata
Verschiedene Fenster: Result-Fenster
Das Result-Fenster zeigt die Befehle und die dazugehörenden Ergebnisse.
Werner Fröhlich
17
Erste Schritte mit Stata
Verschiedene Fenster: Variables-Fenster
Das Variables-Fenster listet alle Variablen des derzeit geladenen Datensatzes auf.
Werner Fröhlich
18
Erste Schritte mit Stata
Verschiedene Fenster: Properties-Fenster
Das Properties-Fenster bietet Informationen zu den einzelnen Variablen und zum Datensatz.
Werner Fröhlich
19
Erste Schritte mit Stata
Verschiedene Fenster: Dateneditor
Der Dateneditor (Data Editor) erlaubt die manuelle Eingabe oder Korrektur von Daten.
Das DateneditorFenster kann auch
über das CommandFenster mit dem
Befehl
. edit
aufgerufen werden
Werner Fröhlich
20
Erste Schritte mit Stata
Verschiedene Fenster: Datenbrowser
Im Datenbrowser (Data Browser) kann man sich die Daten lediglich ansehen, aber nicht bearbeiten.
Das DatenbrowserFenster kann auch
über das CommandFenster mit dem
Befehl
. browse
aufgerufen werden
Werner Fröhlich
21
Erste Schritte mit Stata
Exkurs: Struktur eines Datensatzes
Jede Zeile enthält die Angaben eines Befragten
Jede Spalte repräsentiert eine Variable
String-Variablen sind im
Datensatz rot dargestellt;
nummerische Variablen schwarz.
Werner Fröhlich
22
Erste Schritte mit Stata
Verschiedene Fenster: Do-File Editor
Im Do-File Editor kann man einen „Befehlsdatensatz“ (mit Kommentaren) erstellen und diesen
abspeichern.
Werner Fröhlich
23
Erste Schritte mit Stata
Verschiedene Fenster: Variables Manager
Im Variables Manager Fenster kann man manuell Variablen- und Wertelabels verändern.
Werner Fröhlich
24
Erste Schritte mit Stata
Befehlssyntax
§ Befehle in Stata sind (mit wenigen Ausnahmen) immer gleich aufgebaut:
• Zunächst wird der Befehl an sich eingegeben
• Dann folgt eine Anweisung, die vom Befehl verarbeitet werden soll (zum Beispiel
der Name einer auszuwertenden Variable)
• Danach können meist zusätzliche Optionen angegeben werden, die mit einem
Komma vom Befehl abgetrennt werden
• Veranschaulichung:
[prefix:] command [varlist][=exp][if][in][weight]
[using filename] [, options]
Werner Fröhlich
25
Erste Schritte mit Stata
Hilfefunktionen
§ Ähnlich wie andere Statistiksoftwarepakete bietet auch Stata
unterschiedliche Hilfefunktionen für die Befehlssyntax:
• Um die Hilfe für einen bestimmten Befehl aufzurufen, geben Sie im CommandFenster help „command name“ ein
z.B.: . help regression
• Um alle Hinweise/Empfehlungen für ein bestimmtes statistisches
Auswertungsverfahren aufzurufen, geben Sie im Command-Fenster search
„topic“ ein
z.B.: . search ols
• Zudem ist noch eine online Hilfe implementiert; diese rufen Sie auf, indem Sie
im Comand-Fenster findit „topic“ eingeben
z.B.: . findit ols
Werner Fröhlich
26
Erste Schritte mit Stata
Befehle: Abkürzungsregeln
§ Ähnlich wie andere Statistiksoftwarepakete erlaubt auch Stata die
Abkürzung von Befehlen; zusätzlich können in Stata auch noch
Variablennamen und Optionen abgekürzt werden
§ Allgemeine Regel: Befehle, Optionen und Variablennamen können soweit
abgekürzt werden, dass sie eineindeutig identifiziert werden können
§ Die kürzeste erlaubte Abkürzung für einen Befehl oder eine Option können
Sie auch herausfinden, indem Sie sich den Befehl über die Hilfefunktion
anzeigen lassen. Die kürzest mögliche Abkürzung ist unterstrichen.
§
§
Betrachten wir z.B. den Befehl, um sich den Mittelwert einer Variablen ausgeben
zu lassen:
. summarize myvar, detail
Dieser Befehl kann auch wie folgt eingegeben werden:
. sum myv, d
Werner Fröhlich
27
Erste Schritte mit Stata
Laden, öffnen und speichern von Datenfiles
§ Datensätze werden in der Regel mit dem Change directory Befehl geöffnet:
. cd [“]directory_name[“]
§ Z.B.:
. cd “C:\uf341io\Uni\WiSe2015_16\Methoden1\GMF“
§ Um einen bereits existierenden Stata-Datensatz zu öffnen ist folgender
Befehl zu verwenden:
. use “[datasetname.dta]“ [, clear]
§ Zum Öffnen des von uns verwendeten Stata Beispieldatensatzes „auto“ ist
benötigen wir folgenden Befehl:
. sysuse auto.dta , clear
Werner Fröhlich
28
Erste Schritte mit Stata
Typen von Datenformaten
Suffix
Datenformat
*.dta
Datenfile (data file)
*.do
Syntax-File, das die eigenen Befehle und Anmerkungen
enthält (Do-File)
*ado
Zusätzliche Programme, die von Nutzern geschrieben
wurden
*.gph
Grafiken
*.txt
Textfiles, z.B. Log-File
Werner Fröhlich
29
Erste Schritte mit Stata
Weitere nützliche Befehle
§ Beschreibung des Datensatzes (mit Anzahl der Fälle und Variablen,
Variablenname und -label usw.):
. describe
§ Ausgabe eines Codeplans des Datensatzes (u.a. Angabe der Werte und
deren Labels, z.B. Mittelwert; Percentile, Anteile usw.) :
. codebook
§ Auflistung der Werte für jeden Fall:
. list [varlist], z.B. list price
§ Auflistung der Werte für bestimmte Fälle mit der in-Option, z.B. Auflistung
des Preises der ersten zehn Fälle oder der letzten zehn Fälle:
. list price in 1/10 bzw. list price in -10/-1
§
Auflistung der Werte für bestimmte Fälle mit der if-Option, z.B. Auflistung des
Preises für die ausländischen Automarken:
. list price if foreign == 1
Werner Fröhlich
30
Erste Schritte mit Stata
Missing values
§ Missing values werden in Stats mit einem “.“ gekennzeichnet. Es gibt z.B.
5 missing values bei der Variablen „rep78“.
. tabulate rep78, missing nolabel
Werner Fröhlich
31
Erste Schritte mit Stata
Missing values
§ Warnung: Missings werden in Stata mit einem Wert von + ∞!!! behandelt
è diese Fälle werden bei der Auswahl von Beobachtungen mit > oder >=
mit berücksichtigt, z.B.:
. summarize price if rep78 => 4
§ Der Preis für 34 Autos wird ausgegeben, obwohl laut
Häufigkeitsauszählung nur 29 Autos mit einem Reparaturauftrag
vorhanden sind è Grund: Bei den verbleibenden 5 Autos wurde keine
Angabe zum Reparaturauftrag gemacht (=missing) è + ∞ und damit
zulässiger Wert
Werner Fröhlich
32
Erste Schritte mit Stata
Missing values
§ è Definition von missing values:
. mvencode rep78, mv (-1)
§ è Häufigkeitsauszählung:
. summarize price if rep78 => 4
Werner Fröhlich
33
Übungsaufgaben
§ Laden Sie den Beispieldatensatz auto.dta in Stata.
§ Überprüfen Sie mit einem geeigneten Befehl die Datenstruktur:
• Wie viele Beobachtungen und wie viele Variablen befinden sich im
Datensatz?
• Wie viele Variablen sind nummerisch und wie viele Variablen sind StringVariablen?
§
§
§
§
Lassen Sie sich einen Codeplan für den Datensatz ausgeben
Wie viele missings weist die Variable „rep78“ auf?
Vergeben Sie für die missings der Variablen „rep78“ den Wert -77.
Lassen Sie sich für die letzten 10 Fälle der Variablen „weight“ die
Werte auflisten.
Werner Fröhlich
34