Einführung in die sozialwissenschaftliche Statistik - Goethe

Goethe-Universität Frankfurt am Main | Institut für Soziologie 1
Heinz Leitgöb | Katrin Auspurg
Einführung in die sozialwissenschaftliche Statistik | Sommersemester 2015
Übungsblatt 3: Bivariate Deskription I (Sitzung 4)
Aufgabe 1
Eine Kreuztabelle beinhaltet unterschiedliche Verteilungen.
a) Geben Sie an, wie diese Verteilungen heißen und was sie beinhalten.
b) Welche drei zentralen Fragen können mit der bivariaten Analyse des Zusammenhangs zwischen zwei Variablen beantwortet werden?
Aufgabe 2
Im Allbus 2010 wurde unter anderem gefragt, ob die Bundesregierung eher Steuern senken
oder mehr Geld für soziale Leistungen zur Verfügung stellen sollte. Befragt wurden insgesamt 2641 Personen, davon 1822 in Westdeutschland und 819 in Ostdeutschland. Von allen
Befragten haben 1283 geantwortet, dass die Bundesregierung Steuern senken sollte, während 1358 der Meinung sind, das Geld sollte eher für soziale Leistungen zur Verfügung stehen.
a) Was wählt man hier sinnvollerweise als abhängige und unabhängige Variable? Wie
sind entsprechend die Variablen in einer Kreuztabelle anzuordnen?
b) Es ist bekannt, dass 424 Personen in Ostdeutschland der Meinung sind, dass mehr
Geld für soziale Leistungen zur Verfügung gestellt werden sollte. Erstellen Sie die
Kreuztabelle der absoluten Häufigkeiten.
c) Geben Sie in der Notation der Kreuztabelle an, welche Indices die in Teilaufgabe b)
genannte Häufigkeit von 424 Fällen hat.
d) Welche Verteilung gibt die äußerste rechte Spalte der Tabelle und welche die unterste Zeile der Tabelle an und wie lautet der Oberbegriff für diese Verteilungen?
e) Berechnen Sie eine geeignete Prozentuierung mit der geprüft werden kann, ob Befragte aus Ost- und Westdeutschland unterschiedlicher Meinung in Bezug auf eine
sinnvolle Verwendung von Steuergeldern sind. Wie nennt man diese Werte auch?
f) Interpretieren Sie das Ergebnis.
Goethe-Universität Frankfurt am Main | Institut für Soziologie 2
Heinz Leitgöb | Katrin Auspurg
Einführung in die sozialwissenschaftliche Statistik | Sommersemester 2015
Aufgabe 3
Sie interessieren sich für den Zusammenhang zwischen Bildungsniveau und Religiosität. Als
Indikator für Religiosität verwenden Sie die im ISSP (International Survey Programme) 2008
gestellte Frage nach dem Glauben an die Hölle, mit den beiden Antwortkategorien „eher ja“
und „eher nein“ (ursprünglich wurde das in mehr Kategorien erfragt, die hier zusammengefasst wurden). Für das Bildungsniveau unterscheiden Sie Befragte ohne und mit Abitur. In
nachfolgender Kreuztabelle ist die gemeinsame Verteilung der beiden Variablen wiedergegeben.
Glaube an die
Hölle
Eher ja
Eher nein
Gesamt
Bildungsniveau
Kein Abitur
Abitur
435
257
44,2%
26,1%
233
60
23,7%
6,1%
668
317
67,8%
32,2%
Gesamt
692
70,3%
293
29,7%
985
100,0%
a) Wie ist statistische Unabhängigkeit in einer Kreuztabelle definiert?
b) Berechnen Sie die Anteile oder relativen Häufigkeiten in den Tabellenfeldern, die zur
Feststellung der statistischen Unabhängigkeit notwendig sind.
c) Wie stellen Sie nach der Berechnung der Teilaufgabe b) fest, ob die Variablen in der
gegebenen Kreuztabelle statistisch unabhängig voneinander sind?
d) Wie lautet Ihre Schlussfolgerung?
Aufgabe 4
Die folgende Kontingenztabelle mit relativen Häufigkeiten ist unvollständig.
a1
a2
b1
0,16
b2
b3
0,06
0,8
a) Vervollständigen Sie die Tabelle unter der Annahme, dass die beiden Merkmale unabhängig sind.
b) Ganz allgemein, wie verändert sich Χ² bei gleichbleibenden relativen Häufigkeiten, wenn
der Stichprobenumfang verdoppelt wird?
Goethe-Universität Frankfurt am Main | Institut für Soziologie 3
Heinz Leitgöb | Katrin Auspurg
Einführung in die sozialwissenschaftliche Statistik | Sommersemester 2015
Aufgabe 5
In einem Fragebogenexperiment wurde ein Teil der Studierenden zunächst zu ihrer Zufriedenheit mit dem Mensa-Essen befragt („mit experimentellem Stimulus“), und anschließend
zur Zufriedenheit mit dem Studium. Der andere Teil wurde lediglich nach der Zufriedenheit
mit dem Studium gefragt. Es ergab sich aus dem Experiment die folgende Kreuztabelle.
Sehr zufrieden
120
60
Ohne Stimulus
Mit Stimulus
Studienzufriedenheit
Mäßig zufrieden
unzufrieden
60
20
100
40
a) Bestimmen Sie die Randhäufigkeiten dieser Kontingenztabelle, und interpretieren Sie
diese, soweit dies sinnvoll ist.
b) Bestimmen Sie diejenige bedingte Häufigkeitsverteilung, die sinnvoll interpretierbar
ist.
c) Bestimmen Sie den χ²- Koeffizienten und ein sinnvolles Zusammenhangsmaß.
Aufgabe 6
Ein Statistikprogramm gibt Ihnen die folgenden Notenverteilungen für Bachelorabsolventen
der Soziologie und Politikwissenschaften (Gesamtnote) aus.
Abschlussnote Politik
Soziologie
Total
Sehr gut
134
73
207
Gut
114
77
191
Befriedigend
3
2
5
Ausreichend
1
0
1
Total
252
152
404
a) Erstellen Sie eine sinnvolle Kreuztabelle; überlegen Sie dabei insbesondere auch, ob
Sie ggf. Kategorien zusammenfassen sollten.
b) Bestimmen Sie anschließend sinnvolle Prozentsatzunterschiede sowie
c) ein Chi²-basiertes Zusammenhangsmaß.
d) Wie könnten Sie den Zusammenhang grafisch veranschaulichen? (Erstellen Sie eine
Excel-Grafik oder skizzieren Sie eine Grafik per Hand).
Goethe-Universität Frankfurt am Main | Institut für Soziologie 4
Heinz Leitgöb | Katrin Auspurg
Einführung in die sozialwissenschaftliche Statistik | Sommersemester 2015
Aufgabe 7
Die nachfolgende Tabelle zeigt die Verteilung von Studierenden aus akademischen Elternhaus (Vater hat studiert) versus nicht-akademischen Elternhaus (Vater hat nicht studiert) auf
Studienfächer.
a) Berechnen Sie einmal Chi² und ein zugehöriges Zusammenhangsmaß für die dort angezeigte Fächeraufteilung.
b) Wie verändert sich das Zusammenhangsmaß, wenn Sie nur noch zwischen Sozialwissenschaften (Politik, Soziologie) und Naturwissenschaften (Chemie/Bio) unterscheiden? [Überlegen Sie das zunächst, ohne eine Rechnung anzustellen.]
c) Was besagt das inhaltlich?
Studienfach
Politik
Soziologie
Chemie/Bio
Total
Vater hat nicht
studiert
92
37,10 %
87
35,08 %
69
27,82 %
248
100,00 %
Vater hat
studiert
152
53,71 %
63
22,26 %
68
24,03 %
283
100,00 %
Total
244
45,95 %
150
28,25 %
137
25,80 %
531
100,00 %
Aufgabe 8
Betrachten Sie die folgende Kreuztabelle.
Vater hat
studiert
während
bachelorstudium
erwerbstätig gewesen?
nein
ja
Total
nein
169
47.47
329
51.25
498
49.90
ja
187
52.53
313
48.75
500
50.10
Total
356
100.00
642
100.00
998
100.00
a) Inwieweit sind die dort angegebenen bedingten Häufigkeiten sinnvoll? Welche Änderungen würden Sie empfehlen?
b) Wirken sich Ihre Änderungen auch auf berechnete Zusammenhangsmaße aus? Wenn
ja, auf welche?
Goethe-Universität Frankfurt am Main | Institut für Soziologie 5
Heinz Leitgöb | Katrin Auspurg
Einführung in die sozialwissenschaftliche Statistik | Sommersemester 2015
Aufgabe 9
In einem Bericht über Bachelorabsolventen findet sich das folgende Balkendiagramm zur
Aufnahme eines weiteren Studiums (Master) nach Geschlecht.
Beginn eines Masterstudiums
100
80
60
40
20
0
81.7%
18.3%
männlich
70.9%
29.1%
nein
ja
weiblich
(Datenquelle: Konstanzer Absolventenbefragungen 2007-2010; n = 761 Männer und n = 633
Frauen).
a) Berechnen Sie mindestens ein geeignetes Maß für den Zusammenhang der beiden
Variablen.
b) Im Bericht findet sich zudem die Information, dass in den Politikwissenschaften (mit
insgesamt 245 Absolventen) 81,2% der weiblichen und 84,0% der männlichen Studierenden ein weiteres Studium aufnehmen, während es in der Soziologie (mit 152 Absolventen) 62,3 % (Frauen) und 84,2 % (Männer) sind.
c) Mit welchen Maßen könnten sie die Stärke des Zusammenhangs zwischen Geschlecht
und Aufnahme eines weiteren Studiums über die Subgruppen hinweg vergleichen?
Berechnen Sie mindestens ein solches Maß und interpretieren Sie die Ergebnisse.
Goethe-Universität Frankfurt am Main | Institut für Soziologie 6
Heinz Leitgöb | Katrin Auspurg
Einführung in die sozialwissenschaftliche Statistik | Sommersemester 2015
Aufgabe 10
Die folgende Tabelle gibt den Zusammenhang zwischen dem Studienfach und den Englischkenntnissen von Studierenden an.
Englischkenn
tnisse
Studienfach
Politik Soziologi
Total
sehr gut
77
82.80
71.96
16
17.20
37.21
93
100.00
62.00
gut/schlecht
30
52.63
28.04
27
47.37
62.79
57
100.00
38.00
Total
107
71.33
100.00
43
28.67
100.00
150
100.00
100.00
a) Berechnen Sie die Prozentsatzdifferenz, wenn das Studienfach als unabhängige Variable angesehen wird.
b) Berechnen Sie die Prozentsatzdifferenz, wenn die Englischkenntnisse als unabhängige
Variable angesehen werden.
c) Geben Sie eine inhaltliche Interpretation von a) und b) an.
Aufgabe 11
In einem Forschungsartikel aus dem Jahr 2014 heißt es:
Eine neue Absolventenstudie hat herausgefunden, dass während im Jahr 1980 nur 20% Studierende aus einem bildungsfernen Haushalt einen Auslandsaufenthalt absolviert haben,
sind es inzwischen 50%. Bei Studierenden aus bildungsnahen Haushalten ist ein analoger
Anstieg von 30 auf 60% festzustellen. Demnach ist der Abstand gleich geblieben und die
Chancen auf einen Auslandsaufenthalt haben sich für bildungsferne Schichten gegenüber
bildungsnahen Schichten nicht verbessert.
a) Ist diese Schlussfolgerung korrekt?
b) Berechnen Sie Odds-Ratios für Studierende aus bildungsnahen und bildungsfernen
Haushalten einmal für das Jahr 1980 und einmal für 2014. Zu welcher Schlussfolgerung kommen Sie, wenn Sie die Werte vergleichen?
c) Sind die Ergebnisse mit dem Zeitungsartikel noch haltbar? Ist hier die Angabe von
Odds-Ratios sinnvoller, warum oder warum nicht?
d) Wählen Sie eine geeignete grafische Darstellung, um die Zusammenhänge zu veranschaulichen.
Goethe-Universität Frankfurt am Main | Institut für Soziologie 7
Heinz Leitgöb | Katrin Auspurg
Einführung in die sozialwissenschaftliche Statistik | Sommersemester 2015
Aufgabe 12
Im ALLBUS 2010 wurde nach der Einschätzung zu möglichen Konflikten gefragt. Prüfen Sie,
ob die Einschätzungen von Konflikten zwischen arm und reich bzw. zwischen Kapital und
Arbeiterklasse einhergehen (die vier Antwortkategorien sind: gibt es nicht, eher schwach,
ziemlich stark und sehr stark).
konflikt: arm
vs. reich in
der brd
konflikt: kapital vs. arbeiterklasse
gibt es n eher schw ziemlich
sehr star
Total
gibt es nicht
eher schwach
ziemlich stark
sehr stark
48
39
12
9
27
238
227
65
21
190
741
330
5
29
261
411
101
496
1,241
815
Total
108
557
1,282
706
2,653
a) Bestimmen Sie für die gegebene Kontingenztabelle, ob statistische Unabhängigkeit besteht. Formulieren Sie einen Antwortsatz.
b) Bestimmen Sie für die gegebene Kontingenztabelle ein geeignetes Zusammenhangsmaß
auf χ²-Basis. Formulieren Sie einen Antwortsatz.
c) Kann man Kausalität in diesem Beispiel unterstellen und welche Konsequenzen hat das für
die Anordnung der Variablen in der Kreuztabelle?