Statistik II – Übung 3: Hypothesentests

Statistik II – Übung 3: Hypothesentests
Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum
Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden Sie dazu den Datensatz
“Arbeitsmarktdaten.sav“. Bitte bearbeiten Sie Aufgaben 1-5 in Gruppen von bis zu 4 Studierenden
(vergessen Sie nicht die Namen!) und reichen Sie die Lösungen VOR der 3. PC Übung ein.
1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest.
2. Was versteht man unter einem Konfidenzinterval? Wie wird es gebildet und was sagt es aus?
3. Überprüfen Sie anhand des 1-Stichproben t-Tests, ob der Mittelwert der Variable
„befristArbeit“ (1 falls jemand eine befristete Arbeitsstelle über eine italienische
Arbeitsagentur erhalten hat und 0 falls nicht) signifikant verschieden von 0.5 ist.
4. Überprüfen Sie anhand des 2-Stichproben t-Tests, ob sich das mittlere Gehalt (siehe Variable
„Gehalt“, welche zeitlich später gemessen wurde als „befristArbeit“) in den Gruppen mit
„befristArbeit“=1 und „befristArbeit“=0 signifikant unterscheidet. Kommentieren Sie auch,
ob „Gehalt“ eine signifikant unterschiedliche Varianz in beiden Gruppen aufweist und was
dies für den 2-Stichproben t-Test bedeutet.
5. Regressieren Sie „Gehalt“ auf „befristArbeit“ und vergleichen Sie die Ergebnisse
(insbesondere die t-Statistiken und p-Werte) mit jenen von Aufgabe 4.
6. Überprüfen Sie, ob die Varianz der Variablen „Bildung“ signifikant unterschiedlich ist in den
Gruppen mit „Training“=1 und „Training“=0.
7. Zeigen Sie die Verteilung von „Gehalt“ in den Gruppen mit „befristArbeit“=1 und
„befristArbeit“=0 grafisch. Besteht Ähnlichkeit zur Normalverteilung?
8. Verwenden Sie einen Q-Q-Plot um die Ähnlichkeit der Verteilung von „Gehalt“ in den
Gruppen mit „befristArbeit“=1 und „befristArbeit“=0 zur Normalverteilung zu überprüfen.
9. Verwenden Sie den Mann Whitney U-Test um zu überprüfen, ob sich das mittlere Gehalt
(siehe Variable „Gehalt“, welche zeitlich später gemessen wurde als „befristArbeit“) in den
Gruppen mit „befristArbeit“=1 und „befristArbeit“=0 signifikant unterscheidet. Inwiefern
unterscheidet sich dieser Test vom t-Test?
10. Verwenden Sie den Kolmogorov Smirnov Test um zu überprüfen, ob sich die Verteilungen
von
(a) „Gehalt“ und (b) „Bildung“ in den Gruppen mit „befristArbeit“=1 und
„befristArbeit“=0 signifikant voneinander unterscheiden.
11. Verwenden Sie die einfaktorielle Varianzanalyse, um zu überprüfen, (a) ob sich “Gehalt” für
verschiedene Ausprägungen von “Bildung” signifikant unterscheidet und (b) falls ja, zwischen
welchen Ausprägungen von “Bildung” signifikante Unterschiede bestehen (verwenden Sie für
letztere Analyse die Methode „Tamhane’s T2“ für ungleiche Varianzen für verschiedene
Ausprägungen von „Bildung“).
12. Generieren Sie neue Variablen für unterschiedliche Ausprägungen von „Bildung“:
„geringBild“ (geringe Bildung; soll 1 sein falls „Bildung“=0 und 0 sein falls „Bildung“=1 oder
2), „mittlereBild“ (mittlere Bildung; soll 1 sein falls „Bildung“=1 und 0 sein falls „Bildung“=0
oder 2), „hoheBild“ (hohe Bildung; soll 1 sein falls „Bildung“=2 und 0 sein falls „Bildung“=0
oder 1)
13. Regressieren Sie “Gehalt” auf „mittlereBild“ und „hoheBild“ um zu testen, ob sich das Gehalt
für verschiedene Bildungsniveaus signifikant unterscheidet.
14. Regressieren Sie “Gehalt” auf „geringBild“ und „mittlereBild“ um zu testen, ob sich das
Gehalt für verschiedene Bildungsniveaus signifikant unterscheidet. Inwiefern unterscheiden
sich die Ergebnisse von jenen in Aufgabe 11 bzw stimmen mit jenen überein?
15. Warum können Sie „Gehalt“ nicht gleichzeitig (also in der selben Regression) auf
„geringBild“, „mittlereBild“ und „hoheBild“ regressieren?
16. Regressieren Sie „Gehalt“ auf „geringBild“, „mittlereBild“, „Training“ und „befristArbeit“
und testen Sie anhand des F-tests, ob die Koeffizienten aller Variablen gemeinsam signifikant
verschieden von Null sind. Zeigen Sie auch für jeden Koeffizienten das jeweilige 95%
Konfidenzintervall.