Statistik II – Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden Sie dazu den Datensatz “Arbeitsmarktdaten.sav“. Bitte bearbeiten Sie Aufgaben 1-5 in Gruppen von bis zu 4 Studierenden (vergessen Sie nicht die Namen!) und reichen Sie die Lösungen VOR der 3. PC Übung ein. 1. Erklären Sie den Unterschied zwischen einem einseitigen und zweiseitigen Hypothesentest. 2. Was versteht man unter einem Konfidenzinterval? Wie wird es gebildet und was sagt es aus? 3. Überprüfen Sie anhand des 1-Stichproben t-Tests, ob der Mittelwert der Variable „befristArbeit“ (1 falls jemand eine befristete Arbeitsstelle über eine italienische Arbeitsagentur erhalten hat und 0 falls nicht) signifikant verschieden von 0.5 ist. 4. Überprüfen Sie anhand des 2-Stichproben t-Tests, ob sich das mittlere Gehalt (siehe Variable „Gehalt“, welche zeitlich später gemessen wurde als „befristArbeit“) in den Gruppen mit „befristArbeit“=1 und „befristArbeit“=0 signifikant unterscheidet. Kommentieren Sie auch, ob „Gehalt“ eine signifikant unterschiedliche Varianz in beiden Gruppen aufweist und was dies für den 2-Stichproben t-Test bedeutet. 5. Regressieren Sie „Gehalt“ auf „befristArbeit“ und vergleichen Sie die Ergebnisse (insbesondere die t-Statistiken und p-Werte) mit jenen von Aufgabe 4. 6. Überprüfen Sie, ob die Varianz der Variablen „Bildung“ signifikant unterschiedlich ist in den Gruppen mit „Training“=1 und „Training“=0. 7. Zeigen Sie die Verteilung von „Gehalt“ in den Gruppen mit „befristArbeit“=1 und „befristArbeit“=0 grafisch. Besteht Ähnlichkeit zur Normalverteilung? 8. Verwenden Sie einen Q-Q-Plot um die Ähnlichkeit der Verteilung von „Gehalt“ in den Gruppen mit „befristArbeit“=1 und „befristArbeit“=0 zur Normalverteilung zu überprüfen. 9. Verwenden Sie den Mann Whitney U-Test um zu überprüfen, ob sich das mittlere Gehalt (siehe Variable „Gehalt“, welche zeitlich später gemessen wurde als „befristArbeit“) in den Gruppen mit „befristArbeit“=1 und „befristArbeit“=0 signifikant unterscheidet. Inwiefern unterscheidet sich dieser Test vom t-Test? 10. Verwenden Sie den Kolmogorov Smirnov Test um zu überprüfen, ob sich die Verteilungen von (a) „Gehalt“ und (b) „Bildung“ in den Gruppen mit „befristArbeit“=1 und „befristArbeit“=0 signifikant voneinander unterscheiden. 11. Verwenden Sie die einfaktorielle Varianzanalyse, um zu überprüfen, (a) ob sich “Gehalt” für verschiedene Ausprägungen von “Bildung” signifikant unterscheidet und (b) falls ja, zwischen welchen Ausprägungen von “Bildung” signifikante Unterschiede bestehen (verwenden Sie für letztere Analyse die Methode „Tamhane’s T2“ für ungleiche Varianzen für verschiedene Ausprägungen von „Bildung“). 12. Generieren Sie neue Variablen für unterschiedliche Ausprägungen von „Bildung“: „geringBild“ (geringe Bildung; soll 1 sein falls „Bildung“=0 und 0 sein falls „Bildung“=1 oder 2), „mittlereBild“ (mittlere Bildung; soll 1 sein falls „Bildung“=1 und 0 sein falls „Bildung“=0 oder 2), „hoheBild“ (hohe Bildung; soll 1 sein falls „Bildung“=2 und 0 sein falls „Bildung“=0 oder 1) 13. Regressieren Sie “Gehalt” auf „mittlereBild“ und „hoheBild“ um zu testen, ob sich das Gehalt für verschiedene Bildungsniveaus signifikant unterscheidet. 14. Regressieren Sie “Gehalt” auf „geringBild“ und „mittlereBild“ um zu testen, ob sich das Gehalt für verschiedene Bildungsniveaus signifikant unterscheidet. Inwiefern unterscheiden sich die Ergebnisse von jenen in Aufgabe 11 bzw stimmen mit jenen überein? 15. Warum können Sie „Gehalt“ nicht gleichzeitig (also in der selben Regression) auf „geringBild“, „mittlereBild“ und „hoheBild“ regressieren? 16. Regressieren Sie „Gehalt“ auf „geringBild“, „mittlereBild“, „Training“ und „befristArbeit“ und testen Sie anhand des F-tests, ob die Koeffizienten aller Variablen gemeinsam signifikant verschieden von Null sind. Zeigen Sie auch für jeden Koeffizienten das jeweilige 95% Konfidenzintervall.
© Copyright 2024 ExpyDoc