Kreuztabelle – zweidimensionale Häufigkeitstabelle Heute: Merkmal 2 „Die widerspenstige Zähmung des Zufalls“ Ein Lustspiel in mehreren Akten Merkmal 1 y1 y2 Summe x1 n11 n12 n1. x2 n21 n22 n2. x3 n31 n32 n3. Summe n.1 n.2 n Eine der gebräuchlichsten Analysemethoden – bei Nominalskalen und allen kategorisierten Skalen (Übersichtlichkeit!) Achtung: Je nach Kategorisierung unterschiedliche Ergebnisse 1. Akt: Die Kreuztabelle 2 Häufigkeitstabellen Kreuztabelle Merkmal B: Spalten 3 Merkmal A: Zeilen 4 Spaltenprozentwerte Kreuztabelle 5 Zeilenprozentwerte 6 Gesamtprozentwerte 7 8 10 Aufstellen von Hypothesen Besteht ein Zusammenhang zwischen Variable X und Variable Y? unabhängige Variable „Zufall oder nicht Zufall, - das ist hier die Frage.“ Rauchen Gewalterfahrung hat Einfluß auf hat Einfluß auf hat Einfluß auf 2. Akt: Prüfmaß und Signifikanz Geschlecht Grundlagen zur Hypothesentestung – Aussagen über die Grundgesamtheit 1. 2. 4. Je nach Irrtums-WS H0 beibehalten oder H1 annehmen. Einstiegsalter Heroin Konsumgewohnheiten Unterscheiden sich die inhaftierten Frauen mit oder ohne Gewalterfahrung in der Kindheit hinsichtlich ihres Einstiegsalters von Heroin SIGNIFIKANT? Oder: Ist der beobachtete Unterschied im Einstiegsalter nach Gewalterfahrung ZUFÄLLIG oder nicht???? Wahl des geeigneten Tests und Sig.niveau der Prüfgröße festlegen (5% oder 1%) Prüfgröße berechnen Lungenkrebs Beispiel 1: Drogenabhängige Frauen im Gefängnis (n=30, Studie 2009) Hypothesen (H0 und H1) formulieren 3. hat Einfluß auf abhängige Variable Anzahl heroin1_di Ers tkons umat ions alter Heroin 1 v or 18 J. 2 nach 18 J . b5 Gewalt erf ahrung 0 not ex perienced 5 10 1 experienced 11 4 Gesamt 16 14 11 Gesamt 15 15 30 12 14 Ist der festgestellte Unterschied signifikant? Nullhypothese (H0): Ausganspunkt der Testung: Es besteht kein signifikanter Unterschied/Zusammenhang b5 physical violence or threats before age 17 from family members, relatives or known persons * heroin1_di Erstkonsumationsalter Heroin Kreuztabelle heroin1_di Erstkonsumationsalter Heroin 2 nach 18 J. 1 vor 18 J. 5 10 Die tatsächlichen Zellhäufigkeiten der Kreuztabelle entsprechen in etwa den erwarteten Zellhäufigkeiten. Gesamt 15 b5 physical violence 0 not experienced or threats before age 17 from family 1 experienced members, relatives or known persons Anzahl 11 4 15 % 73,3% 26,7% 100,0% Gesamt Anzahl % 16 53,3% 14 46,7% 30 100,0% % Anzahl 33,3% 66,7% „Die befragten Frauen mit bzw. ohne Gewalterfahrung unterscheiden sich nicht hinsichtlich ihres Einstiegsalters.“ Alternativhypothese (HA): Hypothese zum Zusammenhang: Es besteht ein signifikanter Unterschied/Zusammenhang 100,0% „Die befragten Frauen mit bzw. ohne Gewalterfahrung unterscheiden sich hinsichtlich ihres Einstiegsalters.“ (zweiseitig) „Befragte mit Gewalterfahrung beginnen früher, Heroin zu konsumieren als Befragte ohne Gewalterfahrung.“ (einseitig) Die tatsächlichen Zellhäufigkeiten der Kreuztabelle weichen signifikant von den erwarteten Zellhäufigkeiten ab. 13 Erwartete Anzahl bei Unabhängigkeit = Wenn sich die Befragten mit oder ohne Gewalterfahrung nicht hinsichtlich des Erstkonsumationsalters von Heroin unterscheiden. Regeln bei der Hypothesentestung – Konvention Jedes Prüfmaß hat eine berechenbare Signifikanz = Wahrscheinlichkeit des jeweiligen Prüfmaß unter Voraussetzung von Unabhängigkeit (= Zufall) (= kein Unterschied) (= kein Zusammenhang) Abhängigkeit = kein Zufall = Unterschied / Zusammenhang = Gesetzmäßigkeit Nullhypothese: wenn der Signifikanzwert groß ist ( p > 0,05) dann wird die Nullhypothese beibehalten (kein signifikanter Unterschied). Alternativhypothese: Hypothese zum Zusammenhang: wenn der Signifikanzwert sehr klein ist ( p ≤ 0,05) dann wird die HA angenommen (signifikanter Unterschied/Zusammenhang) Die Fehlerwahrscheinlichkeit ist dann kleiner als 0,05 (oder: 5%). Das Risiko, einen falschen Zusammenhang anzunehmen, liegt unter 5%. Der Signifikanzwert des Prüfmaß spricht entweder für Unabhängigkeit (H0 wenn p > 0,05) oder für Abhängigkeit (HA wenn p <= 0,05). Σfo = Σfe b5 Gewalterf ahrung Gesamt heroin1_di Ers tkons umations alte r Heroin 2 nach 18 J . 1 v or 18 J . 0 not ex perienc ed Anzahl 5 10 Erwartete Anzahl 8,0 7,0 1 experienced Anzahl 11 4 Erwartete Anzahl 8,0 7,0 Anzahl 16 14 Erwartete Anzahl 16,0 14,0 = 30 Gesamt 15 15,0 15 15,0 30 30,0 Randsummen werden als gegeben angenommen: Erwartete Anzahl in den einzelnen Zellen = (Randsumme Zeile x Randsumme Spalte) / Gesamtsumme Bsp.: Gewalterfahrung, Einstieg vor18 J.: (15 x 16) / 30 = 8 15 16 17 Absolutes Residuum = Differenz zwischen tatsächlicher und erwarteter Häufigkeit = Abweichung tatsächlicher Häufigkeit zur Unabhängigkeit (=Zufall) b5 Gewalterf ahrung 0 not ex perienced 1 ex perienced Gesamt heroin1_di Ers tkons umations alter Heroin 1 v or 18 J. 2 nach 18 J . Anzahl 5 10 Erwartete Anzahl 8,0 7,0 Residuen -3,0 3,0 Anzahl 11 4 Erwartete Anzahl 8,0 7,0 Residuen 3,0 -3,0 Anzahl 16 14 Erwartete Anzahl 16,0 14,0 Standardisiertes Residuum = Stdd. absolutes Residuum = standardisierte Abweichung tatsächlicher Hfkt. zur Unabhängigkeit (=Zufall) b5 Gewalterf ahrung Gesamt 15 15,0 15 15,0 0 0 30 30,0 Gesamt heroin1_di Erstkonsumationsalter Heroin 1 v or 18 J. 2 nach 18 J. 0 not experienced Anzahl 5 10 Erwartete Anzahl 8,0 7,0 Residuen -3,0 3,0 Standardisierte Residuen -1,1 1,1 1 experienced Anzahl 11 4 Erwartete Anzahl 8,0 7,0 Residuen 3,0 -3,0 Standardisierte Residuen 1,1 -1,1 Anzahl 16 14 Erwartete Anzahl 16,0 14,0 0 0 Standardisiertes Residuum = Gesamt 15 15,0 15 15,0 30 30,0 abs. Re s erw.Hfkt Residuum = Tatsächliche Zellhäufigkeit – erwartete Zellhäufigkeit Bsp.: Gewalterfahrung, Einstieg vor 18 J.: 3 / 8 Bsp.: Gewalterfahrung, Einstieg vor 18 J.: 11 – 8 = 3 fo - fe 18 Zufall = Unabhängigkeit = fe Σ = 1,1 fo - fe fe standardisiertes Residuum WS hoch Summe der standardisierten Residuen = 0 19 Zufall regiert Σ = 100% nieder „klein“ -2 0 standardisiertes Residuum „groß“ 2 20 Chi-Quadrat-Tests Quadrieren = Prüfmaß Σ ( fo – fe ) 2 Wert = Chi-Quadrat nach Pearson a Kontinuitätskorrektur Likelihood-Quotient Exakter Test nach Fisher Zusammenhang linear-mit-linear Anzahl der gültigen Fälle χ2 fe Asymptotisch e Signifikanz (2-seitig) df b 4,821 1 ,028 3,348 4,963 1 1 ,067 ,026 Exakte Signifikanz (2-seitig) ,066 4,661 1 Exakte Das Prüfmaß Signifikanz Chi-Quadrat beträgt 4,8 (1-seitig) ,033 ,031 Dieses Prüfmaß ist mit 2,8 % WS durch Zufall zustande gekommen. ODER: Irrtums-WS: b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 7,00. Wenn ich einen signifikanten Unterschied annehme, Symmetrische Maße irre ich mich in 2,8 % aller Fälle. 30 a. Wird nur für eine 2x2-Tabelle berechnet = Summe der quadrierten stdd. Residuen = z.B. ((-1,1)2 + (1,1)2 + (-1,1)2 + (1,1)2) = 4,8 = Maß für die Abweichung von der erwarteten Verteilung (oder: der Zufallsverteilung) Nominal- bzgl. Nominalmaß Phi Cramer-V Kontingenzkoeffizient Anzahl der gültigen Fälle Es gilt: Große Abweichung = hohes Chi-Quadrat Wert -,401 ,401 ,372 30 Näherung sweise Signifikanz ,028 ,028 ,028 Es besteht ein starker Zusammenhang mit V= 0,4 a. Die Null-Hyphothese wird nicht angenommen. 21 Bei allen möglichen Stichproben: Wie ist Chi-Quadrat verteilt, wenn kein Zusammenhang besteht? b. Unter Annahme der Null-Hyphothese wird der asymptotische Standardfehler verwendet. 22 WS 5% hoch Zur Erinnerung: die standardisierten Residuen sind bei Unabhängigkeit normalverteilt. Zufall regiert Σ = 100% nieder 2 Wahrscheinlichkeitsverteilung von χ klein p ≤ 0,05 groß 5% der Verteilung abgeschnitten = quadrierte Normalverteilung 23 24 χ2-Verteilung 25 Simulation: Was passiert, wenn ich doppelt so viele Fälle HÄTTE: Daten Fälle gewichten mit gewicht2 (quadrierte Normalverteilung) (versch. Verteilungen je nach Freiheitsgraden) Das heißt: Wir tun so (simulieren), als ob wir doppelt so viele Befragte in unserer Stichprobe hätten also statt 30 haben wir 60 Personen. df = (Spalten – 1) x (Zeilen – 1) Beachte: Das dient nur zur Veranschaulichung. Derartige Gewichtungen sind selbstverständlich nicht zulässig! Σ = 100% 5% p ≤ 0,05 zB: df=8 ab hier: HA (Gesetz) gilt heroin1_di Erstkonsumationsalter Heroin 1 vor 18 J. 2 nach 18 J. b5 physical violence 0 not experienced Anzahl 10 20 or threats before age Erwartete Anzahl 16,0 14,0 17 from family Residuen -6,0 6,0 members, relatives Standardisierte Residuen -1,5 1,6 or known persons 1 experienced Anzahl 22 8 Erwartete Anzahl 16,0 14,0 Residuen 6,0 -6,0 Standardisierte Residuen 1,5 -1,6 Gesamt Anzahl 32 28 Erwartete Anzahl 32,0 28,0 Gesamt 30 30,0 30 30,0 60 60,0 26 Simulation: Was passiert, wenn ich neunmal so viele Fälle HÄTTE: Daten Fälle gewichten mit gewicht9 Simulation: Was passiert, wenn ich dreimal so viele Fälle HÄTTE: Daten Fälle gewichten mit gewicht3 Wir simulieren, dass wir dreimal so viele Befragte in unserer Stichprobe haben also statt 30 haben wir 90 Personen. heroin1_di Erstkonsumationsalter Heroin 1 vor 18 J. 2 nach 18 J. b5 physical violence 0 not experienced Anzahl 15 30 or threats before age Erwartete Anzahl 24,0 21,0 17 from family Residuen -9,0 9,0 members, relatives Standardisierte Residuen -1,8 2,0 or known persons 1 experienced Anzahl 33 12 Erwartete Anzahl 24,0 21,0 Residuen 9,0 -9,0 Standardisierte Residuen 1,8 -2,0 Gesamt Anzahl 48 42 Erwartete Anzahl 48,0 42,0 Wir simulieren, dass wir neunmal so viele Befragte in unserer Stichprobe haben also statt 30 haben wir 270 Personen. heroin1_di Erstkonsumationsalter Heroin 1 vor 18 J. 2 nach 18 J. b5 physical violence 0 not experienced Anzahl 45 90 or threats before age Erwartete Anzahl 72,0 63,0 17 from family Residuen -27,0 27,0 members, relatives Standardisierte Residuen -3,2 3,4 or known persons 1 experienced Anzahl 99 36 Erwartete Anzahl 72,0 63,0 Residuen 27,0 -27,0 Standardisierte Residuen 3,2 -3,4 Gesamt Anzahl 144 126 Erwartete Anzahl 144,0 126,0 Gesamt 45 45,0 45 45,0 90 90,0 27 Gesamt 135 135,0 135 135,0 270 270,0 28 Gewalterfahrung und Einstiegsalter Heroin Fallzahl Prüfmaß Chi-Quadrat Prüfmaß Cramer´s V 29 Signifikanz Gewalterfahrung und Einstiegsalter Heroin Chi-Quadrat-Tests Wert n = 30 χ2 = 4,8 V = 0,40 Chi-Quadrat nach Pearson Anzahl der gültigen Fälle p = 0,028 Asymptotisch e Signifikanz (2-seitig) df b 4,821 1 ,028 30 a. Wird nur für eine 2x2-Tabelle berechnet n = 60 χ2 = 9,6 V = 0,40 p = 0,002 b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 7,00. n = 90 χ2 = 14,5 V = 0,40 p = 0,000 Chi-Quadrat-Tests n = 270 χ2 = 43,4 V = 0,40 Wert p = 0,000 Chi-Quadrat nach Pearson Anzahl der gültigen Fälle Asymptotisch e Signifikanz (2-seitig) df b 43,393 Mit steigender Fallzahl wird die Zufalls-WS kleiner 1 ,000 270 a. Wird nur für eine 2x2-Tabelle berechnet Mit steigender Größe der Stichprobe unterliegt das Ergebnis immer weniger Zufallsschwankungen. Das bedeutet auch: bei einer sehr großen Stichprobe sind sehr kleine (darunter auch nicht relevante) Unterschiede bereits signifikant. b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 63,00. 30 31 Beispiel für ein nicht signifikantes Ergebnis: „Von Zuhause ausgerissen“ und Einstiegsalter Heroin b7 “runaway from home as child or adolescent because of conflicts” und Einstiegsalter dichotom Unterscheiden sich die inhaftierten Frauen, die als Kind/Jugendliche von zu Hause ausgerissen sind, hinsichtlich ihres Einstiegsalters SIGNIFIKANT von jenen, die das nicht gemacht haben? b7 “runaway from home as child or adolescent because of conflicts” und Einstiegsalter dichotom runaway f rom home not as c hild or adoles cent ex perienced because of conf lict s ex perienced Gesamt Anzahl % Anzahl % Anzahl % Ers tk ons umat ions alt er Heroin v or 18 J . nach 18 J . 5 7 41,7% 58,3% 11 7 61,1% 38,9% 16 14 53,3% 46,7% Gesamt 12 100, 0% 18 100, 0% 30 100, 0% Ers tkons umations alter Heroin v or 18 J . nach 18 J . runaway f rom home not experienc ed Anzahl 5 7 as c hild or adoles cent Erwartete Anzahl 6,4 5,6 because of conf licts Residuen -1,4 1,4 Standardisierte Residuen -,6 ,6 ex perienced Anzahl 11 7 Erwartete Anzahl 9,6 8,4 Residuen 1,4 -1,4 Standardisierte Residuen ,5 -,5 Gesamt Anzahl 16 14 Erwartete Anzahl 16,0 14,0 Σ Standardiesierte Residuen = 0 Gesamt 12 12,0 18 18,0 30 30,0 32 b7 “runaway from home as child or adolescent because of conflicts” und Einstiegsalter dichotom b7 “runaway from home as child or adolescent because of conflicts” und Einstiegsalter dichotom Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Anzahl der gültigen Fälle df 1,094 b Fallzahl Asymptotisch e Signifikanz (2-seitig) 1 Prüfmaß Cramer´s V Signifikanz n = 30 χ2 = 1,1 V = 0,19 p = 0,296 n = 60 χ2 = 2,2 V = 0,19 p = 0,139 n = 90 χ2 = 3,3 V = 0,19 p = 0,070 n = 270 χ2 = 9,8 V = 0,19 p = 0,002 ,296 30 a. Wird nur für eine 2x2-Tabelle berechnet b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 5,60. Mit steigender Fallzahl wird die Zufalls-WS kleiner Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Anzahl der gültigen Fälle Prüfmaß Chi-Quadrat Asymptotisch e Signifikanz (2-seitig) df b 9,844 1 ,002 270 Bei diesem Beispiel wird ein nicht signifikantes Ergebnis bei einer höheren Stichprobengröße signifikant! (hier simuliert bei einer Fallzahl von 30 bis 270 Befragten). a. Wird nur für eine 2x2-Tabelle berechnet b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 50,40. 34 33 Beispiel für ein nicht signifikantes Ergebnis: Trennung der Eltern und Einstiegsalter Heroin Beispiel für ein nicht signifikantes Ergebnis: b1 “separation of parents” und Einstiegsalter Heroin Unterscheiden sich die inhaftierten Frauen, deren Eltern sich getrennt haben hinsichtlich ihres Einstiegsalters SIGNIFIKANT von jenen, die deren Eltern sich nicht getrennt haben? b1 “separation of parents” und Einstiegsalter Heroin b1 seperation or divorce of parents Gesamt 0 not experienced Anzahl % von b1 1 experienced Anzahl % von b1 Anzahl % von b1 heroin1_di Erstkonsumationsalter Heroin 2 nach 18 J. 1 vor 18 J. 5 4 55,6% 44,4% 11 10 52,4% 47,6% 16 14 53,3% 46,7% b1 seperation or divorce of parents Gesamt 9 100,0% 21 100,0% 30 100,0% Gesamt 35 heroin1_di Erstkonsumationsalter Heroin 1 vor 18 J. 2 nach 18 J. 0 not experienced Anzahl 5 4 Erwartete Anzahl 4,8 4,2 Residuen ,2 -,2 Standardisierte Residuen ,1 -,1 1 experienced Anzahl 11 10 Erwartete Anzahl 11,2 9,8 Residuen -,2 ,2 Standardisierte Residuen -,1 ,1 Anzahl 16 14 Erwartete Anzahl 16,0 14,0 Gesamt 9 9,0 21 21,0 30 30,0 36 Trennung der Eltern und Einstiegsalter Heroin Beispiel für ein nicht signifikantes Ergebnis: Trennung der Eltern und Einstiegsalter Heroin Fallzahl Chi-Quadrat-Tests Wert Chi-Quadrat nach Pearson Anzahl der gültigen Fälle Asymptotisch e Signifikanz (2-seitig) df ,026 b 1 ,873 30 a. Wird nur für eine 2x2-Tabelle berechnet b. 2 Zellen (50,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 4,20. Mit steigender Fallzahl wird die Zufalls-WS zwar kleiner, aber das Ergebnis bleibt nicht signifikant Chi-Quadrat nach Pearson Anzahl der gültigen Fälle Prüfmaß Cramer´s V Signifikanz n = 30 χ2 = 0,03 V = 0,029 p = 0,873 n = 60 χ2 = 0,05 V = 0,029 p = 0,821 n = 90 χ2 = 0,08 V = 0,029 p = 0,782 n = 270 χ2 = 0,23 V = 0,029 p = 0,632 Dieses Ergebnis bleibt trotz hoher Fallzahl nicht signifikant. Chi-Quadrat-Tests Wert Prüfmaß Chi-Quadrat 38 Asymptotisch e Signifikanz (2-seitig) df b ,230 1 ,632 270 a. Wird nur für eine 2x2-Tabelle berechnet b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete Häufigkeit ist 37,80. 37 39 2. Beispiel aus dem Datensatz zum Darmmanagement Konsumhäufigkeit von Obst und Gemüse nach Geschlecht Wichtig bei Signifikanztests bei Kreuztabellen: Voraussetzung: Die erwartete Anzahl darf in keiner Zelle weniger als 5 sein. Weniger streng: Die erwartete Anzahl darf in 20% der Zellen weniger als 5 sein. Unser Bsp.: Trennung der Eltern: Es gibt nur 9 Personen, die das nicht betrifft: In 2 von 4 Zellen liegt die erwartete Häufigkeit unter 5. Kein Signifikanztest zulässig. Ergebnis unterliegt zu stark den Zufallsschwankungen. Ist der festgestellte Unterschied signifikant? Nullhypothese (H0): Ausganspunkt der Testung: Es besteht kein signifikanter Unterschied/Zusammenhang „Die befragten Patienten und Patientinnen unterscheiden sich nicht hinsichtlich ihren Konsumgewohnheiten.“ Die tatsächlichen Zellhäufigkeiten der Kreuztabelle entsprechen den erwarteten Zellhäufigkeiten. Alternativhypothese (HA): Hypothese zum Zusammenhang: Es besteht ein signifikanter Unterschied/Zusammenhang „Die befragten Patienten und Patientinnen unterscheiden sich hinsichtlich ihren Konsumgewohnheiten.“ Die tatsächlichen Zellhäufigkeiten der Kreuztabelle weichen signifikant von den erwarteten Zellhäufigkeiten ab. Erwartete Anzahl der Zellhäufigkeiten = Anzahl bei Unabhängigkeit (Zufall = keine Gesetzmäßigkeit) 40 Kreuztabelle – Residuen Kreuztabelle – Erwartete Häufigkeiten 42 Erwartete Anzahl in den einzelnen Zellen = (Randsumme Zeile x Randsumme Spalte) / Gesamtsumme Bsp.: Erwartete Anzahl Männer mit täglichem Konsum: (34 x 56) / 78 = 24,4 das sind 44% von 56 Personen 24,4 / 56 = 34 / 78 oder 72% von 34 Personen 24,4 / 34 = 56 / 78 entspricht Spalten% für Gesamt (44% täglicher Konsum) entspricht Zeilen% für Gesamt (72% Männer) 41 Kreuztabelle – Signifikanztest: Prüfmaß Chi-Quadrat 43 Konsumhäufigkeit von fettreichen Speisen nach Geschlecht Prüfmaß χ2 Freiheitsgrade WS vom Prüfmaß unter Voraussetzung von Unabhängigkeit ist 0,006 oder 0,6%, also unter 1%. Oder: Mit weniger als 1%iger Wahrscheinlichkeit ist dieses Ergebnis zufällig zustande gekommen. 44 Kreuztabelle – Residuen Kreuztabelle – Signifikanztest: Prüfmaß Chi-Quadrat Prüfmaß 46 χ2 Freiheitsgrade WS vom Prüfmaß unter Voraussetzung von Unabhängigkeit ist 0,629 oder 63%. Oder: Mit 63%iger Wahrscheinlichkeit ist dieses Ergebnis zufällig zustande gekommen. 45 Kreuztabelle – Signifikanztest: Interpretation Ergebnis: Frauen konsumieren Obst und Gemüse laut eigenen Angaben signifikant häufiger als Männer (χ2=7,5; df=1; p=0,006). Die Irrtumswahrscheinlichkeit beträgt 0,6% und ist damit kleiner als 5%. (hier sogar kleiner als 1%) Ergebnis: Frauen und Männer konsumieren laut eigenen Angaben gleich häufig fettreiche Speisen (χ2=2,3; df=1; p=0,629). Die Irrtumswahrscheinlichkeit beträgt 63% und ist damit größer als 5%. 47 Vorteil: Wahrscheinlichkeit: immer zwischen 0 -1 Wenn Chi2 ein so hoher Wert, dass WS dafür kleiner als 0,05 (= 5%) dann: signifikantes Ergebnis, Zusammenhang/Gesetzmäßigkeit gilt 50 Fehlerarten Simulation: Grundgesamtheit/Population H0 Stichprobe H0 HA kein Zusammenhang a HA Maximale Abhängigkeit Zusammenhang falsch α - Fehler Zusammenhang nicht erkannt β - Fehler Zusammenhang Starke Abhängigkeit a Signifikanztests niemals mit gewichteten Daten berechnen: Weil: Kriterium für die Signifikanz ist die Fallzahl 49 50 52 Simulation: „Trend“ α-Fehler soll möglichst klein (5%, 1%) sein !! = konservatives Verhalten; Wenn α-Fehler = 5% Jedes 20. „signifikante“ Ergebnis ist falsch Zufall 51 Simulation: Abhängigkeit von der Fallzahl Hier: H0 gilt: Ergebnis = Zufall Bei hoher Fallzahl sind bereits kleine Unterschiede signifikant. Hier: HA gilt: Ergebnis ≠ Zufall Simulation: Testen auf Vorergebnis (β-Fehler) Antidepressiva werden nur Frauen verschrieben. Hier: H0 gilt: akt. = voriges Erg. Fehler-WS = 20% WS des Ergebnisses bei erwarteter Verteilung = 26% Gefahr, den Zufall fälschlicherweise zu behaupten: 26% Hier: HA gilt: akt. ≠ voriges Erg. 53 Hier: Fehler = 2,5% HÜ Arbeitsgruppe E 232 Personen haben eineN pflegebedürftigeN AngehörigeN. 100 Personen pflegen IhreN Angehörigen selbst, 132 nicht. In der Stichprobe sind 63 Männer und 169 Frauen. Entwerfen Sie zu den gegebenen Randsummen eine fiktive Kreuztabelle. Berechnen Sie: Zeilen- und Spalten%, erwartete Häufigkeiten, absolute und standardisierte Residuen und den Chi2-Wert. Vergleichen Sie anhand der WS-Verteilung ob Ihr Ergebnis signifikant ist. HÜ Arbeitsgruppe F – für total Lernwütige !! (Tipp: Verwenden Sie dazu das Bastel-Tool „Wer bastelt mit?“ auf unserer HP!) a) Erstellen Sie die Übersicht von der vorigen Folie (das Kontinuum der Abhängigkeit) mit einer Fallzahl von 200! b) Wer noch immer nicht genug hat: Machen Sie selbiges mit einer Fallzahl von 2000! c) Was fällt Ihnen auf? 55 Simulation: Verschreibungspraxis von Antidepressiva nach Geschlecht Frauen und Männern werden gleichermaßen Antidepressiva verschrieben.
© Copyright 2024 ExpyDoc