folien vo 5

Kreuztabelle
– zweidimensionale Häufigkeitstabelle
Heute:
Merkmal 2
„Die widerspenstige
Zähmung des Zufalls“
Ein Lustspiel in mehreren Akten
Merkmal 1
y1
y2
Summe
x1
n11
n12
n1.
x2
n21
n22
n2.
x3
n31
n32
n3.
Summe
n.1
n.2
n
Eine der gebräuchlichsten Analysemethoden –
bei Nominalskalen und allen kategorisierten Skalen (Übersichtlichkeit!)
Achtung: Je nach Kategorisierung unterschiedliche Ergebnisse
1. Akt: Die Kreuztabelle
2
Häufigkeitstabellen
Kreuztabelle
Merkmal B: Spalten
3
Merkmal A:
Zeilen
4
Spaltenprozentwerte
Kreuztabelle
5
Zeilenprozentwerte
6
Gesamtprozentwerte
7
8
10
Aufstellen von Hypothesen
Besteht ein Zusammenhang zwischen Variable X und Variable Y?
unabhängige
Variable
„Zufall oder nicht Zufall,
- das ist hier die Frage.“
Rauchen
Gewalterfahrung
hat Einfluß auf
hat Einfluß auf
hat Einfluß auf
2. Akt: Prüfmaß und Signifikanz
Geschlecht
Grundlagen zur Hypothesentestung –
Aussagen über die Grundgesamtheit
1.
2.
4.
Je nach Irrtums-WS
H0 beibehalten oder
H1 annehmen.
Einstiegsalter
Heroin
Konsumgewohnheiten
Unterscheiden sich die inhaftierten Frauen mit oder ohne Gewalterfahrung
in der Kindheit hinsichtlich ihres Einstiegsalters von Heroin SIGNIFIKANT?
Oder:
Ist der beobachtete Unterschied im Einstiegsalter nach Gewalterfahrung
ZUFÄLLIG oder nicht????
Wahl des geeigneten Tests und Sig.niveau
der Prüfgröße festlegen (5% oder 1%)
Prüfgröße berechnen
Lungenkrebs
Beispiel 1: Drogenabhängige Frauen im Gefängnis (n=30, Studie 2009)
Hypothesen
(H0 und H1) formulieren
3.
hat Einfluß auf
abhängige
Variable
Anzahl
heroin1_di
Ers tkons umat ions alter
Heroin
1 v or 18 J. 2 nach 18 J .
b5 Gewalt erf ahrung 0 not ex perienced
5
10
1 experienced
11
4
Gesamt
16
14
11
Gesamt
15
15
30
12
14
Ist der festgestellte Unterschied signifikant?
Nullhypothese (H0): Ausganspunkt der Testung:
Es besteht kein signifikanter Unterschied/Zusammenhang
b5 physical violence or threats before age 17 from family members, relatives or known
persons * heroin1_di Erstkonsumationsalter Heroin Kreuztabelle
heroin1_di
Erstkonsumationsalter
Heroin
2 nach
18 J.
1 vor 18 J.
5
10
Die tatsächlichen Zellhäufigkeiten der Kreuztabelle entsprechen
in etwa den erwarteten Zellhäufigkeiten.
Gesamt
15
b5 physical violence 0 not experienced
or threats before age
17 from family
1 experienced
members, relatives
or known persons
Anzahl
11
4
15
%
73,3%
26,7%
100,0%
Gesamt
Anzahl
%
16
53,3%
14
46,7%
30
100,0%
%
Anzahl
33,3%
66,7%
„Die befragten Frauen mit bzw. ohne Gewalterfahrung unterscheiden sich
nicht hinsichtlich ihres Einstiegsalters.“
Alternativhypothese (HA): Hypothese zum Zusammenhang:
Es besteht ein signifikanter Unterschied/Zusammenhang
100,0%
„Die befragten Frauen mit bzw. ohne Gewalterfahrung unterscheiden sich
hinsichtlich ihres Einstiegsalters.“ (zweiseitig)
„Befragte mit Gewalterfahrung beginnen früher, Heroin zu konsumieren
als Befragte ohne Gewalterfahrung.“ (einseitig)
Die tatsächlichen Zellhäufigkeiten der Kreuztabelle
weichen signifikant von den erwarteten Zellhäufigkeiten ab.
13
Erwartete Anzahl bei Unabhängigkeit
= Wenn sich die Befragten mit oder ohne Gewalterfahrung nicht hinsichtlich
des Erstkonsumationsalters von Heroin unterscheiden.
Regeln bei der Hypothesentestung – Konvention
Jedes Prüfmaß hat eine berechenbare Signifikanz
= Wahrscheinlichkeit des jeweiligen Prüfmaß unter Voraussetzung von
Unabhängigkeit (= Zufall) (= kein Unterschied) (= kein Zusammenhang)
Abhängigkeit = kein Zufall = Unterschied / Zusammenhang = Gesetzmäßigkeit
Nullhypothese: wenn der Signifikanzwert groß ist ( p > 0,05) dann wird die
Nullhypothese beibehalten (kein signifikanter Unterschied).
Alternativhypothese: Hypothese zum Zusammenhang:
wenn der Signifikanzwert sehr klein ist ( p ≤ 0,05) dann wird die
HA angenommen (signifikanter Unterschied/Zusammenhang)
Die Fehlerwahrscheinlichkeit ist dann kleiner als 0,05 (oder: 5%).
Das Risiko, einen falschen Zusammenhang anzunehmen, liegt unter 5%.
Der Signifikanzwert des Prüfmaß spricht
entweder für Unabhängigkeit (H0 wenn p > 0,05)
oder für Abhängigkeit (HA wenn p <= 0,05).
Σfo = Σfe
b5 Gewalterf ahrung
Gesamt
heroin1_di
Ers tkons umations alte
r Heroin
2 nach
18 J .
1 v or 18 J .
0 not ex perienc ed Anzahl
5
10
Erwartete Anzahl
8,0
7,0
1 experienced
Anzahl
11
4
Erwartete Anzahl
8,0
7,0
Anzahl
16
14
Erwartete Anzahl
16,0
14,0
=
30
Gesamt
15
15,0
15
15,0
30
30,0
Randsummen werden als gegeben angenommen:
Erwartete Anzahl in den einzelnen Zellen =
(Randsumme Zeile x Randsumme Spalte) / Gesamtsumme
Bsp.: Gewalterfahrung, Einstieg vor18 J.: (15 x 16) / 30 = 8
15
16
17
Absolutes Residuum =
Differenz zwischen tatsächlicher und erwarteter Häufigkeit
= Abweichung tatsächlicher Häufigkeit zur Unabhängigkeit (=Zufall)
b5 Gewalterf ahrung
0 not
ex perienced
1
ex perienced
Gesamt
heroin1_di
Ers tkons umations alter
Heroin
1 v or 18 J. 2 nach 18 J .
Anzahl
5
10
Erwartete Anzahl
8,0
7,0
Residuen
-3,0
3,0
Anzahl
11
4
Erwartete Anzahl
8,0
7,0
Residuen
3,0
-3,0
Anzahl
16
14
Erwartete Anzahl
16,0
14,0
Standardisiertes Residuum = Stdd. absolutes Residuum
= standardisierte Abweichung tatsächlicher Hfkt. zur Unabhängigkeit (=Zufall)
b5 Gewalterf ahrung
Gesamt
15
15,0
15
15,0
0
0
30
30,0
Gesamt
heroin1_di
Erstkonsumationsalter
Heroin
1 v or 18 J. 2 nach 18 J.
0 not experienced Anzahl
5
10
Erwartete Anzahl
8,0
7,0
Residuen
-3,0
3,0
Standardisierte Residuen
-1,1
1,1
1 experienced
Anzahl
11
4
Erwartete Anzahl
8,0
7,0
Residuen
3,0
-3,0
Standardisierte Residuen
1,1
-1,1
Anzahl
16
14
Erwartete Anzahl
16,0
14,0
0
0
Standardisiertes Residuum =
Gesamt
15
15,0
15
15,0
30
30,0
abs. Re s
erw.Hfkt
Residuum = Tatsächliche Zellhäufigkeit – erwartete Zellhäufigkeit
Bsp.: Gewalterfahrung, Einstieg vor 18 J.: 3 / 8
Bsp.: Gewalterfahrung, Einstieg vor 18 J.: 11 – 8 = 3
fo - fe
18
Zufall = Unabhängigkeit
=
fe
Σ
= 1,1
fo - fe
fe
standardisiertes
Residuum
WS
hoch
Summe der
standardisierten
Residuen
=
0
19
Zufall
regiert
Σ = 100%
nieder
„klein“
-2
0
standardisiertes
Residuum
„groß“
2
20
Chi-Quadrat-Tests
Quadrieren = Prüfmaß
Σ
( fo – fe )
2
Wert
=
Chi-Quadrat nach
Pearson
a
Kontinuitätskorrektur
Likelihood-Quotient
Exakter Test nach Fisher
Zusammenhang
linear-mit-linear
Anzahl der gültigen Fälle
χ2
fe
Asymptotisch
e Signifikanz
(2-seitig)
df
b
4,821
1
,028
3,348
4,963
1
1
,067
,026
Exakte
Signifikanz
(2-seitig)
,066
4,661
1
Exakte
Das Prüfmaß
Signifikanz
Chi-Quadrat
beträgt 4,8
(1-seitig)
,033
,031
Dieses Prüfmaß ist mit 2,8 % WS
durch Zufall zustande gekommen.
ODER:
Irrtums-WS:
b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die minimale erwartete
Häufigkeit
ist 7,00.
Wenn ich einen signifikanten
Unterschied annehme,
Symmetrische Maße
irre ich mich in 2,8 % aller Fälle.
30
a. Wird nur für eine 2x2-Tabelle berechnet
= Summe der quadrierten stdd. Residuen
= z.B. ((-1,1)2 + (1,1)2 + (-1,1)2 + (1,1)2) = 4,8
= Maß für die Abweichung von der erwarteten
Verteilung (oder: der Zufallsverteilung)
Nominal- bzgl.
Nominalmaß
Phi
Cramer-V
Kontingenzkoeffizient
Anzahl der gültigen Fälle
Es gilt: Große Abweichung = hohes Chi-Quadrat
Wert
-,401
,401
,372
30
Näherung
sweise
Signifikanz
,028
,028
,028
Es besteht ein starker
Zusammenhang mit V= 0,4
a. Die Null-Hyphothese wird nicht angenommen.
21
Bei allen möglichen Stichproben:
Wie ist Chi-Quadrat verteilt,
wenn kein Zusammenhang besteht?
b. Unter Annahme der Null-Hyphothese wird der asymptotische
Standardfehler verwendet.
22
WS
5%
hoch
Zur Erinnerung:
die standardisierten Residuen
sind bei Unabhängigkeit normalverteilt.
Zufall
regiert
Σ = 100%
nieder
2
Wahrscheinlichkeitsverteilung von χ
klein
p ≤ 0,05
groß
5% der Verteilung
abgeschnitten
= quadrierte Normalverteilung
23
24
χ2-Verteilung
25
Simulation: Was passiert, wenn ich doppelt so viele Fälle HÄTTE:
Daten
Fälle gewichten
mit gewicht2
(quadrierte Normalverteilung)
(versch. Verteilungen je nach Freiheitsgraden)
Das heißt: Wir tun so (simulieren), als ob wir doppelt so viele Befragte in unserer
Stichprobe hätten also statt 30 haben wir 60 Personen.
df = (Spalten – 1) x (Zeilen – 1)
Beachte: Das dient nur zur Veranschaulichung.
Derartige Gewichtungen sind selbstverständlich nicht zulässig!
Σ = 100%
5%
p ≤ 0,05
zB: df=8
ab hier:
HA (Gesetz) gilt
heroin1_di
Erstkonsumationsalter
Heroin
1 vor 18 J. 2 nach 18 J.
b5 physical violence 0 not experienced Anzahl
10
20
or threats before age
Erwartete Anzahl
16,0
14,0
17 from family
Residuen
-6,0
6,0
members, relatives
Standardisierte Residuen
-1,5
1,6
or known persons
1 experienced
Anzahl
22
8
Erwartete Anzahl
16,0
14,0
Residuen
6,0
-6,0
Standardisierte Residuen
1,5
-1,6
Gesamt
Anzahl
32
28
Erwartete Anzahl
32,0
28,0
Gesamt
30
30,0
30
30,0
60
60,0
26
Simulation: Was passiert, wenn ich neunmal so viele Fälle HÄTTE:
Daten
Fälle gewichten
mit gewicht9
Simulation: Was passiert, wenn ich dreimal so viele Fälle HÄTTE:
Daten
Fälle gewichten
mit gewicht3
Wir simulieren, dass wir dreimal so viele Befragte in unserer Stichprobe haben
also statt 30 haben wir 90 Personen.
heroin1_di
Erstkonsumationsalter
Heroin
1 vor 18 J. 2 nach 18 J.
b5 physical violence 0 not experienced Anzahl
15
30
or threats before age
Erwartete Anzahl
24,0
21,0
17 from family
Residuen
-9,0
9,0
members, relatives
Standardisierte Residuen
-1,8
2,0
or known persons
1 experienced
Anzahl
33
12
Erwartete Anzahl
24,0
21,0
Residuen
9,0
-9,0
Standardisierte Residuen
1,8
-2,0
Gesamt
Anzahl
48
42
Erwartete Anzahl
48,0
42,0
Wir simulieren, dass wir neunmal so viele Befragte in unserer Stichprobe haben
also statt 30 haben wir 270 Personen.
heroin1_di
Erstkonsumationsalter
Heroin
1 vor 18 J. 2 nach 18 J.
b5 physical violence 0 not experienced Anzahl
45
90
or threats before age
Erwartete Anzahl
72,0
63,0
17 from family
Residuen
-27,0
27,0
members, relatives
Standardisierte Residuen
-3,2
3,4
or known persons
1 experienced
Anzahl
99
36
Erwartete Anzahl
72,0
63,0
Residuen
27,0
-27,0
Standardisierte Residuen
3,2
-3,4
Gesamt
Anzahl
144
126
Erwartete Anzahl
144,0
126,0
Gesamt
45
45,0
45
45,0
90
90,0
27
Gesamt
135
135,0
135
135,0
270
270,0
28
Gewalterfahrung und Einstiegsalter Heroin
Fallzahl
Prüfmaß
Chi-Quadrat
Prüfmaß
Cramer´s V
29
Signifikanz
Gewalterfahrung und Einstiegsalter Heroin
Chi-Quadrat-Tests
Wert
n = 30
χ2 = 4,8
V = 0,40
Chi-Quadrat nach
Pearson
Anzahl der gültigen Fälle
p = 0,028
Asymptotisch
e Signifikanz
(2-seitig)
df
b
4,821
1
,028
30
a. Wird nur für eine 2x2-Tabelle berechnet
n = 60
χ2 = 9,6
V = 0,40
p = 0,002
b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit ist 7,00.
n = 90
χ2 = 14,5
V = 0,40
p = 0,000
Chi-Quadrat-Tests
n = 270
χ2 = 43,4
V = 0,40
Wert
p = 0,000
Chi-Quadrat nach
Pearson
Anzahl der gültigen Fälle
Asymptotisch
e Signifikanz
(2-seitig)
df
b
43,393
Mit steigender
Fallzahl wird die
Zufalls-WS kleiner
1
,000
270
a. Wird nur für eine 2x2-Tabelle berechnet
Mit steigender Größe der Stichprobe unterliegt das Ergebnis immer weniger
Zufallsschwankungen. Das bedeutet auch: bei einer sehr großen Stichprobe sind
sehr kleine (darunter auch nicht relevante) Unterschiede bereits signifikant.
b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit ist 63,00.
30
31
Beispiel für ein nicht signifikantes Ergebnis:
„Von Zuhause ausgerissen“ und Einstiegsalter Heroin
b7 “runaway from home as child or adolescent
because of conflicts” und Einstiegsalter dichotom
Unterscheiden sich die inhaftierten Frauen, die als Kind/Jugendliche
von zu Hause ausgerissen sind, hinsichtlich ihres Einstiegsalters
SIGNIFIKANT von jenen, die das nicht gemacht haben?
b7 “runaway from home as child or adolescent
because of conflicts” und Einstiegsalter dichotom
runaway f rom home
not
as c hild or adoles cent ex perienced
because of conf lict s
ex perienced
Gesamt
Anzahl
%
Anzahl
%
Anzahl
%
Ers tk ons umat ions alt er
Heroin
v or 18 J . nach 18 J .
5
7
41,7%
58,3%
11
7
61,1%
38,9%
16
14
53,3%
46,7%
Gesamt
12
100, 0%
18
100, 0%
30
100, 0%
Ers tkons umations alter
Heroin
v or 18 J . nach 18 J .
runaway f rom home not experienc ed Anzahl
5
7
as c hild or adoles cent
Erwartete Anzahl
6,4
5,6
because of conf licts
Residuen
-1,4
1,4
Standardisierte Residuen
-,6
,6
ex perienced
Anzahl
11
7
Erwartete Anzahl
9,6
8,4
Residuen
1,4
-1,4
Standardisierte Residuen
,5
-,5
Gesamt
Anzahl
16
14
Erwartete Anzahl
16,0
14,0
Σ Standardiesierte Residuen = 0
Gesamt
12
12,0
18
18,0
30
30,0
32
b7 “runaway from home as child or adolescent because of conflicts”
und Einstiegsalter dichotom
b7 “runaway from home as child or adolescent
because of conflicts” und Einstiegsalter dichotom
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Anzahl der gültigen Fälle
df
1,094
b
Fallzahl
Asymptotisch
e Signifikanz
(2-seitig)
1
Prüfmaß
Cramer´s V
Signifikanz
n = 30
χ2 = 1,1
V = 0,19
p = 0,296
n = 60
χ2 = 2,2
V = 0,19
p = 0,139
n = 90
χ2 = 3,3
V = 0,19
p = 0,070
n = 270
χ2 = 9,8
V = 0,19
p = 0,002
,296
30
a. Wird nur für eine 2x2-Tabelle berechnet
b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit ist 5,60.
Mit steigender
Fallzahl wird die
Zufalls-WS kleiner
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Anzahl der gültigen Fälle
Prüfmaß
Chi-Quadrat
Asymptotisch
e Signifikanz
(2-seitig)
df
b
9,844
1
,002
270
Bei diesem Beispiel wird ein nicht signifikantes Ergebnis
bei einer höheren Stichprobengröße signifikant!
(hier simuliert bei einer Fallzahl von 30 bis 270 Befragten).
a. Wird nur für eine 2x2-Tabelle berechnet
b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit ist 50,40.
34
33
Beispiel für ein nicht signifikantes Ergebnis:
Trennung der Eltern und Einstiegsalter Heroin
Beispiel für ein nicht signifikantes Ergebnis:
b1 “separation of parents” und Einstiegsalter Heroin
Unterscheiden sich die inhaftierten Frauen, deren Eltern sich
getrennt haben hinsichtlich ihres Einstiegsalters SIGNIFIKANT
von jenen, die deren Eltern sich nicht getrennt haben?
b1 “separation of parents” und Einstiegsalter Heroin
b1 seperation
or divorce of
parents
Gesamt
0 not experienced Anzahl
% von b1
1 experienced
Anzahl
% von b1
Anzahl
% von b1
heroin1_di
Erstkonsumationsalter
Heroin
2 nach
18 J.
1 vor 18 J.
5
4
55,6%
44,4%
11
10
52,4%
47,6%
16
14
53,3%
46,7%
b1 seperation
or divorce of
parents
Gesamt
9
100,0%
21
100,0%
30
100,0%
Gesamt
35
heroin1_di
Erstkonsumationsalter
Heroin
1 vor 18 J. 2 nach 18 J.
0 not experienced Anzahl
5
4
Erwartete Anzahl
4,8
4,2
Residuen
,2
-,2
Standardisierte Residuen
,1
-,1
1 experienced
Anzahl
11
10
Erwartete Anzahl
11,2
9,8
Residuen
-,2
,2
Standardisierte Residuen
-,1
,1
Anzahl
16
14
Erwartete Anzahl
16,0
14,0
Gesamt
9
9,0
21
21,0
30
30,0
36
Trennung der Eltern und Einstiegsalter Heroin
Beispiel für ein nicht signifikantes Ergebnis:
Trennung der Eltern und Einstiegsalter Heroin
Fallzahl
Chi-Quadrat-Tests
Wert
Chi-Quadrat nach
Pearson
Anzahl der gültigen Fälle
Asymptotisch
e Signifikanz
(2-seitig)
df
,026
b
1
,873
30
a. Wird nur für eine 2x2-Tabelle berechnet
b. 2 Zellen (50,0%) haben eine erwartete Häufigkeit kleiner 5.
Die minimale erwartete Häufigkeit ist 4,20.
Mit steigender Fallzahl
wird die Zufalls-WS
zwar kleiner, aber das
Ergebnis bleibt nicht
signifikant
Chi-Quadrat nach
Pearson
Anzahl der gültigen Fälle
Prüfmaß
Cramer´s V
Signifikanz
n = 30
χ2 = 0,03
V = 0,029
p = 0,873
n = 60
χ2 = 0,05
V = 0,029
p = 0,821
n = 90
χ2 = 0,08
V = 0,029
p = 0,782
n = 270
χ2 = 0,23
V = 0,029
p = 0,632
Dieses Ergebnis bleibt trotz hoher Fallzahl nicht signifikant.
Chi-Quadrat-Tests
Wert
Prüfmaß
Chi-Quadrat
38
Asymptotisch
e Signifikanz
(2-seitig)
df
b
,230
1
,632
270
a. Wird nur für eine 2x2-Tabelle berechnet
b. 0 Zellen (,0%) haben eine erwartete Häufigkeit kleiner 5. Die
minimale erwartete Häufigkeit ist 37,80.
37
39
2. Beispiel aus dem Datensatz zum Darmmanagement
Konsumhäufigkeit von Obst und Gemüse nach Geschlecht
Wichtig bei Signifikanztests bei Kreuztabellen: Voraussetzung:
Die erwartete Anzahl darf in keiner Zelle weniger als 5 sein.
Weniger streng: Die erwartete Anzahl darf in 20% der Zellen weniger als 5 sein.
Unser Bsp.: Trennung der Eltern: Es gibt nur 9 Personen, die das nicht betrifft:
In 2 von 4 Zellen liegt die erwartete Häufigkeit unter 5. Kein Signifikanztest zulässig.
Ergebnis unterliegt zu stark den Zufallsschwankungen.
Ist der festgestellte Unterschied signifikant?
Nullhypothese (H0): Ausganspunkt der Testung:
Es besteht kein signifikanter Unterschied/Zusammenhang
„Die befragten Patienten und Patientinnen unterscheiden sich
nicht hinsichtlich ihren Konsumgewohnheiten.“
Die tatsächlichen Zellhäufigkeiten der Kreuztabelle entsprechen
den erwarteten Zellhäufigkeiten.
Alternativhypothese (HA): Hypothese zum Zusammenhang:
Es besteht ein signifikanter Unterschied/Zusammenhang
„Die befragten Patienten und Patientinnen unterscheiden sich
hinsichtlich ihren Konsumgewohnheiten.“
Die tatsächlichen Zellhäufigkeiten der Kreuztabelle
weichen signifikant von den erwarteten Zellhäufigkeiten ab.
Erwartete Anzahl der Zellhäufigkeiten
= Anzahl bei Unabhängigkeit (Zufall = keine Gesetzmäßigkeit)
40
Kreuztabelle – Residuen
Kreuztabelle – Erwartete Häufigkeiten
42
Erwartete Anzahl in den einzelnen Zellen =
(Randsumme Zeile x Randsumme Spalte) / Gesamtsumme
Bsp.: Erwartete Anzahl Männer mit täglichem Konsum: (34 x 56) / 78 = 24,4
das sind 44% von 56 Personen
24,4 / 56 = 34 / 78
oder 72% von 34 Personen
24,4 / 34 = 56 / 78
entspricht Spalten% für Gesamt
(44% täglicher Konsum)
entspricht Zeilen% für Gesamt
(72% Männer)
41
Kreuztabelle – Signifikanztest: Prüfmaß Chi-Quadrat
43
Konsumhäufigkeit von fettreichen Speisen nach Geschlecht
Prüfmaß
χ2
Freiheitsgrade
WS vom Prüfmaß unter Voraussetzung von Unabhängigkeit
ist 0,006 oder 0,6%, also unter 1%.
Oder: Mit weniger als 1%iger Wahrscheinlichkeit
ist dieses Ergebnis zufällig zustande gekommen.
44
Kreuztabelle – Residuen
Kreuztabelle – Signifikanztest: Prüfmaß Chi-Quadrat
Prüfmaß
46
χ2
Freiheitsgrade
WS vom Prüfmaß unter Voraussetzung von Unabhängigkeit
ist 0,629 oder 63%.
Oder: Mit 63%iger Wahrscheinlichkeit
ist dieses Ergebnis zufällig zustande gekommen.
45
Kreuztabelle – Signifikanztest: Interpretation
Ergebnis:
Frauen konsumieren Obst und Gemüse laut eigenen Angaben
signifikant häufiger als Männer (χ2=7,5; df=1; p=0,006).
Die Irrtumswahrscheinlichkeit beträgt 0,6% und ist damit kleiner
als 5%. (hier sogar kleiner als 1%)
Ergebnis:
Frauen und Männer konsumieren laut eigenen Angaben
gleich häufig fettreiche Speisen (χ2=2,3; df=1; p=0,629).
Die Irrtumswahrscheinlichkeit beträgt 63% und ist damit größer
als 5%.
47
Vorteil:
Wahrscheinlichkeit:
immer zwischen 0 -1
Wenn Chi2 ein so hoher Wert, dass
WS dafür kleiner als 0,05 (= 5%)
dann: signifikantes Ergebnis,
Zusammenhang/Gesetzmäßigkeit gilt
50
Fehlerarten
Simulation:
Grundgesamtheit/Population
H0
Stichprobe
H0
HA
kein
Zusammenhang
a
HA
Maximale
Abhängigkeit
Zusammenhang
falsch
α - Fehler
Zusammenhang
nicht erkannt
β - Fehler
Zusammenhang
Starke
Abhängigkeit
a
Signifikanztests niemals mit gewichteten Daten berechnen:
Weil: Kriterium für die Signifikanz ist die Fallzahl
49
50
52
Simulation:
„Trend“
α-Fehler soll möglichst
klein (5%, 1%) sein !!
= konservatives
Verhalten;
Wenn α-Fehler = 5%
Jedes 20. „signifikante“
Ergebnis ist falsch
Zufall
51
Simulation: Abhängigkeit von der Fallzahl
Hier: H0 gilt:
Ergebnis = Zufall
Bei hoher Fallzahl
sind bereits kleine
Unterschiede
signifikant.
Hier: HA gilt:
Ergebnis ≠ Zufall
Simulation: Testen auf Vorergebnis (β-Fehler)
Antidepressiva
werden nur
Frauen
verschrieben.
Hier: H0 gilt:
akt. = voriges Erg.
Fehler-WS = 20%
WS des Ergebnisses
bei erwarteter
Verteilung = 26%
Gefahr, den Zufall
fälschlicherweise zu
behaupten: 26%
Hier: HA gilt:
akt. ≠ voriges Erg.
53
Hier: Fehler = 2,5%
HÜ Arbeitsgruppe E
232 Personen haben eineN pflegebedürftigeN AngehörigeN.
100 Personen pflegen IhreN Angehörigen selbst, 132 nicht.
In der Stichprobe sind 63 Männer und 169 Frauen.
Entwerfen Sie zu den gegebenen Randsummen eine fiktive Kreuztabelle.
Berechnen Sie: Zeilen- und Spalten%, erwartete Häufigkeiten,
absolute und standardisierte Residuen und den Chi2-Wert.
Vergleichen Sie anhand der WS-Verteilung ob Ihr Ergebnis signifikant ist.
HÜ Arbeitsgruppe F – für total Lernwütige !!
(Tipp: Verwenden Sie dazu das Bastel-Tool „Wer bastelt mit?“ auf unserer HP!)
a)
Erstellen Sie die Übersicht von der vorigen Folie
(das Kontinuum der Abhängigkeit) mit einer Fallzahl von 200!
b) Wer noch immer nicht genug hat:
Machen Sie selbiges mit einer Fallzahl von 2000!
c)
Was fällt Ihnen auf?
55
Simulation:
Verschreibungspraxis
von Antidepressiva
nach Geschlecht
Frauen und
Männern werden
gleichermaßen
Antidepressiva
verschrieben.