Statistik I — bis jetzt K 1 Einf ¨uhrung K 2 Beschreibende

Statistik I — bis jetzt
K 1 Einführung
K 2 Beschreibende Statistik
K 3 Graphiken
K 4 Schätzen
und jetzt
K 5 Testen
5.1 Tests im allgemeinen
5.2 Binomial Tests
K5 Statistische Tests
Beispiel: Exemestane und Brustkrebs
Tamoxifen über 5 Jahre ist für gewisse Frauen mit Brustkrebs
eine Standardbehandlung. Wissenschaftler haben eine
neue Behandlung vorgeschlagen:
2 bis 3 Jahre Tamoxifen und danach Exemestane.
In einer Doppelblindstudie von Coombes et al sind folgende Resultate berichtet worden (NEJM 350(11) 108192).
4742 Patientinnen insgesamt
2362 bekamen nach 2 bis 3 Jahren Exemestane
2380 bekamen noch Tamoxifen
Tote
93 in der Exemestane Gruppe
106 in der Tamoxifen Gruppe
Ereignisse
183 in der Exemestane Gruppe
266 in der Tamoxifen Gruppe
%
%
%
%
Zeigen diese Resultate, dass die Behandlung mit
Exemestane besser ist?
5.1 Statistische Tests im allgemeinen
z.B. Hilft Vitamin C gegen Erkältungen?
Ist der neue Ferrari schneller als der alte?
Sind finnische Schüler besser als deutsche?
• Was ist ein statisticher Test?
• Warum werden statistische Tests durchgeführt?
• Wann werden statistische Tests durchgeführt?
• Wie werden statistische Tests durchgeführt?
• Wer führt statistische Tests durch?
• Welche Folgen haben statistische Tests?
Terminologie für Test-Theorie
Hypothese
H0 Nullhypothese
H1 Alternativhypothese
Teststatistik (Prüfgröße)
Verteilung der Teststatistik
Testniveau α
Annahmebereich/Ablehnungsbereich
Entscheidungsregel (kritischer Wert)
Statistische Signifikanz
p-Wert
Fehler Typ I
Fehler Typ II
P (H0 verwerfen |H0 wahr)
P (H0 akzeptieren |H1 wahr)
Gütefunktion (beim Test eines Parameters)
g(θ) = P (H0 verwerfen |θ der wahre Parameter)
Operationscharakteristik eines Tests
OC = 1 − g(θ)
Statistische Testprozeduren
Theorie
Nullhypothese H0
Studie entwerfen
Definition der Grundgesamtheit
Stichprobenverfahren
Stichprobengröße
Daten holen
Daten erheben
Daten organisieren
Häufigkeitstabellen, Histogramme usw.
Resultate zusammenfassen
Teststatistik berechnen
Teststatistik mit erwarteten Werten vergleichen
Verteilung der Teststatistik
p-Wert, Signifikanz
Signifikanz der Teststatistik
Wir berechnen den p-Wert
PH0 (Teststatistik > beobachtete Wert der Statistik)
(Im allgemeinen sucht man die Wahrscheinlichkeit des Wertebereichs, worin alle Werte eine kleinere Wahrscheinlichkeit als der beobachtete Wert haben.)
Traditionelle Deutung
(nach Fisher nur als Richtlinie, aber . . . ):
p-Wert > 0.05 ⇒ H0 sollte nicht verworfen werden
p-Wert < 0.05 ⇒ H0 kann vielleicht verworfen werden
p-Wert < 0.01 ⇒ H0 kann verworfen werden
Vieles hängt von den nachfolgenden Wirkungen ab, wie
man p-Werte interpretiert.
z.B.
neues Medikament genehmigt
oder
alte Behandlung verboten
5.2 Binomial Test (eine Stichprobe)
Nullhypothese
p = p0
Teststatistik
Anzahl Erfolge R aus n
Verteilung unter H0 P (R = r) = nr pr0(1 − p0)n−r
Annahmebereich
[a, b] um np0
Ablehnungsbereich
[0, a − 1] ∪ [b + 1, n]
Typ I Fehler (Test-Niveau)
P (R 6∈ [a, b]|H0)
Das Test-Niveau wird für einen diskreten Test selten genau
α sein. Eine Möglichkeit ist ein randomisierter Test: falls
R = a oder R = b, akzeptiert man H0 mit Wahrscheinlichkeiten, die so gewählt sind, dass das Test-Niveau = α.
Das wird mathematisch genau sein, ist aber in der Praxis
unzufriedenstellend.
Alternativhypothese
p = p1
Typ II Fehler
P (R ∈ [a, b]|H1)
Gütefunktion
g(p1) = P (R 6∈ [a, b]|p = p1)
Binomial Test Beispiel
Außersinnliche Wahrnehmung
Farbe einer Karte erraten
(cf. u.a. Jung und Pauli)
Nullhypothese
Teststatistik
p = 0.5
Anzahl Erfolge R aus 6
Verteilung unter H0 P (R = r) = 6r 0.5r (1 − 0.5)6−r
Annahmebereich
[1, 5]
Ablehnungsbereich
[0] ∪ [6]
Typ I Fehler (Test-Niveau)
P (R 6∈ [1, 5]|H0) = 0.03125
p-Wert von R = 5
Alternativhypothese
Typ II Fehler
Gütefunktion
P (R 6∈ [2, 4]|H0) = 0.2188
p = p1 = 0.8
P (R ∈ [1, 5]|H1) = 0.74
g(p1) = P (R 6∈ [1, 5]|p = p1)
Binomial Test (zwei Stichproben)
Nullhypothese
Teststatistik
p1 = p 2
X/n1 − Y /n2
Verteilung unter H0
E[T ] = 0, V [T ] = p(1 − p)(1/n1 + 1/n2)
Annahmebereich
?
Ablehnungsbereich
?
Typ I Fehler (Test-Niveau)
Alternativhypothese
Typ II Fehler
Gütefunktion
?
p1 6= p2
?
?
Oder wir nehmen an, dass n1, n2 groß genung sind, dass
die Normalapproximation gilt. Dann haben wir:
X/n1 ∼ N (p, p(1−p)/n1) und Y /n2 ∼ N (p, p(1−p)/n2)
⇒ T = X/n1 − Y /n2 ∼ N (0, p(1 − p)(1/n1 + 1/n2))