Statistik I — bis jetzt K 1 Einf ¨uhrung K 2 Beschreibende

Statistik I — bis jetzt
K 1 Einführung
K 2 Beschreibende Statistik
K 3 Graphiken
K 4 Schätzen
und jetzt
K 5 Testen
5.1 Tests im allgemeinen
5.2 Binomial Tests
K5 Statistische Tests
Beispiel: Exemestane und Brustkrebs
Tamoxifen über 5 Jahre ist für gewisse Frauen mit Brustkrebs
eine Standardbehandlung. Wissenschaftler haben eine
neue Behandlung vorgeschlagen:
2 bis 3 Jahre Tamoxifen und danach Exemestane.
In einer Doppelblindstudie von Coombes et al sind folgende Resultate berichtet worden (NEJM 350(11) 108192).
4742 Patientinnen insgesamt
2362 bekamen nach 2 bis 3 Jahren Exemestane
2380 bekamen noch Tamoxifen
Tote
93 in der Exemestane Gruppe
106 in der Tamoxifen Gruppe
Ereignisse
183 in der Exemestane Gruppe
266 in der Tamoxifen Gruppe
%
%
%
%
Zeigen diese Resultate, dass die Behandlung mit
Exemestane besser ist?
5.1 Statistische Tests im allgemeinen
z.B. Hilft Vitamin C gegen Erkältungen?
Ist der neue Ferrari schneller als der alte?
Sind finnische Schüler besser als deutsche?
• Was ist ein statisticher Test?
• Warum werden statistische Tests durchgeführt?
• Wann werden statistische Tests durchgeführt?
• Wie werden statistische Tests durchgeführt?
• Wer führt statistische Tests durch?
• Welche Folgen haben statistische Tests?
Terminologie für Test-Theorie
Hypothese
H0 Nullhypothese
H1 Alternativhypothese
Teststatistik (Prüfgröße)
Verteilung der Teststatistik
Testniveau α
Annahmebereich/Ablehnungsbereich
Entscheidungsregel (kritischer Wert)
Statistische Signifikanz
p-Wert
Fehler Typ I
Fehler Typ II
P (H0 verwerfen |H0 wahr)
P (H0 akzeptieren |H1 wahr)
Gütefunktion (beim Test eines Parameters)
g(θ) = P (H0 verwerfen |θ der wahre Parameter)
Operationscharakteristik eines Tests
OC = 1 − g(θ)
Statistische Testprozeduren
Theorie
Nullhypothese H0
Studie entwerfen
Definition der Grundgesamtheit
Stichprobenverfahren
Stichprobengröße
Daten holen
Daten erheben
Daten organisieren
Häufigkeitstabellen, Histogramme usw.
Resultate zusammenfassen
Teststatistik berechnen
Teststatistik mit erwarteten Werten vergleichen
Verteilung der Teststatistik
p-Wert, Signifikanz
Signifikanz der Teststatistik
Wir berechnen den p-Wert
PH0 (Teststatistik > beobachtete Wert der Statistik)
(Im allgemeinen sucht man die Wahrscheinlichkeit des Wertebereichs, worin alle Werte eine kleinere Wahrscheinlichkeit als der beobachtete Wert haben.)
Traditionelle Deutung
(nach Fisher nur als Richtlinie, aber . . . ):
p-Wert > 0.05 ⇒ H0 sollte nicht verworfen werden
p-Wert < 0.05 ⇒ H0 kann vielleicht verworfen werden
p-Wert < 0.01 ⇒ H0 kann verworfen werden
Vieles hängt von den nachfolgenden Wirkungen ab, wie
man p-Werte interpretiert.
z.B.
neues Medikament genehmigt
oder
alte Behandlung verboten
5.2 Binomial Test (eine Stichprobe)
Nullhypothese
p = p0
Teststatistik
Anzahl Erfolge R aus n
Verteilung unter H0 P (R = r) = nr pr0(1 − p0)n−r
Annahmebereich
[a, b] um np0
Ablehnungsbereich
[0, a − 1] ∪ [b + 1, n]
Typ I Fehler (Test-Niveau)
P (R 6∈ [a, b]|H0)
Das Test-Niveau wird für einen diskreten Test selten genau
α sein. Eine Möglichkeit ist ein randomisierter Test: falls
R = a oder R = b, akzeptiert man H0 mit Wahrscheinlichkeiten, die so gewählt sind, dass das Test-Niveau = α.
Das wird mathematisch genau sein, ist aber in der Praxis
unzufriedenstellend.
Alternativhypothese
p = p1
Typ II Fehler
P (R ∈ [a, b]|H1)
Gütefunktion
g(p1) = P (R 6∈ [a, b]|p = p1)
Binomial Test Beispiel
Außersinnliche Wahrnehmung
Farbe einer Karte erraten
(cf. u.a. Jung und Pauli)
Nullhypothese
Teststatistik
p = 0.5
Anzahl Erfolge R aus 6
Verteilung unter H0 P (R = r) = 6r 0.5r (1 − 0.5)6−r
Annahmebereich
[1, 5]
Ablehnungsbereich
[0] ∪ [6]
Typ I Fehler (Test-Niveau)
P (R 6∈ [1, 5]|H0) = 0.03125
p-Wert von R = 5
Alternativhypothese
Typ II Fehler
Gütefunktion
P (R 6∈ [2, 4]|H0) = 0.2188
p = p1 = 0.8
P (R ∈ [1, 5]|H1) = 0.74
g(p1) = P (R 6∈ [1, 5]|p = p1)
Binomial Test (zwei Stichproben)
Nullhypothese
Teststatistik
p1 = p 2
X/n1 − Y /n2
Verteilung unter H0
E[T ] = 0, V [T ] = p(1 − p)(1/n1 + 1/n2)
Annahmebereich
?
Ablehnungsbereich
?
Typ I Fehler (Test-Niveau)
Alternativhypothese
Typ II Fehler
Gütefunktion
?
p1 6= p2
?
?
Oder wir nehmen an, dass n1, n2 groß genung sind, dass
die Normalapproximation gilt. Dann haben wir:
X/n1 ∼ N (p, p(1−p)/n1) und Y /n2 ∼ N (p, p(1−p)/n2)
⇒ T = X/n1 − Y /n2 ∼ N (0, p(1 − p)(1/n1 + 1/n2))

Download Report