Statistik I — bis jetzt K 1 Einführung K 2 Beschreibende Statistik K 3 Graphiken K 4 Schätzen und jetzt K 5 Testen 5.1 Tests im allgemeinen 5.2 Binomial Tests K5 Statistische Tests Beispiel: Exemestane und Brustkrebs Tamoxifen über 5 Jahre ist für gewisse Frauen mit Brustkrebs eine Standardbehandlung. Wissenschaftler haben eine neue Behandlung vorgeschlagen: 2 bis 3 Jahre Tamoxifen und danach Exemestane. In einer Doppelblindstudie von Coombes et al sind folgende Resultate berichtet worden (NEJM 350(11) 108192). 4742 Patientinnen insgesamt 2362 bekamen nach 2 bis 3 Jahren Exemestane 2380 bekamen noch Tamoxifen Tote 93 in der Exemestane Gruppe 106 in der Tamoxifen Gruppe Ereignisse 183 in der Exemestane Gruppe 266 in der Tamoxifen Gruppe % % % % Zeigen diese Resultate, dass die Behandlung mit Exemestane besser ist? 5.1 Statistische Tests im allgemeinen z.B. Hilft Vitamin C gegen Erkältungen? Ist der neue Ferrari schneller als der alte? Sind finnische Schüler besser als deutsche? • Was ist ein statisticher Test? • Warum werden statistische Tests durchgeführt? • Wann werden statistische Tests durchgeführt? • Wie werden statistische Tests durchgeführt? • Wer führt statistische Tests durch? • Welche Folgen haben statistische Tests? Terminologie für Test-Theorie Hypothese H0 Nullhypothese H1 Alternativhypothese Teststatistik (Prüfgröße) Verteilung der Teststatistik Testniveau α Annahmebereich/Ablehnungsbereich Entscheidungsregel (kritischer Wert) Statistische Signifikanz p-Wert Fehler Typ I Fehler Typ II P (H0 verwerfen |H0 wahr) P (H0 akzeptieren |H1 wahr) Gütefunktion (beim Test eines Parameters) g(θ) = P (H0 verwerfen |θ der wahre Parameter) Operationscharakteristik eines Tests OC = 1 − g(θ) Statistische Testprozeduren Theorie Nullhypothese H0 Studie entwerfen Definition der Grundgesamtheit Stichprobenverfahren Stichprobengröße Daten holen Daten erheben Daten organisieren Häufigkeitstabellen, Histogramme usw. Resultate zusammenfassen Teststatistik berechnen Teststatistik mit erwarteten Werten vergleichen Verteilung der Teststatistik p-Wert, Signifikanz Signifikanz der Teststatistik Wir berechnen den p-Wert PH0 (Teststatistik > beobachtete Wert der Statistik) (Im allgemeinen sucht man die Wahrscheinlichkeit des Wertebereichs, worin alle Werte eine kleinere Wahrscheinlichkeit als der beobachtete Wert haben.) Traditionelle Deutung (nach Fisher nur als Richtlinie, aber . . . ): p-Wert > 0.05 ⇒ H0 sollte nicht verworfen werden p-Wert < 0.05 ⇒ H0 kann vielleicht verworfen werden p-Wert < 0.01 ⇒ H0 kann verworfen werden Vieles hängt von den nachfolgenden Wirkungen ab, wie man p-Werte interpretiert. z.B. neues Medikament genehmigt oder alte Behandlung verboten 5.2 Binomial Test (eine Stichprobe) Nullhypothese p = p0 Teststatistik Anzahl Erfolge R aus n Verteilung unter H0 P (R = r) = nr pr0(1 − p0)n−r Annahmebereich [a, b] um np0 Ablehnungsbereich [0, a − 1] ∪ [b + 1, n] Typ I Fehler (Test-Niveau) P (R 6∈ [a, b]|H0) Das Test-Niveau wird für einen diskreten Test selten genau α sein. Eine Möglichkeit ist ein randomisierter Test: falls R = a oder R = b, akzeptiert man H0 mit Wahrscheinlichkeiten, die so gewählt sind, dass das Test-Niveau = α. Das wird mathematisch genau sein, ist aber in der Praxis unzufriedenstellend. Alternativhypothese p = p1 Typ II Fehler P (R ∈ [a, b]|H1) Gütefunktion g(p1) = P (R 6∈ [a, b]|p = p1) Binomial Test Beispiel Außersinnliche Wahrnehmung Farbe einer Karte erraten (cf. u.a. Jung und Pauli) Nullhypothese Teststatistik p = 0.5 Anzahl Erfolge R aus 6 Verteilung unter H0 P (R = r) = 6r 0.5r (1 − 0.5)6−r Annahmebereich [1, 5] Ablehnungsbereich [0] ∪ [6] Typ I Fehler (Test-Niveau) P (R 6∈ [1, 5]|H0) = 0.03125 p-Wert von R = 5 Alternativhypothese Typ II Fehler Gütefunktion P (R 6∈ [2, 4]|H0) = 0.2188 p = p1 = 0.8 P (R ∈ [1, 5]|H1) = 0.74 g(p1) = P (R 6∈ [1, 5]|p = p1) Binomial Test (zwei Stichproben) Nullhypothese Teststatistik p1 = p 2 X/n1 − Y /n2 Verteilung unter H0 E[T ] = 0, V [T ] = p(1 − p)(1/n1 + 1/n2) Annahmebereich ? Ablehnungsbereich ? Typ I Fehler (Test-Niveau) Alternativhypothese Typ II Fehler Gütefunktion ? p1 6= p2 ? ? Oder wir nehmen an, dass n1, n2 groß genung sind, dass die Normalapproximation gilt. Dann haben wir: X/n1 ∼ N (p, p(1−p)/n1) und Y /n2 ∼ N (p, p(1−p)/n2) ⇒ T = X/n1 − Y /n2 ∼ N (0, p(1 − p)(1/n1 + 1/n2))
© Copyright 2024 ExpyDoc