Übungsblatt 8

Prof. Dr. M. Birkner
M. Sc. Sebastian Steiber
Übungsblatt 8
Biostatistik“
”
im Wintersemester 2015/2016
Aufgabe 1:
Sie untersuchen einen Membrantransporter für die Aminosäure Arginin. Sie haben den Verdacht, dass ein Transportmechanismus am Werk ist, bei dem ein bestimmter Cysteinrest des
Transporters eine wichtige Funktion erfüllt. Um Ihre Vermutung zu überprüfen, ersetzen Sie
das entsprechende Cystein durch Alanin und überprüfen, ob dadurch die Transportaktivität
abnimmt. Aus zahlreichen Versuchen wissen Sie, dass die Transportaktivität des Wildtyps
(des ursprünglichen Transporters) im Mittel 2 nmol/h beträgt. Folgende Transportaktivitäten
messen Sie beim modifizierten Transporter (in nmol/h):
2,11
1,87
1,76
2,00
1,81
1,87
1,90
Führen Sie einen t-Test zum Signifikanzniveau α = 5% durch. Gehen Sie dazu wie folgt vor:
(a) Entscheiden Sie sich für einen einseitigen oder zweiseitigen Test.
(b) Formulieren Sie die Nullhypothese und die Alternative.
(c) Berechnen Sie die Teststatistik.
(d) Können Sie die Nullhypothese zum Niveau α = 5% verwerfen?
Aufgabe 2:
Als begeisterter Salatzüchter und großer Kulturfreund möchten Sie der Frage nachgehen, ob
der Ertrag Ihrer Pflanzen durch klassische Musik beeinflusst wird. Dazu installieren Sie in
einem Ihrer Gewächshäuser eine Stereoanlage und spielen den Salatköpfen Mozarts Klavierkonzert Nr. 23 in A-Dur vor. Die Pflanzen in Ihrem zweiten Gewächshaus wachsen in aller
Stille. Bei der Ernte notieren Sie das Gewicht jedes Salats in beiden Gewächshäusern.
a) Welchen Test führen Sie durch? Wie lautet die Nullhypothese?
Sie erzählen einem befreundeten Landwirt von Ihrem Versuch. Ihr Freund ist begeistert von
der Idee und startet eine eigene Testreihe. Er misst die Milchleistung jeder seiner 21 Kühe.
Danach beschallt er die Tiere eine Woche lang mit Bob Dylans Like a Rolling Stone“ und
”
misst die Milchleistung jeder Kuh erneut.
b) Welchen Test sollte Ihr Freund durchführen und wie lautet die Nullhypothese?
Ein Schäfer hört die ungewöhnlichen Laute aus dem Kuhstall und erkundigt sich nach der
Ursache. Auch er ist sofort Feuer und Flamme. Während dieser Saison trägt er seiner Herde
ausgewählte Stücke aus seinem Repertoire auf der Blockflöte vor. Er besitzt jahrelange Erfahrung in seinem Beruf und kennt den Wollertrag eines Durchschnittsschafs. Er notiert für
jedes seiner Schafe die Wollmenge, die es in dieser Saison hergibt.
c) Welchen Test führt der Schäfer durch und wie lautet die Nullhypothese?
Aufgabe 3:
Eine Herstellerfirma für Schuhsohlen hat ein neues, günstiges Sohlenmaterial (B) entwickelt.
Die Firma behauptet nun, dass die Qualität der Sohlen bezüglich Abnutzung trotz des geringeren Herstellungspreises genauso hoch ist, wie die der Sohlen, die aus dem bisherigen,
teureren Material A angefertigt worden sind. Sie wollen diese Hypothese mit einem t-Test
zum Niveau α = 5% überprüfen. Dazu haben Sie 10 Testpersonen in einem Versuch jeweils
einen Schuh mit Sohlenmaterial A und einen Schuh mit Sohlenmaterial B tragen lassen und
nach einiger Zeit die Abnutzung gemessen. Es kam zu folgendem Ergebnis:
Testperson
1
2
3
4
5
6
7
8
9
10
Abnutzung A
13,2
8,2
10,9
14,3
10,7
6,6
9,5
10,8
8,8
13,3
Abnutzung B
14,0
8,8
11,2
14,2
11,8
6,4
9,8
11,3
9,3
13,6
a) Ist es sinnvoller von einer gepaarten oder von einer ungepaarten Stichprobe auszugehen?
b) Wie lauten die Nullhypothese und die Alternative in der einseitigen und in der zweiseitigen Testsituation?
c) Bestimmen Sie die t-Statistik für gepaarte und ungepaarte Stichproben (gehen Sie bei
2 , σ 2 aus). Verwenden Sie
der ungepaarten Stichprobe von Gleichheit der Varianzen σA
B
hierbei, dass die Standardabweichung bei Material A ungefähr sA = 2,45 beträgt und
bei Material B ungefähr sB = 2,52.
d) In welchen der vier Fälle (gepaart/ungepaart; einseitig/zweiseitig) wird die Nullhypothese verworfen?
Aufgabe 4:
(Keine ILIAS-Abgabe)
Diese Aufgabe greift verschiedene Themen aus der Vorlesung auf. Sie dient nicht nur dem
besseren Umgang mit R, sondern kann Ihnen auch helfen einige Themen der Vorlesung besser
zu verstehen. Führen Sie zunächst den Befehl set.seed(123) aus. Sie setzen damit den“seed”
für den in R implementierten Zufallsgenerator auf 123. Wenn Sie danach den Befehl
y<-rnorm(100,mean=20,sd=sqrt(10))
ausführen, erhalten Sie immer die gleiche Stichprobe der Länge 100 aus einer Normalverteilung
mit Erwartungswert 20 und Varianz 10.
(a) Berechnen Sie nun mit mean(y) den Stichprobenmittelwert. Warum ist mean(y) 6= 20,
obwohl wir in rnorm() den Parameter mean auf 20 gesetzt haben? Ist die Abweichung
abs(mean(y)-20) im Vergleich zum Standardfehler sd(y)/10 ungewöhnlich groß?
(b) Führen Sie die folgenden Befehle aus:
z<-(y-20)/sqrt(10)
hist(z,freq=FALSE,breaks=5,ylim=c(0,0.4))
curve(dnorm(x),from=-3,to=3,add=TRUE)
Welcher Zusammenhang besteht zwischen dem Histogramm und der eingezeichneten
Kurve?
(c) Führen Sie die folgenden Befehle aus:
set.seed(124)
b<-rbinom(100,size=40,p=1/2)
(sum(b<30)-sum(b<20))/100
(sum(y<30)-sum(y<20))/100
(pnorm((30-20)/sqrt(10))-pnorm((20-20)/sqrt(10)))
Wie interpretieren Sie die letzten drei Zeilen? Warum sind die Werte ungefähr gleich?
(d) Einer Ihrer Kommilitonen behauptet Ihnen gegenüber den folgenden Befehl ausgeführt
zu haben:
round(rnorm(10,mean=12,sd=3),2)
[1] 10.10 10.57 10.52
6.83 11.43 14.14 11.37
6.59
8.69 11.04
Sie speichern die Daten mit dem Befehl
x<-c(10.10,10.57,10.52,6.83,11.43,14.14,11.37,6.59,8.69,11.04)
unter der Variablen x ab.
Finden Sie zu den folgenden Situationen den passenden R -Befehl für einen statistischen
Test zum Signifikanzniveau α = 5%.
(i) Sie gehen davon aus, dass Ihr Kommilitone sich lediglich beim Erwartungswert
vertippt hat. Sie vermuten er hat einen kleineren Wert eingegeben.
(ii) Sie wissen nicht was er beim Parameter sd eingestellt hat. Sie vermuten allerdings
er hat bei mu einen größeren Wert eingegeben.
(iii) Sie bitten Ihren Kommilitonen um eine neue Stichprobe und erhalten von ihm die
Werte
[1]
6.08
7.26 11.31
6.49
8.85
9.12
9.66
3.70 12.51
4.48.
Sie speichern die Daten mit
y<-c(6.08,7.26,11.31,6.49,8.85,9.12,9.66,3.70,12.51,4.48)
ab und gehen davon aus, dass er an der Varianz nichts verändert hat. Sie vermuten
allerdings, dass er beim Erwartungswert einen anderen Wert als bei der ersten
Stichprobe eingegeben hat.
(iv) Sie gehen nicht mehr davon aus, dass die Varianz bei den Daten x und y gleich ist.
Sie vermuten, dass er beim Erwartungswert einen kleineren Wert als bei der ersten
Stichprobe eingegeben hat.
Auswahl R-Befehle bei d):
t.test(x,y, alternative = "two.sided", mu=0, paired = FALSE, var.equal=TRUE,
conf.level = 0.95)
t.test(x, alternative = "greater", mu = 12, conf.level = 0.95)
t.test(x,y, alternative = "greater", mu = 0, paired = FALSE, var.equal=FALSE,
conf.level = 0.95)
z.test(x, alternative = "less", mu = 12, sigma.x = 3, conf.level = 0.95)
Wie berechnen Sie die Teststatistiken mit R, ohne die implementierten Befehle für die
Tests zu verwenden?
Hinweis: Bevor Sie den z-Test mit R durchführen können, müssen Sie zuerst das entsprechende
“package” installieren und laden. Verwenden Sie hierzu die Befehle install.packages("BSDA")
und library(BSDA). Nach dem Sie den ersten Befehl ausgeführt haben, werden Sie aufgefordert einen “CRAN mirror” auszuwählen. Sie können sich hier zum Beispiel für “Germany(Berlin)” entscheiden.