Übungsblatt 5

Prof. Dr. M. Birkner
M. Sc. Sebastian Steiber
Übungsblatt 5
Biostatistik“
”
im Wintersemester 2015/2016
Aufgabe 1:
Der Vertreter eines Saatgutherstellers preist das neueste Produkt der Hirsezucht seines Konzerns: Die neue Zuchtlinie Wüstenfuchs“ benötigt erheblich weniger Wasser als die herkömm”
liche Sorte Hirse 0815“. Seine Behauptung untermauert er mit folgendem Stripchart:
”
(a) Welche Transpirationsrate erwarten Sie ungefähr, wenn Sie die Sorte Wüstenfuchs“
”
anbauen? Welche Transpiration erwarten Sie für Hirse 0815“?
”
(b) Schätzen Sie die Standardabweichung beider Datensätze.
(c) Bestimmen Sie für beide Datensätze ungefähr den Standardfehler der mittleren Transpirationsrate.
(d) Ihre eigene Hirsezucht weist eine durchschnittliche Transpiration von 0.16 ml/(d · cm2 )
auf. Würden Sie auf den ersten Blick vermuten, dass die Linie Wüstenfuchs“ eine
”
signifikant niedrigere Transpirationsrate besitzt?
Aufgabe 2:
In einem Experiment wurden zwei Gruppen mit je 10 Ferkeln nach dem Absetzen von der
Mutter mit zwei verschiedenen Futtersorten A und B aufgezogen. Nach 10 Wochen wurden die
Schweine gewogen. In der Gruppe mit Futtermittel A starb ein Schwein durch einen Unfall,
ein Zusammenhang mit dem Futtermittel wird ausgeschlossen. Die Ergebnisse waren (in kg):
Sorte A
32,9
28,6
29,5
28,2
25,3
24,4
26,5
30,1
26,5
Sorte B
26,2
30,4
27,1
28,5
27,7
26,9
29,3
29,5
26,8
28,6
(i) Schätzen Sie für die Futtersorten A und B jeweils das mittlere Gewicht nach 10 Wochen
und bestimmen Sie den Standardfehler Ihres Schätzers.
(ii) Angenommen, Sie sollten ein Experiment entwerfen, in dem das mittlere Gewicht nach
10 Wochen mit Futtersorte A auf ungefähr 200g genau bestimmt werden kann. Wie
viele Schweine müssten Sie dafür in etwa wiegen? Wie viele bräuchte man vermutlich
um das selbe Problem für Sorte B zu lösen?
Aufgabe 3:
Wir nehmen an, eine Population hat Mittelwert µ und Standardabweichung σ. Aus dieser
Population ziehen wir eine Zufallsstichprobe vom Umfang n und beobachten Stichprobenmittelwert x̄ sowie korrigierte Stichprobenvarianz s2 . Welche der folgenden Aussagen sind
wahr?
(i) Der Standardfehler
√s
n
wird nicht von der Varianz σ des Merkmals in der Population
√s
n
wird nicht von dem Erwartungswert µ des Merkmals in der
beeinflusst.
(ii) Der Standardfehler
Population beeinflusst.
(iii) Der Standardfehler
√s
n
ist ein Maß für die Genauigkeit, mit der wir den wahren Mittel-
√s
n
ist ein Schätzwert für die Standardabweichung σ in der Popula-
√s
n
wird kleiner, wenn die Stichprobengröße n größer wird.
wert µ schätzen.
(iv) Der Standardfehler
tion.
(v) Der Standardfehler
(vi) Schwankungen in x̄ von der Größe
√s
n
kommen selten vor.
(vii) Schwankungen in der Stichprobenvarianz s2 von der Größe
(viii) Der Standardfehler
√s
n
√s
n
kommen häufig vor.
ist proportional zur Standardabweichung s.
(ix) Für eine Halbierung des Standardfehlers
√s
n
ist eine Vervierfachung des Stichproben-
umfangs n nötig.
(x) Der Standardfehler ist ein Schätzwert für die Standardabweichung des Stichprobenmittelwerts.
Aufgabe 4:
(Keine ILIAS-Abgabe)
Die folgende Aufgabe“ soll Ihnen einen Einblick verschaffen, wie Sie das Programm R in
”
Ihrem Studium verwenden können um Daten auszuwerten. Im Lauf der Vorlesung werden Sie
statistische Verfahren kennenlernen, die sich in R relativ einfach umsetzen lassen. Doch auch
hinsichtlich der Visualisierung von Daten ist R eine echte Alternative z.B. zu Tabellenkalkulationsprogrammen.
Wir nehmen an, Sie und einige Ihrer Freunde befinden sich auf Wohnungssuche. Bevor Sie
einzelne Objekte besichtigen, nimmt sich jeder von Ihnen einen Abend Zeit und durchforstet
eine Immobilienbörse.
Jeder erstellt eine Tabelle der Mietobjekte mit den Einträgen
• Anzahl der Zimmer
• Kaltmiete pro m2
Die Tabellen fügen Sie per copy+paste“ zusammen. Eine (fiktive) Beispieldatei finden Sie
”
auf der Homepage zum Übungsbetrieb. Bevor Sie die Datei herunterladen: Mit dem Befehl
getwd() gibt Ihnen R sein aktuelles Arbeitsverzeichnis aus. Sie können auf Dateien im Arbeitsverzeichnis zugreifen, ohne einen kompletten Pfad anzugeben. Mit
setwd("Pfad/zum/neuen/Arbeitsverzeichnis")
ändern Sie das Arbeitsverzeichnis.
Wenn Sie die Datei in das Arbeitsverzeichnis gespeichert haben, können Sie sie mit dem Befehl
daten <- read.table("Miete.txt", header=TRUE)
einlesen. Indem Sie einem Befehl ein ?-Zeichen voranstellen, erhalten Sie ein Hilfefenster zu
dem Befehl, z.B. ?read.table.
Die Daten sind nun in einem data.frame“ mit Namen daten gespeichert. Mit der Syntax
”
daten$Zimmer greifen Sie z.B. auf die Spalte Zimmer“ zu.
”
a) Mit dem Befehl
hist(daten$Miete)
erstellen Sie ein Histogramm der Kaltmieten pro m2 . Probieren Sie folgende HistogrammBefehle aus und versuchen Sie anhand der Hilfe, dem Internet oder durch rumprobie”
ren“ herauszufinden, was die Parameter bedeuten:
hist(daten$Miete, main="Titel", xlab="Kaltmiete pro m^2")
hist(daten$Miete, breaks=20)
b) Mit dem Befehl
boxplot(daten$Miete)
zeichnen Sie einen Boxplot. Folgende Befehle verfeinern Ihre Zeichnung:
boxplot(daten$Miete, notch=TRUE)
boxplot(daten$Miete, col="grey", border="blue")
Finden Sie heraus, welche Parameter aus dem hist- und dem boxplot-Befehl im jeweils
anderen Befehl verwendet werden können.
c) Was bewirkt der folgende Befehl (die Zeilenumbrüche sind nicht zu übernehmen)?
boxplot(Miete~Zimmer, daten,
main="Kaltmiete fuer Wohnungen unterschiedlicher Groesse",
xlab="Anzahl der Zimmer",
ylab="Kaltmiete pro qm in EUR",
col = c("red3", "yellow3", "blue3"),
lwd = 2)