Biostatistik“

Prof. Dr. M. Birkner
M. Sc. Sebastian Steiber
Übungsblatt 4
Biostatistik“
”
im Wintersemester 2015/2016
Zur Bearbeitung von Zusatzaufgabe 4 auf diesem Übungsblatt benötigen Sie das Programm
R“. Sie können dieses Programm kostenlos herunterladen (www.r-project.org) oder finden
”
es bei den ZDV-Apps“ auf Ihrem ZDV-Account.
”
Aufgabe 1:
Die folgenden Boxplots zeigen die Länge von Kuckuckseiern, die in Nestern von drei verschiedenen Wirtsspezies gefunden wurden:
(a) Geben Sie zu obigem Boxplot für jede der drei Wirtsspezies jeweils den Median, das
erste und dritte Quartil der beobachteten Längen sowie den kleinsten und den größten
Wert an.
(b) Welcher der folgenden vier Datensätze passt zu dem abgebildeten Boxplot?
A
79
84
85
100
110
110
111
111
113
B
79
84
97
100
110
115
124
127
128
C
89
92
105
105
107
109
111
111
113
D
89
91
97
100
103
104
110
111
113
Denken Sie daran, dass Sie Daten manuell in R“ einlesen können und mit dem Befehl
”
boxplot den Boxplot zeichnen können.
Aufgabe 2:
Erwachsene Ridley’s Streifenkletternattern (Elaphe taeniura ridley) werden (den Angaben in
der Literatur entsprechend) bis zu 250 cm lang. Bei 13 erwachsenen Schlangen wurden die
folgenden Längen (in cm) beobachtet:
222
234
228
220
235
209
217
207
253
259
225
224
231
(a) Bestimmen Sie Mittelwert, Standardabweichung, Median, erstes Quartil und drittes
Quartil der Beobachtungen. Wie groß ist der Interquartilsabstand?
(b) Welcher der folgenden Boxplots passt zu dem Datensatz?
Boxplot 1
Boxplot 2
Boxplot 3
Boxplot 4
Aufgabe 3:
Ordnen Sie je eine der folgenden Aussagen den abgebildeten Histogrammen zu:
a) Der Mittelwert ist positiv, der Median negativ.“
”
b) Median und Mittelwert stimmen in etwa überein.“
”
c) Der Mittelwert ist negativ, der Median positiv.“
”
d) Der Median ist deutlich kleiner als der Mittelwert.“
”
e) Der Median ist deutlich größer als der Mittelwert.“
”
Aufgabe 4:
(Freiwillig)
Diese Aufgabe muss nicht bearbeitet werden. Sie wird trotzdem bei ILIAS angeboten. Wer sie
bearbeitet sammelt zusätzliche Punkte.
Auf der Homepage zum Übungsbetrieb finden Sie die Datei lebensalter19Jhd.txt. Es
handelt sich um einen Datensatz mit den Lebensaltern von 100 000 Männern, die in Deutschland gegen Ende des 19 Jahrhunderts verstorben sind. Lesen Sie diesen Datensatz in R“ ein,
”
indem Sie die Datei auf Ihrer Festplatte speichern und in R“ den Befehl
”
daten <- scan("Pfad/zur/Datei/lebensalter19Jhd.txt")
ausführen. Beachten Sie, dass Sie bei der Pfadangabe nicht wie in Windows üblich das \Zeichen verwenden, sondern das /-Zeichen.
a) Bestimmen Sie mithilfe der Befehle median(daten), mean(daten) und sd(daten) den
Median, den Mittelwert und die Standardabweichung der Stichprobe. Zeichnen Sie mit
dem Befehl hist(daten) ein Histogramm des Datensatzes. Inwieweit eignen sich Ihrer
Meinung nach Mittelwert und Median als Lagemaße für diesen Datensatz?
b) Der Befehl
daten2 <- daten[daten > 5]
verschafft Ihnen einen Datensatz, der nur die Individuen enthält, die älter als fünf
Jahre geworden sind. Berechnen Sie Mittelwert, Median des Datensatzes daten2. Wie
interpretieren Sie diese Werte?