Lösung

Übung zur Vorlesung Statistik I für
Biowissenschaften
WS 2015-2016
Übungsblatt 3
2. November 2015
Aufgabe 6 (4 Punkte):
A
Beim Lotto “6 aus 49“ werden zufällig sechs Kugeln aus 49 ohne Zurücklegen gezogen.
Geben Sie die Berechnungsformel für die Wahrscheinlichkeiten von k =
0, 1, . . . , 6 Richtigen an. Berechnen Sie mit R explizit diese sieben Wahrscheinlichkeiten.
B
Bei einer anderen Lotterie werden auch 6 aus 49 Kugeln ohne Zurücklegen
gezogen. Es soll nun die Reihenfolge der Ziehung eine Rolle spielen. Eine
Kugel gilt nur dann als Richtige, wenn neben ihrer Zahl auch noch ihre
Position in der Ziehung erraten wurde.
Berechnen Sie die Wahrscheinlichkeiten für k = 6 Richtige nach dieser
verschärften Regel.
Lösung:
A
Da der Wahrscheinlichkeitsraum, der die Lotterie “6 aus 49“ beschreibt,
ein Laplaceraum ist, müssen nur die Anzahl der Elemente des Ereignisses
“genau k Richtige“ (die günstigen Fälle) bestimmt werden.
Diese Anzahl
49
geteilt durch alle Möglichkeiten (laut Vorlesung 6 ) ergibt die gesuchte
Wahrscheinlichkeit.
Um die günstigen Fälle zu ermitteln, überlegt man sich, auf wie viele
Möglichkeiten man k Kugeln aus den sechs Richtigen und auf wie viele
Möglichkeiten man 6 − k Kugeln aus den 43 “Nieten“ ziehen kann. Die
Lösung beider
Vorlesung
bekannt: Man
Teilprobleme ist schon aus der 43
kann auf k6 Weisen k aus 6 Kugeln und auf 6−k
Weisen 6 − k Kugeln
aus 43 Kugeln ziehen. Da jede Möglichkeit k aus 6 Kugeln mit jeder
Möglichkeit 6 − k aus 43 Kugeln zu ziehen kombiniert werden kann, gibt
es insgesamt
6
43
k
6−k
günstige Fälle. Die Wahrscheinlichkeit für genau k Richtige ist daher
43 6
k
6−k
49
6
Explizite Werte erhält man mit
> for(k in 0:6) print(choose(6,k)*choose(43,6-k)/choose(49,6))
[1]
[1]
[1]
[1]
[1]
[1]
[1]
B
0.435965
0.4130195
0.132378
0.0176504
0.0009686197
1.84499e-05
7.151124e-08
Da die Reihenfolge der Ziehung nun eine Rolle spielt, gibt es insgesamt
> 49*48*47*46*45*44
[1] 10068347520
Möglichkeiten. Bei k = 6 Richtigen, müssen nun alle sechs Positionen
mit den richtigen Kugeln an den Richtigen Stellen besetzt werden. Hierfür
gibt es genau eine Möglichkeit. Die Wahrscheinlichkeit für einen “Sechser“
nach der verschärften Regel ist daher
> 1/(49*48*47*46*45*44)
[1] 9.932116e-11
Aufgabe 7 (4 Punkte): Berechnen Sie die Wahrscheinlichkeit für
A
einen Sechser (sechs gleiche)
B
eine Straße (sechs verschiedene, Reihenfolge spielt keine Rolle)
C
einen Zwilling aus Einsen (genau zwei der sechs Würfe sind eine Eins,
alle anderen sind nicht Eins und verschieden),
wenn ein fairer Würfel sechs mal geworfen wird. Man nehme an, dass die sechs
Würfe unabhängig voneinander erfolgen.
Lösung:
A
Für das Erreichen eines Sechsers, sind für den ersten Wurf alle sechs
Möglichkeiten erlaubt. Die fünf folgenden liegen aber nach dem ersten
Wurf fest. Es gibt also genau fünf Möglichkeiten, einen Sechser zu würfeln. Da es insgesamt 66 mögliche gleichwahrscheinliche Ausgänge gibt,
beträgt die Wahrscheinlichkeit 6/66 .
> 1/6^5
[1] 0.0001286008
B
Bei einer Straße hat man für den ersten Wurf 6 Möglichkeiten, für den
zweiten 5 usw. Insgesamt stehen also 6! günstigen Fällen 66 Fälle insgesamt gegenüber.
> factorial(6)/6^6
C
[1] 0.0154321
Es gibt 62 = 15 Möglichkeiten, die zwei Einsen auf die sechs Positionen zu verteilen. Auf die verbleibenden vier Positionen müssen nun vier
verschiedene Zahlen aus 2 bis 6 verteilt werden. Insgesamt gibt es also
15 ∗ 5 ∗ 4 ∗ 3 ∗ 2 = 1800
Möglichkeiten. Da es insgesamt 66 Möglichkeiten gibt, ist die gesuchte
Wahrscheinlichkeit
> 1800/6^6
[1] 0.03858025
Aufgabe 8 (6 Punkte): Einige schwere Erbkrankheiten werden dominantrezessiv vererbt. Krank sind nur Individuen vom Genotyp (a, a), wohingegen
die beiden anderen Genotypen gesund bleiben. Nehmen Sie an, die Prävalenz
des a-Allels (=relative Häufigkeit des a-Allels) in der F0 sei pa = 0.1.
A
Mit welchen Wahrscheinlichkeiten treten die drei Genotypen in der Generation F1 auf? Für die F1 und alle folgenden Generationen gelte die
Hardy-Weinberg Bedingung.
B
Nehmen Sie nun und in den folgenden Teilaufgaben an, dass die durch
das Allel a bedingte Erbkrankheit so schwer ist, dass die Individuen vom
Genotyp (a, a) sterben, bevor sie ihre Gene an die nächste Generation
weitergeben können.
Berechnen Sie die Prävalenz (=relative Häufigkeit) pa1 des a-Allels in der
Generation F1 nachdem alle Individuen vom Genotyp (a, a) verstorben
sind.
C
Berechnen Sie die Prävalenzen pak des a Allels, unter den gleichen Annahmen wie in B, für die Generationen Fk, k = 1, 2, . . . , 100. Für welches
n wird das erste Mal pan < 0.01 erreicht?
Hinweis: Schreiben Sie ein R Programm mit einer while Schleife.
D
Erstellen Sie einen Plot der Prävalenzen pak , k = 0, 1, . . . , n.
Lösung:
A
Hier muss man einfach pa = 0.1 in die Formeln aus der Vorlesung einsetzen:
P((a, a)) = p2a = 0.01
P((A, a)) = 2 ∗ pa (1 − pa ) = 0.18
P((A, A)) = (1 − pa )2 = 0.81
B
Man nehme an, dass es N Individuen in der F1 gibt. N 2pa (1 − pa ) sind
vom Genotyp (A, a), N (1 − pa )2 vom Genotyp (A, A) und N p2a vom
Genotyp (a, a). Letztere sind aber so krank, dass sie gleich versterben
und deshalb keinen Beitrag zum Gene Pool mehr leisten.
Insgesamt befinden sich 2(N 2pa (1 − pa ) + N (1 − pa )2 ) Allele in der F1,
von denen N 2pa (1 − pa ) von Typ a sind. Damit ergibt sich für pa1 :
pa1 =
C
>
>
>
>
+
+
+
+
>
>
pa
N 2pa (1 − pa )
=
2(N 2pa (1 − pa ) + N (1 − pa )2 )
1 + pa
p_a <- 0.1
Pa <- numeric()
p_n <- p_a
for(k in 1:100){
Pa <- c(Pa, p_n)
p_n
p_n <- p_n/(1+p_n)
}
# Erste Generation mit pk<0.01:
min(which(Pa<0.01))-1
[1] 91
>
>
plot(x=0:(length(Pa)-1),y=Pa)
abline(h=0.01)
0.10
D
●
●
0.08
●
●
●
0.06
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●●
●●
●●
●●
●●●
●●●
●●●
●●●●
●●●●
●●●●●
●●●●●●
●●●●●●●
●●●●●●●●
●●●●●●●●●●
●●●●●●●●●●●●●
●●●
0.02
0.04
Pa
●
0
20
40
60
80
100
0:(length(Pa) − 1)
Schicken Sie Ihre Lösung bis spätestens Sonntag, den 8.11.2015 direkt an
Ihre(n) Tutor(in):
[email protected] (Ivo Soares Parchao)
[email protected] (Ben Hillmer)