Lösung

Übung zur Vorlesung Statistik I für
Biowissenschaften
WS 2015-2016
Übungsblatt 3
2. November 2015
Aufgabe 6 (4 Punkte):
A
Beim Lotto “6 aus 49“ werden zufällig sechs Kugeln aus 49 ohne Zurücklegen gezogen.
Geben Sie die Berechnungsformel für die Wahrscheinlichkeiten von k =
0, 1, . . . , 6 Richtigen an. Berechnen Sie mit R explizit diese sieben Wahrscheinlichkeiten.
B
Bei einer anderen Lotterie werden auch 6 aus 49 Kugeln ohne Zurücklegen
gezogen. Es soll nun die Reihenfolge der Ziehung eine Rolle spielen. Eine
Kugel gilt nur dann als Richtige, wenn neben ihrer Zahl auch noch ihre
Position in der Ziehung erraten wurde.
Berechnen Sie die Wahrscheinlichkeiten für k = 6 Richtige nach dieser
verschärften Regel.
Lösung:
A
Da der Wahrscheinlichkeitsraum, der die Lotterie “6 aus 49“ beschreibt,
ein Laplaceraum ist, müssen nur die Anzahl der Elemente des Ereignisses
“genau k Richtige“ (die günstigen Fälle) bestimmt werden.
Diese Anzahl
49
geteilt durch alle Möglichkeiten (laut Vorlesung 6 ) ergibt die gesuchte
Wahrscheinlichkeit.
Um die günstigen Fälle zu ermitteln, überlegt man sich, auf wie viele
Möglichkeiten man k Kugeln aus den sechs Richtigen und auf wie viele
Möglichkeiten man 6 − k Kugeln aus den 43 “Nieten“ ziehen kann. Die
Lösung beider
Vorlesung
bekannt: Man
Teilprobleme ist schon aus der 43
kann auf k6 Weisen k aus 6 Kugeln und auf 6−k
Weisen 6 − k Kugeln
aus 43 Kugeln ziehen. Da jede Möglichkeit k aus 6 Kugeln mit jeder
Möglichkeit 6 − k aus 43 Kugeln zu ziehen kombiniert werden kann, gibt
es insgesamt
6
43
k
6−k
günstige Fälle. Die Wahrscheinlichkeit für genau k Richtige ist daher
43 6
k
6−k
49
6
Explizite Werte erhält man mit
> for(k in 0:6) print(choose(6,k)*choose(43,6-k)/choose(49,6))
[1]
[1]
[1]
[1]
[1]
[1]
[1]
B
0.435965
0.4130195
0.132378
0.0176504
0.0009686197
1.84499e-05
7.151124e-08
Da die Reihenfolge der Ziehung nun eine Rolle spielt, gibt es insgesamt
> 49*48*47*46*45*44
[1] 10068347520
Möglichkeiten. Bei k = 6 Richtigen, müssen nun alle sechs Positionen
mit den richtigen Kugeln an den Richtigen Stellen besetzt werden. Hierfür
gibt es genau eine Möglichkeit. Die Wahrscheinlichkeit für einen “Sechser“
nach der verschärften Regel ist daher
> 1/(49*48*47*46*45*44)
[1] 9.932116e-11
Aufgabe 7 (4 Punkte): Berechnen Sie die Wahrscheinlichkeit für
A
einen Sechser (sechs gleiche)
B
eine Straße (sechs verschiedene, Reihenfolge spielt keine Rolle)
C
einen Zwilling aus Einsen (genau zwei der sechs Würfe sind eine Eins,
alle anderen sind nicht Eins und verschieden),
wenn ein fairer Würfel sechs mal geworfen wird. Man nehme an, dass die sechs
Würfe unabhängig voneinander erfolgen.
Lösung:
A
Für das Erreichen eines Sechsers, sind für den ersten Wurf alle sechs
Möglichkeiten erlaubt. Die fünf folgenden liegen aber nach dem ersten
Wurf fest. Es gibt also genau fünf Möglichkeiten, einen Sechser zu würfeln. Da es insgesamt 66 mögliche gleichwahrscheinliche Ausgänge gibt,
beträgt die Wahrscheinlichkeit 6/66 .
> 1/6^5
[1] 0.0001286008
B
Bei einer Straße hat man für den ersten Wurf 6 Möglichkeiten, für den
zweiten 5 usw. Insgesamt stehen also 6! günstigen Fällen 66 Fälle insgesamt gegenüber.
> factorial(6)/6^6
C
[1] 0.0154321
Es gibt 62 = 15 Möglichkeiten, die zwei Einsen auf die sechs Positionen zu verteilen. Auf die verbleibenden vier Positionen müssen nun vier
verschiedene Zahlen aus 2 bis 6 verteilt werden. Insgesamt gibt es also
15 ∗ 5 ∗ 4 ∗ 3 ∗ 2 = 1800
Möglichkeiten. Da es insgesamt 66 Möglichkeiten gibt, ist die gesuchte
Wahrscheinlichkeit
> 1800/6^6
[1] 0.03858025
Aufgabe 8 (6 Punkte): Einige schwere Erbkrankheiten werden dominantrezessiv vererbt. Krank sind nur Individuen vom Genotyp (a, a), wohingegen
die beiden anderen Genotypen gesund bleiben. Nehmen Sie an, die Prävalenz
des a-Allels (=relative Häufigkeit des a-Allels) in der F0 sei pa = 0.1.
A
Mit welchen Wahrscheinlichkeiten treten die drei Genotypen in der Generation F1 auf? Für die F1 und alle folgenden Generationen gelte die
Hardy-Weinberg Bedingung.
B
Nehmen Sie nun und in den folgenden Teilaufgaben an, dass die durch
das Allel a bedingte Erbkrankheit so schwer ist, dass die Individuen vom
Genotyp (a, a) sterben, bevor sie ihre Gene an die nächste Generation
weitergeben können.
Berechnen Sie die Prävalenz (=relative Häufigkeit) pa1 des a-Allels in der
Generation F1 nachdem alle Individuen vom Genotyp (a, a) verstorben
sind.
C
Berechnen Sie die Prävalenzen pak des a Allels, unter den gleichen Annahmen wie in B, für die Generationen Fk, k = 1, 2, . . . , 100. Für welches
n wird das erste Mal pan < 0.01 erreicht?
Hinweis: Schreiben Sie ein R Programm mit einer while Schleife.
D
Erstellen Sie einen Plot der Prävalenzen pak , k = 0, 1, . . . , n.
Lösung:
A
Hier muss man einfach pa = 0.1 in die Formeln aus der Vorlesung einsetzen:
P((a, a)) = p2a = 0.01
P((A, a)) = 2 ∗ pa (1 − pa ) = 0.18
P((A, A)) = (1 − pa )2 = 0.81
B
Man nehme an, dass es N Individuen in der F1 gibt. N 2pa (1 − pa ) sind
vom Genotyp (A, a), N (1 − pa )2 vom Genotyp (A, A) und N p2a vom
Genotyp (a, a). Letztere sind aber so krank, dass sie gleich versterben
und deshalb keinen Beitrag zum Gene Pool mehr leisten.
Insgesamt befinden sich 2(N 2pa (1 − pa ) + N (1 − pa )2 ) Allele in der F1,
von denen N 2pa (1 − pa ) von Typ a sind. Damit ergibt sich für pa1 :
pa1 =
C
>
>
>
>
+
+
+
+
>
>
pa
N 2pa (1 − pa )
=
2(N 2pa (1 − pa ) + N (1 − pa )2 )
1 + pa
p_a <- 0.1
Pa <- numeric()
p_n <- p_a
for(k in 1:100){
Pa <- c(Pa, p_n)
p_n
p_n <- p_n/(1+p_n)
}
# Erste Generation mit pk<0.01:
min(which(Pa<0.01))-1
[1] 91
>
>
plot(x=0:(length(Pa)-1),y=Pa)
abline(h=0.01)
0.10
D
●
●
0.08
●
●
●
0.06
●
●
●
●
●
●
●
●
●
●
●
●
●
●●
●●
●●
●●
●●
●●
●●●
●●●
●●●
●●●●
●●●●
●●●●●
●●●●●●
●●●●●●●
●●●●●●●●
●●●●●●●●●●
●●●●●●●●●●●●●
●●●
0.02
0.04
Pa
●
0
20
40
60
80
100
0:(length(Pa) − 1)
Schicken Sie Ihre Lösung bis spätestens Sonntag, den 8.11.2015 direkt an
Ihre(n) Tutor(in):
[email protected] (Ivo Soares Parchao)
[email protected] (Ben Hillmer)

Download Report