Übung zur Vorlesung Statistik I für Biowissenschaften WS 2015-2016 Übungsblatt 3 2. November 2015 Aufgabe 6 (4 Punkte): A Beim Lotto “6 aus 49“ werden zufällig sechs Kugeln aus 49 ohne Zurücklegen gezogen. Geben Sie die Berechnungsformel für die Wahrscheinlichkeiten von k = 0, 1, . . . , 6 Richtigen an. Berechnen Sie mit R explizit diese sieben Wahrscheinlichkeiten. B Bei einer anderen Lotterie werden auch 6 aus 49 Kugeln ohne Zurücklegen gezogen. Es soll nun die Reihenfolge der Ziehung eine Rolle spielen. Eine Kugel gilt nur dann als Richtige, wenn neben ihrer Zahl auch noch ihre Position in der Ziehung erraten wurde. Berechnen Sie die Wahrscheinlichkeiten für k = 6 Richtige nach dieser verschärften Regel. Lösung: A Da der Wahrscheinlichkeitsraum, der die Lotterie “6 aus 49“ beschreibt, ein Laplaceraum ist, müssen nur die Anzahl der Elemente des Ereignisses “genau k Richtige“ (die günstigen Fälle) bestimmt werden. Diese Anzahl 49 geteilt durch alle Möglichkeiten (laut Vorlesung 6 ) ergibt die gesuchte Wahrscheinlichkeit. Um die günstigen Fälle zu ermitteln, überlegt man sich, auf wie viele Möglichkeiten man k Kugeln aus den sechs Richtigen und auf wie viele Möglichkeiten man 6 − k Kugeln aus den 43 “Nieten“ ziehen kann. Die Lösung beider Vorlesung bekannt: Man Teilprobleme ist schon aus der 43 kann auf k6 Weisen k aus 6 Kugeln und auf 6−k Weisen 6 − k Kugeln aus 43 Kugeln ziehen. Da jede Möglichkeit k aus 6 Kugeln mit jeder Möglichkeit 6 − k aus 43 Kugeln zu ziehen kombiniert werden kann, gibt es insgesamt 6 43 k 6−k günstige Fälle. Die Wahrscheinlichkeit für genau k Richtige ist daher 43 6 k 6−k 49 6 Explizite Werte erhält man mit > for(k in 0:6) print(choose(6,k)*choose(43,6-k)/choose(49,6)) [1] [1] [1] [1] [1] [1] [1] B 0.435965 0.4130195 0.132378 0.0176504 0.0009686197 1.84499e-05 7.151124e-08 Da die Reihenfolge der Ziehung nun eine Rolle spielt, gibt es insgesamt > 49*48*47*46*45*44 [1] 10068347520 Möglichkeiten. Bei k = 6 Richtigen, müssen nun alle sechs Positionen mit den richtigen Kugeln an den Richtigen Stellen besetzt werden. Hierfür gibt es genau eine Möglichkeit. Die Wahrscheinlichkeit für einen “Sechser“ nach der verschärften Regel ist daher > 1/(49*48*47*46*45*44) [1] 9.932116e-11 Aufgabe 7 (4 Punkte): Berechnen Sie die Wahrscheinlichkeit für A einen Sechser (sechs gleiche) B eine Straße (sechs verschiedene, Reihenfolge spielt keine Rolle) C einen Zwilling aus Einsen (genau zwei der sechs Würfe sind eine Eins, alle anderen sind nicht Eins und verschieden), wenn ein fairer Würfel sechs mal geworfen wird. Man nehme an, dass die sechs Würfe unabhängig voneinander erfolgen. Lösung: A Für das Erreichen eines Sechsers, sind für den ersten Wurf alle sechs Möglichkeiten erlaubt. Die fünf folgenden liegen aber nach dem ersten Wurf fest. Es gibt also genau fünf Möglichkeiten, einen Sechser zu würfeln. Da es insgesamt 66 mögliche gleichwahrscheinliche Ausgänge gibt, beträgt die Wahrscheinlichkeit 6/66 . > 1/6^5 [1] 0.0001286008 B Bei einer Straße hat man für den ersten Wurf 6 Möglichkeiten, für den zweiten 5 usw. Insgesamt stehen also 6! günstigen Fällen 66 Fälle insgesamt gegenüber. > factorial(6)/6^6 C [1] 0.0154321 Es gibt 62 = 15 Möglichkeiten, die zwei Einsen auf die sechs Positionen zu verteilen. Auf die verbleibenden vier Positionen müssen nun vier verschiedene Zahlen aus 2 bis 6 verteilt werden. Insgesamt gibt es also 15 ∗ 5 ∗ 4 ∗ 3 ∗ 2 = 1800 Möglichkeiten. Da es insgesamt 66 Möglichkeiten gibt, ist die gesuchte Wahrscheinlichkeit > 1800/6^6 [1] 0.03858025 Aufgabe 8 (6 Punkte): Einige schwere Erbkrankheiten werden dominantrezessiv vererbt. Krank sind nur Individuen vom Genotyp (a, a), wohingegen die beiden anderen Genotypen gesund bleiben. Nehmen Sie an, die Prävalenz des a-Allels (=relative Häufigkeit des a-Allels) in der F0 sei pa = 0.1. A Mit welchen Wahrscheinlichkeiten treten die drei Genotypen in der Generation F1 auf? Für die F1 und alle folgenden Generationen gelte die Hardy-Weinberg Bedingung. B Nehmen Sie nun und in den folgenden Teilaufgaben an, dass die durch das Allel a bedingte Erbkrankheit so schwer ist, dass die Individuen vom Genotyp (a, a) sterben, bevor sie ihre Gene an die nächste Generation weitergeben können. Berechnen Sie die Prävalenz (=relative Häufigkeit) pa1 des a-Allels in der Generation F1 nachdem alle Individuen vom Genotyp (a, a) verstorben sind. C Berechnen Sie die Prävalenzen pak des a Allels, unter den gleichen Annahmen wie in B, für die Generationen Fk, k = 1, 2, . . . , 100. Für welches n wird das erste Mal pan < 0.01 erreicht? Hinweis: Schreiben Sie ein R Programm mit einer while Schleife. D Erstellen Sie einen Plot der Prävalenzen pak , k = 0, 1, . . . , n. Lösung: A Hier muss man einfach pa = 0.1 in die Formeln aus der Vorlesung einsetzen: P((a, a)) = p2a = 0.01 P((A, a)) = 2 ∗ pa (1 − pa ) = 0.18 P((A, A)) = (1 − pa )2 = 0.81 B Man nehme an, dass es N Individuen in der F1 gibt. N 2pa (1 − pa ) sind vom Genotyp (A, a), N (1 − pa )2 vom Genotyp (A, A) und N p2a vom Genotyp (a, a). Letztere sind aber so krank, dass sie gleich versterben und deshalb keinen Beitrag zum Gene Pool mehr leisten. Insgesamt befinden sich 2(N 2pa (1 − pa ) + N (1 − pa )2 ) Allele in der F1, von denen N 2pa (1 − pa ) von Typ a sind. Damit ergibt sich für pa1 : pa1 = C > > > > + + + + > > pa N 2pa (1 − pa ) = 2(N 2pa (1 − pa ) + N (1 − pa )2 ) 1 + pa p_a <- 0.1 Pa <- numeric() p_n <- p_a for(k in 1:100){ Pa <- c(Pa, p_n) p_n p_n <- p_n/(1+p_n) } # Erste Generation mit pk<0.01: min(which(Pa<0.01))-1 [1] 91 > > plot(x=0:(length(Pa)-1),y=Pa) abline(h=0.01) 0.10 D ● ● 0.08 ● ● ● 0.06 ● ● ● ● ● ● ● ● ● ● ● ● ● ●● ●● ●● ●● ●● ●● ●●● ●●● ●●● ●●●● ●●●● ●●●●● ●●●●●● ●●●●●●● ●●●●●●●● ●●●●●●●●●● ●●●●●●●●●●●●● ●●● 0.02 0.04 Pa ● 0 20 40 60 80 100 0:(length(Pa) − 1) Schicken Sie Ihre Lösung bis spätestens Sonntag, den 8.11.2015 direkt an Ihre(n) Tutor(in): [email protected] (Ivo Soares Parchao) [email protected] (Ben Hillmer)
© Copyright 2024 ExpyDoc