Blatt 1 - Physics of Complex Biosystems

Prof. U. Gerland
Theory of Complex Biosystems
Physik Department, TUM
Statistische Mechanik und Thermodynamik (4A)
WS 2015/16, Blatt 1
12. Okt. 2015
Aufgabe 1: Binomialverteilung
Für ein Bernoulli-Experiment (ein Zufallsexperiment mit nur zwei Ausgängen, z.B. Kopf/Zahl
oder Spin up/down) sei P rob(Kopf ) = a und P rob(Zahl) = b, mit a + b = 1. Man betrachte
für eine Folge von N Wiederholungen die Zufallsvariable “Zahl der Würfe, die Kopf lieferten”.
Der Ereignisraum ist Ω = {1, 2, . . . , N } und die Wahrscheinlichkeitsverteilung auf Ω,
N n N −n
pn =
a b
,
n
hat die Parameter N und a.
Hinweis: Der Trick bei allen Berechnungen zur Binomialverteilung ist (i) zu bemerken,
dass pn der n−te Term in (a + b)N ist, und (ii) erst am Ende der Rechnung a + b = 1 zu
setzen.
(a) Der Erwartungswert sei mit E[.] bezeicnet. Zeigen Sie, dass E[n] = a∂a (a + b)N ist und
berechnen Sie den Erwartungswert. Analog verfahren Sie für E[n2 ].
(b) Zeigen Sie allgemein, dass die mittlere quadratische Abweichung (∆n)2 := E[(n −
E[n])2 )] auch als (∆n)2 = E[n2 ]−E[n]2 berechnet werden kann. Für die Binomialverteilung berechnen Sie die relative Schwankung ∆n/E[n] und finden die Wurzel-N -Regel.
(c) Berechnen Sie die Momenterzeugende Funktion und die ersten beiden Momente.
(d) Berechnen Sie die Kumulantenerzeugende Funktion und die ersten beiden Kumulanten. Man erkennt den allgemeinen Zusammenhang, dass sich die Kumulanten von unabhängigen Zufallsvariablen addieren.
(e) (Freiwillige Zusatzaufgabe) Begründen Sie, warum für große N die Binomialverteilung
in eine Normalverteilung übergeht und bestimmen sie µ und σ. Als Anwendung betrachte man ein Idealgases bei Normbedingungen in einem Volumen von 1 mm3 und
denke sich das Volumen in zwei Hälften geteilt. Als Maß für zufällige Abwechungen
von der Gleichverteilung auf beide Hälften betrachte man die relative Schwankung. Wie
wahrscheinlich sind relative Schwankungen größer als 10−6 ? Drücken Sie das Ergebnis
durch die Fehlerfunktion aus.
Aufgabe 2: Poissonverteilung
Ein Poissonprozess ist durch eine Rate λ von Ereignissen gegeben, die unkorreliert erfolgen,
z.B. Klicks in einem Geigerzähler. Die Poissonverteilung ist die Wahrscheinlichkeitsverteilung,
pro Zeiteinheit genau n Klicks zu registrieren, wobei n ∈ {0, 1, 2, . . . }.
1
(a) Herleitung als Grenzübergang der Binomialverteilung: Man denke sich das Einheitsintervall in N Intervalle der Länge ∆t = 1/N unterteilt, in jedem ist die Ereigniswahrscheinlichkeit demnach a = λ∆t. Betrachte nun N → ∞, also auch a → 0. Die Wahrscheinlichkeit für mehr als ein Ereignis in ∆t kann im Limes vernachlässigt werden. In
∆t hat man demnach ein Bernoulli-Experiment, die Wahrscheinlichkeit für n Ereignisse
in [0,1] kann also mit der Binomialverteilung aus Aufgabe 1 angenähert werden. Führen
Sie den Grenzübergang durch und finden Sie die Poissonverteilung
pλ (n) = e−λ
λn
n!
Warum hat die Poissonverteilung nur einen Parameter, die Binomialverteilung aber
zwei?
(b) Bestimmen Sie die Momenterzeugende Funktion.
(c) Bestimmen Sie die Kumulantenerzeugende Funktion und berechnen Sie alle Kumulanten. Gilt für die Poissonverteilung die Wurzel-N -Regel?
Aufgabe 3: Zentraler Grenzwertsatz
(a) Die Zufallsvariable X habe eine uniforme Wahrscheinlichkeitsverteilung auf [−1, 1]
(
1/2 für |x| ≤ 1
pX (x) =
0
sonst
√ PN
Es sei YN = 1/ N i Xi die (standardisierte) Summe von N Kopien von X. Berechnen
Sie explizit pY2 (x) (durch benutzen der Faltung).
(b) Skizzieren Sie pX (x), pY2 (x), sowie pY∞ (x). Wenn Sie wollen, fügen Sie, z.B. per Computer, pY3 (x) hinzu. Ist mit dem bloßen Auge noch ein Unterschied zwischen pY3 (x) und
pY∞ (x) feststellbar?
Aufgabe 4: Bayes-Formel
Angenommen bei einem Fahrradrennen mit 1000 Teilnehmern sein 10% aller Fahrer gedoped. Der verwendete Dopingtest habe eine Verlässlichkeit p(positiv|doped) von 90% und eine Falsch-Positivrate p(positiv|clean) von 1%. Dabei bezeichnet p(A|B) die bedingte Wahrscheinlichkeit p(“A, falls B”).
(a) Berechnen Sie p(doped|positiv), den positive Vorhersagewert.
(b) Wiederholen Sie die Berechnung für eine geringere Prävalenz von nur 1% gedopeden
Fahrern. Ist der positive Vorhersagewert eine Eigenschaft des Tests selbst?
(c) Eine oft durchsichtigere Herangehensweise als die Bayes-Formel ist das Verwenden von
absoluten Häufigkeiten: Berechnen Sie die Ergebnisse nochmals mithilfe von Entscheidungsbäumen (starten sie mit 1000 Teilnehmern, davon sind ... gedoped, ...).
2