HA 12 - Universität zu Köln

Universität zu Köln
WS 2015/16
Institut für Mathematik
Dozent: Prof. Dr. A. Drewitz
Assistent: L. Schmitz
Abgabe: 4.2. & 5.2. vor den Übungen
12. Übung Einführung in die Stochastik
(Maximum-Likelihood-Schätzer, Cramér-Rao, Tests)
Hausaufgaben
1. Aufgabe
(4 Punkte)
Man betrachte das Modell (X , A, (Pϑ )ϑ∈Θ ), wobei Pϑ die Verteilung eines Vektors (X1 , . . . , Xn ) auf (X , A) = (Rn , B(Rn )) bezeichnet und X1 , . . . , Xn unabhängige, identisch N (µ, σ 2)-verteilte Zufallsvariablen sind. Ferner seien dabei µ ∈ R und σ 2 > 0 unbekannt, d.h. Θ = R × (0, ∞) und wir setzen
ϑ := (µ, σ 2 ) ∈ Θ.
Bestimmen Sie den Maximum-Likelihood-Schätzer für τ (ϑ) = ϑ. Ist dieser
erwartungstreu?
2. Aufgabe
(6 Punkte)
Man betrachte das Modell (X , A, (Pν )ν∈Θ ), wobei Pν die Verteilung eines Vekn
tors (X1 , . . . , Xn ) auf (X , A) = Nn0 , 2N0 bezeichnet und X1 , . . . , Xn unabhängige, identisch Poiν -verteilte Zufallsvariablen sind. Dabei ist ν ∈ (0, ∞) =
Θ unbekannt.
a) Bestimmen Sie den Maximum-Likelihood-Schätzer ν̂ für τ (ν) = ν.
(2 Punkte)
b) Zeigen Sie, dass ν̂ aus a) erwartungstreu ist.
(1 Punkt)
c) Verifizieren Sie, dass (Nn0 , 2N0 , (Pν )ν∈Θ ) ein reguläres parametrisches Modell ist und zeigen Sie, dass im Falle von ν̂ aus a) die Cramér-RaoUngleichung (Display (2.1.13)) zu einer Gleichung wird. (3 Punkte)
n
3. Aufgabe
(0 Punkte)
Es sei X die Anzahl der Unfälle in einer bestimmten Stadt in einer Woche.
Wir nehmen dabei an, dass X Poiν -verteilt ist mit unbekanntem ν > 0. Wir
wollen aus der Beobachtung von X die Wahrscheinlichkeit schätzen, dass in
den folgenden drei Wochen kein Unfall geschieht, d.h. τ (ν) := (Pν (X = 0))3 .
Zeigen Sie, dass jeder erwartungstreue Schätzer T keinen sinnvollen Schätzwert
für τ (ν) liefert.
Einführung in die Testtheorie
Manchmal ist es nicht wichtig, Parameter genau zu bestimmen, sondern man
interessiert sich für Bereiche, in denen sich der gesuchte Parameter mit möglichst
großer, vorgegebener Wahrscheinlichkeit befindet. Man trifft also auf Grundlage einer Beobachtung x = (x1 , . . . , xn ) ∈ X eine Entscheidung zwischen zwei
Hypothesen
H : ϑ ∈ Θ0 , K : ϑ ∈
/ Θ0 ,
wobei Θ0 ( Θ. Im einfachsten Fall (“nicht randomisiert”) wird die Entscheidung getroffen durch den Wert einer “Zweientscheidungsfunktion”ϕ mit
(
1, falls x ∈ S,
,
ϕ(x) =
0, falls x ∈ A = X \S.
wobei S und A = X \S “geeignet“ zu wählen sind (s.u.). Mit Vorliegen der
Beobachtung x gibt ϕ(x) die Wahrscheinlichkeit an, die Entscheidung für K
zu treffen.
Fehlentscheidungen sind dabei möglich. Üblicherweise unterscheidet man zwei
Fehlerarten:
• Fehler 1. Art: ϑ ∈ Θ0 , aber x ∈ S (oder ϕ(x) = 1).
Man trifft also die falsche Entscheidung für K.
• Fehler 2. Art: ϑ ∈
/ Θ0 , aber x ∈ A (oder ϕ(x) = 0).
Der Test wird nun so konstruiert (d.h. S darf nur so gewählt werden), dass die
Fehlerw’keit 1. Art klein bleibt, d.h.
!
Pϑ (ϕ(X) = 1) = Pϑ (X ∈ S) ≤ α ∀ϑ ∈ Θ0 ,
(1)
wobei α klein ist (üblicherweise α = 0.1, 0.05, 0.01). Dann wird unter der Nebenbedingung (1) derjenigen Test ϕ∗ (oder derjenigen Bereich A∗ ) ausgewählt,
der die Fehlerw’keit 2. Art minimiert, d.h.
Pϑ (ϕ∗ (X) = 0) = min Pϑ (ϕ(X) = 0) = min Pϑ (X ∈ A) ∀ϑ ∈
/ Θ0 .
ϕ
A⊂X
(2)
Gemäß (2) sollte also S = X \A möglichst groß gewählt werden, aber noch so
klein, dass (1) erfüllt ist.
Ein Test, welcher (1) und (2) erfüllt, wird auch Neyman-Person-Test zum Niveau α genannt.
Das folgende Beispiel veranschaulicht, wie ein Test konkret konstruiert werden
kann. Dabei verwendet der Test bereits als “gut“ (erwartungstreu, konsistent
etc.) verifizierte Parameterschätzer ϑ̂, um zu entscheiden, ob der unbekannte
Parameter ϑ in einem bestimmten Bereich liegt.
Beispiel: X1 , . . . , Xn seien unabhängige und identisch Bin1,p -verteilte Zufallsvariablen, p ∈ (0, 1). Ein Neyman-Pearson-Test zum Niveau α = 0.1 für
H : p ≤ p0 ,
K : p > p0 ,
wobei 0 < pP
0 < 1 bekannt ist, könnte wiefolgt aussehen:
1
Da X̄ = n ni=1 Xi eine “gute Schätzung“ für p ist, spricht ein großer Wert
von X̄ für K, andernfalls spricht er für H. Wir würden also den Test folgendermaßen konstruieren:
(
1, falls x̄ > c
ϕ(x) = ϕ(x1 , . . . , xn ) =
0, falls x̄ ≤ c,
wobei c noch gewählt wird. Der Test muss dann so konstruiert werden, dass
(1) und (2) eingehalten werden, d.h.
Pp (ϕ(X) = 1) = Pp X̄ > c ≤ α ∀p ≤ p0
(3)
und gleichzeitig c möglichst klein gewählt werden (unter Einhaltung von (3)),
damit der Fehler 2. Art minimiert wird.
Auf dieselbe Art kann die folgende Aufgabe bearbeitet werden:
4. Aufgabe
(0 Punkte)
Es seien X1 , . . . , Xn unabhängige, identisch Poiν -verteilte Zufallsvariablen, ν >
0.
a) Konstruieren Sie einen Neyman-Pearson-Test zum Niveau α für die Hypothesen
H : ν ≤ ν0 , K : ν > ν0 ,
wobei ν0 > 0 bekannt sei.
b) Ein Zufallsgenerator liefert die folgenden Realisationen einer Poiν -verteilten
Zufallsvariablen:
4, 2, 3, 5, 3, 3, 3, 3, 0, 2.
Testen Sie die Hypothesen H : ν ≤ 2 gegen K : ν > 2 jeweils bei einem
Niveau α = 0.05 bzw. α = 0.07.
Hinweis zu a): Sie dürfen
Pn verwenden, dass die Summe X1 + . . . + Xn Poinν 1
verteilt ist und dass n i=1 Xi ein guter Schätzer für Eν [X1 ] = ν ist.
zu b): Für eine Poi20 -verteilte Zufallsvariable X gilt
k
24
25
26
27
28
29
30
P20 (X ≤ k) 0.8432 0.8878 0.9221 0.9475 0.9657 0.9782 0.9865
Anmerkung: Es sind nur die Aufgaben einzureichen, welche strikt positive
Punktzahlen haben. Sollten Sie für eine Aufgabe mehrere Blätter benötigen, so
sind diese zusammenzuheften. Bitte beschriften Sie Ihre Lösungen in der ersten
Zeile in der folgenden Reihenfolge: Gruppe, Name, Aufgabe. Gesamtpunktzahl:
10
4