Vorlesung Mathematische Statistik Sommersemester 2015 Humboldt-Universit¨ at zu Berlin Prof. Dr. Markus Reiß ¨ 1. Ubungsblatt 1. Beweisen Sie den Korrespondenzsatz zwischen Tests und Konfidenzbereichen: Sind f¨ ur jeden Parameter ϑ0 ∈ Θ Tests ϕϑ0 auf die Hypothese H0 : ϑ = ϑ0 (gegen irgendeine Alternative) vom Niveau α ∈ (0, 1) gegeben, so bildet n o C := ϑ0 ∈ Θ ϕϑ0 akzeptiert H0 : ϑ = ϑ0 eine (1 − α)-Konfidenzmenge. Andersherum kann aus einer (1 − α)Konfidenzmenge eine Familie solcher Tests (ϕϑ0 ) konstruiert werden (wie?). 2. Es seien X und Y rellwertige Zufallsvariablen mit E[|Y |] < ∞ und gemeinsamer Lebesgue-Dichte f X,Y . Als bedingte Dichte von Y gegeben X = x definiert man f X,Y (x, y) f Y |X=x (y) := R X,Y . (x, η) dη Rf (a) Zeigen Sie, dass f Y |X=x f¨ ur P X -fast alle x wohl definiert ist. R (b) Betrachten Sie die Funktion g(x) = R yf Y |X=x (y) dy, falls die rechte Seite wohldefiniert ist, und g(x) = 0 andernfalls. Weisen Sie nach, dass g(X) eine Version der bedingten Erwartung E[Y |X] ist. (c) X und Y m¨ ogen gemeinsam normalverteilt sein mit Erwartungswert µ ∈ R2 und Kovarianzmatrix Σ ∈ R2×2 . Bestimmen Sie E[Y |X]. 3. F¨ ur X und Y wie in Aufgabe 2 ist m(x) ein bedingter Median von Y gegeben X = x, sofern Z m(x) f Y |X=x (y) dy = 1/2 (falls wohldefiniert) −∞ gilt. Zeigen Sie, dass m die Minimalit¨atseigenschaft E[|Y − m(X)|] = inf E[|Y − h(X)|] h besitzt, wobei sich das Infimum u ¨ber alle Borel-messbaren h : R → R erstreckt. Welches Kriterium minimieren die entsprechend definierten bedingten αQuantile, α ∈ (0, 1)? 4. Bei acht Absolventen werden anhand einer Befragung die Studiendauer und das Einstiegsgehalt (in 1000¿) ermittelt: Studiendauer xi 10 9 11 9 11 12 10 11 Einstiegsgehalt Yi 35 35 34 36 41 39 40 38 (a) Modellieren Sie dies als ein lineares Modell und bestimmen Sie die Regressionsgerade. Zeichnen Sie Daten und Regressionsgerade in ein geeignetes Koordinatensystem ein. (b) Es stellt sich heraus, dass die ersten Vier ein anderes Fach studiert haben als die anderen Vier. Bestimmen und zeichnen Sie die Regressionsgeraden f¨ ur beide Studienf¨ acher getrennt. (c) Wie erkl¨ aren Sie die unterschiedlichen Ergebnisse in (a) und (b)? Abgabe vor der Vorlesung am Freitag, dem 24.4.15. Vorlesung Mathematische Statistik Sommersemester 2015 Humboldt-Universit¨ at zu Berlin Prof. Dr. Markus Reiß ¨ 2. Ubungsblatt 1. Es sei (X , F, (Pϑ )ϑ∈Θ ) ein statistisches Experiment sowie π eine a-prioriVerteilung auf (Θ, FΘ ), so dass Pϑ µ f¨ ur alle ϑ ∈ Θ sowie π ν gilt mit σ-endlichen Maßen µ und ν und Dichten fX|Θ=ϑ bzw. fΘ . Zeigen Sie f¨ ur (F ⊗ FΘ )-messbare Funktionen (x, ϑ) 7→ fX|Θ=ϑ (x) ∈ [0, ∞): R (a) F¨ ur fX (x) := Θ fX|Θ=ϑ (x)fΘ (ϑ)ν(dϑ) in (0, ∞) definiere fΘ|X=x (ϑ) durch fX|Θ=ϑ (x)fΘ (ϑ) fΘ|X=x (ϑ) := , ϑ ∈ Θ, fX (x) und sonst durch fΘ|X=x (ϑ) := fΘ (ϑ), ϑ ∈ Θ, dann ist fΘ|X=x eine νWahrscheinlichkeitsdichte f¨ ur alle x ∈ X . (b) Es seien X und Θ Zufallsvariablen mit der gemeinsamen Verteilung ˜ P(dx, dϑ) = Pϑ (dx)π(dϑ). Die Funktion g : X × Θ → sei (F ⊗ FΘ )messbar. Ist g nichtnegativ oder ist EP˜ [|g(X, Θ)|] < ∞, dann gilt Z EP˜ [g(X, Θ)|X = x] = g(x, ϑ)fΘ|X=x (ϑ)ν(dϑ) R Θ und speziell x). R A fΘ|X=x (ϑ)ν(dϑ) ˜ = EP˜ [1{Θ∈A} |X = x] =: P(Θ ∈ A|X = (c) Bestimmen Sie fX|Θ=• sowie EP˜ [(X − Θ)2 | X = x] im Fall Θ = R, Pϑ = N (ϑ, 1), π = N (0, δ 2 ) f¨ ur festes δ > 0. Was ergibt sich f¨ ur δ → ∞ und δ → 0? 2. Wenn man in die Bayesformel statt einer Dichte fΘ eine nichtnegative, messbare Funktion fΘ einsetzt und fΘ|X=x (ϑ) weiterhin wohldefiniert ist, so ergibt sich aus der a-posteriori-Verteilung ein verallgemeinerter Bayessch¨ atzer. Es sei nun X1 , . . . , Xn eine N (µ, Ed )-verteilte mathematische Stichprobe mit µ ∈ d unbekannt. ¯ := 1 Pn Xi ist ein verallgemeinerter Bayessch¨atzer von (a) Beweisen Sie: X i=1 n µ zum quadratischen Risiko bzgl. dem Lebesguemaß als verallgemeinerter a-priori-Verteilung. R (b) Berechnen Sie den verallgemeinerten Bayessch¨atzer µ ˆa,b zum quadratischen Risiko f¨ ur d = 1 und fΘ (ϑ) = 1(a,b) (ϑ) mit a, b ∈ R ∪{−∞, ∞}. ¯ Zeichnen Sie µ ˆ0,1 f¨ ur n = 1 als Funktion von X. 3. Gegeben sei das gew¨ ohnliche lineare Modell Y = Xβ + ε. In der ridge regression verwendet man den Sch¨atzer βˆa = (X > X + a2 Ep )−1 X > Y . Weisen Sie nach: Der ridge-regression-Sch¨atzer βˆa ist Bayes-optimaler Sch¨atzer f¨ ur quadratisches Risiko bei a-priori-Verteilung β ∼ N (0, η 2 Ep ) mit η = η(a, σ) > 0 geeignet. 4. Beweisen Sie f¨ ur Entscheidungsregeln ρ basierend auf einem statistischen Experiment (X , F, (Pϑ )ϑ∈Θ ) mit Verlustfunktion l: (a) Ist ρ minimax und eindeutig in dem Sinn, dass jede andere Minimax-Regel die gleiche Risikofunktion besitzt, so ist ρ zul¨assig. (b) Ist ρ zul¨ assig mit konstanter Risikofunktion, so ist ρ minimax. (c) Ist ρ eine Bayesregel (bzgl. π) und eindeutig in dem Sinn, dass jede andere Bayesregel (bzgl. π) die gleiche Risikofunktion besitzt, so ist ρ zul¨assig. (d) Die Parametermenge Θ bilde einen metrischen Raum mit Borel-σ-Algebra FΘ . Ist ρ eine Bayesregel (bzgl. π), so ist ρ zul¨assig, falls (i) Rπ (ρ) < ∞; (ii) f¨ ur jede nichtleere offene Menge U in Θ gilt π(U ) > 0; (iii) f¨ ur jede Regel ρ0 mit Rπ (ρ0 ) ≤ Rπ (ρ) ist ϑ 7→ R(ϑ, ρ0 ) stetig. 5. Eine Krankheit kommt bei ca. 0, 1% der Bev¨olkerung vor. Ein Test zur Erkennung der Krankheit f¨ uhrt bei 97% der Kranken, aber auch bei 2% der Gesunden zu einer Reaktion. Auf Grund des Tests wird eine Person als krank bzw. gesund klassifiziert. Mit `0 > 0 (bzw. `1 > 0) werde der Verlust bei der Klassifizierung krank (bzw. gesund) eines gesunden (bzw. kranken) Patienten bewertet. Formulieren Sie dies als Bayessches Entscheidungsproblem und geben Sie eine Bayes-optimale Entscheidungsregel in Abh¨angigkeit von `0 , `1 an. 6. Die Beta-Verteilung B(a, b) auf [0, 1] ist gegeben durch die Dichte fa,b (x) = Γ(a + b) a−1 x (1 − x)b−1 , Γ(a)Γ(b) x ∈ (0, 1), wobei a, b > 0 und Γ die Gamma-Funktion bezeichnet. B(a, b) hat Erwara ab 2 = und Varianz σa,b . tungswert µa,b = a+b (a+b)2 (a+b+1) (a) Skizzieren Sie fa,b f¨ ur (a, b) ∈ {0.5; 1; 10}2 (Computereinsatz gestattet). (b) Es sei eine Bin(n, p)-verteilte math. Stichprobe X gegeben, wobei n > 1 bekannt ist sowie p gem¨aß B(a, b) a priori verteilt ist. Zeigen Sie, dass die bedingte Dichte von p gegeben X = x zur Beta-Verteilung B(a + x, b + n − x) geh¨ ort. (c) Schließen Sie, dass der Bayessch¨atzer unter quadratischem Risiko gegea+X ben ist durch pˆa,b = a+b+n . Bestimmen Sie sein quadratisches Risiko als Funktion von p und sein zugeh¨origes Bayesrisiko. Abgabe vor der Vorlesung am Freitag, dem 8.5.15. Vorlesung Mathematische Statistik Sommersemester 2015 Humboldt-Universit¨ at zu Berlin Prof. Dr. Markus Reiß ¨ 3. Ubungsblatt R d , sei ein statistischen Experiment mit a-priori1. (X , F, (Pϑ )ϑ∈Θ ), Θ ⊆ Verteilung π und ρ sei eine Bayesregel (bzgl. π) zum quadratischen Risiko (d.h. l(ϑ, a) = |a − ϑ|2 ). Zeigen Sie: ρ kann nur dann erwartungstreu sein, wenn Rπ (ρ) = 0. 2. Es sei X1 , . . . , Xn eine N (µ, Ed )-verteilte mathematische Stichprobe. Der James-Stein-Sch¨ atzer mit positivem Gewicht ist definiert als µ ˆJS+ = 1 − d d−2 X. Beweisen Sie f¨ u r alle d > 3 und µ ∈ R schrittweise folgenden n|X|2 + Risikovergleich mit dem klassischen James-Stein-Sch¨atzer: Eµ [|ˆ µJS+ − µ|2 ] < Eµ [|ˆ µJS − µ|2 ]. (a) Die Absch¨ atzung ist korrekt f¨ ur µ = 0. ur (b) Die Absch¨ atzung folgt aus der Ungleichung Eµ [µi X i |G|1{G60} ] > 0 f¨ d−2 G = 1 − n|X|2 und alle i = 1, . . . , d mit µi 6= 0. (c) F¨ ur a > 0 und µi 6= 0 gilt Eµ [µi X i | (X i )2 = a2 ] = aµi tanh(naµi ) > 0. Dies ergibt die Ungleichung in (b) durch Einf¨ ugen einer auf 2 2 ((X 1 ) , . . . , (X d ) ) bedingten Erwartung. Rd unbekannt. (a) Zeigen Sie: Soll in einem statistischen Experiment g(ϑ) ∈ Rd durch gˆ 3. Gegeben sei X ∼ N (µ, σ 2 Ed ) mit σ > 0 bekannt und µ ∈ gesch¨ atzt werden, so gilt die Bias-Varianz-Zerlegung: Eϑ [|ˆ g − g(ϑ)|2 ] = | Eϑ [ˆ g ] − g(ϑ)|2 + Eϑ [|ˆ g − Eϑ [ˆ g ]|2 ] R (b) Bestimmen Sie die Bias-Varianz-Zerlegung f¨ ur µ ˆα = αX, α ∈ , und 2d zeigen Sie, dass αOrakel := 1 − |µ|2σ+σ das quadratische Risiko minimiert, 2d falls µ der wahre Parameter ist. Erkl¨aren Sie das Verhalten f¨ ur d → ∞ bei konstantem |µ|. (c) Weisen Sie nach, dass |X|2 ein erwartungstreuer Sch¨atzer von |µ|2 + σ 2 d σ2 d 2 ist und setze α ˆ := 1 − |X| 2 . Schließen Sie durch Berechnen von Var(|X| ), dass ∀, R > 0 ∃K > 0 : |X|2 |µ|2 + σ 2 d K > √ Pµ 2 − 6 , ∀d > 1 ∀µ ∈ d mit |µ| 6 R. σ d σ2d d R Folgere, dass |ˆ α − αOrakel | = OP (d−1/2 ) f¨ ur d → ∞ und |µ| 6 R gilt, d.h. 0 ∀, R > 0 ∃K > 0 : Pµ (|ˆ α − αOrakel | > K 0 d−1/2 ) 6 , ∀d > 1 ∀µ ∈ Rd mit |µ| 6 R. 4. Beweisen Sie das Stein- bzw. Chen-Stein-Lemma: (a) Eine reellwertige Zufallsvariable X ist N (µ, σ 2 )-verteilt genau dann, wenn E[(X − µ)f (X)] = σ 2 E[f 0 (X)] f¨ ur alle f ∈ C 1 (R) mit E[|f 0 (X)|] < ∞ gilt. (b) Eine Zufallsvariable N mit Werten in N0 ist Poiss(λ)-verteilt genau dann, wenn E[N f (N )] = λ E[f (N + 1)] f¨ ur jedes beschr¨ankte f : N0 → R gilt. Abgabe vor der Vorlesung am Freitag, dem 15.5.15. Vorlesung Mathematische Statistik Sommersemester 2015 Humboldt-Universit¨ at zu Berlin Prof. Dr. Markus Reiß ¨ 4. Ubungsblatt 1. Es sei X1 , . . . , Xn eine N (µ, 1)-verteilte mathematische Stichprobe mit µ ∈ R unbekannt. (a) Geben Sie das zugeh¨orige statistische Experiment auf X = Rn an und zeigen Sie, dass es vom Produktmaß N (0, 1)⊗n dominiert wird. (b) Bestimmen Sie die Likelihoodfunktion f¨ ur das dominierende Maß in (a). Welcher Wert µ ∈ R maximiert die Likelihoodfunktion zu gegebenem x ∈ Rn (dies ist der Maximum-Likelihood-Sch¨atzer bei Beobachtung X = x)? 2. Beweisen oder widerlegen Sie die Aussage, dass folgende Verteilungen Exponentialfamilien bilden. Bestimmen Sie gegebenenfalls den nat¨ urlichen Parameterraum. (a) Multinomialverteilung (M (p0 , . . . , ps ; n))0<pi <1,P pi =1 ; (b) Poissonverteilung (Poiss(λ))λ>0 ; (c) Gleichm¨ aßige Verteilung (U ([0, ϑ]))ϑ>0 ; (d) Gammaverteilung (Γ(a, b))a,b>0 . 3. Ein Physiker untersucht die Radioaktivit¨at bei zwei verschiedenen Pr¨aparaten. Die unabh¨ angig gemessene Zahl der Zerf¨alle in einer Zeiteinheit bei Pr¨aparat 1 sei X1 , . . . , Xm1 (m1 Messungen), bei Pr¨aparat 2 Y1 , . . . , Ym2 (m2 Messungen). Geben Sie eine vern¨ unftige Regel an, um zu entscheiden, welches Pr¨aparat st¨ arker radioaktiv ist. Begr¨ unden Sie dazu, weshalb die Annahme einer Poissonverteilung gerechtfertigt ist, und geben Sie ein Suffizienzargument. 4. Beweisen Sie: Es sei (Pϑ )ϑ∈Z eine Exponentialfamilie mit nat¨ urlichem Parak meterraum Z ⊆ R und Darstellung d Pϑ (x) = C(ϑ)h(x) exp(hϑ, T (x)i) = h(x) exp(hϑ, T (x)i − A(ϑ)), dµ R wobei A(ϑ) = log h(x) exp(hϑ, T (x)i)µ(dx) . Ist ϑ¯ ein innerer Punkt von Z, so ist die erzeugende Funktion von T ψϑ¯(s) = Eϑ¯[ehT,si ], s ∈ Rk , in einer Umgebung der Null wohldefiniert und beliebig oft differenzierbar. Es gilt ¯ f¨ ψϑ¯(s) = exp(A(ϑ¯ + s) − A(ϑ)) ur alle s mit ϑ¯ + s ∈ Z. F¨ ur i, j = 1, . . . , k folgt dA ¯ d2 A ¯ Eϑ¯[Ti ] = dϑi (ϑ) und Covϑ¯(Ti , Tj ) = dϑi dϑj (ϑ). Abgabe vor der Vorlesung am Freitag, dem 22.5.15. Vorlesung Mathematische Statistik Sommersemester 2015 Humboldt-Universit¨ at zu Berlin Prof. Dr. Markus Reiß ¨ 5. Ubungsblatt 1. Eine suffiziente Statistik T ∗ heißt minimalsuffizient, wenn es zu jeder suffizienten Statistik T eine messbare Funktion h gibt, so dass T ∗ = h(T ) Pϑ -f.s. f¨ ur alle ϑ ∈ Θ gilt. Beweisen Sie, dass jede d -wertige, suffiziente und vollst¨andige Statistik minimalsuffizient ist, sofern eine minimalsuffiziente Statistik u ¨berhaupt existiert. Gilt die Umkehrung f¨ ur d -wertige Statistiken? Hinweis: Man kann zeigen, dass minimalsuffiziente Statistiken f¨ ur dominierte Experimente auf separablen Messr¨aumen (wie ( d , BRd )) stets existieren. R R R 2. Es sei (Bt , t > 0) eine Brownsche Bewegung. Es wird Xt := σBt + at mit σ > 0 unbekannt und a ∈ unbekannt zu den n Zeitpunkten h, 2h, . . . , T := nh mit h > 0 beobachtet. R (a) Bestimmen Sie die gemeinsame Verteilung der ∆Xk := Xkh − X(k−1)h , k ∈ {1, . . . , n}. (b) Pa,σ2 bezeichne die Verteilung von (∆X1 , ∆X2 , . . . , ∆Xn ) mit Xt := σBt +at. BestimmenP Sie die Likelihoodfunktion bez¨ uglich P0,1 und weisen Sie nach, dass (XT , nk=1 (∆Xk )2 ) eine suffiziente Statistik ist. (c) P Berechnen Sie das quadratische Risiko von a ˆ = XT /T und σ ˆ2 = n 2 ur T → ∞ k=1 (∆Xk ) /T und diskutieren Sie jeweils das Verhalten f¨ bei festem h und f¨ ur h → 0 bei festem T . (d) Simulieren Sie 1000 Realisierungen von Xt = Bt sowie Xt = 0.5Bt +4t auf dem Intervall [0, 1] und berechnen Sie σ ˆ 2 jeweils f¨ ur h ∈ {0.1, 0.01, 10−4 } anhand der Beobachtungen Xh , X2h , . . . , X1 . Stellen Sie in jedem der sechs F¨ alle die Verteilung des Sch¨atzfehlers σ ˆ − σ in einem Histogramm dar. Formulieren Sie eine Vermutung, gegen welche Verteilung σ ˆ − σ bei richtiger Skalierung f¨ ur h → 0 konvergiert. Hinweis: Eine Brownsche Bewegung (Bt , t > 0) ist durch folgende Eigenschaften charakterisiert: (i) es gilt B0 = 0 und Bt ∼ N (0, t), t > 0; (ii) die Inkremente sind station¨ar und unabh¨angig: f¨ ur 0 6 t0 < t1 < · · · < tm gilt (Bt1 − Bt0 , . . . , Btm − Btm−1 ) ∼ N (0, diag(t1 − t0 , . . . , tm − tm−1 )); (iii) B hat stetige Pfade. Abgabe vor der Vorlesung am Freitag, dem 29.5.15. Vorlesung Mathematische Statistik Sommersemester 2015 Humboldt-Universit¨ at zu Berlin Prof. Dr. Markus Reiß ¨ 6. Ubungsblatt 1. F¨ ur zwei Wahrscheinlichkeitsmaße P, Q auf demselben Raum (X , F ) bezeichnet Z p 2 p 2 H (P, Q) := p(x) − q(x) µ(dx) X den quadrierten Hellinger-Abstand, wobei µ ein Maß ist, das P und Q dominiert (z.B. µ = P + Q), und p, q die entsprechenden µ-Dichten bezeichnet. Zeigen Sie: (a) Der Hellingerabstand H ist unabh¨angig vom dominierenden Maß µ und definiert eine Metrik. R p (b) Es gilt H 2 (P, Q) = 2 − 2 X p(x)q(x) µ(dx) ∈ [0, 2]. (c) F¨ ur Produktmaße P = ⊗ni=1 Pi , Q = ⊗ni=1 Qi gilt n n Y H 2 (Pi , Qi ) X 2 H 2 (P, Q) = 2 1 − 1− 6 H (Pi , Qi ). 2 i=1 i=1 2. F¨ ur zwei Wahrscheinlichkeitsmaße P, Q auf (X , F ) bezeichnet kP − QkT V := sup |P(A) − Q(A)| A∈F den Totalvariationsabstand. Weisen Sie die Ungleichung von Le Cam nach: q 1 2 H (P, Q) 6 kP − Qk 6 H(P, Q) 1 − 14 H 2 (P, Q). TV 2 Insbesondere konvergiert also Pn → P im Totalvariationsabstand genau dann, wenn Konvergenz im Hellingerabstand vorliegt. Anleitung: R R 1 |p − q|dµ = 1 − min(p, q)dµ Weise mit µ-Dichten p, q nach: kP − Qk = T V 2 R√ R 2 sowie ( pqdµ) 6 2 min(p, q)dµ. 3. Betrachten Sie f¨ ur eine Lebesguedichte f : R → [0, ∞) das Lokationsmodell einer mathematischen Stichprobe X1 , . . . , Xn , die gem¨aß f (• − ϑ) mit ϑ ∈ R unbekannt verteilt ist. Zeigen Sie, dass diese Verteilungsfamilie L2 -differenzierbar R ist, wenn f ∈ C 1 (R), f > 0 und f 0 (x)2 f (x)−1 dx < ∞ gilt, und bestimmen Sie die Fisher-Information In (ϑ). K¨ onnen Sie die Bedingungen so abschw¨achen, dass auch die L2 Differenzierbarkeit im Fall der Laplace-Verteilung f (x) = 21 e−|x|/2 folgt? 4. Bestimmen Sie die Fisher-Informationsmatrix f¨ ur eine N (µ, σ 2 )-verteilte mathematische Stichprobe X1 , . . . XN mit unbekannten Werten µ ∈ und σ 2 > 0 sowie f¨ ur X ∼ Bin(n, p) mit p ∈ (0, 1) unbekannt und n bekannt. Finden Sie jeweils einen erwartungstreuen Sch¨atzer f¨ ur µ und f¨ ur p, der die Cram´er-RaoSchranke erreicht. Bestimmen Sie einen erwartungstreuen Sch¨atzer f¨ ur σ 2 bei N > 2 Beobachtungen, der zumindest asymptotisch f¨ ur N → ∞ die Cram´erRao-Schranke erreicht (bei Reskalierung mit N ). R Abgabe vor der Vorlesung am Freitag, dem 5.6.15. Vorlesung Mathematische Statistik Sommersemester 2015 Humboldt-Universit¨ at zu Berlin Prof. Dr. Markus Reiß ¨ 7. Ubungsblatt 1. (a) Es sei X1 , . . . , Xn eine U ([0, ϑ])-verteilte mathematische Stichprobe mit ϑ > 0 unbekannt. Weisen Sie nach, dass ϑˆn := maxi Xi ein Maximumd Likelihood-Sch¨ atzer f¨ ur ϑ ist und n(ϑ − ϑˆn ) − → Exp(1/ϑ) f¨ ur n → ∞ gilt. (b) Zeigen Sie f¨ ur eine mathematische Stichprobe X1 , . . . , Xn bei zugrundeliegender Lebesguedichte fm (x) = 21 e−|x−m| , x ∈ R, mit m ∈ R unbekannt, dass der Stichproben-Median ein Maximum-Likelihood-Sch¨atzer von m ist. 2. Es seien X1 , . . . , Xn unabh¨angig und gem¨aß der stetigen Lebesgue-Dichte f : R∞ Rm + R → R verteilt. Es gebe ein m ∈ R (Median) mit −∞ f = m f = 1/2 und es gelte f (m) > 0. Dann gilt f¨ ur jeden Stichprobenmedian m ˆ n die asymptotische Normalit¨ at √ 1 d . n(m ˆ n − m) − → N 0, 4f (m)2 Zeigen Sie dies gem¨ aß einem der folgenden Ans¨atze: (a) F¨ ur eine U ([0, 1])-verteilte mathematische Stichprobe U1 , . . . , Un ist die k-te Ordnungsstatistik X(k) Beta(k,n+1-k)-verteilt auf [0, 1]. Setzt amn k = n/2 bzw. k = (n±1)/2, so folgt, dass ihr Stichprobenmedian m ˆU n obige asymptotische Normalit¨at erf¨ ullt. Benutze die Quantilstransformation Xi = F −1 (Ui ) f¨ ur eine geeignete Inverse F −1 der Verteilungsfunktion von Xi , um die Asymptotik von m ˆ n herzuleiten. (b) Der Stichprobenmedian kann als Funktional der empirischen Verteilungsfunktion dargestellt werden und eine funktionale ∆-Methode kann angewendet werden, wobei der Satz von Donsker zur Asymptotik des empirischen Prozesses als bekannt vorausgesetzt sei. Argumentieren Sie zun¨ achst heuristisch und erkl¨aren Sie dann kurz die notwendigen formalen Schritte z.B. aus A. van der Vaart, Asymptotic Statistics. 3. F¨ ur zwei Wahrscheinlichkeitsmaße P und Q auf demselben Messraum (X , F ) heißt die Funktion (R dP log (x) P(dx), falls P Q, dQ X KL(P | Q) = +∞, sonst Kullback-Leibler-Divergenz. (a) Zeigen Sie, dass f : (0, ∞) → P (benutze d P = dd Q d Q) KL(P | Q) > 0 und R, x 7→ x log(x) konvex ist und somit KL(P | Q) = 0 ⇐⇒ P = Q . Finden Sie zwei ¨ aquivalente Wahrscheinlichkeitsmaße P und Q mit KL(P | Q) 6= KL(Q | P). (b) Beweisen Sie f¨ ur Produktmaße: KL n O i=1 Pi | n O i=1 Qi = n X KL(Pi | Qi ). i=1 4. (a) Beweisen Sie: Bildet (Pϑ )ϑ∈Θ eine nat¨ urliche Exponentialfamilien und ist k ϑ0 innerer Punkt von Θ ⊆ R , so gilt KL(Pϑ0 | Pϑ ) = A(ϑ) − A(ϑ0 ) + ˙ 0 ), ϑ0 − ϑi. Folgern Sie hA(ϑ ¨ ϑ | Pϑ )|ϑ=ϑ = I(ϑ0 ). KL(P 0 0 (b) Leiten Sie eine entsprechende Formel f¨ ur die Hesse-Matrix bei ϑ0 des quadrierten Hellingerabstandes ϑ 7→ H 2 (Pϑ0 | Pϑ ) her. Abgabe vor der Vorlesung am Freitag, dem 12.6.15. Vorlesung Mathematische Statistik Sommersemester 2015 Humboldt-Universit¨ at zu Berlin Prof. Dr. Markus Reiß ¨ 8. Ubungsblatt 1. Ein Teich enth¨ alt eine unbekannte Anzahl ϑ von Karpfen. Zur Sch¨atzung von ϑ werden zun¨ achst w Fische gefangen, markiert und wieder freigelassen. Wenn sich die markierten Fische wieder gut verteilt haben, werden n Fische gefangen, von denen x markiert sind. Modellieren Sie die Sch¨ atzung des Fischbestandes ϑ durch ein statistisches Experiment mit hypergeometrischen Verteilungen und bestimmen Sie einen MLE, diskutieren Sie dabei den Fall x = 0 separat. 2. Sei X1 , . . . , Xn eine mathematische Stichprobe bez¨ uglich der Lebesguedichte 1−ϑ |x − ϑ| ϑ fϑ (x) = 1− + 1[−1,1] (x), ϕ(ϑ) ϕ(ϑ) + 2 wobei ϑ ∈ [0, 1) und ϕ : [0, 1] → [0, 1] eine stetige, fallende Funktion mit ϕ(0) = 1 und 0 < ϕ(ϑ) 6 1 − ϑ f¨ ur ϑ ∈ (0, 1) ist. Setze weiterhin f1 (x) = 21 1[−1,1] (x). Ziel ist es f¨ ur geeignetes ϕ zu sehen, dass f¨ ur alle ϑ ∈ [0, 1] jeder MLE fast sicher gegen Eins konvergiert und insbesondere inkonsistent ist. Zeigen Sie: (a) Es existiert ein Maximum-Likelihood-Sch¨atzer ϑˆn . (b) F¨ ur ϑ < 1 ist fϑ (x) < 1/ϕ(ϑ) + 1/2 und daraus folgt, dass f¨ ur die Loglikelihoodfunktion `n bei n Beobachtungen und f¨ ur jedes α < 1 `n (ϑ) 1 1 max 6 log + <∞ 06ϑ6α n ϕ(α) 2 gilt. Um zu beweisen, dass limn→∞ ϑˆn = 1 f.s. f¨ ur alle ϑ ∈ [0, 1], reicht es max06ϑ61 `n (ϑ)/n → ∞ f.s. zu zeigen. (c) Mit X(n) = max{X1 , . . . , Xn } gilt f.s. `n (ϑ) n−1 max > log 06ϑ61 n n X(n) 2 1 + log n 1 − X(n) ϕ(X(n) ) . (d) Aus dem Lemma von Borel-Cantelli folgt n1/4 (1 − X(n) ) → 0 f.s. f¨ ur ϑ = 0 und auch f¨ ur alle ϑ ∈ [0, 1]. Mit ϕ(ϑ) := (1 − ϑ) exp(−(1 − ϑ)−4 + 1) folgt lim inf n→∞ (1/n) log((1 − X(n) )/ϕ(X(n) )) = ∞ f.s. und damit die gew¨ unschte Aussage. 3. Es sei Θ ⊆ Rk kompakt sowie (Xn (ϑ), ϑ ∈ Θ)n>1 und (X(ϑ), ϑ ∈ Θ) stetige P Prozesse mit Xn (ϑ) − → X(ϑ) f¨ ur n → ∞ f¨ ur alle ϑ ∈ Θ. Beweisen Sie: (a) ∀δ > 0 ∃Uδ ⊆ Θ endlich: supϑ∈Θ inf ϑ0 ∈Uδ |ϑ − ϑ0 | 6 δ. (b) Mit dem Stetigkeitsmodul ωδ (f ) := sup|ϑ1 −ϑ2 |6δ |f (ϑ1 ) − f (ϑ2 )| gilt sup |Xn (ϑ) − X(ϑ)| 6 ωδ (Xn ) + ωδ (X) + max|Xn (ϑ) − X(ϑ)|. ϑ∈Uδ ϑ∈Θ P (c) Es gilt maxϑ∈Uδ |Xn (ϑ) − X(ϑ)| − → 0 f¨ ur n → ∞ sowie ωδ (X) → 0 fast sicher f¨ ur δ → 0. Schließen Sie daraus, dass aus der Straffheitsbedingung ∀ε, η > 0 ∃δ > 0 : lim sup P(ωδ (Xn ) > ε) 6 η n→∞ P die gleichm¨ aßige Konvergenz supϑ∈Θ |Xn (ϑ) − X(ϑ)| − → 0 f¨ ur n → ∞ folgt. 4. Im nichtlinearen Regressionsmodell der Beobachtungen Yi = fϑ (i/n) + εi , i = 1, . . . , n, fϑ ∈ C([0, 1]), (εi )16i6n iid, mit E[εi ] = 0, Var(εi ) = σ 2 , E[ε4i ]P< ∞, σ > 0 betrachte den KleinsteQuadrate-Sch¨ atzer ϑˆn = argminϑ∈Θ ni=1 (Yi − fϑ (i/n))2 . Geben Sie Voraussetzungen f¨ ur die Parametrisierung ϑ 7→ fϑ an, um auf die asymptotische Normalit¨ at von ϑˆn f¨ ur n → ∞ zu schließen und bestimmen Sie die asymptotische Varianz. Berechnen Sie ϑˆn und die asymptotische Varianz konkret f¨ ur das Modell fϑ (x) = sin(2π(x + ϑ)), ϑ ∈ [0, 1). Hinweis: Schlagen Sie ggf. den ZGWS unter Lindeberg- oder LyapunovBedingung nach. ¨ Abgabe vor der Ubung am Freitag, den 19.6.15. Vorlesung Mathematische Statistik Sommersemester 2015 Humboldt-Universit¨ at zu Berlin Prof. Dr. Markus Reiß ¨ 9. Ubungsblatt 1. Im Beobachtungsmodell Yi = γ + εi , i = 1, . . . , n, mit (εi ) i.i.d. und symmetrisch um Null verteilt betrachte f¨ ur κ > 0 und Γ ⊆ R den Huber-Sch¨atzer ( n 1 2 x , falls |x| 6 κ, 1X γˆn = argminγ∈Γ ρ(Yi − γ), ρ(x) = 2 2 κ n κ|x| − 2 , falls |x| > κ. i=1 (a) Im Fall Γ = [a, b] mit −∞ < a < b < ∞ weise die Konsistenz von γˆn , z.B. gem¨ aß Bedingungen A1-A3, nach. (b) F¨ ur γ0 ∈ (a, b), Γ = [a, b] und P(εi = x) = 0 f¨ ur alle x ∈ R beweise rigoros die asymptotische Normalit¨at E[ε2 ∧ κ2 ] √ d i n(ˆ γn − γ0 ) − → N 0, . P(|εi | 6 κ)2 Tipp: Der Mittelwertsatz gilt f¨ ur K˙ n bis auf einen maximalen Fehler (c*) Untersuche den Fall Γ = R. 1 n. 2. Vergleichen Sie im Modell aus Aufgabe 1 die asymptotische Varianz von Stichprobenmittel, Stichprobenmedian, Huber-Sch¨atzer (f¨ ur geeignete Wahlen von κ, ggf. Computereinsatz) im Fall folgender Verteilungen: (a) εi ∼ N (0, σ 2 ), (b) fε (x) = 2s e−s|x| , (c) εi ∼ t(k), k ∈ {1, 2, 4, 10}. Welche Gesichtspunkte sollten daher bei der Auswahl des Sch¨atzers Beachtung finden? 3. Es sei (Y, Z) gem¨ aß der Dichte f (y, z, ϑ), ϑ ∈ Θ, bez¨ uglich µ ⊗ ν verteilt, wobei µ und ν σ-endliche Maße seien. Nur Y = y wird beobachtet. Der EMAlgorithmus zur Berechnung eines MLE besteht aus der Wahl eines Startwertes ϑ0 mit L(ϑ0 ) = fY (y, ϑ0 ) > 0 und aus der Wiederholung f¨ ur j = 0, 1, . . . der Schritte (1) und (2): (1) Berechne J(ϑ, ϑj ) = Eϑj log f (Y, Z, ϑ) Y =y . f (Y, Z, ϑj ) (2) Setze ϑj+1 = argmaxϑ J(ϑ, ϑj ). Zeigen Sie die Gleichung Z fZ|Y =y (z, ϑj+1 ) fY (y, ϑj+1 ) J(ϑj+1 , ϑj ) = log + log fZ|Y =y (z, ϑj )ν( dz) fY (y, ϑj ) fZ|Y =y (z, ϑj ) und folgern Sie, dass im EM-Algorithmus L(ϑj+1 ) > L(ϑj ) gilt. 4. Betrachten Sie eine mathematische Stichprobe Y1 , . . . , Yn , die gem¨aß einer Mischung zweier Normalverteilungen verteilt ist: Gegeben Zi = 0 ist Yi ∼ N (a, 1) und gegeben Zi = 1 ist Yi ∼ N (b, 1), wobei Pa,b (Zi = 0) = Pa,b (Zi = 1) = 1/2 und (Y1 , Z1 ), . . . , (Yn , Zn ) unabh¨angig. µ sei das Lebesguemaß auf n und ν sei gegeben durch ν({z}) = 1/2n f¨ ur alle z ∈ {0, 1}n . R (a) Bestimmen Sie fY (y, a, b) f¨ ur n = 1 und zeigen Sie f¨ ur beliebige n f (y, z, a, b) = n Y 1−zi ϕ(yi −a) zi ϕ(yi −b) , i=1 2 1 x mit ϕ(x) = √ exp − . 2 2π (b) Zeigen Sie: Es gilt im EM-Algorithmus Pn Pn τi yi i=1 (1 − τi )yi P aj+1 = und bj+1 = Pi=1 , n n (1 − τ ) i i=1 i=1 τi wobei τi := ϕ(yi − bj )/(ϕ(yi − aj ) + ϕ(yi − bj )). (c*) Simulieren Sie einen numerischen MLE und den EM-Algorithmus f¨ ur a = 1, b = 2, n = 100 und f¨ ur verschiedene Werte von j . Konvergiert ϑj f¨ ur j → ∞ gegen den numerischen MLE? ¨ Abgabe vor der Ubung am Freitag, dem 26.6.15. Vorlesung Mathematische Statistik Sommersemester 2015 Humboldt-Universit¨ at zu Berlin Prof. Dr. Markus Reiß ¨ 10. Ubungsblatt 1. Betrachten Sie eine mathematische Stichprobe X1 , . . . , Xn mit Lebesguedichte fµ,σ (x) = σ −1 f ((x − µ)/σ), f ∈ C 2 (R), mit (µ, σ) ∈ Θ ⊆ × + unbekannt (Lokations-Skalen-Familie). Welche Annahmen an f garantieren, dass der MLE asymptotisch normalverteilt ist? Geben Sie die asymptotische Kovarianzmatrix an. R R 2. Betrachten Sie f¨ ur ein bin¨ares statistisches Modell (X , F, (Pϑ )ϑ∈Θ ) mit Θ = {0, 1} das Testproblem H0 : ϑ = 0 gegen H1 : ϑ = 1. Beweisen Sie: (a) Im Neyman-Pearson-Lemma gilt auch die Umkehrung: Jeder gleichm¨aßig beste Test ϕ f¨ ur H0 : ϑ = 0 gegen H1 : ϑ = 1 zum Niveau E0 [ϕ] ∈ (0, 1) besitzt fast sicher die Form eines Neyman-Pearson-Tests. (b) Bei einem Minimax-Test bez¨ uglich 0-1-Verlust sind Fehler 1. und 2. Art gleich: E0 [ϕ] = 1 − E1 [ϕ]. (c) F¨ ur einen Test ϕ mit E0 [ϕ] ∈ (0, 1) sind ¨aquivalent: ϕ ist ein Minimax-Test bez¨ uglich 0-1-Verlust. ϕ besitz fast sicher die Form eines Neyman-Pearson-Tests und es gilt E0 [ϕ] = 1 − E1 [ϕ]. H inweis: (b) kann indirekt durch betrachten von Tests der Form ϕ˜ := χϕ bzw. ϕ˜ := χϕ + (1 − χ) mit χ ∈ (0, 1) bewiesen werden. 3. Es sei X1 , . . . , Xn eine Exp(ϑ)-verteilte mathematische Stichprobe mit ϑ > 0 unbekannt. Konstruieren Sie einen gleichm¨aßig besten Test zum Niveau α ∈ (0, 1) f¨ ur das Testproblem H0 : ϑ 6 1 gegen H1 : ϑ > 1. Geben Sie f¨ ur n = 1 den kritischen Wert k explizit an und zeichnen Sie die G¨ utefunktion f¨ ur α = 0, 05. 4. Es sei X1 , . . . , Xn eine U ([0, ϑ])-verteilte mathematische Stichprobe mit ϑ > 0 unbekannt. Setze X = (X1 , . . . , Xn ). Zeigen Sie: F¨ ur das Testproblem H0 : ϑ ≤ ϑ0 gegen H1 : ϑ > ϑ0 mit festem ϑ0 ist jeder Test ϕ mit Eϑ0 [ϕ(X)] = α, Eϑ [ϕ(X)] ≤ α f¨ ur alle ϑ ≤ ϑ0 und ϕ(X) = 1 f¨ ur max(X1 , . . . , Xn ) > ϑ0 ein gleichm¨ aßig bester Test zum Niveau α ∈ (0, 1). ¨ Abgabe vor der Ubung am Freitag, dem 3.7.15. Vorlesung Mathematische Statistik Sommersemester 2015 Humboldt-Universit¨ at zu Berlin Prof. Dr. Markus Reiß ¨ 11. Ubungsblatt 1. Beweisen Sie das verallgemeinerte Neyman-Pearson-Lemma aus der Vorlesung. Hinweis: Orientieren Sie sich am Beweis des Neyman-Pearson-Lemmas. 2. Es seien X1 , . . . , Xn eine Exp(ϑ)-verteilte mathematische Stichprobe mit ϑ > 0 unbekannt sowie ϑ0 > 0. Konstruieren Sie einen gleichm¨aßig besten unverf¨ alschten Test zum Niveau α ∈ (0, 1) f¨ ur das zweiseitige Testproblem H0 : ϑ = ϑ0 gegen H1 : ϑ 6= ϑ0 . Berechnen Sie (zumindest approximativ) die kritischen Werte im Fall ϑ0 = 1, n = 5, α = 0, 05. 3. Es werden die zwei mathematischen Stichproben X1 , . . . , Xn ∼ Bin(1, p1 ) und Y1 , . . . , Yn ∼ Bin(1, p2 ) mit p1 , p2 ∈ (0, 1) unabh¨angig beobachtet. Konstruieren Sie einen gleichm¨ aßig besten unverf¨alschten Test vom Niveau α ∈ (0, 1) f¨ ur das Testproblem H0 : p1 = p2 gegen H1 : p1 6= p2 . ¨ Abgabe vor der Ubung am Freitag, dem 10.7.15.
© Copyright 2024 ExpyDoc