Maßtheorie Vorlesungsmitschrift Kiel WS2008/09 Professor Dr.Uwe Rösler 20. Dezember 2016 Kapitel 1 Objekte und Morphismen Wir beschreiben im folgenden die hier behandelten Objekte, die Maßräume, und ihre Morphismen (strukturerhaltende Abbildungen), die meßbaren Abbildungen. 1.1 Mengensysteme Sei Ω stets eine nichtleere Menge. Ein Mengensystem A ist eine Teilmenge der Potenzmenge P(Ω). Ein Mengensystem heißt abgeschlossen unter einer Mengenoperation (P(Ω))I → P (Ω) oder stabil , falls diese Operation angewandt auf Mengen aus A wieder ein Element aus A liefert. Beispiele für Mengenoperationen sind: S S S - (endliche, abzählbare, beliebige) Vereinigung e , a , , T T T - (endliche, abzählbare, beliebige) Durchschnitte e , a , , S - Vereinigung paarweiser disjunkter Mengen ◦ , - Komplementbildung Ac = {ω ∈ Ω | ω 6∈ A}, - Differenz A\B = A ∩ B c , - symmetrische Differenz A△B = (A\B) ∪ (B\A), - aufsteigender (absteigender) Limes, T S - Limes superior lim supn∈IN An := m∈IN n≥m An = {ω | |{n | ω ∈ An }| = ∞}, S T - der Limes inferior lim inf n∈IN An := m∈IN n≥m An = {ω | |{n | ω 6∈ An }| < ∞} - der Limes falls lim sup = lim inf usw.. - Obermengen (A ∈ A, A ⊂ B ⇒ B ∈ A) Besonders wichtige Mengensysteme sind Topologien und σ-Algebren. Eine Topologie ist ein Mengensystem, welches die Grundmenge enthält und abgeschlossen ist bezüglich beliebiger Vereinigung und endlichem Durchschnitt. Not: (Ω, τ ) für einen topologischen Raum. Eine Menge heißt offen, genau dann wenn sie Element der Topologie ist. Das Komplement einer offenen Menge heißt abgeschlossen. Topologien sind grundlegend für Konvergenzen. (Alle) Konvergenzbegriffe beruhen auf Topologien (siehe Pedersen [9]). (Ω ∋ xn →n→∞ x ∈ Ω ⇔ ∀U ∈ τ, x ∈ U ∃n0 ∈ IN ∀n ≥ n0 : xn ∈ U .) Die Morphismen (=strukturerhaltenden Abbildungen) sind die stetigen Funktionen (f : (Ω, τ ) → (Ω′ , τ ′ ) stetig ⇔ ∀x ∈ Ω ∀V ′ ∈ τ ′ , f (x) ∈ V ′ ∃U ∈ τ, x ∈ U : f (U ) ⊂ V ). Eine σ-Algebra A ist ein nichtleeres Mengensystem abgeschlossen bezüglich Komplementbildung und abzählbarer Vereinigung. Eine Menge heis̈t mes̈bar, genau dann wenn sie Element der σ-Algebra ist. Die Morphismen sind die mes̈baren Funktionen bzw. Zufallsgrös̈en 1 WS10/11 Maßtheorie (f : (Ω, A) → (Ω′ , A′ ) meßbar ⇔ ∀A′ ∈ A′ : f −1 (A′ ) ∈ A). Not: (Ω, A) ist ein mes̈barer Raum. σ-Algebren sind grundlegend für die Mas̈theorie und die Wahrscheinlichkeitstheorie. Weitere Beispiele sind Filter . Ein Filter ist ein nichtleeres Mengensystem ungleich der Potenzmenge, welches abgeschlossen ist bzgl. endlichem Durchschnitt und Obermengen. In diesem Skript erscheinen weiterhin Algebren und Ringe . Eine Algebra ist ein nicht leeres Mengensysteme, welches abgeschlossen ist bzgl. Komplement und endlicher Vereinigung. Ein Ring ist ein Mengensystem mit der leeren Menge und abgeschlossen bzgl. endlichem Durchschnitt und der symmetrischen Differenz. Bemerkung: Die Namensgebung Ring, siehe Elstrodt, stammt von dem algebraischen Ring der Funktionen 11A , A aus dem Mengenring, über dem binären Körper, versehen mit der Addition 11A + 11B := 11A△B und der Multiplikation 11A 11B := 11A∩B . Der Zusatz σ deutet auf etwas abzählbares hin, vgl. Algebra und σ-Algebra. Erzeuger: Mengensysteme A werden oft nicht explizit angegeben, sondern als kleinstes Mengensystem charakterisiert, welches ein Mengensystem E enthält und abgeschlossen ist bzgl. gewisser Mengenoperationen. Dieses kleinste Mengensystem A, wenn es existiert, ist der Durchschnitt aller Mengensysteme, abgeschlossen bzgl. der Operationen und E enthaltend. Das Mengensystem E heis̈t Erzeuger von A (bzgl. den Operationen ...) und A heis̈t das von E erzeugte Mengensystem. Beispiele: Die Borelsche σ-Algebra für einen topologischen Raum (Ω, τ ) ist die kleinste von der Topologie erzeugten σ-Algebra. Die übliche Topologie auf den reellen Zahlen wird erzeugt von allen offenen Intervallen. 1.1.1 σ-Algebren Eine σ-Algebra A ist ein nichtleeres Mengensystem abgeschlossen bezüglich Komplementbildung und abzählbarer Vereinigung. Ausführlicher: A ⊂ P(Ω) erfüllt i) A = 6 ∅ ii) A ∈ A ⇒ Ac ∈ A S iii) An ∈ A, n ∈ IN ⇒ n An ∈ A. Ein mes̈barer Raum ist ein Tupel (Ω, A). Hierbei ist Ω eine nichtleere Menge und A eine σ-Algebra darüber. Eine mes̈bare Menge ist ein Element der σ-Algebra. Proposition 1 Jede σ-Algebra enthält die leere Menge und die Grundmenge Ω. Sie ist abgeschlossen bzgl. endlicher und abzählbarer Vereinigung, endlichem und abzählbarem Durchschnitt, Differenz, symmetrischer Differenz, aufsteigenden oder absteigenden Folgen, Limes superior und dem Limes inferior. Beweis: Ist A aus der σ-Algebra, so auch das Komplement Ac . Die Vereinigung über aller Glieder der Folge A, Ac , Ac , Ac . . . ist in A. Damit ist die Grundmenge Ω in der σ-Algebra. Die leere Menge ist das Komplement der Grundmenge Ω. Jede endliche Folge läs̈t sich zu einer abzählbaren Folge erweitern durch hinzunehmen der leeren Menge. Daher ist A abgeschlossen bzgl. endlicher Vereinigung. T S Für den Durchschnitt argumentiere ( An )c = Acn ist mes̈bar. Der Rest ist Übung. q.e.d. Für E ∈ P(Ω) sei σ(E) die kleinste σ-Algebra, die E enthält. Formaler ausgedrückt: \ σ(E) := E⊂A σ−Algebra 2 A. WS10/11 U. Rösler (Übung: Dies ist die kleinste E enthaltende σ-Algebra.) Ein Erzeuger E einer σ−Algebra A ist ein Mengensystem mit σ(E) = A. Der Operator σ hat u.a. die Eigenschaften σ(σ(E)) = σ(E) und E ⊂ E ′ ⇒ σ(E) ⊂ σ(E ′ ). Beispiele: – Die kleinste σ-Algebra ist stets {∅, Ω}, die nächst grös̈ere ist {∅, A, Ac , Ω} für ein A 6= ∅, Ω. (Übung: Nächstgrös̈ere?) – Die Potenzmenge P(Ω) ist die grös̈te σ-Algebra. – Die Menge {A ⊂ Ω | A oder Ac abzählbar} ist eine σ-Algebra. – Sei A eine σ-Algebra und B eine beliebige Menge aus Ω. Die eingeschränkte σ-Algebra ist A|B := {A ∩ B | A ∈ A}. – Die Borel σ-Algebra B = σ(τ ) wird von einer Topologie τ auf Ω erzeugt. Die Baire σ-Algebra wird erzeugt von der kleinsten Topologie, so das̈ alle stetigen Funktionen (bzgl. τ ) mit kompaktem Träger stetig sind. Spezialisierung auf IR : Der euklidische Abstand definiert eine Metrik auf den reellen Zahlen. Die offenen Kugeln bezüglich dieser Metrik sind die offenen Intervalle ]a, b[, a, b ∈ IR. Diese erzeugen die (metrische) Topologie auf den reellen Zahlen. Jede offene Menge in IR ist darstellbar als Vereinigung abzählbar vieler offener Intervalle. Daher wird die Borel σ-Algebra auch von allen offenen Intervallen erzeugt. Andere Erzeuger für die Borel σ-Algebra B auf IR sind die Topologie selber, das Mengensystem aller kompakten Mengen, die Mengensysteme E[,] := {[a, b] | a, b ∈ IR} aller abgeschlossenen Intervalle oder analog E],] , E[,[ aller halboffenen Intervalle. Es reicht hier a, b aus einer dichten Teilmenge von IR, z.B. Ql, zu fordern. Ebenso reichen einseitige Intervalle, denn es kann stets a = −∞ oder auch b = ∞ gesetzt werden. Stellvertretend zeigen wir nur die Richtung σ(E],[ ) ⊂ σ(E[,[ ). Es reicht zu zeigen ]a, b[∈ σ(E[,] ) für jedes a, b. Dies folgt aus E[,] ∋ ∪n [a + 1/n, b[=]a, b[. Die Borel σ-Algebra auf den reellen Zahlen wird erzeugt von allen Kompakta. Diverses: – Eine σ−Algebra A heis̈t separierend, falls es für alle ω 6= ω ′ eine mes̈bare Mengen A ∈ A gibt mit ω ∈ A und ω ′ 6∈ A. Durch Äquivalenzklassenbildung auf dem Grundraum Ω können wir eine σ-Algebra überführen in eine separierende σ-Algebra. Betrachte auf dem Grundraum Ω die Äquivalenzrelation ω ∼ ω ′ ⇔6 ∃A ∈ A : ω ∈ A, ω ′ 6∈ A. Seien [ω] die Äquivalenzklassen. Dann ist A/ ∼:= {{[a] | a ∈ A} | A ∈ A}) eine separierende σ−Algebra bezüglich Ω/ ∼:= {[ω] | ω ∈ Ω}. – Ein Atom einer σ−Algebra ist eine mes̈bare Menge, die nicht in echt kleinere meßbare Mengen zerlegt werden kann. (∀ B ∈ A, B ⊂ A ⇒ B = ∅ ∨ B = A) Im Regelfall sind die Atome genau die Punktmengen {ω}. Jede separierende σ−Algebra über einem abzählbaren Grundraum ist die Potenzmenge. Die Atome sind die einelementigen Mengen {ω}. 1.1.2 Nachweis einer σ-Algebra Zum Nachweis eines Mengensystems als σ-Algebra sind zwei Methoden wichtig, über Dynkinsysteme und über monotone Klassen. Dynkinsystem: Ein Dynkinsystem D ist ein nicht leeres Mengensystem abgeschlossen bzgl. der Differenz aufsteigender Mengen und bzgl. der abzählbaren Vereinigung paarweise disjunkter Mengen. (Ausführlicher: ∅ = 6 D ⊂ P(Ω) erfüllt i) D ∋ A ⊂ B ∈ D ⇒ B\A ∈ D S ii) An ∈ D, n ∈ IN, paarweise disjunkt ⇒ ◦ n An ∈ D. 3 WS10/11 Maßtheorie Lemma 2 Ein Dynkinsystem D ist genau dann eine σ-Algebra, wenn D den Grundraum Ω enthält und bzgl. endlichem Durchschnitt abgeschlossen ist. Beweis: Jede σ-Algebra ist ein Dynkinsystem, welches abgeschlossen ist bzgl. endlichem Durchschnitt. Für die Umkehrung sind die drei Eigenschaften einer σ-Algebra zu zeigen. Für die dritte argumentiere: Zu Dn ∈ D definiere Bn := Dn \∪i<n Di . Diese Mengen sind paarweise S S S disjunkt und erfüllen Bn = Dn ∩ ∩i<n Dic ∈ D und ◦ n≤N Bn = n≤N Dn für N ∈ IN {∞}. S q.e.d. Hieraus folgt n∈IN Dn ∈ D. T Bezeichne D(E) das kleinste von E erzeugte Dynkinsystem. (Formaler: D(E) := E⊂B Dynkinsystem B tut’s.) Ein Erzeuger eines Dynkinsystems D ist ein Mengensystem E mit D(E) = D. Lemma 3 Ein Dynkinsystem mit Ω ist genau dann eine σ-Algebra, wenn es einen Erzeuger abgeschlossen bzgl. endlichem Durchschnitt besitzt. Beweis: Ist das Dynkinsystem D eine σ-Algebra, so ist D selbst ein Erzeuger und abgeschlossen bzgl. endlichem Durchschnitt. Für die Umkehrung betrachte DA := {B ∈ D | A ∩ B ∈ D} mit A ∈ D. Dies ist ein Dynkinsystem (Übung). Für jedes Element E aus dem durchschnittstabilen Erzeuger E von D enthält DE den Erzeuger E. Damit gilt E ⊂ DE ⊂ D und wegen der Sandwichposition D(E) = DE = D. Als direkte Folgerung enthält jedes DA , A ∈ D den Erzeuger E und die Sandwichposition impliziert gilt D(E) = DA = D. Damit ist D durchschnittstabil und nach Lemma 2 eine σ-Algebra. q.e.d. Monotone Klasse: Eine monotone Klasse ist ein Mengensystem abgeschlossen bzgl. aufsteigenden und absteigenden Folgen. Sei M(E) die von E erzeugte kleinste monotone Klasse. Hierbei ist M(E) die kleinste monotone Klasse welche E enthält. (Formaler: M(E) := T E⊂B monotone Klasse B.) Eine Algebra ist ein Mengensystem welches Ω enthält und abgeschlossen ist bzgl. Komplement und endlicher Vereinigung. Lemma 4 Eine monotone Klasse erzeugt von einer Algebra ist eine σ-Algebra. Beweis: Sei A die Algebra und M = M(A) die erzeugte monotone Klasse. • M ist komplementabgeschlossen. Das Mengensystem {A ∈ M | Ac ∈ M} ist eine monotone Klasse und enthält die Algebra A (Übung). Damit ist das Mengensystem bereits M selbst. • M ist eine Algebra. Wir haben nur die endliche Durchsschnittsabgeschlossenheit zu zeigen. Für A ∈ M betrachte MA := {B ∈ M | A ∪ B ∈ M}. Dies ist eine monotone Klasse. Für A aus der Algebra enthält MA das Erzeugersystem A und ist damit M selber (Sandwichposition). Die Menge {A ∈ M | MA = M} ist eine monotone Klasse und enthält die Algebra. Damit ist dies M selbst. • Eine Algebra, die auch eine monotone Klasse ist, ist eine σ-Algebra. Nur die Abgeschlossenheit gegenüber abzählbarer Vereinigung ist zu zeigen. Sei An eine Folge aus der Algebra. Die Folge ∪i≤n Ai ist aus der Algebra und konvergiert aufsteigend gegen ∪i Ai . Der Grenzwert ist in der monotonen Klasse. q.e.d. 4 WS10/11 1.2 U. Rösler Meßbare Abbildungen Meßbare Abbildungen sind die Morphismen, d.h. die strukturerhaltenden Abbildungen bezüglich mes̈barer Räume. Eine Abbildung zwischen meßbaren Räumen heißt meßbar , falls das Urbild jeder meßbaren Menge meßbar ist. Formaler formuliert, eine Abbildung f : Ω → Ω′ von einem meßbaren Raum (Ω, A) in einen anderen meßbaren Raum (Ω′ , A′ ) ist meßbar, falls für jede Menge A ∈ A gilt f −1 (A′ ) ∈ A. Kürzer formuliert f −1 (A′ ) ⊂ A. Merkregel: Die mengentheoretische Struktur wird durch Funktionen zurückgeholt. Das Urbild einer σ-Algebra ist stets eine σ-Algebra. Das Bild f (A) einer σ-Algebra ist im allgemeinen keine σ-Algebra. Bemerkung: Die Morphismen für topologische Räume sind die stetigen Funktionen. Eine Funktion auf topologischen Räumen heißt stetig, falls das Urbild offener Mengen offen ist. Proposition 5 Die Komposition meßbarer Funktionen ist meßbar. Beweis: Mit entsprechender Notation (f ◦ g)−1 (A′′ ) = g −1 (f −1 (A′′ )) ⊂ A. q.e.d. Proposition 6 Eine Funktion ist genau dann meßbar, wenn das Urbild eines (und dann jedes) Erzeugers in der σ-Algebra liegt. Beweis: Nur die Rückrichtung ist zu zeigen. Sei f : Ω 7→ Ω′ die Funktion und E ′ ein Erzeuger von A′ . Dann ist {A′ ∈ A′ | f −1 (A′ ) ∈ A} eine E ′ enthaltende σ-Algebra und damit gleich A′ . q.e.d. Folgerung: Jede stetige Funktion ist Borel meßbar. (Per Definition der Stetigkeit ist das Urbild jeder offenen Menge offen ist). Jede stetige Funktion mit kompaktem Träger ist meßbar bezüglich der Baire σ-Algebra. (Die kleinste Topologie, bzgl. der alle stetigen Funktionen mit kompaktem Träger stetig sind, ist ein Erzeugendensystem der Baire σ-Algebra.) Notation: F((Ω, A), (Ω′ , A′ )) bezeichne die Menge aller A − A′ meßbaren Funktionen f : Ω 7→ Ω′ . Der Einfachheit halber benutzen wir auch F(Ω, A) oder aber F. Notation: Anstelle der korrekten Schreibweise {ω ∈ Ω | f (ω) ∈ A′ } für das Urbild von A′ unter f benutzen wir {f ∈ A′ } oder auch f ∈ A′ . Allgemein wird die Realisierung ω weggelassen wenn immer möglich. Dies ist ein allgemein akzeptierter (kleiner) Notationsmißbrauch. Spezialisierung auf IR: Die reellen Zahlen seien stets mit der Borel σ-Algebra B versehen. Sei f : Ω 7→ IR eine Funktion. In Formeln unterdrücken wir nach Möglichkeit das ω aus Gründen der Übersichtlichkeit. Dies führt zuweilen zu einem Notationsmißbrauch. Wir schreiben z.B. {f ≥ x} für {ω ∈ Ω | f (ω) ≥ x}. Eine Funktion f : Ω 7→ IR ist genau dann meßbar, wenn eine der äquivalenten Kriterien erfüllt ist: - ∀x ∈ IR : {f ≥ x} ∈ A, - ∀x ∈ IR : {f > x} ∈ A, - ∀x ∈ IR : {f ≤ x} ∈ A, - ∀x ∈ Ql : {f < x} ∈ A. Die Aussage gilt auch, falls obiges nur für x aus einer dichten Teilmenge von IR gefordert wird. 5 WS10/11 Maßtheorie Proposition 7 Seien fn : Ω 7→ IR, n ∈ IN, mes̈bare Funktionen. Dann sind meßbar, sofern wohldefiniert und endlich, f1 +f2 , −f1 , f1 f2 , 1/f1 , supn fn , inf n fn , lim supn fn , lim inf n fn , limn fn . S Beweis: Die Kernpunkte für die Meßbarkeit sind {f + g < x} = q∈Ql{f < x + q, g < −q}, S {−g < x} = {g > −x}. Bezüglich der Multiplikation argumentiere {f g < x} = q∈Ql{f < x/q, g < q} ist meßbar für f, g überall strikt grös̈er als 0. Allgemeine f, g zerlege in Positivund Negativteil. {lim supn fn > x} = lim supn {fn > x}, lim sup fn = − lim inf −fn , lim fn = S 11lim sup fn =lim inf fn lim sup fn , {supn fn > x} = n {fn > x}, inf fn = − sup(−fn ). q.e.d Warnung: In obiger Proposition ist die Abzählbarkeit der Operationen wichtig. Das Supremum überabzählbar vieler meßbarer Funktionen ist im allgemeinen nicht mehr meßbar. Jedoch ist es schwer, eine nicht messbare Funktion anzugeben. Dies ist (im ZFC-Axiomensystem) nur mit Hilfe des Auswahlaxiomes möglich. Wir erweitern die reellen Zahlen um +∞, −∞ zu IR. Sei eine isotone (ordnungserhalx tende) und bijektive Abbildung von IR auf (−1, 1) gegeben, etwa x 7→ 1+|x| . Erweitere diese Abbildung durch Zuordnung von +∞, −∞ nach +1, −1. Versehe IR mit der zurückgeholten Topologie und entsprechenden Borel σ-Algebra. (Diese ist unabhängig von der gegebenen Bijektion.) Wir benutzen ebenso IN , Ql und ZZ. Die obigen Aussagen gelten sinngemäß auch für erweiterte Funktionen f : Ω 7→ IR. Der Raum der meßbaren, reellwertigen Funktion ist ein Vektorraum. Dies gilt nicht, falls wir die Werte +∞, −∞ zulassen. Die Baire σ-Algebra ist gleich der Borel σ-Algebra für die reellen Zahlen. 1.3 Mengenfunktionen Wir betrachten Mengenfunktionen von einem Mengensystem in die reellen oder erweiterten reellen Zahlen. Eine Mengenfunktion µ : A 7→ IR oder erweiterte Mengenfunktion µ : A 7→ IR heißt - positiv , falls µ(A) ≥ 0 für alle A ∈ A, - isoton bzw. ordnungserhaltend , falls µ(A) ≤ µ(B) für A ⊂ B, S - additiv , falls µ(A ◦ B) = µ(A) + µ(B) S P - σ-additiv , falls µ( ◦ n∈IN An ) = n∈IN µ(An ), - σ-stetig von unten , falls limn µ(An ) = µ(limn An ) für aufsteigende An , - σ-stetig von oben, falls limn µ(An ) = µ(limn An ) für absteigende An , - σ-stetig in der leeren Menge, falls µ(An ) ց µ(∅) für An ց ∅, P S - subadditiv , falls µ( i∈I Ai ) ≤ i∈I µ(Ai ) gilt für I endlich. - σ-subadditiv , falls obiges gilt für abzählbare Indexmengen I abzählbar. S S Hierbei sind A, B, A B, An , n An aus dem Mengensystem. Bemerkung: σ steht stets für etwas Abzählbares. 1.3.1 Maße Ein Maß ist eine positive, σ-additive, erweiterte Mengenfunktion nicht identisch unendlich auf einer σ-Algebra. Die Eigenschaften in äquivalenten (Übung), formelmäßigen Aussagen, sind i) µ(∅) = 0 ii) ∀A ∈ A ⇒ µ(A) ≥ 0 6 WS10/11 S U. Rösler P iii) An ∈ A, n ∈ IN, paarweise disjunkt ⇒ µ( ◦ n An ) = n µ(An ). Ein Maßraum (Ω, A, µ) ist ein meßbarer Raum versehen mit einem Maß. Ein endliches Maß ist ein Maß µ(Ω) < ∞. Ein Wahrscheinlichkeitsmaß ist ein Maß mit µ(Ω) = 1. Ein Wahrscheinlichkeitsraum ist ein Maßraum mit einem Wahrscheinlichkeitsmaß. Jedes endliche Maß µ läßt sich zu einem W-maß transformieren via cµ mit c = 1/µ(Ω). Notation: P (=Probability) für ein W-maß. Proposition 8 (Mas̈eigenschaften) Jedes Maß ist additiv, isoton, endlich subadditiv und σ-subadditiv. Beweis: • Additiv Erweitere die endliche Folge durch die leere Menge zu einer abzählbaren Folge und verwende die σ-Additivität. • Isoton Für mes̈bare Mengen A ⊂ B gilt µ(B) = µ(A) + µ(B\A) ≥ µ(A). • Subadditiv und σ-Subadditiv Wir verwenden die Disjunktifizierung. Für eine Folge An mes̈barer Mengen definiere rekurS S siv B1 = A1 und Bn = An \ ∪i<n Ai . Dann sind die Bn paarweise disjunkt, ◦ i≤n Bi = i≤n Ai und es gilt X [ X µ(An ). µ(Bn ) ≤ µ(∪n An ) = µ( ◦ Bn ) = n n n q.e.d. Ein Punktmaß auf ω ∈ Ω ist ein W-maß δω mit δω (A) = 11A (ω). Ein diskretes Maß ist eine positiv gewichtete Summe von Punktmaßen. Jedes diskrete Maß hat eine Darstellung P + µ = ω∈Ω f (ω)δω mit einer Funktion f : Ω → R . Die Abbildung zwischen diskreten Maßen und erweiterten Funktionen f wie oben ist bijektiv (vorausgesetzt die σ−Algebra umfaßt alle Punktmengen {ω}). Es gilt X f (ω). µ(A) = ω∈A Ein diskreter Wahrscheinlichkeitsraum ist ein Maßraum mit diskretem W-maß. Ein Laplaceraum ist ein diskreter Wahrscheinlichkeitsraum mit endlicher Grundmenge und dem Maß |A| P (A) = . |Ω| Das Zählmaß ist das Maß µ mit µ(A) = |A|. Hier einige Beispiele und Standardkonstruktionen Bernoulliverteilung Ber(p) zum Parameter 0 ≤ p ≤ 1. Ω = {0, 1}, A = Pot(Ω), µ({1}) = p = 1 − µ({0}) =: 1 − q. Geometrische Verteilung Geo(p) zum Parameter 0 ≤ p ≤ 1. Ω = IN0 , A = Pot(Ω), µ({k}) = qpk. Poissonverteilung Poi(λ) zum Parameter λ > 0. Ω = IN0 , A = Pot(Ω), µ({k}) = k e−λ λk! . Binomialverteilung Bin(n,p) zu den Parametern n ∈ IN und p ∈ [0, 1]. Der W-raum ist (Ω = {0, 1, . . . , n}, P(Ω), P ) mit P (k) = ! n k p (1 − p)n−k k 7 WS10/11 Maßtheorie für k ∈ Ω. Beispiel: Sei Ω überabzählbar. Das Mengensystem der Teilmengen A ⊂ Ω mit A abzählbar oder Ac abzählbar ist eine σ-Algebra. Die Mengenfunktion µ mit µ(A) = 0 falls A abzählbar und ∞ anderenfalls ist ein Maß. Eingeschränktes Maß: Sei Q eine meßbare Menge. Die Einschränkung (Q, A|Q ) := {Q ∩ A | A ∈ A}), µ|Q := µ) mit µ|Q : A|Q → IR die Einschränkung, ist ein Maßraum. bedingte Wahrscheinlichkeit: Ist P ein W-mass und P (Q) > 0, so sprechen wir von A ∋ A 7→ P (A | Q) := P (A ∩ Q) P (Q) als bedingte W-keit von P unter Q. Erweitertes Maß: Durch Umkehrung obiger Konstruktion läßt sich ein Maß erweitern. Übung. Mit M = M (Ω, A) bezeichnen wir den Raum der Maße über dem meßbaren Raum (Ω, A). Dies ist ein konvexer Kegel (= eine konvexe Menge, die positive Vielfache enthält). (Die Addition ist gegeben durch (µ + ν)(·) = µ(·) + ν(·) und die Multiplikation durch (cµ)(·) = c(µ(·)) für c ≥ 0). Die W-maße bilden eine konvexe Menge. Die Menge V := {µ − ν | µ, ν endliche Maße } ist ein Vektorraum. Die Element heißen Ladungsverteilung . Bildmaß: Sei f : Ω 7→ Ω′ eine meßbare Funktion, (Ω, A, µ) ein Maßraum und (Ω′ , A′ ) ein meßbarer Raum. Die Mengenfunktion µf , definiert durch A′ ∋ A′ 7→ µ(f −1 (A′ )) ist ein Maß auf A′ . Es heißt transportiertes Maß oder auch Bildmaß . Eine maßerhaltende Abbildung ist eine messbare Funktion f : Ω 7→ Ω′ auf Maßräumen (Ω, A, µ), (Ω′ , A′ , µ′ ) mit µf = µ′ . Isomorphismen Die Isomorphismen auf Mas̈räumen sind mas̈erhaltende Isomorphismen der mes̈baren Räumen. (Isomorphismen der meßbaren Räume sind meßbare bijektive Funktionen der Grundräume, deren Inverses meßbar ist. 1.3.2 Warum σ-Additivität? Die σ−Additivität ist äquivalent zu einer σ-Stetigkeit. Grundlegend ist das Theorem 9 Sei (Ω, A) ein meßbarer Raum und µ : A 7→ IR eine positive, additive, erweiterte Mengenfunktion mit µ(∅) = 0. µ ist ein Maß genau dann, wenn es σ-stetig von unten ist. Ist µ endlich, so sind äquivalent: i) µ ist σ-stetig von unten. ii) µ ist σ-stetig von oben. iii) µ ist σ-stetig in der leeren Menge. iv) µ ist σ-stetig. 8 WS10/11 U. Rösler Beweis: ’⇒’ War schon beweisen. ’⇐’ Sei An ∈ A, n ∈ IN eine Folge paarweise disjunkter meßbarer Menge. Dann ist Bn := ∪i≤n Ai aufsteigend gegen B = ∪n An . Es folgt µ(B) = lim µ(Bn ) = lim n n n X µ(An ) = i=1 X µ(An ). n i) ⇒ ii) Sei Bn ց B ∈ A. Betrachte Bnc ր B c und verwende µ(Ω) − µ(Bn ) = µ(Bnc ) ր µ(B c ) = µ(Ω) − µ(B). ii) ⇒ i) Für An ր A betrachte Acn ց Ac und argumentiere analog. ii) ⇒ iii) Spezialisierung. iii) ⇒ ii) Für An ց A betrachte An \A ց ∅. i) ⇔ iv) Benutze ii) und Definition. 1.3.3 q.e.d. Vollständige und σ-endliche Mas̈räume Sei (Ω, A, µ) ein Maßraum. Eine µ-Nullmenge ist eine Menge aus dem Grundraum, für die es eine meßbare Obermenge A mit µ(A) = 0 gibt. Eine Nullmenge braucht nicht mes̈bar zu sein. Die Menge N aller Nullmengen (bzgl. µ) ist abgeschlossen bzgl. abzählbarer Vereinigung und Teilmengen. Ein Maßraum heis̈t vollständig falls die σ-Algebra alle Nullmengen enthält. Die kleinste σ-Algebra Av erzeugt von A und allen µ-Nullmengen heißt Vervollständigung von A bzgl. µ. Proposition 10 Av = {A ∪ N | A ∈ A, N ∈ N } = {B ⊂ Ω | ∃A, C ∈ A : A ⊂ B ⊂ C, µ(C\A) = 0} Beweis: Einfach. Die Mengensysteme sind σ-Algebren und enthalten A und N . Sie sind auch nicht größer. q.e.d. Wir können stets das Maß µ auf die vervollständigte σ-Algebra Av als Maß fortsetzen durch µv (Av ) = µ(A) mit Av = A ∪ N, Av ∈ Av , A ∈ A, N ∈ N . Übung. Eine Aussage A über Realisierungen ω gilt fast sicher , (f.s.), falls sie bis auf eine Nullmenge für alle Realisierungen gilt. σ-Endlichkeit: Viele Aussagen über Mas̈e werden zuerst für endliche Mas̈e gezeigt und dann für σ-endliche. Ein Mas̈ µ heißt σ-endlich, falls es eine gegen Ω aufsteigende Folge von Mengen An ∈ A endlichen Mas̈es gibt. Äquivalent ist die Existenz einer Zerlegung (Bn )n von Ω S in abzählbar viele Mengen endlichen Maßes gibt. (∃Bn ∈ A, n ∈ IN ◦ n Bn = Ω, µ(Bn ) < ∞.) (Die Äquivalenz ersieht man aus Bn = An \An−1 .) Der Schritt von endlichem Mas̈ auf σendliches Mas̈ beruht in der Regel auf der abzählbaren disjunkten Zerlegung Bn . Zeige die Eigenschaft auf jedem Bn und setze dann zusammen. (Genauer, erst für das Mas̈ A ∋ A → P µ(A ∩ Bn ) und dann für A ∋ A 7→ µ(A) = n µ(A ∩ Bn ).) Der Schritt von endlichem Mas̈ auf beliebiges, nicht σ-endliches Mas̈ beruht häufig auf einer lokalen Form der Aussage. Argumentiere die Eigenschaft gilt lokal, d.h. in allen (geeigneten) Mengen von endlichem Mas̈, wobei hierauf angewandt das Mas̈ endlich ist. Der Satz von Caratheodory ist von dieser Struktur. 9 WS10/11 10 Maßtheorie Kapitel 2 Über die Existenz von Maßen Dieser Abschnitt zeigt die Existenz von nicht diskreten Maßen via der Caratheodory Maßerweiterung. Anschließend betrachten wir Maße auf den reellen Zahlen, insbesonders das Lebesguemaß, und zeigen einige Eigenschaften. Heuristik: Es geht um die Existenz von allgemeinen Maßen. Dazu wird auf einem speziellen Mengensystem einfacher Struktur eine additive Mengenfunktion konstruiert und dann zu einem Maß fortgesetzt. Der (vielleicht) mathematisch natürlichere Zugang ist eine Erweiterung über Kapazitäten, siehe Meyer [8]. Wir benutzen den elementareren Zugang über das äußere Maß. Standardbeispiele sind das Lebesgue Maß und Maße auf Produkträumen. Ein Ring ist ein Mengensystem mit der leeren Menge und abgeschlossen bzgl. endlichem Durchschnitt und der symmetrischen Differenz. (Äquivalent ist, enthält die leere Menge und ist abgeschlossen bzgl. endlicher Vereinigung und der Differenz.) Ein Inhalt auf einem Ring ist eine positive, additive und erweiterte Mengenfunktion. Ein Prämaß auf einem Ring ist ein von unten σ-stetiger Inhalt. Ein Prämaß auf einer σ-Algebra ist ein Maß. Satz 11 (Caratheodory) Jedes Prämaß auf einem Ring läßt sich fortsetzen zu einem Maß auf die vom Ring erzeugte σ-Algebra. 2.0.4 Beweis und Eindeutigkeit von Caratheodory Ein äußeres Maß ist eine isotone, σ-subadditive, erweiterte Mengenfunktion auf der Potenzmenge, die die leere Menge auf die Null abbildet. In Formeln, µ∗ : P(Ω) 7→ IR mit i) µ∗ (∅) = 0 ii) A ⊂ B ⇒ µ∗ (A) ≤ µ∗ (B) Isotonie P S Subadditivität. iii) An ∈ P(Ω), n ∈ IN ⇒ µ∗ ( n An ) ≤ n µ∗ (An ) Hierbei wird die Konvention inf ∅ = ∞ benutzt. Eine µ∗ -meßbare Menge ist eine Menge A ⊂ Ω, die µ∗ (Q) ≥ µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac ) (2.1) für alle Q ⊂ Ω erfüllt. Wegen der σ-Subadditivität folgt dann Gleichheit. Sei A∗ die Menge aller µ∗ -meßbaren Menge. Lemma 12 Für jedes äußere Maß µ∗ ist (Ω, A∗ , µ∗ ) ein Maßraum. Beweis: • A∗ ist eine Algebra. 11 WS10/11 Maßtheorie Das Mengensystem A∗ enthält Ω und ist komplementabgeschlossen. Seien A, B ∈ A∗ . Dazu etabliere µ∗ (Q) = µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac ) = µ∗ (Q ∩ A ∩ B) + µ∗ (Q ∩ A ∩ B c ) + µ∗ (Q ∩ Ac ∩ B) + µ∗ (Q ∩ Ac ∩ B c ) Q durch Q ∩ (A ∪ B) ersetzt in (2.1) ergibt µ∗ (Q ∩ (A ∪ B)) = µ∗ (Q ∩ A ∩ B) + µ∗ (Q ∩ A ∩ B c ) + µ∗ (Q ∩ Ac ∩ B). Die Subtraktion beider Zeilen ergibt die Behauptung. • µ∗ ist ein Inhalt auf A∗ . S Setze Q = A ◦ B in (2.1). • A∗ ∋ An ր A ⇒ µ∗ (Q ∩ An ) ր µ∗ (Q ∩ A) Definiere Bn := An \An−1 . Bn , n ∈ IN, ist eine Folge paarweiser disjunkter Mengen aus S ∗ A mit ◦ ni=1 Bi = An . Per Induktion nach n zeige n X i=1 µ∗ (Q ∩ Bi ) = µ∗ (Q ∩ An ). Dies ist leicht. Damit folgt die obere Behauptung via lim µ∗ (Q ∩ An ) = n X n µ∗ (Q ∩ Bn ) ≥ µ∗ (Q ∩ ( [ n Bn )) = µ∗ (Q ∩ A). • A∗ ist σ-Algebra. Mit An wie oben µ∗ (Q) = µ∗ (Q ∩ An ) + µ∗ (Q ∩ Acn ) ≥ µ∗ (Q ∩ An ) + µ∗ (Q ∩ Ac ) liefert das gewünschte µ∗ (Q) ≥ µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac ). • µ∗ ist ein Maß auf A∗ . µ∗ ist Inhalt auf A∗ und σ-Stetigkeit von unten. q.e.d. Proposition 13 Die σ-Algebra A∗ ist vollständig bzgl. dem äußeren Maß µ∗ . Bew: Sei N eine µ∗ -Nullmenge, d.h. ∃A ∈ A∗ : N ⊂ A ∈ A∗ , µ∗ (A) = 0. Dann impliziert µ∗ (Q ∩ N ) + µ∗ (Q ∩ N c ) ≤ µ∗ (A) + µ∗ (Q) die Aussage. Über die Eindeutigkeit gibt der folgende Satz Auskunft. Satz 14 Seien µ, ν zwei Maße, die auf einem Erzeuger der σ-Algebra A übereinstimmen. Der Erzeuger sei abgeschlossen bzgl. endlichem Durchschnitt und es gebe eine gegen Ω aufsteigende Folge En aus dem Erzeuger mit endlichem µ-Maß. Dann sind µ und ν identisch. Beweis: Sei E aus dem Erzeuger mit µ(E) < ∞ und DE := {A ∩ E | A ∈ A, µ(A ∩ E) = ν(A ∩ E)}. • DE ist die Einschränkung A|E der σ-Algebra A auf E. 12 WS10/11 U. Rösler Das Mengensystem DE ist ein Dynkinsystem (leicht) und enthält den ∩-stabilen Erzeuger eingeschränkt auf E. Nach (Lemma 2) ist DE eine σ-Algebra und damit = A|E . •µ=ν Argumentiere µ(A) = limn µ(A ∩ En ) = limn ν(A ∩ En ) = ν(A). q.e.d. Bem: Ohne die σ-Endlichkeit auf dem Erzeuger ist die Eindeutigkeit nicht gegeben. Betrachte als Erzeuger die Menge aller halboffenen Intervalle (a, b] mit a < b. Als Mas̈e wähle das Zählmaß und das triviale Maß, welches jeder Menge ungleich der leeren Menge den Wert ∞ zuordnet. Beide Maße sind gleich auf dem Erzeuger, aber verschieden auf der erzeugten σ-Algebra, hier die Borel σ-Algebra. (Auch die Hausdorffmaße tun’s.) Proposition 15 Sei M ein Mengensystem mit der leeren Menge und µ eine positive, erweiterte Mengenfunktion auf M mit µ(∅) = 0. Dann ist die Mengenfunktion µ∗ : P(Ω) 7→ IR definiert durch X [ µ∗ (Q) := inf{ µ(Mn ) | Vn ∈ M, Q ⊂ Mn } n n∈IN ein positives äußeres Maß. Beweis: Nur die dritte Eigenschaft ist zu zeigen. Sei Q = ∪n Qn . Wähle zu vorgegebenen ǫn > 0 P eine Überdeckung Mn,m ∈ M, m ∈ IN, von Qn mit µ∗ (Qn ) ≤ m µ(Mn,m ) ≤ µ∗ (Qn ) + ǫn . S S Aus Q ⊂ n Qn ⊂ n,m Mn,m folgt µ∗ (Q) ≤ X n,m µ(Mn,m ) ≤ X (µ∗ (Qn ) + ǫn ). n P Dies gilt für alle Folgen ǫn , d.h. µ∗ (Q) ≤ n µ∗ (Qn ). q.e.d. Beweis von Caratheodory: Sei µ das Prämaß auf dem Ring R und sei µ∗ das äußere Maß dazu (Proposition 15). • µ = µ∗ auf R. Die Richtung µ∗ ≤ µ auf dem Ring folgt aus der Definition des äußeren Maßes. Für die P Umkehrung sei R ∈ R und Rn ∈ R eine Überdeckung von R mit µ∗ (R) ≤ n µ(Rn ) ≤ µ ∗ (R) + ǫ für gegebenes ǫ > 0. µ(R) = lim µ(R ∩ ∪i≤n Rn ) ≤ lim µ(∪i≤n Rn ) ≤ lim n→∞ n n X i≤n µ(Ri ) ≤ X n µ(Rn ) ≤ µ∗ (R) + ǫ • R ⊂ A∗ P Sei R ∈ R und Rn ∈ R, n ∈ IN eine Überdeckung von Q mit µ∗ (Q) ≤ n µ(Rn ) ≤ µ ∗ (Q) + ǫ. µ∗ (Q) + ǫ ≥ X n µ(Rn ) = X n (µ(Rn ∩ R) + µ(Rn ∩ Rc ) ≥ µ∗ (Q ∩ R) + µ∗ (Q ∩ Rc ) Dies gilt für alle ǫ > 0. Mit σ(R) ⊂ A∗ endet der Beweis. q.e.d. Bem: Die µ∗ -meßbaren Mengen A sind genau diejenigen, so dass für jedes R aus dem Ring von endlichem Maß und jedes ǫ ein Ringelement S existiert mit µ∗ ((A ∩ R)△S) < ǫ gilt. Noch anders ausgedrückt, ∪i ∩n Rn,i ⊂ A ∩ R ⊂ ∩i ∪n Sn,i mit R· , s· Ringelemente und die rechte Menge minus der linken ist eine µ∗ -Nullmenge. 13 WS10/11 2.0.5 Maßtheorie Wann ist ein Inhalt ein Prämaß Wann ist ein Inhalt σ-stetig von unten? Eine kompakte Klasse oder ein Mengensystem mit der endlichen Durchschnittseigenschaft ist ein Mengensystem, sodaß jede abzählbare Auswahl mit gemeinsamem leeren Durchschnitt bereits eine endliche Teilauswahl mit leerem Durchschnitt enthält. In Formeln, K ⊂ P(Ω) ist ein kompaktes Mengensystem genau dann, wenn T T * ∀Kn ∈ K, n ∈ IN : ( n∈IN Kn = ∅) ⇒ ∃J ⊂ IN |J| < ∞ : j∈J Kj = ∅. Durch Negation erhalten wie die äquivalente Bedingung T T * ∀Kn ∈ K, n ∈ IN : (∀J ⊂ IN |J| < ∞ j∈J Kj 6= ∅) ⇒ n∈IN Kn 6= ∅. Anstelle der endlichen Teilmengen J reicht es {1, . . . , n0 } mit n0 ∈ IN zu nehmen. Ein Beispiel, vielleicht das einzig wichtige, ist die Menge der kompakten Mengen eines topologischen Raumes. (Siehe auch 8.2.) (Diese erfüllen etwas mehr, da wir uns auf abzählbare Folgen beschränken.) Lemma 16 Sei R ein Ring, µ ein endlicher Inhalt darauf und K ein kompaktes System. Falls es für alle R ∈ R und alle ǫ > 0 eine Menge K ∈ K und ein B ∈ R gibt mit B⊂K⊂R µ(R\B) < ǫ gibt, so ist µ ein Prämaß auf dem Ring. Beweis: Wir zeigen, vergleiche Satz (9), die σ-Stetigkeit in der leeren Menge, d.h. R ∋ Rn ց ∅ ⇒ µ(Rn ) ցn 0. Dies reicht. P Zu obigen Rn wähle Bn ∈ R, Kn ∈ K mit Bn ⊂ Kn ⊂ Rn und n µ(Rn \Bn ) hinreichend T T T T klein. Wegen n Kn ⊂ n Rn = ∅ gibt es ein n0 mit n≤n0 Kn = ∅. Dies impliziert n≤n0 Bn = ∅. Es folgt µ(Rn0 ) = µ(Rn0 \ = µ( [ n≤n0 ≤ X n≤n0 \ Bn ) n≤n0 Rn0 \Bn ) ≤ µ( µ(Rn \Bn ) ≤ X n \ n≤n0 Rn \Bn ) µ(Rn \Bn ) Die rechte Seite ist hinreichend klein. q.e.d. Die Standardanwendung dieses Lemmas betrifft einen topologischen Raum Ω und das kompakte System der kompakten Mengen. 2.0.6 Konstruktion von Inhalten und Algebren Ein Halbring ist ein Mengensystem mit der leeren Menge, abgeschlossen bzgl. endlichem Durchschnitt und die Differenz zweier Halbringmengen ist darstellbar als endliche Vereinigung von paarweise disjunkten Halbringmengen. Proposition 17 Der von einem Halbring erzeugte Ring besteht genau aus den endlichen, paarweise disjunkten Vereinigungen von Halbringmengen. 14 WS10/11 U. Rösler In Formeln, für einen Halbring H gilt [ R(H) = { ◦ n≤N Hn | N ∈ IN, Hn ∈ H paarweise disjunkt }. Beweis: Zeige die bestimmenden Eigenschaft für einen Ring, hier abgeschlossen bzgl. der Differenz endlicher Vereinigung und enthält die leere Menge. Der Rest ist nachrechnen. q.e.d. Standardbeispiel: Das Mengensystem aller halboffenen Rechtecke (a, b], 0 < a ≤ b < 1 in (0, 1] ist ein Halbring. (Übung). Dasselbe gilt für alle halboffenen Rechtecke (a1 , b1 ]×(a2 , b2 ] im (0, 1]2 mit 0 < ai ≤ bi ≤ 1. Dies läßt sich auf höhere Dimensionen und ganz IRd ausdehnen. Proposition 18 Eine positive, additive, erweiterte Mengenfunktion auf einem Halbring hat eine eindeutige additive Fortsetzung auf den vom Halbring erzeugten Ring. Beweis: Die einzig mögliche additive Fortsetzung der Mengenfunktion µ auf den Ring ist [n µ̃( ◦ i=1 Ai ) = n X µ(Ai ). i=1 µ̃ tut’s. S S Die Abbildung ist wohldefiniert wegen ◦ i Ai = ◦ j Bj X i µ(Ai ) = X i [ µ( ◦ Ai ∩ Bj ) = j XX i j µ(Ai ∩ Bj ) = XX j und offensichtlich additiv. 2.0.7 i µ(Ai ∩ Bj ) = X µ(Bj ) j q.e.d. Beispiele Wir zeigen das Zusammenspiel der Resultate und Strukturen an zwei Beispielen. Borelmaß: Das Maß auf dem Einheitsintervall versehen mit der Borel σ-Algebra, welches jedem Intervall darin seine Länge zuordnet, heißt Borelwahrscheinlichkeitsmaß . Satz 19 Das Borelwahrscheinlichkeitsmaß auf (0, 1] existiert. Es ordnet jeder einelementigen Menge das Maß 0 zu. Beweis: Betrachte das Mengensystem H aller halboffenen Intervalle (a, b] mit 0 ≤ a ≤ b ≤ 1. Dies ein Halbring bzgl. Ω = (0, 1]. Definiere die Mengenfunktion µ auf H durch µ(a, b] := b − a. µ ist ein Inhalt auf der vom Halbring erzeugten Ring, Proposition 18. • Der Inhalt µ ist ein Prämaß. Wir verwenden das Lemma (16). Als kompakte Klasse nehmen wir alle kompakten Mengen in (0, 1]. Die Einschachtelung für ein Intervall (a, b) mit a < b ist (a + ǫ, b] ⊂ [a + ǫ, b] ⊂ (a, b] mit µ((a, b]\(a + ǫ, b]) ≤ ǫ. Für die disjunkte Vereinigung endlich vieler läuft dies analog. Die Fortsetzung µ des Prämaßes auf die von H erzeugte σ-Algebra ist eindeutig, Satz von Caratheodory (11) und (14). µ tut’s. 15 WS10/11 Maßtheorie Ein Nachrechnen liefert µ ist ein Wahrscheinlichkeitsmaß und µ({a}) = lim µ((a − n→∞ 1 1 , a]) = lim = 0 n n n und µ(I) ist die Länge des Intervall. q.e.d. Um das Borelmaß µ auf den gesamten reellen Zahlen zu definieren, betrachte die reellen Zahlen als disjunkte Vereinigungen von den Intervallen In = (n, n + 1], n ∈ ZZ. Sei µn das Borelmas̈ auf In versehen mit der Borel σ-Algebra Bn hierauf. Beachte, jede Borelmenge B ∈ B schreibt sich als disjunkte Vereinigung von Mengen B ∩ In ∈ Bn . Dann tut es µ(B) := P n∈ZZ µn (B ∩ In ). Das Lebesguemaß ist die Erweiterung des obigen Borelmaßes auf die vervollständigte Borel σ-Algebra. Die Standardnotation ist λ. Das Lebesguemaß auf einem Intervall I ist die Einschränkung λI des Lebesguemaßes auf dieses Intervall. Maße auf endlichen Produkträumen: Seien (Ωi , Ai , µi ), 1 ≤ i ≤ n, endliche Maßräume. Der Produktraum ist n Y i=1 Ωi := Ω1 × Ω2 × . . . × Ωn = {f : {1, . . . , n} 7→ n [ i=1 Ωi | f (j) ∈ Ωj , j ∈ {1, . . . , n}}. Eine Rechteckmenge ist eine Menge A1 × A2 × . . . × An , Ai ∈ Ai . Sei H die Menge aller Rechteckmengen. Die hiervon erzeugte σ-Algebra σ(H) heißt Produkt σ-Algebra. N Notation i Ai := A1 ⊗ A2 ⊗ . . . ⊗ An . N Ein Maß µ : i Ai 7→ IR mit µ(A1 × A2 × . . . × An ) = µ1 (A1 )µ2 (A2 ) . . . µn (An ), Ai ∈ Ai , 1 ≤ i ≤ n, heißt Produktmaß . Q N Notation i µi = µ1 ⊗ µ2 ⊗ . . . ⊗ µn = i µi . Proposition 20 Das Produktmaß existiert und ist eindeutig. Beweisskizze: Das Mengensystem der Rechteckmengen ist kein Halbring, aber der davon erzeugte Ring besteht aus allen endlichen disjunkten Vereinigungen von Rechteckmengen. Definiere auf den Rechteckmengen die Mengenfunktion µ : R → IR durch µ(A1 × A2 × . . . × An ) := µ1 (A1 )µ2 (A2 ) . . . µn (An ). µ ist additiv auf dem Halbring H. Erweitere µ additiv auf dem von den Rechteckmengen erzeugten Ring, Proposition 18. Wenn wir zeigen könnten, daß diese Mengenfunktion ein Prämaß ist, (genauen Beweis später, vgl. auch Fubini) dann impliziert der Satz von Caratheodory 11 eine Erweiterung zum Maß auf σ(R). Die Eindeutigkeit folgt aus Satz 14. q.e.d. Q N N Das Tripel ( i Ωi , i Ai , i µi ) heißt Produktmaßraum oder Produktraum. Der Produktraum von W-räumen ist ein W-raum. Später betrachten wir Produkträume über beliebige Indexmengen. 16 WS10/11 2.1 U. Rösler Maße auf den reellen Zahlen Wieviele Maße gibt es auf den reellen Zahlen versehen mit der Borel σ−Algebra B? Sei f eine Funktion von den reellen Zahlen in die reellen Zahlen. Wir benutzen die Notation f (x+) für den Grenzwert limyցx f (y). Eine Funktion f : IR → IR heißt rechtsstetig in x, falls f (x+) = f (x) gilt. Sie heißt rechtsstetig, falls sie rechtsstetig in jedem Punkt x ist. Analog definiert man f (x−) und linksstetig. Ein Radonmaß auf den reellen Zahlen ist ein Maß auf der Borel σ-Algebra mit endlichem Maß für jedes Kompaktum. Satz 21 Es gibt eine bijektive Abbildung zwischen isotonen, rechtsstetigen Funktionen F : IR 7→ IR mit F (0) = 0 und Radonmaßen µ auf den reellen Zahlen. Diese Bijektion kann durch F (b) − F (a) = µ((a, b]), (2.2) a < b ∈ IR gegeben werden. Beweis: Jedes Radonmaß definiert eindeutig durch die obige Bijektion 2.2 eine Funktion wie oben beschrieben. Die Umkehrung folgt dem Beweis von Satz 19. Jede Funktion wie oben liefert eine additive und isotone erweiterte Mengenfunktion µ auf dem Halbring aller halboffenen Intervalle {(a, b] | a ≤ b ∈ IR}. Die Mengenfunktion µ wird (eindeutig) zu einem Inhalt auf dem erzeugten Ring erzeugten Ring fortgesetzt, Proposition 18. Dieser Inhalt ist ein Prämaß nach Lemma 16. Wähle dazu als kompakte Klasse das Mengensystem C der kompakten MenS gen. Für vorgegebenes A = ◦ ni=1 (ai , bi ] und µ(A) < ∞ wähle die Mengen Bi := (ai +ǫi , bi ] ∈ E und Ci = [ai + ǫi , bi ]. Dann erfüllen B := ∪i Bi und C := ∪i Ci ∈ C die Bedingung B ⊂ C ⊂ A und X (F (ai + ǫi ) − F (ai ) µ(A\B) = i wird beliebig klein für geeignet gewählte ǫi . Der Satz von Caratheodory 11 liefert die Existenz und der Satz 14 die Eindeutigkeit. q.e.d. Bem: Es mag einfacher erscheinen, erst auf Ω = (z, z + 1], z ∈ ZZ die Konstruktion zu machen, da dann das Maß endlich ist. Anschließend wird via der Partition IR = ∪z∈ZZ (z, z +1] P q.e.d. das Maß µ = z∈ZZ µz definiert. Dies tut’s. Lebesguemaß: Die Lebesgue σ-Algebra ist die Vervollständigung der Borel σ-Algebra unter dem Borelmaß, welches jedem Interval seine Länge zuordnet. Die zugehörige Funktion F ist die Identität. Die Standardnotation ist λ. Der Sprachgebrauch zieht das Lebesguemaß dem Borelmaß vor und unterscheidet i.a. nicht dazwischen. Verteilungsfunktion: Eine Verteilungsfunktion ist eine rechtsstetige, aufsteigende Funktion F : IR 7→ IR mit F (−∞) := limx→−∞ F (x) = 0, F (∞) := limx→∞ F (x) = 1. Korollar 22 Es gibt eine bijektive Abbildung zwischen Verteilungsfunktionen und W-Maßen auf der Borel σ-Algebra über IR. Diese Bijektion kann durch F (b) − F (a) = µ((a, b]) a < b ∈ IR gegeben werden. 17 WS10/11 Maßtheorie Beweis: Einfach aus Satz 21. d-dimensionaler Raum: Die Konstruktion des Lebesguemaßes auf IRd verläuft ganz analog. Die halboffenen Intervalle (a1 , b1 ] × ... × (ad , bd ], 0 ≤ ai ≤ bi ≤ 1 im Einheitswürfel einen bilden einen Halbring. Die Mengenfunktion λ((a1 , b1 ] × ... × (ad , bd ]) := d Y i=1 (bi − ai ) ist ein Prämaß auf dem Hiervon erzeugten Ring. Der Satz von Caratheodory liefert eine Fortsetzung als Maß auf dem Einheitsintervall. Anschließend erweitere dieses Maß translationsinvariant auf ganz IRd durch Partitionierung. Übung. Notation: λd bezeichnet das Lebesguemaß auf IRd versehen mit der Lebesgue σ-Algebra, der Vervollständigung der Borel σ-Algebra. Bemerkung: Im IRd ist die Charakterisierung von Maßen über (Verteilungs-)Funktionen schwieriger. Wie würde die Charakterisierung lauten? (Siehe Gänzler-Stute [5]) 2.1.1 Hausdorff Maße und Cantor Menge Haufsdorffmaß: Es gibt andere Maße auf den reellen Zahlen von Interesse, die eventuell einer kompakten Menge keinen endlichen Wert zuordnen. Wir geben als Beispiel Hausdorff Maße an. Sei 0 < α. Definiere µα (Q) = lim inf{ ǫց0 X n∈IN diamα (Bn ) | diam(Bn ) < ǫ, Q ⊂ ∪n Bn }. B. bezeichnet offene Kugeln und diam steht für den Durchmesser der Kugel. (Der Limes existiert, da die Folge monoton steigend ist in ǫ. Siehe Falconer [4].) µα ist ein äußeres Maß. Das Maß µα auf der σ-Algebra A∗α der µα -meßbaren Mengen heißt Hausdorffmaß zum Index α. Das Hausdorffmaß ist ein translationsinvariantes Maß auf A∗α . A∗α enthält die Borel σ−Algebra. Alle offenen, nicht leeren Mengen U in IRd haben den Wert µα (U ) = ∞ für 0 < α < d. Das Lebesguemaß λd ist ein Vielfaches des Hausdorffmaßes µd auf IRd . Die Hausdorff Dimension einer Menge ist das Infimum der α mit endlichem Hausdorffmaß µα (Q) < ∞ [4]. Offene, beschränkte, reelle Mengen in IRd haben die Hausdorff Dimension d. Das Hausdorffmaß einer Menge C ist das Maß µα (C ∩ ·) : A∗α → IR mit α die Hausdorff Dimension der Menge C. Cantormenge: Als Beispiel wollen wir die Cantormenge und das Cantormaß , das Hausdorffmaß zu der Cantormenge, betrachten. 0r ♣ ♣ ♣ ♣ ♣ ♣ ♣♣♣♣ ♣♣♣♣ r1/3 ♣ ♣ ♣ ♣ ♣ ♣ ♣♣♣♣ ♣♣♣♣ r2/3 ♣ ♣ ♣ ♣ ♣ ♣ ♣♣♣♣ ♣♣♣♣ Cantorset Cantorset Can r1 ♣ ♣ ♣ ♣ ♣ ♣ ♣♣♣♣ ♣♣♣♣ Cantorset Cantorset Can Die formale Definition der Cantormenge C lautet: Cn := {x = ∞ X xi i=1 3i | xi ∈ {0, 1, 2}, xj 6= 1 für j ≤ n, i ∈ IN } 18 WS10/11 C := \ n Cn = {x = ∞ X xi i=1 3i U. Rösler | xi ∈ {0, 2}}. Die Cantormenge hat interessante Eigenschaften: • Die Cantor Menge ist überabzählbar, abgeschlossen, kompakt, nirgends dicht (=das Innere vom Abschluß ist leer) und perfekt (=jeder Punkt ist Häufungspunkt). (Übung) • Die Cantor Menge ist Borel meßbar und das Lebesgue Maß der Cantor Menge ist 0. Übung 2 • Die Hausdorff Dimension ist α = ln ln 3 < 1. (Keine Übung) • Die Abbildung ϕ : C 7→ [0, 1] x= ∞ X xi i=1 3i 7→ ϕ(x) = ∞ 1X xi 2 i=1 2i (2.3) ist isoton, stetig, und surjectiv. Seien B3 und B2 diejenigen reellen Zahlen, deren Trialdarstellung bzw. Dualdarstellung nicht eindeutig ist. Dann ist ϕ : C\B3 → [0, 1]\B2 bijektiv. (ϕ bildet z.B. die Punkte 1/3 und 2/3 beide auf 1/2 ab.) B3 und B2 sind abzählbar. • Das Cantor Maß ist ein Wahrscheinlichkeitmaß mit der stetigen, fast überall (bis auf C) unendlich oft differenzierbaren Verteilungsfunktion F (x) = inf{1, ϕ(y) | C ∋ y ≥ x} mit Ableitung 0 f.s. (Die Ableitung auf C ist ∞.) Ein Bild ist sehr hilfreich. (Übung) Das Bildmaß des Cantor Maßes unter ϕ bzw. F ist das Lebesgue Maß. • Die Cantormenge ist die größte kompakte invariante Menge bzgl. der Funktion f : IR 7→ IR, f (x) = 11x≤1/2 3x+11x>1/2 (3−3x). (Eine Menge A heißt invariant unter f, falls f −1 (A) = A gilt.) (Übung: Benutze die Trialdarstellung einer reellen Zahl.) Die Iteration f n (x), n ∈ IN eines Punktes x unter f bleibt beschränkt genau dann, wenn x aus C ist. 2.1.2 Translationsinvariante Maße Ein Maß auf (IR, +) heißt translationsinvariant, falls es invariant ist bezüglich aller Translationen. (D.h. µ(A + x) = µ(A) für alle x ∈ IR, A ∈ A). Beispiele translationsinvarianter Mäse sind (i) das triviale Maß auf der Potenzmenge, welches jeder nichtleeren Menge ∞ zuordnet, (ii) das Maß auf der Potenzmenge, welches genau den abzählbaren Mengen den Wert 0 zuordnet, ansonsten aber ∞ ist (iii) das Zählmaß auf der Potenzmenge, (iv) das Hausdorffmaß auf der Hausdorff σ-Algebra zu vorgegebenem α ∈ (0, 1) (v) das Lebesguemaß auf der Borel- bzw. Lebesgue σ-Algebra. Proposition 23 Das Lebesgue Maß ist bis auf Vielfache das einzige translationsinvariante Radonmaß auf den reellen Zahlen versehen mit der Borel σ-Algebra. 19 WS10/11 Maßtheorie Beweis: • Das Lebesguemaß ist translationsinvariant. Betrache D := {A ∈ B | ∀x ∈ IR : λ(A) = λ(A + x)}. Dies ist ein Dynkin System und enthält den durchschnittabgeschlossenen Erzeuger der halboffenen Intervalle (a, b]. Nach Lemma 3 gilt D = B. Eindeutigkeit: Durch den Wert µ((0, 1]) wird, verwende Additivität und Translationsinvarianz das Maßes µ, das Maß für alle halboffenen Intervalle (p, q], p, q ∈ Ql festgelegt. Diese bilden ein Erzeugersystem der Borel σ-Algebra. q.e.d. 2.1.3 Nichtmeßbare Mengen Lemma 24 Es gibt nicht lebesguemeßbare Mengen auf dem Einheitsintervall. Beweis: Definiere auf den reellen Zahlen die Äquivalenzrelation x ∼ y ⇔ x − y ∈ Ql. Aus jeder Äquivalenzklasse [x] := {y ∈ IR | x ∼ y} wähle einen Repräsentanten aus [0, 1]. Dies ist möglich nach dem Auswahlaxiom. A tut’s. Angenommen A ist lebesguemeßbar. Die Mengen A + q, q ∈ Ql, sind paarweise disjunkt. S Das Lebesguemaß von B := ◦ q∈Ql ∩[−1,1] (A + q) berechnet sich via der Translationsinvarianz zu X X λ(B) = λ(A + q) = λ(A + q) = ∞λ(A) q∈Q l ∩[−1,1] q∈Q l ∩[−1,1] mit den möglichen Werten 0 oder ∞. Andererseits gilt [0, 1] ⊂ B ⊂ [−1, 2] und damit 1 ≤ λ(B) = ∞λ(A) ≤ 3. Dies ist ein Widerspruch. q.e.d. Proposition 25 Es gibt lebesguemeßbare Mengen, die nicht borelmeßbar sind. Bew: Betrachte dazu die Cantorabbildung ϕ : C\B3 → [0, 1]\B2 aus (2.3). ϕ ist bijektiv und wegen der Monotonie sind ϕ und ϕ−1 borelmeßbar. Sei A eine nicht lebesguemeßbare Menge. Dann ist ϕ−1 (A) ⊂ C als Nullmenge lebesguemeßbar, aber nicht borelmeßbar. q.e.d. Bemerkung: Auch nicht meßbare Mengen sind manchmal nützlich. Sei (Ω, A, µ) ein beliebiger Maßraum und C eine eventuell nicht meßbare Menge. Dann ist die Einschränkung (Ω|C = C, A|C = {A∩C | A ∈ A}, µ∗|C ) mit µ∗|C (A) := µ∗ (A∩C) = inf{µ(B) | B ∈ A, A∩C ⊂ B} ein Maßraum. Ist µ ein W-maß und hat C das äußere Maß 1, so ist µ∗C ein W-maß. 2.2 2.2.1 Diverses Regularität∗ Sei (Ω, A, µ) ein Maßraum. Ein Maß µ heißt von außen regulär oder von oben regulär bzgl. einem Mengensystem C, falls für alle meßbaren Mengen A gilt µ(A) = inf{µ(C) | A ⊂ C ∈ C}. Analog definiert man von innen regulär oder unten durch µ(A) = sup{µ(C) | C ∋ C ⊂ A}. 20 WS10/11 U. Rösler µ heißt regulär bzgl. C, falls es von außen und innen regulär ist. Ein Maß µ heißt von außen σ−regulär oder von oben bzgl. einem Mengensystem C, falls für alle meßbaren Mengen A gilt µ(A) = inf{ X n µ(Cn ) | A ⊂ ∪n Cn , Cn ∈ C}. Regularität ist eine Art σ-Stetigkeit des Maßes bzgl. gewisser Mengensysteme. Lemma 26 Jedes Radonmaß auf den reellen Zahlen ist regulär von innen bzgl. kompakten Mengen, regulär von außen bzgl. offenen Mengen und σ−regulär von außen bzgl. kompakten Mengen. Beweis: Sei zuerst µ ein endliches Maß. Betrachte die Menge D aller meßbaren Mengen, die sich dem Maße nach beliebig gut von außen durch offene Mengen und von innen durch abgeschlossene Mengen approximieren lassen. • D enthält alle abgeschlossenen beschränkte Intervalle. Das Intervall [a, b] ist abgeschlossen und enthalten in der offenen Menge (a − ǫ, b + ǫ). Die σ-Stetigkeit des Maßes liefert µ((a − ǫ, b + ǫ)) →ǫ→ µ([a, b]). • D ist ein Dynkinsystem mit IR. D enthält die reellen Zahlen und ist abgeschlossen bzgl. der Differenz aufsteigender Mengen ist einfaach zu zeigen. Für die Abgeschossenheit bzgl. abzählbarer disjunkter Vereinigung seien Dn ∈ D paarweise disjunkt. Wähle zu vorgegebenem ǫ abgeschlossene Mengen An und offene P Mengen Un mit An ⊂ Dn ⊂ Un und µ(Un \An ) ≤ ǫn und n ǫn < ǫ. Sei N ∈ IN. Dann sind A = ∪n≤N An abgeschlossen, U = ∪n Un offen und erfüllen A ⊂ ∪n Dn ⊂ U und µ(U \A) ≤ µ( [ n Un \ [ m Am ) + µ( [ m Am \A) ≤ X n µ(Un \An ) + X µ(Dm ) < 2ǫ. m>N P Die zweite Summe ist klein für große N wegen der Endlichkeit des Maßes ( n µ(Dn ) < ∞)). • D ist die Borel σ-Algebra. Die Menge der abgeschlossenen Intervalle erzeugen die Borel σ-Algebra, sind durchschnittstabil und in D. Damit ist das Dynkinsystem eine σ-Algebra. • µ ist regulär von oben durch offenen und von unten durch abgeschlossene. Folgt aus obigem. • µ ist regulär von unten durch kompakte. Die abgeschlossenen beschränkten Mengen sind nach dem Satz von Heine-Borel genau die kompakten Mengen. Zu jeder abgeschlossenen Menge A gibt es eine enthaltene kompakte Menge K mit µ(A\K) beliebig klein wählbar. (A ∩ [−n, n] ist kompakt und aufsteigend gegen A.) • Jedes µ ist σ−regulär von oben durch kompakte. Jede offene Menge U läßt sich schreiben als höchstens abzählbare disjunkte Vereinigung von offenen Intervallen. Jedes offene Intervall I läßt sich beliebig gut durch höchstens abzählbar viele Kompakta [a, b] ⊂ I überdecken mit µ(a) = 0 = µ(b). Fertig. (Formal: Zu vorgebenem B ∈ B wähle eine offene Obermenge U mit µ(U \B) < ǫ. U ist darstellbar als disjunkte S Vereinigung ◦ In von abzählbar vielen offenen Intervallen In . Überdecke jedes Intervall In wie oben beschrieben durch abzählbar viele kompakte Intervalle Kn,m = [an,m , an,m+1 ], m ∈ ZZ mit µ(an,m ) = 0, deren Innere alle disjunkt sind. Dies ist möglich, da {x | µ({x}) > 0} P höchstens abzählbar ist (Übung). Es gilt 0 ≤ m µ(Kn,m ) − µ(In ) = 0. 21 WS10/11 Maßtheorie Damit folgt B ⊂ U ⊂ ∪n,m Kn,m und P n µ(In ) = µ(U ) ≤ µ(B) + ǫ.) n,m µ(Kn,m ) = • Der Satz gilt auch für nichtendliche Maße. Finde eine Folge xn ∈ IR mit xn →n→∞ = ∞ und xn →n→−∞ −∞ und µ({xn }) = 0. dies ist möglich. Dann zerlege IR in die disjunkten Intervalle (xn , xn+1 ], n ∈ ZZ und das Maß in die Summe abzählbar vieler eingeschränkte Maße µn = µ(· ∩ (xn , xn+1 ). Der Rest ist Übung. q.e.d. P Das folgende Lemma besagt in Worten, jede Borelmenge ist irgendwo dick. Lemma 27 Sei λ das Lebesguemaß auf IR und B eine Borelmenge von strikt positivem Lebesguemaß. Dann existiert für alle ǫ > 0 ein offenes, nichtleeres Intervall I mit λ(I ∩ B) ≥ 1 − ǫ. λ(I) Beweis: OEdA sei B beschränkt. Wähle eine offene Obermenge U von B mit λ(U \B) < δ. S Die offene Menge hat eine Darstelllung U = ◦ n∈IN In mit In offene Intervalle. Schätze ab λ(B) = X λ(In ∩ B) n λ(In ) λ(In ) ≤ sup m λ(Im ∩ B) X λ(Im ∩ B) (λ(B) + δ). λ(In ) ≤ sup λ(Im ) λ(Im ) m n Für δ hinreichend klein muß das Supremum dicht bei 1 liegen. q.e.d. Proposition 28 Sei B eine Borelmenge von strikt positivem Lebesguemaß. Dann ist 0 ein innerer Punkt von B − B = {x − y | x, y ∈ B}. Beweis. Sei I ein Intervall mit λ(I ∩ B) > 34 λ(I) > 0. Sei A := I ∩ B. Hieraus folgt λ(A ∩ (A + ǫ)) = λ(A) + λ(A + ǫ) − λ(A ∪ (A + ǫ)) ≥ 2λ(A) − λ(I ∪ (I + ǫ)) ≥ 2λ(A) − λ(I) − ǫ ≥ λ(I) −ǫ 2 Für hinreichend kleine ǫ hat A ∩ (A + ǫ) strikt positives Maß und ist daher nicht leer. Daher enthält B − B ⊃ A − A die Werte ǫ und auch −ǫ. Dies reicht. q.e.d. 2.2.2 Isomorphien und standard Lebesgueräume* Weshalb spielen Maße auf den reellen Zahlen versehen mit der Borel-σ-Algebra solch eine prominente Rolle? Antwort: Abzählbar erzeugte σ-Algebren sind isomorph zur Borel σ-Algebra auf den rellen Zahlen eingeschränkt auf eine Teilmenge. Zwei meßbare Räume heißen isomorph, falls es eine bimeßbare Bijektion der Grundräume gibt. (Eine Funktion heißt bimeßbar, falls sie bijektiv ist und sie und ihre Inverse meßbar sind.) Beachte, die σ-Algebren sind isomorph als geordnete Räume bzgl. der Mengeninklusion. (Der Isomorphiebegriff von σ-Algebren bezieht sich nur auf eine bijektive, strukturerhaltende Abbildung zwischen den σ-Algebren. Für meßbare Räume nimmt man den Grundraum mit hinzu.) Ein Borelraum ist eine Borelmenge versehen mit der induzierten Borel-σ-Algebra eines topologischen Raumes. Ein meßbarer Raum heißt separabel oder abzählbar erzeugt, falls es einen abzählbaren Erzeuger gibt. Ein meßbarer Raum heißt punktetrennend oder hausdorffsch falls es zu jedem ω 6= ω ′ eine meßbare Menge A gibt, die ω, aber nicht ω ′ enthält. 22 WS10/11 U. Rösler Durch Äquivalenzbildung läßt sich jeder meßbare Raum hausdorffsch machen. Die Relation ω ∼ ω‘ ⇔ ∃A ∈ A : ω ∈ A, ω ′ 6∈ A ist eine Äquivalenzrelation auf Ω. Der Raum Ω/∼ der Äquivalenzklassen versehen mit der σ-Algebra A/∼ := {{[ω] | ω ∈ A} | A ∈ A}) ist ein Hausdorffscher meßbarer Raum. Satz 29 Sei (Ω, A) ein separabler, hausdorffscher, meßbarer Raum. Dann ist (Ω, A) isomorph zu einer (nicht notwendig meßbaren) Menge in IR versehen mit der eingeschränkten Borel σAlgebra. Diese Bijektion kann gegeben werden durch f := X 3−n 211En . n∈IN Hierbei ist {En ∈ A | n ∈ IN } ein abzählbarer Erzeuger für A. Die Abbildung f : E → f (E) ist bimeßbar. Beweis: f ist wohldefiniert und bijektiv. Für die Bimeßbarkeit argumentiere über Erzeuger und der Trialdarstellung f (En ) = {x ∈ f (Ω) | xn = 2}. q.e.d. Alle separablen metrischen Räume sind isomorph bzgl. der meßbaren Struktur zu einer Teilmenge der reellen Zahlen versehen mit der Borel σ-Algebra. Wählen wir als abzählbaren Erzeuger der σ-Algebra einen abzählbaren Erzeuger der Topologie, z.B. die offenen Bälle mit rationalem Radius, so erhält obige Konstruktion zwar die Topologie, nicht aber die Metrik. Zwei Maßräume heißen isomorph, falls es eine maßerhaltende Isomorphie der meßbaren Räume gibt. Maße werden durch einen Isomorphismus der meßbaren Struktur eindeutig transportiert. Für alle abzählbar erzeugten σ-Algebren reicht es daher Maße auf reellen Zahlen genauer zu studieren. Wir sprechen von einem Standardlebesgueraum, falls die meßbaren Räume vollständig sind und, nach eventueller Entfernung einer Nullmenge, maßtheoretisch isomorph zur Lebesgueσ-Algebra auf IR versehen mit dem Lebesguemaß und eingeschränkt auf eine Menge ist. Bemerkung: Die Konstruktion von Satz 29 geht auch mit der Binär- anstelle der Trialdarstellung. Es treten dabei abzählbar viele Punkte auf, deren Dualdarstellung nicht eindeutig ist. Dies ist eine Lebesguenullmenge. Der Vorteil der Konstruktion per Binärdarstellung ist eine zusammenhängendere Menge als in der Trialdarstellung.) 23 WS10/11 24 Maßtheorie Kapitel 3 Integrale Ziel dieser Sektion ist der Integralbegriff als lineare und σ-stetige Fortsetzung I des Maßes µ auf Funktionen. Ein Maß µ fassen wir als eine Abbildung auf Indikatorfunktionen 11A auf, I(11A ) = µ(A). Diese Abbildung setzen wir linear fort zu einer Abbildung I auf der Menge T + der positiven P Treppenfunktionen f = ni=1 ai 11Ai via I(f ) := X ai µ(Ai ). i Damit ist die algebraische Erweiterung beendet. Wir erweitern die Abbildung I zu I˜ durch einen geeigneten Konvergenzbegriff via ˜ ) = lim I(fn ) I(f n mit Treppenfunktionen fn konvergiert gegen f. Als Konvergenzbegriff benutzen wir Ordnungskonvergenz, fn konvergiert aufsteigend punktweise gegen f . Mengentheoretischer Zugang: Eine Alternative ist der mengentheoretische Zugang. Wir identifizieren eine positive Funktion f : Ω 7→ IR+ mit der Menge {(ω, x) | 0 ≤ x ≤ f (ω)} auf dem Produktraum Ω × IR und definieren das Integral als das Mas̈ dieser Menge bezüglich dem Produktmas̈. (IR ist versehen mit der Borel σ-Algebra und dem Lebesguemaäß.) Vektorraumstruktur Ein anderer gern gewählter Zugang ist es, die Menge T der Treppenfunktionen als Vektorraum zu betrachten, mit einer Norm zu versehen, bezüglich dieser Norm T abzuschließen und dann das Funktional I auf den Abschluß von T stetig zu erweitern. Wir kommen hierauf bei banachraumwertigen Funktionen zurück. 3.0.3 Algebraische Erweiterung Eine Treppenfunktion ist eine Funktion der Form f= n X ai 11Ai (3.1) i=1 mit reellen Zahlen a1 , . . . , an und meßbaren Mengen A1 , . . . , An . Die Standarddarstellung einer Treppenfunktion ist eine Darstellung wie oben mit der zusätzlichen Forderung alle a1 , . . . , an sind verschieden und die die Mengen A1 , . . . , An bilden eine meßbare Zerlegung 25 WS10/11 Maßtheorie (=Partition) des Stichprobenraumes Ω. (Zerlegung=Menge von Teilmengen, die paarweise disjunkt sind und deren Vereinigung der ganze Raum ist. Wir sprechen von meßbarer Zerlegung, falls die Mengen stets meßbar sind.) Proposition 30 Die Treppenfunktionen sind genau die meßbaren Funktionen mit endlichem Bildraum. Jede mb. Treppenfunktion hat eine eindeutige Standarddarstellung gegeben durch f= n X ai 11f −1 (ai ) (3.2) i=1 mit a1 , . . . , an die verschiedenen Werte von f . Beweis: Eine Treppe a1 11A1 ist meßbar und die endliche Summe meßbarer Funktionen ist meßbar. Damit nimmt jede Treppenfunktion nur endlich viele Werte an und ist meßbar. Die Darstellung (3.2) ist eindeutig für eine meßbare Funktion mit endlichem Bildraum. Dies ist die Standarddarstellung einer Treppenfunktion. q.e.d. Die Menge T = T (Ω, IR) der Treppenfunktionen ist ein Vektorraum. Wir betrachten den positiven Kegel T + der positiven Treppenfunktionen. (OEdA sind die Koeffizienten positiv.) Definiere auf T + die Abbildung I I(f ) := n X ai µ(f −1 (ai )) i=1 mit Hilfe der Standarddarstellung von f. Proposition 31 Die Funktion I : T + → IR ist eine additive, skalare, isotone und erweiterte Funktion. Beweis: I ist wohldefiniert, da die Standarddarstellung eindeutig ist. Mit entsprechender Notation zeigen wir die Additivität. I(f + g) = X ci µ((f + g)−1 (ci )) = XX j = k XX j (aj + bk )µ(f k −1 X ci i i = X (aj ) ∩ g {j,k|aj +bk =ci } −1 (bk )) aj µ(f −1 (aj ) ∩ g −1 (bk )) + = I(f ) + I(g) µ(f −1 (aj ) ∩ g −1 (bk )) XX j k bk µ(f −1 (aj ) ∩ g −1 (bk )) Die Skalarität und die Isotonie (die Differenz von Treppenfunktion ist eine Treppenfunktion) sind einfach. q.e.d. Bemerkung: Für einen additiven Operator auf einem Vektorraum ist Isotonie und Positivität dasselbe. P Folgerung: Für jede Darstellung m i=1 bi 11Bi einer Treppenfunktion f gilt (nachrechnen) I(f ) := m X i=1 26 bi µ(Bi ) (3.3) WS10/11 U. Rösler Hintergrund Ordnungsstruktur Sei A eine Menge. Eine Relation ist eine Teilmenge R von A × A. Die Komposition oder Verknüpfung zweier Relationen R, Q ist gegeben durch R ◦ Q =: {(a, c) | ∃b ∈ A : (a, b) ∈ R, (b, c) ∈ Q}. Das Inverse einer Relation ist R−1 := {(b, a) | (a, b) ∈ R}. Eine Relation heißt reflexiv, falls die Relation die Diagonale {(a, a) | a ∈ A} enthält. Eine Relation heißt symmetrisch, falls die Relation gleich ihrer Inversen ist. Eine Relation heißt antisymmetrisch, falls der Durchschnitt der Relation mit der Inversen genau die Diagonale ist. Eine Relation heißt transitiv, falls die Relation unter Komposition abgeschlossen ist (R ◦ R ⊂ R). Eine Teilordnung oder partielle Ordnung oder Ordnung auf einer Menge A ist eine reflexive, antisymmetrische und transitive Relation. Wir schreiben a b für (a, b) ∈ R und sprechen von b dominiert oder majorisiert a oder auch b ist größer als a. Analog benutzen wir Minorante und kleiner. Ein Tupel (A, ) heißt geordnete Menge . Sei (A, ) eine partielle Ordnung. Ein Element a ∈ A heißt obere Schranke von B ⊂ A falls b ≤ a für alle b ∈ B gilt. Eine Menge B ⊂ A heißt nach oben (unten) beschränkt, falls es eine obere (untere) Schranke von A gibt. Wir sprechen von einer kleinsten oberen Schranke a von B falls a eine obere Schranke ist und für alle anderen oberen Schranken x gilt a ≤ x. W Notation: a = supb∈B b = b∈B b. Eine kleinste obere Schranke a heißt Maximum von B, falls zusätzlich a ∈ B gilt. Notation: x = maxb∈B b. V Analog verwenden wir das Infimum inf b∈B = b∈B b und Minimum. Notation: a ∨ b := sup{a, b} a ∧ b := inf{a, b}. Ein Verband ist eine geordnete Menge abgeschlossen bzgl. endlichem Supremum und endlichem Infimum. Wir schreiben (A, ≺, ∧, ∨) in der Notation wie oben. Ein Verband heißt von oben (unten) vollständig falls jede nach oben (unten) beschränkte Teilmenge ein Supremum (Infimum) besitzt. Er heißt vollständig, falls er von unten und oben vollständig ist. Analog verwenden wir σ-vollständig falls jede beschränkte abzählbare Menge ein Supremum und Infimum besitzt. Eine isotone Funktion ist eine ordnungserhaltende Funktion. Eine isotone Funktion f heißt von unten σ-stetig, falls für jede aufsteigende abzählbare Folge an ∈ M mit supn an ∈ M gilt ∨n f (an ) = f (∨n an ). Analog verwenden wir von oben σ-stetig und σ-stetig für beides. Bemerkung: Jeder Verband läßt sich σ-vervollständigen, (von unten, von oben, vervollständigen). Darunter verstehen wir eine kleinste, ordnungserhaltende und injektive Einbettung des Verbandes in einen σ-vollständigen (von unten, von oben, vollständigen) Verband. Bis auf Isomorphie (ordnungserhaltende Bijektion) ist diese eindeutig. (Keine Übung: Dies ist eine mathematische Standardkonstruktion. Z.B. lassen sich so die reellen Zahlen aus den rationalen Zahlen konstruieren.) Weiterhin: jede isotone, von unten σ-stetige Abbildung I : V 7→ IR∪{∞} läßt sich eindeutig von unten σ-stetig fortsetzen auf die σ-Vervollständigung des Verbandes durch ˜ = lim I(vn ). I(v) n Hierbei ist vn ∈ M, n ∈ IN, eine Folge mit vn րn v. Dies bildet den abstrakten Hintergrund unserer folgenden Argumentation. Bemerkung: Eine σ-Algebra ist ein Verband mit der Ordnung induziert durch die Enthaltensrelations, A ≺ B ⇔ A ⊂ B, A∨B = A∪B, A∧B = A∩B. Dieser Verband ist vollständig. 27 WS10/11 Maßtheorie Ein Maß ist von unten σ-stetig, eine endliches Maß sogar σ-stetig. Der Satz von Caratheodory ist die σ-stetige Erweiterung einer σ-stetigen, additiven und isotonen Abbildung auf einem Verband. Der Ring (=Verband) wird erweitert zur σ-Algebra (Verbandsvervollständigung) und das Prämaß zum Maß. Das Integral Der Raum der reellwertigen, positiven, erweiterten Treppenfunktionen T + = T (IR+ ) versehen mit der punktweisen Ordnung ist ein Verband. Die Vervollständigung von T + bzgl. σ+ Stetigkeit von unten ist der Raum F der erweiterten reellwertigen, meßbaren und positiven + Funktionen. Zu gegebener Funktion f ∈ F konvergieren zum Beispiel die Treppenfunktionen fn n n2 X i fn (x) := 11 i i+1 2n 2n ≤f (x)< 2n i=0 aufsteigend gegen f. Die Erweiterung von I kann nur funktionieren, falls I auf T + bereits σ-stetig von unten ist. Dies liefert die nächste Proposition. Proposition 32 Die Funktion I (3.3) ist eine additive, skalare, isotone, von unten σ-stetige erweiterte Funktion. Die Abbildung I eingeschränkt auf I −1 (IR) ist σ-stetig. Beweis: Die Wohldefiniertheit, Linearität, Skalarität und Isotonie wurde in Proposition 31 gezeigt. Für die σ-Stetigkeit von unten betrachte eine aufsteigende Folge fn ր f aus T + . Seien 0 ≤ a1 < a2 < ... < aN die Werte von f und Ai = f −1 (ai ). • I(fn 11Ai ) ր I(f 11Ai ) für alle i = 1..N. Dies folgt aus der σ-Stetigkeit des Maßes, ai µ(Ai ) = I(ai 11Ai ) ≥ I(fn 11Ai ) ≥ (ai − ǫ)µ(Ai ∩ {fn ≥ ai − ǫ}) →n (ai − ǫ)µ(Ai ). Mit ǫ → 0 erhalten wir die Teilbehauptung. • σ-Stetigkeit von unten. I(fn ) = X i I(fn 11Ai ) ր X I(f 11Ai ) = I(f ). i • I eingeschränkt auf I −1 (IR) ist σ-stetig. Für eine Folge fn ց f ∈ T + betrachte f1 − fn ր f1 − f und argumentiere wie oben. q.e.d. + Definiere die Abbildung I˜ von F in die erweiterten reellen Zahlen via ˜ ) = lim I(fn ). I(f nր∞ für irgendeine Folge fn von positiven Treppenfunktionen punktweise aufsteigend gegen f. + Satz 33 Die Abbildung I˜ : F → IR ist wohldefiniert. Sie ist als additive und σ-stetige Fortsetzung des Maßes µ eindeutig und ist additiv, skalar, isoton und σ-stetig von unten. Die Fortsetzung I˜ eingeschränkt auf I˜−1 (IR) ist σ-stetig. 28 WS10/11 U. Rösler Beweis: • I˜ ist wohldefiniert. Seien fn und gm zwei monoton gegen f aufsteigende Folgen von Treppenfunktionen. Dann gilt lim I(fn ) ≥ lim I(fn ∧ gm ) = I(gm ). n n Dies ergibt limn I(fn ) ≥ limm I(gm ). Aus Symmetriegründen gilt auch die andere Ungleichung. • I˜ ist additiv, skalar und isoton. Einfach. • I˜ ist σ-stetig. + Sei F ∋ fn ր f. Seien T + ∋ fi,n րi fn . Dann konvergieren die Treppenfunktionen W gn := i,m≤n fi,m ≤ fn isoton gegen f. Aus der Sandwichposition ˜ ) = lim I(gn ) ≤ lim I(f ˜ n ) ≤ I(f ˜ ) I(f n ergibt sich die Behauptung. • Die Fortsetzung I˜ eingeschränkt auf I˜−1 (IR) ist σ-stetig. Verwende σ-Stetigkeit von unten und fn ց f ⇔ f1 − fn ր f1 − f. Es verbleibt die Eindeutigkeit der Fortsetzung zu zeigen. Dies ist einfach. q.e.d. + Bem: F ist die σ-Vervollständigung von unten bzgl. der (punktweisen) Ordnung von T + . I˜ ist die einzig mögliche σ-stetige Fortsetzung von I. Jede Funktion f : Ω 7→ IR hat eine eindeutige Zerlegung f = f + − f − mit f + := f ∨ ˜ + ) oder 0, f − = (−f )+ . Sei Fe der Raum alle meßbaren erweiterten Funktionen f mit I(f − ˜ ˜ I(f ) endlich. Erweitere I auf Fe durch ˜ ˜ ) := I(f ˜ + ) − I(f ˜ − ). I(f Dies Objekt nennen wir Integral bzw. genauer Lebesgueintegral. Dies ist (fast) der allgemeinste Integralbegriff. Gebräuchliche Notationen für das Integral I˜˜ sind ˜˜ ) =: µ(f ) =: I(f Z f (ω)dµ(ω) =: Z f (ω)µ(dω) =: Ω Z f dµ =: Z Für eine meßbare Menge A verwenden wir Z Speziell auf IR verwenden wir f dµ := Z f dµ := Z A Z b a f 11A dµ. f dµ. (a,b] Hat µ keine Punktmaße (∀x ∈ IR : µ(x) = 0), so benutzen wir auch Z b f dµ := a Z [a,b] f dµ =: − 29 Z a f dµ. b f = µ(f ) = µf. WS10/11 Maßtheorie Ist µ das Lebesguemaß λ auf IR so schreiben wir Z Für W-mas̈e P ist R f (x)λ(dx) = Z f (x)dx. f dP =: E(f ) =: Ef der Erwartungswert von f. Eine integrierbare Funktion f ist eine meßbare Funktion mit endlichem Wert Der Raum L1 der integrierbaren Funktionen ist ein Vektorraum. R |f |dµ < ∞. R Korollar 34 Das Integral auf den integrierbaren Funktionen ist eine additive, skalare, isotone und σ-stetige Abbildung. Üblicherweise wird nicht der Raum der integrierbaren Funktionen verwendet, sondern der Raum L1 der Äquivalenzklassen [f ] bzgl. der Äquivalenzrelation f ∼g⇔ Z |f − g|dµ = 0. Aus der Äquivalenzklasse werden dann Repräsentanten benutzt. (Der Integralwert ist unbeeinflußt von der Auswahl des Repräsentanten.) Der Sprachgebrauch unterscheidet nicht zwischen Funktionen und Äquivalenzklassen. Korollar 35 Es gibt eine Bijektion zwischen erweiterten, additiven, skalaren, positiven und von unten σ-stetigen Abbildungen I auf den positiven mes̈baren Funktionen und Mas̈en µ. Diese Bijektion kann gegeben werden durch I(11A ) = µ(A). Bew: Die so definierte Abbildung ist ein Mas̈ und I die eindeutige Erweiterung im obigen Sinne. q.e.d. Bemerkung: Sei A ein linearer Operator auf eine Vektorraum von Funktionen mit Werten in den reellen Zahlen. Dann ist A positiv genau dann wenn A isoton ist. Bsp: Dichte: Sei µ ein Maß und f ≥ 0 eine meßbare Funktion. Dann ist die Mengenfunktion ν : A 7→ IR, definiert durch ν(A) := Z f dµ, A ein Maß. Notation dν = f dµ oder auch ν = f µ. dν . Die Funktion f heißt Radon-Nikodym Dichte von ν bzgl. µ. Geschrieben g = dµ Bsp: Radon-Nikodym Dichte bzgl. dem Lesbesguemaß: Wir betrachten ein W-Maß µ auf (IR, B). Die zugehörige Verteilungsfunktion F sei stetig differenzierbar. Die Behauptung ist Z Z g(x)dµ(x) = g(x)F ′ (x)dx für alle integrierbarenR Funktionen g. Die Behauptung ist richtig für eine Treppe g = 11A mit A = (a, b]. (µ(A) = A F ′ (x)dx = F (b) −RF (a).) Damit ist sie richtig für jede A-meßbare Menge. (Die Menge M = {A ∈ A | µ(A) = A F ′ (x)dx} ist eine σ-Algebra,die einen Erzeuger enthält.) Da beide Seiten additiv und σ-stetig sind, gilt Gleichheit für alle positiven meßbaren Funktionen. Dann aber auch für alle integrierbaren Funktionen. Die Funktion F ′ ist die Radon-Nikodym Dichte aus obigem Beispiel. 30 WS10/11 U. Rösler Bsp: Diskrete Räume: Sei Ω endlich oder abzählbar versehen mit der Potenzmenge und P sei µ ein Maß. Dann ist µ = ω∈Ω f (ω)δω mit f (ω) = µ({ω}). Das Integral ist die Summe, Z gdµ = X g(ω)f (ω). ω∈Ω Die Abbildung ω 7→ f (ω) läßt sich als Radon-Nikodym Dichte von µ bzgl. dem Zählmaß auffassen. 3.0.4 Konvergenzsätze R Sei das oben definierte Integral für einen beliebigen Maßraum (Ω, A, µ). Wir benutzen R R f = f dµ. Satz 36 (Monotone Konvergenz)R Sei fn , n ∈R IN, eine steigende (fallende) Folge erweiterter meßbarer Funktionen und sei f1 > −∞ ( f1 < ∞.) Dann gilt Z lim fn = lim n n Z fn . Beweis: Dies ist die σ-Stetigkeit des Integrals. q.e.d. Lemma 37 (Lemma von Fatou) Sei fn , n ∈ IN, eine Folge erweiterter, meßbarer Funktionen. Sind die fn gleichmäßig nach unten beschränkt durch eine integrierbare Funktion, so gilt Z Z fn ≥ lim inf lim inf fn . Sind die fn gleichmäßig nach oben beschränkt durch eine integrierbare Funktion, so gilt lim sup Z fn ≤ Z lim sup fn . V Beweis: Definiere gm := m≤n fn . Die Folge gm , m ∈ IN, konvergiert aufsteigend gegen lim inf n fn . Mit dem Satz von der monotonen Konvergenz erhalten wir Z fm ≥ Z gm րm Z lim inf fn . n Für die zweite Aussage betrachte die Folge −fn und beachte lim inf(−fn ) = − lim sup fn . q.e.d. Satz 38 (Dominierte Konvergenz) Sei fn , n ∈ IN, eine punktweise konvergente Folge erweiterter, meßbarer Funktionen. Weiterhin sei |fn |, n ∈ IN, gleichmäßig durch eine integrierbare Funktion beschränkt. Dann gilt lim n Z fn = Z lim fn . Beweis: Folgerung aus dem Lemma von Fatou. lim sup Z fn ≤ Z lim sup fn = Z lim inf fn ≤ lim inf 31 Z fn ≤ lim sup Z fn . WS10/11 Maßtheorie q.e.d. Die Forderung einer Schranke ist essentiell. Als Beispiel betrachten wir: Ω = (0, 1] versehen mit der Borel σ-Algebra und dem Lebesguemaß λ. Sei fn := n11(0,1/n] . Es gilt limn fn ≡ 0, lim Z fn dλ = 1 > 0 = Z lim fn dλ. n Der Satz über dominierte Konvergenz ist nicht anwendbar. Das Lemma von Fatou ist anwendbar und die Ungleichung strikt. 3.0.5 Transformationssatz Satz 39 (Transformationssatz) Sei (Ω, A, µ) ein Maßraum und (Ω′ , A′ ) ein meßbarer Raum. Sei T : Ω 7→ Ω′ eine meßbare Abbildung. Dann gilt für meßbare (erweiterte) Funktionen f : Ω′ 7→ IR, sofern eine Seite wohldefiniert ist, Z f ◦ T dµ = Z f d(µT ) Beweis: Die Aussage ist leicht nachzurechnen für f = 11A′ , A′ ∈ A′ . (Übung). Beide Seiten sind lineare, σ-stetige Fortsetzungen (einer Mengenfunktion). Diese sind eindeutig. q.e.d. Beispiel: Sei T eine stetig differenzierbare Funktion auf den reellen Zahlen mit strikt positiver Ableitung T ′ und sei µ das Lebesguemaß. Es gilt die Transformationsformel mit y = T (x), f integrierbar, Z Z f (y) dy = f (T (x))dx. T ′ (T −1 (y)) Hierbei ist das Maß T µ gegeben durch T (µ )((a, b]) = Z 1 [a,b] T ′ (T −1 (y)) Z.B. f (x) = ex , T (x) = x2 = y, µ(dx) = dx, x2 = y, dx = Z ey √ dy = 2 y Z dy. dy √ 2 y, 2 ex dx. Für weitere und genauere Rechenregeln siehe Lehrbücher über Differential und Integralrechnung. Fubini Der wesentliche Satz dieses Abschnittes ist der Satz von Fubini. Seien (Ω, A, µ) und (Ω′ , A′ , µ′ ) meßbare Räume. Ein Maß ν auf dem Produktraum Ω × Ω′ N versehen mit der Produkt σ-Algebra A A′ = σ(E), E = {A × A′ | A ∈ A, A′ ∈ A′ } heißt Produktmaß zu µ, µ′ falls ν(A × A′ ) = µ(A)µ′ (A′ ) gilt für alle A × A′ ∈ E. 32 WS10/11 U. Rösler Der Schnitt Bω einer Menge B ⊂ Ω×Ω′ bzgl. ω ist die Menge {ω ′ ∈ Ω′ | (ω, ω ′ ) ∈ A ✬ N A′ }. ✩ B Bω ω ✫ ✪ Satz 40 Zu zwei Mas̈en gibt es ein Produktmas̈. Sind die Mas̈e σ-endlich, so ist das Produktmas̈ eindeutig. Beweis: Wir definieren ν durch ν(B) = Z Z 11Bω (ω ′ )µ′ (dω ′ )µ(dω). ( Die Menge D aller B für die obiges wohldefiniert ist, ist ein Dynkinsystem. Dies System enthält den durchschnittstabilen Erzeuger E der Produkt σ-Algebra. Damit ist D die Produkt σ-Algebra. Die Eindeutigkeit folgt aus Satz 14. q.e.d. N Notation: µ µ′ ist das Produktmaß, falls eindeutig definiert. N Bem: Sind µ, µ′ σ-endlich, so auch das Proktmaß µ µ′ . Satz 41 (Fubini) Seien µ, µ′ σ-endliche Maße. Dann gilt Z Z ( ′ ′ ′ f (ω, ω )dµ(ω))dµ (ω ) = Z ′ ′ ′ f (ω, ω )d(µ × µ )(ω, ω ) = Z Z ( f (ω, ω ′ )dµ′ (ω ′ ))dµ(ω). Beweis: Aus Symmetrie und Eindeutigkeitsgründen reicht es nur das zweite Gleichheitszeichen zu zeigen. Sei OEdA f positiv. Für f eine Treppe 11B mit B ∈ E gilt die Gleichheit. Da beide Seiten lineare und von unten σ-stetige Abbildungen auf mes̈baren Funktionen sind, gilt die Gleichheit für Treppenfunktionen und den aufsteigenden Grenzwert von Treppenfunktionen. Das war’s. q.e.d. Bemerkung: Die σ-Endlichkeit ist wichtig. Als Beispiel betrachten wir µ das Lebesguemaß und µ′ das Zählmaß auf dem Einheitsintervall. Die Funktion (x, y) 7→ f (x, y) = 11x=y ist meßbar. Es gilt Z Z ( Z Z ′ f (x, y)dµ(x))dµ (y) = 0 ( f (x, y)dµ′ (y))dµ(x) = 1. Diese Bemerkung zeigt, das̈ man die Eindeutigkeit des Produktmaßes nicht σ-endliche Maße und die Vertauschbarkeit der Integrale verliert (vgl. Halmos [7] page 145, Hahn-Rosenthal SET FUCTIONS 1948 chap IV,§16[6]). 33 WS10/11 34 Maßtheorie Kapitel 4 Ungleichungen Für Ungleichungen gibt es im wesentlichen zwei Quellen, über die Monotonie und über konvexe Funktionen. Ungleichungen mit Hilfe der Monotonie werden Markoffungleichungen genannt. Wesentliche bessere Ungleichungen ergeben sich durch konvexe Funtionen. Die Jensenungleichung in ihrer Grundform gilt jedoch nur für Wahrscheinlichkeitsmaße. Röslers Metatheorem: Alle guten Integralungleichungen beruhen auf Konvexität. 4.1 Markoff Ungleichung Die Ungleichungen in diesem Abschnitt beruhen auf Monotonie. Lemma 42 (Markoff Ungleichung) Sei ϕ : IR 7→ IR eine isotone, positive Funktion. Es gilt für alle a ∈ IR Z ϕ(f )dµ ≥ ϕ(a)µ(f ≥ a) Beweis: Beachte ϕ(a)11ϕ(f )≥ϕ(a) ≤ ϕ(f ) und verwende die Isotonie des Integrals. Wichtige Spezialfälle sind die Momentabschätzungen für ϕ(x) = xp , x, p ≥ 0 Z q.e.d. |f |p dµ ≥ ap µ(|f | ≥ a) und die exponentiellen (=Chernoff) Abschätzungen, ϕ(x) = exp(λx), λ ≥ 0 Z exp(λf )dµ ≥ exp(λa)µ(f ≥ a). Für W-maße ist ein praktischer und wichtiger Spezialfall die Tchebyscheff Ungleichung: Z (f − e)2 dµ ≥ a2 µ(|f − e| ≥ a) R mit dem Erwartungswert e = f dµ. Bemerkung: – In der Regel werden die Momentenabschätzungen besser für zentrierte Momente. 35 WS10/11 Maßtheorie – Die Momentenabschätzungen sind besser als die Chernoff Abschätzungen, da gilt, (Übung Reihenentwicklung) R R exp (λf )dµ |f |p dµ ≤ inf . inf p p>0 λ>0 a exp (λa) Da sich höhere Momente schlecht berechnen lassen, werden gerne exponentiellen Abschätzungen genommen. Diese sind in der Regel gut. Proposition 43 R |f |dµ = 0 ⇔ µ(|f | > 0) = 0. R Beweis: Die Markoff Ungleichung aµ(|f | > a) ≤ |f |dµ liefert die Hinrichtung. Für die R R Rückrichtung sei |f |dµ > 0. Folglich gibt es eine Treppenfunktion 0 ≤ g ≤ |f | mit gdµ > 0. Für diese gilt 0 < µ(g > 0) ≤ µ(|f | > 0)). q.e.d. 4.2 Jensen Ungleichung Die Ungleichungen in diesem Abschnitt beruhen auf Konvexität. Eine reellwertige Funktion ϕ auf einem Intervall I heißt konvex, falls für alle t ∈ (0, 1) und x 6= y ∈ I gilt ϕ(tx + (1 − t)y) ≤ tϕ(x) + (1 − t)ϕ(y). (4.1) Sie heis̈t strikt konvex, falls in 4.1 stets echt kleiner gilt. Satz 44 (Jensen) Sei P ein W-mas̈ und ϕ eine konvexe Funktion. Dann gilt für jede integrierbare Funktion f , sofern alles wohldefiniert ist, Z ϕ ◦ X dP ≥ ϕ( Z f dP ). Gleichheit gilt genau dann, wenn die Funktion ϕ eine Gerade ist, P f −1 fast überall. Beweis: Ohne Beweis sei angeführt, daß es für jedes x0 ∈ IR eine lineare Funktion l, l(x) = ax + b) (=Tangente) gibt mit l ≤ ϕ und l(x0 ) = ϕ(x0 ). Es gilt mit x0 = inf f dP Z ϕ ◦ f dP ≥ Z l ◦ f dP = l( Z f dP ) = l(x0 ) = ϕ(x0 ). (4.2) • Gleichheit. R Gilt überall Gleichheit in (4.2), so folgt (ϕ − l) d(P f −1 ) = 0 und daraus nach (43) die | {z } ≥0 Bedingung. Umgekehrt, die Bedingung impliziert die Gleichheit in (4.2). q.e.d. Merkregel Meine Eselsbrücke ist Falscher Effee für Eϕ ≥ ϕE. Bemerkung: – Für strikt konvexe Funktionen gilt Gleichheit genau dann, wenn f fast sicher konstant ist. – Die Jensen-Ungleichung gilt auch, sofern EX wohldefiniert ist. (Der Positivteil oder der Negativteil von X ist integrierbar.) – Die Jensen-Ungleichung gilt auch für konvexe Funktionen ϕ : I → IR auf einem Intervall I. Warnung: Die Jensenungleichung gilt nur für Wahrscheinlichkeitsmaße. 36 WS10/11 U. Rösler Beispiel: p-te Momente Für 1 ≤ p < ∞ gilt für W-maße P Z P |f |p dP ≥ ( Z |f |dP )p . Aber es gilt n∈IN |xn |p ≤ ( n |xn |)p für das Zählmas̈. Mehrere interessante Ungleichungen folgen aus der Jensen Ungleichung in folgender verallgemeinerter Form: Korollar 45 (Jensen) Sei ϕ eine konvexe Funktion und µ ein Maß auf den reellen Zahlen. Seien f, g meßbare Funktionen und sei g integrierbar und überall strikt positiv. Dann gilt, Wohldefiniertheit vorausgesetzt, R R f gϕ(f /g) R ϕ( R ) ≤ . g g Beweis: Das W-maß ν, gegeben durch ν(A) := W-maß. Die Jensenungleichung ergibt linke Seite = ϕ Z f dν ≤ g Z 1R a A gdµ, A ∈ A, und a := R gdµ ist ein f ϕ( )dν = rechte Seite. g Lp -Ungleichungen: Definiere für 1 ≤ p < ∞ die Abbildung k.kp auf meßbaren Funktionen durch Z kf kp := ( |f |p dµ)1/p . (4.3) Die Abbildung ist wohldefiniert. Satz 46 (Hölder Ungleichung) Sei 1 < p < ∞ und q definiert durch 1/p + 1/q = 1. Für meßbare Funktionen f, g gilt kf gk1 ≤ kf kp kgkq . (4.4) Sind obige Ausdrücke endlich und ungleich 0, so gilt Gleichheit genau für |f |p und |g|q sind echte Vielfache voneinander fast sicher. Beweis: Sei die rechte Seite endlich. Nehme in Korollar 45 die konvexe Funktion ϕ(x) = −x1/p und die Funktionen |f |p , |g|q . Es ergibt sich die Hölderungleichung. Da ϕ strikt konvex ist, gilt Gleichheit genau im Fall |f |p /|g|q eine Konstante. q.e.d. Corollary 47 (Cauchy-Schwarz Ungleichung) Z |f g|dµ ≤ sZ f 2 dµ Z g 2 dµ. Beweis: Spezialfall der Hölderungleichung für p = 2. Corollary 48 Für 1 < p, q, r und 1/p + 1/q = 1/r gilt kf gkr ≤ kf kp kgkq . Satz 49 (Minkowski) Für 1 ≤ p < ∞ gilt kf + gkp ≤ kf kp + kgkp . Gleichheit gilt genau für f und g sind fast sicher positive Vielfache voneinander f.s.. 37 q.e.d. WS10/11 Maßtheorie Beweis: Für die Minkowskiungleichung verwende IR+ ∋ x 7→ ϕ(x) = −(1 + x1/p )p und die Funktionen |f |p und |g|p . Die Gleichheit ergibt sich genau für |f | und |g| Vielfache voneinander und |f + g| = |f | + |g| fast sicher. q.e.d. Die letzten 4 Aussagen gelten auch für 1 ≤ p, q, r ≤ ∞, wenn wir kf k∞ := inf{a > 0 | µ(|f | > a) = 0} setzen. kf k∞ heißt essentielles Supremum esssupf von |f | oder L∞ -Norm. 38 Kapitel 5 Orlicz und Lp-Räume Besonders schöne Räume von meßbaren Funktionen sind Lp -Räume, eine Unterklasse der Orlicz Räume. Hiervon wiederum sind die L2 -Räume als Hilberträume besonders interessant. Jeder Hilbertraum ist isomorph zu einem L2 -Raum. 5.1 Orlicz-Räume Eine Orliczfunktion ist eine unterhalbstetige positive konvexe Funktion ϕ : IR+ 7→ IR+ mit ϕ(0) = 0 ungleich der 0-Funktion. Eine erweiterte Orliczfunktion ist eine unterhalb stetige, + positive, konvexe, erweiterte Funktion ϕ : IR+ 7→ IR mit ϕ(0) = 0 und die Endlichkeitsmenge D = ϕ−1 (IR) hat ein nichtleeres Inneres. Orlicz Funktionen sind monoton steigend, links stetig und stetig bis auf eventuell in dem rechten Randpunkt dr > 0 von D. Sie besitzen eine rechtsseitige Ableitung D+ ϕ(x) = limy↓x ϕ(y)−ϕ(x) und eine linksseitige Ableitung D− ϕ(x) = limy↑x ϕ(y)−ϕ(x) im Inneren von D. y−x y−x Erweitere die rechtsseitige (links-) Ableitung rechtsstetig (links-) zu einer erweiterten Funktion via dem Wert ∞ auf (dr , ∞). Die Ableitungen sind jeweils monoton wachsend und rechtsbzw. linksstetig. Die linksseitige Ableitung ist stets kleiner gleich der rechtsseitigen und sie stimmen überein bis auf eventuell abzählbar viele Punkte. Jede erweiterte Orliczfunktion ϕ hat die Darstellung ϕ(x) = Z Dϕ(dy) = [0,x[ Z (x − y)+ µ(dy) mit µ ist ein Radonmaß auf D (zu DDϕ mit µ({0}) = 0). (Es ergibt sich dasselbe Maß für die links- bzw. rechtseitige Ableitung.) Sei (Ω, A, µ) ein Maßraum und ϕ eine erweiterte Orlicz Funktion. Definiere die Abbildung d = dϕ : F × F → IR auf meßbaren Funktionen f, g via dϕ (f, g) := inf{c > 0 | R Z |f − g| dµ ≤ 1}. ϕ c −g| Proposition 50 Es gilt ϕ d|f dµ ≤ 1. ϕ (f,g) dϕ ist symmetrisch, erfüllt die Dreiecksungleichung dϕ (f, g) ≤ dϕ (f, h) + dϕ (h, g) und ist ideal, d.h. dϕ (f + h, g + h) = dϕ (f, g) und dϕ (af, ag) = adϕ (f, g), a > 0. 39 WS10/11 Maßtheorie Bew: Die erste Aussage folgt aus monotoner Konvergenz. Wir rechnen nur die Dreiecksungleichung nach. OEdA sei die rechte Seite endlich. Sei a > dϕ (f, h) und b > dϕ (g, h). Dann gilt Z |f − g| ϕ dµ ≤ a+b Z b |g − h| a |f − h| + ϕ dµ a+b a a+b b Z Z b a |f − h| |g − h| ϕ ϕ ≤ dµ + dµ a+b a a+b b a b ≤ + = 1. a+b a+b q.e.d. Die letzte Eigenschaft führt auf Vektorräume. Sei k · kϕ : F → IR definiert durch kf kϕ = dϕ (f, 0). Definiere Lϕ als die Menge aller f mit kf kϕ endlich. (Dies ist die Menge aller f mit R ϕ( |fc | )dµ < ∞ für ein c > 0.) Lϕ ist ein Vektorraum. Sei Lϕ der Raum der Äquivalenzklassen bzgl. der Äquivalenzrelation ∼ϕ , f ∼ϕ g ↔ dϕ (f, g) = 0 Diese stimmt überein mit f ∼ g ⇔ µ(f 6= g) = 0. In Lϕ benutzen wir die übliche Addition + +([f ], [g]) := [f ] + [g] := [f + g] die Skalarmultiplikation · : IR × Lϕ → Lϕ ·(c, [f ]) := c[f ] := [cf ] und die Abbildung dϕ ([f ], [g]) = dϕ (f, g) und k · kϕ : Lϕ 7→ IR k[f ]kϕ := dϕ (f, 0). Lϕ heißt Orlicz Raum und k.kϕ die Orlicz Norm. Warnung: Wir unterscheiden in der Regel notationsmäßig nicht zwischen Funktionen und ihren Äquivalenzklassen. Ebenso interessiert in der Regel nicht, wie groß die Äquivalenzklassen wirklich sind. Bem: Das Verhalten der konvexen Funktion am rechten Endpunkt dr spielt keine Rolle in der Definition des Orliczraumes. Wir könnten daher auch die Forderung unterhalbstetig weglassen. Satz 51 Für jede erweiterte Orlicz Funktion ϕ ist (Lϕ , k.kϕ ) ein Banachraum. Beweis: Alle genannten Objekte sind wohldefiniert. Lϕ ist ein Vektorraum und k.kϕ ist eine Norm (wird nachgerechnet). Beachte hierbei 1 1 ϕ(|f − g|) ≤ ϕ(|f |) + ϕ(|g|). 2 2 Wir kommen jetzt zur Vollständigkeit. Sei [fn ] ∈ Lϕ eine Cauchyfolge. Wir können eine Teilfolge ni →i ∞ wählen mit k[fni+1 ] − [fni ]kϕ = bi < 2−i . Es reicht den Satz für die Teilfolge zu zeigen. Also können wir oEdA annehmen, die Teilfolge ist die Originalfolge. Nehme P Funktionen fn als Representanten der Äquivalenzklasse [fn ]. Sei g = n∈IN |fn+1 − fn | 40 WS10/11 U. Rösler • kgkϕ ≤ 1. P Für vorgegebenes ǫ = i ǫi < ∞ mit ǫi > 0 argumentiere Z |g| ϕ dµ ≤ 1+ǫ ≤ Z ϕ X bn + ǫn |fn+1 − fn | 1+ǫ n X bn + ǫ n Z ϕ 1+ǫ n ≤ 1 bn + ǫn ! dµ |fn+1 − fn | dµ bn + ǫ n Mit ǫ → 0 folgt die Teilbehauptung. • g is f.s. endlich. Wende die Markoffungleichung an auf die konvexe Funktion x 7→ ϕ( xc ) mit c = kf kϕ µ(g > a) ≤ R ≤ ϕ P ϕ ϕ 1 a c |g| c a c dµ →a→∞ 0. • fn →n f = f1 + i∈IN (fi+1 − fi ) in Orlicznorm. P f ist wohldefiniert und endlich fast sicher. Aus der Teleskopdarstellung f = fn + i≥n (fi+1 − fi ) folgt X X kf − fn kϕ ≤ k (fi+1 − fi )kϕ ≤ kfi+1 − fi kϕ →n 0. i≥n i≥n Es verbleibt zu zeigen, dass die Äquivalenzklasse von [f ] unabhängig ist von der Auswahl der Repräsentanten. (Wir überschlagen dies.) q.e.d. Eine Orliczfunktion erfüllt die ∇−Bedingung falls es ein a > 1 und b < ∞ gibt mit ϕ(ax) ≤ bϕ(x) für alle x ≥ 0. Satz 52 Sei ϕ eine Orlicz Funktion mit der ∇−Bedingung. Dann ist (Lϕ , k.kϕ ) separabel für jedes Radon Maß auf Ω = IR. Beweis: Sei zuerst µ ein endliches Maß. Die Menge T aller Treppenfunktionen N X qn 11(rn ,sn ) n=1 mit rationalen Zahlen qn , rn , sn ∈ Ql, N ∈ IN tut’s. • T ist abzählbar. • 1A , A ∈ A liegt in dem Abschluß T von T bezüglich k.kϕ . Wegen der Regularität des Maßes können wir A durch eine offene Menge U von oben dem Maße nach approximieren. Jede offenen Menge können wir als abzählbare Vereinigung disjunkter offener Intervalle Un , n ∈ IN, schreiben. Jedes Un approximieren wir von oben 41 WS10/11 Maßtheorie durch offene Intervalle Vn mit rationalen Koeffizienten. Sei V := ∪N n=1 Vn . Damit ist für jedes vorgegebene c > 0 Z ϕ |11A − 11V | dµ = c Z 1 |11A − 11V |dµ c 1 ≤ ≤ϕ (µ(U \A) + µ(V \U )) c ϕ beliebig klein durch Wahl geeigneter Approximationen. • Alle Treppenfunktionen liegen in T . • Alle positiven f ∈ Lϕ liegen in T und dann auch ganz Lϕ . Hier muss man aufpasssen. Approximiere f von unten durch Treppenfunktionen fn . Dies kann geschehen mit f − fn ≤ {f rac1n auf einer Menge An mit µ(Acn ) klein. Wir erhalten Z ϕ( f − fn 1 ) ≤ ϕ( )µ(An ) + c nc Z f ϕ( ) c An Der erste Term ist klein in n für festes c. Der zweite wird abgeschätzt mit Hilfe der ∇−Bedingung durch µ(An )bm mit m so gewählt, dass cam ≥ kf kϕ gilt. Dies wird beliebig klein für n hinreichend gross. • Lϕ liegt in T . Zerlegung in Positiv und Negativteil. • T tut’s auch für nicht endliche Maße. Zerlege den Raum Ω geeignet durch eine Partition und ’klebe’ aneinander. Puh. q.e.d. Bem: Ohne die ∇−Bedingung gibt es Gegenbeispiele zur Separabilität. Lp -Räume Das Standardbeispiel ist die Orlicz Funktion ϕp (x) = xp für ein 1 ≤ p < ∞. Die Orlicznorm wird Z kf kϕp = ( |f |p dµ)1/p . Der Orlicz-Raum Lϕp heißt Lp -Raum und die zugehörige Orlicz-Norm k.kp := k.kϕp heißt Lp -norm. Bemerkung: Die L∞ -Norm wird definiert durch kf k∞ := esssup|f | := inf{α ∈ IR | µ(|f | > α) = 0} (5.1) und L∞ analog dazu. Die L∞ -Norm und der L∞ -Raum ist die Orlicz Norm und der Orlicz Raum zur erweiterten Orlicz Funktion ϕ = ∞11(1,∞) . Der Raum L∞ ist vollständig, aber im allgemeinen nicht separabel. Proposition 53 Sei µ ein W-maß und 1 ≤ p ≤ q ≤ ∞. Dann gilt kf kp ≤ kf kq und Lp ⊃ Lq . Beweis: Jensen angewandt auf die konkave Funktion x 7→ xp/q , x ≥ 0 ergibt kf kp = Z |f | p 1/p Z ≤ |f | pq/p p/qp = kf kq . Die erste Aussage impliziert die zweite Aussage. q.e.d. Bemerkung Sei 1 ≤ p < ∞. Sei L∗p der Dualraum, d.h. der Raum der linearen und stetigen Funktionale auf Lp . Der Satz von Fischer-Riesz besagt L∗p = Lq mit 1/p + 1/q = 1. R Für jedes lineare stetige Funktional B : Lp → IR gibt es ein g ∈ Lq mit B(f ) = f gdµ. ⊃ Warnung: Im allgemeinen gilt L∗∞ 6= L1 . Hilberträume Besonders wichtig sind die L2 -Räume, da sie Hilberträume sind. 42 WS10/11 U. Rösler Lemma 54 L2 versehen mit der Bilinearform < f, g >:= und der Norm √ Z f g dµ < f, f > = kf k2 ist ein Hilbertraum. Hilberträume sind selbstdual. Jeder Hilbertraum hat eine Orthonormalbasis. Hilberträume mit gleicher Kardinalität der Orthonormalbasis sind isomorph. Hilberträume mit vorgegebener Basiskardinalität lassen sich über Zählmaße konstruieren. (D eine Menge, µ(A) = |D ∩ A| 11d , d ∈ D bildet Orthonormalbasis mit der gleichen Kardinalität wie D. ) Die Separabilität eines Hilbertraumes ist äquivalent zur Existenz einer höchstens abzählbaren Basis. Die Hilberträume sind genau die L2 -Räume. ⊃ Warnung: Im allgemeinen gilt L∗∞ 6= L1 . Die Hilberträume sind genau die L2 -Räume. 43 WS10/11 44 Maßtheorie Kapitel 6 Konvergenz und Topologie Wir betrachten verschiedene Konvergenzarten auf dem Raum der Maße und auf dem Raum der Zufallsgrößen. Beachte, daß fast jede Konvergenzart eine Konvergenz im topologischen Sinne ist und umgekehrt, (Pedersen [9]). (Ein topologischer Raum ist ein Tupel (E, τ ), wobei E eine Menge ist und τ eine Teilmenge der Potenzmenge ist, die E enthält und abgeschlossen ist bezüglich endlichem Durchschnitt und beliebiger Vereinigung. Eine Folge en ∈ E, n ∈ IN, konvergiert gegen e ∈ E, falls für alle U ∈ τ mit e ∈ U es ein n0 gibt, sodaß für alle n ≥ n0 gilt en ∈ U.) Die fast sichere Konvergenz ist eine Aussnahme, dies ist keine topologische Konvergenzart. 6.1 Konvergenz von W-maßen R Für ein Maß µ und eine Funktion f benutzen wir µ(f ) := f dµ, falls dies wohldefiniert ist. Eine Folge µn von Maßen konvergiert bzgl. einer Klasse F von Funktionen, falls für alle f ∈ F gilt µn (f ) →n µ(f ). K Notation: µn →n µ. Die zugehörige Topologie wird erzeugt von den Mengen Z Z Uǫ,f (µ) := {ν | f dν − f dµ < ǫ}, ǫ > 0, f ∈ F. Für F bestehend aus den Treppen 11A , A ∈ A, erhalten wir die punktweise Konvergenz von Maßen. Ab jetzt sei (Ω, τ ) ein topologischer Raum. Wir sprechen von schwacher Konvergenz für die Konvergenz bezüglich aller stetigen beschränkten Funktionen. C w d Notation: µn →n µ oder µn →n µ oder µn →bn µ. Hierbei steht w für weak , d für distribution und Cb für die Funktionenklasse. (Die W-theoretische schwache Konvergenz ist die funktionalytische schwach* Konvergenz.) Wir sprechen von vager Konvergenz für die Konvergenz bzgl. allen stetigen Funktionen mit kompaktem Träger. (Der Träger supp(f ) einer Funktion ist die kleinste abgeschlossene Menge f 6= 0 enthaltend.) v Notation: µn →n µ. 45 WS10/11 Maßtheorie Eine Familie M von Maßen heißt straff, falls es für alle ǫ > 0 eine kompakte Menge K gibt mit µ(K c ) ≤ ǫ für alle µ ∈ M. Lemma 55 Eine Folge von W-maßen konvergiert schwach genau dann, wenn sie vage konvergiert und die Familie straff ist. d v µn →n µ ⇔ µn →n µ und {µn , n ∈ IN } straff. Beweis: ⇒‘ Sei K ein kompaktes Intervall und Kǫ := {x ∈ IR | ∃y ∈ K : |x − y| ≤ ǫ}. Es ’ gibt eine stetige Funktion f, die auf dem Kompaktum K stets 1 ist, außerhalb von Kǫ stets 0 und ansonsten von unten durch 0, von oben durch 1 beschränkt ist (Lemma von Urysohn, [3]). Es gilt µn (Kǫc ) ≤ µn (1 − f ) →n µ(1 − f ) ≤ µ(K c ). Wählen wir K mit µ(K) ≥ 1 − ǫ so gilt µn (Kǫc ) < ǫ bis auf endlich viele n. Wir vergrößern K entsprechend, um die restlichen n’s mit einzuschließen. ⇐‘ Sei g stetig, beschränkt, und f, K wie oben. Argumentiere g = f g + (1 − f )g, ’ |µn (g) − µ(g)| = |µn (f g) − µn (f g)| + |µn ((1 − f )g) − µ((1 − f )g)|. Der erste Term wird klein für n hinreichend groß. Der zweite Term wird abgeschätzt durch ≤ kgk∞ (µn (K c ) + µ(K c )) und klein für K hinreichend groß. q.e.d. Beispiel: µn = δn auf den reellen Zahlen konvergiert vage (gegen Null), aber nicht schwach. Für eine Verteilungsfunktion F sei F −1 die linksstetige Inverse F −1 (u) := inf{x | F (x) ≥ u}. Lemma 56 Seien µ, µn , n ∈ IN, W-maße auf den reellen Zahlen. Äquivalent sind die Aussagen i) Die Folge µn konvergiert schwach gegen µ. ii) Die Folge konvergiert bezüglich einer der Klassen Cc , Cb∞ , Cc∞ . iii) Die zugehörigen Verteilungsfunktionen Fn konvergieren gegen F für alle Stetigkeitspunkte von F. iv) Die Inversen Fn−1 konvergieren gegen F −1 für alle Stetigkeitspunkte von F −1 . Beweis: i) ⇔ ii). Konvergenz bzgl. Cb ist hier gleichbedeutend, Lemma 55, mit Konvergenz bzgl. Cc . Jede Funktion aus Cc läßt sich in Supremumsnorm beliebig gut durch eine Cc∞ Funktion approximieren. Dies reicht. i)⇒ iii) Sei fa diejenige stetige Funktion,die 1 auf (−∞, a], 0 auf [a + ǫ, ∞) und sonst linear ist. Es gilt F (a − ǫ) ≤ µ(fa−ǫ ) ←n µn (fa−ǫ ) ≤ Fn (a) ≤ µn (fa ) →n µ(fa ) ≤ F (a + ǫ). Anders geschrieben, F (a − ǫ) ≤ lim inf Fn (a) ≤ lim sup Fn (a) ≤ F (a + ǫ). n n Dies gilt für alle ǫ > 0. 46 WS10/11 U. Rösler iii) ⇐ i) Die Menge S der Stetigkeitspunkte von F ist dicht. (Eine monoton steigende Funktion hat höchstens abzählbar viele Unstetigkeitspunkte und ides sind Sprungstellen.) Betrachte die Menge aller meßbarer beschränkter Funktionen f mit µn (f ) →n µ(f ). Diese Menge ist abgeschlossen bzgl. Addition und gleichmäßiger Konvergenz. Sie enthält alle Treppen 11(−∞,s] mit s ∈ S ein Stetigkeitspunkt. Die Menge enthält alle stetigen Funktion mit kompaktem Träger, da diese sich gleichmäßig durch Treppenfunktionen obiger Treppen approximieren lassen. Folglich konvergiert µn vage. Zusammen mit Straffheit der Folge, siehe gleich, folgt schwache Konvergenz. • µn , n ∈ IN, ist straff. Wähle Stetigkeitspunkte s1 , s2 mit F (s1 ) < ǫ, F (s2 ) > 1 − ǫ. Für K = [s1 , s2 ] gilt µn (K c ) ≤ Fn (s1 ) + 1 − Fn (s2 ) →n F (s1 ) + 1 − F (s2 ) < 2ǫ. Daher gilt µn (K c ) < 2ǫ bis auf endlich viele n. Wir vergrößern jetzt K entsprechend, um diese n mit einzuschließen. iii) ⇔ iv) Dies ist einfach für F stetig und strikt steigend. Der allgemeine Fall ist eine unschöne Übung. q.e.d. Eine Familie F von Funktionen heißt separabel oder trennend bzgl. einer Familie M von Maßen, falls je zwei Maße aus der Familie sich für mindestens eine Funktion f aus der Funktionenfamilie unterscheiden. (∀µ 6= ν ∈ M∃f ∈ F : µ(f ) 6= ν(f ).) Cc ist W-maß trennend, Lemma 56 und Eindeutigkeit der Verteilungsfunktion. 6.1.1 Gleichgradige Integrierbarkeit Gleichgradige Integrierbarkeit ist eine Eigenschaft von Maßen. Wir werden die w-theoretische Sprache mit Zgn verwenden. Eine Familie F von Zgn heißt gleichmäßig integrierbar oder gleichgradig integrierbar, falls gilt Z g(c) := sup X∈F {|X|>c} |X|dP −→c→∞ 0. Für eine Funktion f heißt die Familie F gleichmäßig f -integrierbar oder gleichgradig f integrierbar, falls die Familie f (X), X ∈ F gleichmäßig integrierbar ist. Eine Familie F von Zgn heißt p-gleichmäßig integrierbar 1 ≤ p < ∞, oder gleichmäßig p-integrierbar , falls sie gleichgradig f -integrierbar ist für die Funktion f (x) = |x|p . Bem: Gleichgradige Integrierbarkeit ist eine Eigenschaft der Verteilungen der Zgn und hängt nicht von der Realisation der Zgn ab. Bem: Eine Familie gleichgradig integrierbarer Zgn erfüllt stets supX E|X| ≤ c+g(c) < ∞. Für eine Zg X definiere H = HX : [0, 1] 7→ IR Z HX (t) := sup{ A |X|dP | P (A) ≤ t}. Für eine Familie F von Zgn benutzen wir HF (t) := sup HX (t). X∈F Falls der W-raum reichhaltig genug ist und eine gleichförmig verteilte Zg besitzt, (was wir stets annehmen,) so gilt HX (t) = Z 1 1−t 47 F −1 (u)du, WS10/11 Maßtheorie mit F die Verteilungsfunktion zu |X|. (Übung) Satz 57 Für eine Familie F von Zgn sind die folgenden beiden Aussagen äquivalent: (i) F ist gleichgradig integrierbar. (ii) Für alle ǫ > 0 gibt es eine integrierbare Zg Y mit supX∈F (iii) HF : [0, 1] → IR ist stetig in 0. R |X|>Y |X|dP < ǫ. (iv) Es gibt eine aufsteigende Funktion ϕ : IR+ → IR+ mit limx→∞ gleichgradig ϕ| · |-integrierbar. ϕ(x) x = ∞ und F ist Beweis: i)⇒ ii) Wähle Y als eine Konstante. ii) ⇒ iii) In der Zerlegung Z A |X| = Z A∩{|X|>Y } |X| + Z A∩{|X|≤Y } |X| ≤ Z |X|>Y |X| + Z A |Y | ist der erste Term klein durch Wahl des Y glm. in X. Der zweite Term ist klein in P (A) klein glm. in X. iii) ⇒ i) Zu vorgegebenem ǫ > 0 wähle ein p > 0 mit HF (p) < ǫ. Wähle eine Partition 1 (Ai )N i=1 von Ω in N ≤ p + 1 Mengen vom Maß ≤ p. Dann gilt gleichmäßig in X ∈ F Z |X| ≤ Z ∪i A i |X| ≤ XZ i Ai |X| ≤ HF (p)N < ∞. Die Markoffungleichung liefert sup P (|X| > c) ≤ sup X X R ǫN |X| ≤ →c→∞ 0 c c Es folgt sup X Z |X|>c |X| ≤ sup HX (P (|X| > c) ≤ sup HF (P (|X| > c) ≤ HF (sup(P (|X| > c)) →c→∞ 0 X iv) ⇒ i) Z |X|>c X |X| = Z |X|>c X |x| |X| ϕ(|X|) ≤ sup Eϕ(|X|). ϕ(|X|) x≥c ϕ(|x|) Der erste Faktor konvergiert mit c → ∞ gegen 0 glm. in X ∈ F und der zweite ist endlich gleichmäßig für X ∈ F. i) ⇒ iv) Wähle aufsteigende Folge 0 = e0 < en →n ∞ mit g(en ) ≤ 2−n . Definiere die P Funktion ϕ durch ϕ(x) = n∈IN0 (|x| − en )+ . ϕ ist symmetrisch und auf IR+ strikt monoton steigend gegen unendlich. Es gilt X X (x − en )+ ϕ(x) (x − en )+ lim inf = lim ≥ = n0 →n0 ∞ x→∞ x x x x x n n≤n lim 0 48 WS10/11 U. Rösler Zu vorgegebenem n0 sei c gross mit ϕ(en0 ) < c Z XZ ϕ(|X|) = ϕ|X|>c n ϕ(|X|)>c X Z ≤ (|X| − en )+ + n≥n0 |X|>en0 X Z ≤ n≥n0 |X|≥en X ≤ 2−n + (|X| − en ) + |Xn | + X n<n0 n≥n0 X X Z n<n0 ϕ(|X|)>c |X| g(ϕ−1 (c)) n<n0 g(ϕ−1 (c)) →c→∞ 0 gleichmäßig für X ∈ F. q.e.d. Bemerkung: Die hier konstruierte Funktion ϕ ist eine Orlicz Funktion (ϕ ist positiv, konvex und ϕ(0) = 0). Zusätzlich ließe sich ϕ glatt wählen, eventuell unendlich oft differenzierbar und ϕ(x) > 0 für x > 0. Der wesentliche Einsatz gleichgradiger Integrierbarkeit besteht in folgendem Lemma. Lemma 58 Die Folge (Xn )n konvergiere in Verteilung gegen X∞ . . Dann ist gleichgradige R R Integrierbarkeit der Familie Xn , n ∈ IN äquivalent zu |Xn | →n |X| < ∞. Bew: Hinrichtung: Sei stets c ∈ IR. R R • |X| ≤ lim inf n |Xn | < ∞ Z |X| ∨ c = lim n Z |Xn | ∨ c ≤ lim inf n Mit dem Grenzwert c → ∞ folgt die Teilbehauptung. R R • lim supn |Xn | ≤ |X| Z |X| ≥ Z |X| ∨ c = lim n Z |Xn | ∨ c = lim( n ≥ lim sup n Z Z |Xn | − |Xn | − lim sup n R Z R Z Z |Xn | (|Xn | − c)+ (6.1) (|Xn | − c)+ ) ≥ lim sup n Z |Xn | − g(c) (6.2) R Mit c → ∞ erhalten wir lim sup |Xn | ≤ |X| ≤ lim inf |Xn | und damit die Hinrichtung. Für die Rückrichtung verwenden wir die Funktion gc mit gc (x) = 11x≥c +(x−c+1)11c−1≤x<c . Z |Xn |>c |Xn | = Z ≤ | Z +| |Xn | − Z |Xn | − Z |Xn |≤c Z |Xn | |X|| + | gc (|Xn |) − Z Z |X| − gc (|X|)| + =: I + II + III + IV + V Z Z |X| ∨ c| + ( Z |Xn |≤c |Xn | − Z gc (|Xn |)) gc (|X|) Zu vorgegebenem ǫ gibt es ein c0 und ein n0 so, dass für alle n ≥ n0 jeder der Terme kleiner als ǫ/5 wird. Zu jedem festen n < n0 gibt es ein cn so, dass die linke Seite kleiner als ǫ wird. Dann folgt mit c = sup0≤i<n0 die gewünschte Aussage g(c) < ǫ. 49 WS10/11 Maßtheorie Korollar 59 Sei Xn , n ∈ IN eine gegen X in Verteilung konvergierende Folge von Zgn. Ist die Familie (Xn )n gleichgradig integrierbar, so vertauschen für jede stetige Funktion f mit lim sup |x|→∞ das Integral und der Limes, lim n Z |f (x)| <∞ |x| f (Xn ) = Z (6.3) f (X). Bew: Die Familie f (Xn ), n ∈ IN ist gleichgradig integrierbar und konvergiert in Verteilung. q.e.d. Das folgende Korollar ist eine W-theoretische Aussage. Korollar 60 Die L1 -Konvergenz einer Folge (Xn )n von Zgn ist äquivalent zur stochastischen Konvergenz und gleichgradiger Integrierbarkeit. Beide Grenzwerte stimmen fast sicher überein. Bew: Hinrichtung: Die L1 -Konvergenz impliziert stochastische Konvergenz und diese Konvergenz in Verteilung. Das obige Lemma liefert wegen kXn k → kXk1 die gleichgradige Integrierbarkeit. Für die Rückrichtung argumentiere Z |Xn − X| ≤ Z |X−Xn |<ǫ ... + Z ǫ≤|X−Xn |<c ≤ ǫ + cP (|X − Xn | ≥ ǫ) + 2 Z ... + Z |Xn |<c/2 c≤|X−Xn | |Xn | + 2 ... Z |X|>c/2 |X| alle drei Terme werden beliebig klein für kleine ǫ, große c und n hinreichend groß. q.e.d. Korollar 61 Seien Xn , n ∈ IN , p-integrierbare Zgn, 1 ≤ p < ∞. Dann sind äquivalent • Xn konvergiert in Lp . • Xn → X stochastisch und kXn kp → kXkp < ∞. • Xn konvergiert stochstisch und die Familie Xn , n ∈ IN ist gleichgradig p-integrierbar. Im Konvergenzfalle sind der stochastische und der Lp -Limes gleich. Der Beweis ist einfach aus Obigem. .......................................................................... 6.1.2 Weitere Metriken Metriken für Verteilungsfunktionen: Weitere Metriken lassen sich aus den Verteilungsfunktionen konstruieren. Hintergrund ist die eineindeutige Zuordnung von Maßen und Verteilungsfunktionen. Beispiele auf dem Raum der Verteilungsfunktionen sind d(F, G) := kF − Gk∞ d(F, G) = inf {ǫ | ∀x ∈ IR : |F (x) − G(x + ǫ)| < ǫ und |F (x) − G(x − ǫ)| < ǫ} 50 WS10/11 d(F, G) = Z U. Rösler |F (x) − G(x)|dx. Diese Metriken auf den Verteilungsfunktionen sind auch Metriken auf W-maßen, durch Identifizierung von Verteilungsfunktion und W-maß. (d(µ, ν) = d(Fµ , Fν ).) Wasserstein Metrik: Sei d eine Metrik auf dem Werteraum E und µ, ν W-maße auf (E, B(E)). Definiere D(µ, ν) := inf Ed(X, Y ). Hierbei wird das Infimum über alle X mit Verteilung µ und alle Y mit Verteilung ν auf einem beliebigen W-raum genommen. Dies ist eine Metrik auf dem Raum der W-maße. Mallows Metrik: Ein Abstandsbegriff für Maße impliziert in natürlicher Weise einen Abstandsbegriff für Zgn via der Verteilung. Umgekehrt, haben wir einen Abstandsbegriff d für Zufallsgrößen gegeben, so definieren wir einen (potentiellen) Abstandsbegriff d auf Maßen durch d(µ, ν) := inf d(X, Y ). Hierbei wird das Infimum über alle X mit Verteilung µ und alle Y mit Verteilung ν auf einem beliebigen W-raum genommen. Ein Beispiel ist die Mallows Metrik lp : Mp × Mp 7→ IR, 1 ≤ p ≤ ∞, lp (µ, ν) = inf kX − Y kp R auf dem Raum Mp := {µ | |x|p µ(dx) < ∞} der p-fach integrierbaren Maße auf IR. Ohne Beweis sei angeführt, das Infimum wird angenommen mit lp (µ, ν) = kFµ−1 (U ) − Fν−1 (U )kp , U eine gleichförmig verteilte Zg (siehe [2]). Satz 62 Der Raum (Mp , lp ), 1 ≤ p ≤ ∞, ist ein vollständiger, metrischer Raum. Er ist separabel für 1 ≤ p < ∞. Beweis: • Separabilität. Sei D eine dichte abzählbare Teilmenge in Lp . Dann ist die Menge aller Verteilungen dazu dicht in Mp . • Vollständigkeit. (U ), U Für die Vollständigkeit sei µn eine Cauchyfolge in lp -Mallow Metrik. Dann ist Fµ−1 n −1 gleichförmig verteilt, eine Lp -Cauchyfolge. Diese konvergiert punktweise gegen ein F (U ). Das zugehörige W-maß µ tut’s. q.e.d. Eine Folge Xn ist lp konvergent, falls die Verteilungen in Mallows lp Metrik konvergieren. lp Notation: Xn →n X. Proposition 63 lp Konvergenz ist äquivalent zur schwachen Konvergenz plus Konvergenz des p-ten absoluten Momentes. (=p-gleichmäßige Integrierbarkeit.) Beweis: Wir benutzen die Version Fn−1 (U ) = Xn und d(Fn , Fm ) = kFµ−1 (U ) − Fν−1 (U )kp . Dann verwende den Satz 65. Bemerkung: Beachte auch die gleichmäßige Integrierbarkeit, Korollar ??. 51 WS10/11 6.2 Maßtheorie Konvergenz von Zufallsgrößen Konvergenzen der Verteilungen: Viele Eigenschaften übertragen sich von den Verteilungen nach folgendem allgemeinen Prinzip: Eine Folge, bzw. Familie von Zgn Xn hat die Eigenschaft ∗, falls die zugehörigen Verteilungen die Eigenschaft ∗ besitzt. In diesem Sinne sprechen wir von schwacher und vager Konvergenz oder von einer straffen Familie von Zgn. Wir verwenden dieselben Symbole, z.B. d d Notation: Xn → X ⇔ P Xn → P X . Konvergenzen der Zgn: Nun zu Konvergenzarten der Zgn selbst. Eine Folge Xn , n ∈ IN, von Zgn konvergiert stochastisch oder in Wahrscheinlichkeit gegen eine Zg X, falls lim P (|Xn − X| > ǫ) = 0 n s P für alle ǫ > 0 gilt. Wir schreiben Xn →n X oder Xn →n X. s steht für stochastic und P für probability. Diese Konvergenz entspricht Konvergenz bzgl. der Topologie auf den Zgn erzeugt durch die Metrik d1 (X, Y ) := inf{ǫ ∈ IR | P (|X − Y | > ǫ) < ǫ} oder der Metrik d2 (X, Y ) := E( |X − Y | ). 1 + |X − Y | Eine Folge Xn von Zgn konvergiert fast sicher, falls P (lim Xn = X) = 1 n gilt. f.s. Notation: Xn →n X. Eine Folge Xn ist Lp konvergent bzw. konvergiert im p-ten Mittel, 1 ≤ p ≤ ∞, gegen X, Lp falls kXn − Xkp →n 0. Wir schreiben Xn →n X und sprechen auch von Konvergenz im p-ten Mittel. Hier eine Übersicht. p-te Moment steht für Konvergenz des p-ten absoluten Moments. 52 WS10/11 U. Rösler L∞ ❅ ❅ ❅ ❅ ❘ ❅ Lp , 1 ≤ p < ∞ ✻ + p-te Moment ✠ + 1-te Moment fast sicher ■ ❅ ❅ ✲ ❄ L1 ✛ ❅ ❅ Version ❅ ❅ ❅ ✒ Version ❅ ❅ ❅ + 1-te Moment ❅ ❘ ❅ ✠ stochastisch ✻ ✻W-theorie ❄Maßtheorie Version ❄ schwach ✻ straff ❄ vage Satz 64 Der Beweis erfogt in einer Reihe von Aussagen. • Stochastische Konvergenz impliziert schwache Konvergenz. v Wir zeigen zuerst Xn → X. Sei f ∈ Cc . |Ef (Xn ) − Ef (X)| ≤ E(|f (Xn ) − f (X)|(11|Xn −X|≥ǫ + 11|Xn −X|<ǫ )) ≤ 2kf k∞ P (|Xn − X| ≥ ǫ) + sup |f (x) − f (y)|. |x−y|<ǫ Der erste Term ist klein für n groß, der zweite ist klein in ǫ, da eine stetige Funktion auf einem Kompaktum gleichmäßig stetig ist. Als nächstes zeigen wir Straffheit. P (|Xn | > c) ≤ P (|Xn | > c, |Xn − X| < ǫ) + P (|Xn | > c, |Xn − X| ≥ ǫ) ≤ P (|X| > c − ǫ) + P (|Xn − X| ≥ ǫ). Beide Terme sind klein für ǫ, c, n geeignet. • Fast sichere Konvergenz impliziert stochastische Konvergenz. P (|Xn − X| > ǫ) ≤ P ({∃N ≥ n : |XN − X| > ǫ}) →n 0. 53 WS10/11 Maßtheorie • L1 -Konvergenz impliziert stochastische Konvergenz. Dies folgt aus der Markoff Ungleichung E|Xn − X| →n 0. ǫ • Lq -Konvergenz impliziert Lp -Konvergenz für 1 ≤ p ≤ q ≤ ∞. Die Jensen Ungleichung ergibt kY kp ≤ kY kq . • L∞ -Konvergenz impliziert fast sichere Konvergenz. Einfach. Gegenbeispiele: Alle Beispiele sind auf dem W-raum ([0, 1], B, λ). • Schwache Konvergenz impliziert nicht stochastische Konvergenz. Seien Xn , n ∈ IN, uiv Zgn und keine Konstante. Diese Folge konvergiert schwach. Würde sie auch stochastisch konvergieren, so würde gelten, P (|Xn − X| > ǫ) ≤ P (|Xn − Xm | > ǫ) ≤ P (|Xn − X| > ǫ/2) + P (|Xm − X| > ǫ/2) →n,m 0. Andererseits P (|Xn − Xm | > ǫ) = P (|X1 − X2 | > ǫ) > 0 ist eine strikt positive Konstante für n 6= m und ǫ hinreichend klein. Widerspruch. • Stochastische Konvergenz impliziert nicht fast sichere Konvergenz. X1 = 11[0,1] , X2 = 11[0,1/2] , X3 = 11[1/2,1] , X4 = 11[0,1/4] , X5 = 11[1/4,1/2] , ..., X8 = 1[0,1/8] , ... usw. Formaler Xn := 11[i/2m ,(i+1)/2m ] mit n = 2m + i, 0 ≤ i < 2m . (Zeichnung machen!). Diese tut’s. • Lp -Konvergenz, 1 ≤ p < ∞ impliziert nicht fast sichere Konvergenz. Siehe oben. • Fast sichere Konvergenz impliziert nicht Lp -Konvergenz. Die Folge Xn := an 11[0,1/n] konvergiert fast sicher gegen 0, aber nicht in Lp für geeignet gewählte an . • Lp -Konvergenz impliziert nicht Lq -Konvergenz, 1 ≤ p < q ≤ ∞. P Wähle eine Folge Xn = ni=1 11( 1 , 1 ] ai mit ai geeignet. Übung. i+1 i Nun zu den verbleibenden positive Aussagen mit Zusatzbedingungen. Version: Eine Version einer Zg ist eine Zg mit derselben Verteilung. Beliebt ist folgende Konstruktion. Sei U eine Zg mit gleichmäßiger Verteilung auf [0, 1]. Dann ist F −1 (U ) eine Version von X. Übung. • Sei Xn schwach konvergent gegen X. Dann existiert eine Version Yn der Xn mit Yn ist fast sicher konvergent gegen eine Version von X. Seien Fn , F die zugehörigen Verteilungsfunktionen und U eine gleichmäßig verteilte Zg. Dann tut’s die Folge Yn = Fn−1 (U ). Die Aussage beruht auf Lemma 56. (F bzw F −1 hat höchstens abzählbar viele Unstetigkeitspunkte.) q.e.d. Bemerkung: Schwache und stochastische Konvergenz stimmen überein für Zgn Xn , die gegen eine Konstante konvergieren. Auf diskreten W-räumen stimmen stochastische Konvergenz und fast sichere überein. Teilfolgenprinzip: Jede stochastisch konvergente Folge hat eine fast sicher konvergente Teilfolge. Der Grenzwert ist derselbe. (Übung) Den folgenden Satz vergleiche mit dem Korollar ??. Satz 65 Seien Xn , n ∈ IN , p-integrierbare Zgn, 1 ≤ p < ∞. Xn konvergiert in Lp gegen X genau dann, wenn Xn stochastisch gegen X konvergiert und kXn kp → kXkp < ∞ gilt. Lp s Xn → X ⇔ Xn → X und kXn kp →n kXkp < ∞. 54 WS10/11 U. Rösler Beweis: ⇒‘ Lp Konvergenz impliziert stochastische Konvergenz. Die umgekehrte Dreiecksun’ gleichung liefert |kXn kp − kXkp | ≤ kXn − Xkp →n 0. ⇐‘ Sei A die Menge |Xn − X| > ǫ konvergiert mit n dem Maße nach gegen 0. ’ kXn − Xk ≤ k(Xn − X)11A k + kXn − X11Ac k ≤ kXn 11A k + kX11A k + ǫ ≤ kXn k − kXn 11Ac k + kX11A k + ǫ ≤ kXn k − kX11Ac k + kX11A k + 2ǫ ≤ kXn k − kXk + 2kX11A k + 2ǫ →n 2ǫ →ǫ→0 0 55 WS10/11 56 Maßtheorie Kapitel 7 Radon-Nikodym Dichte Ein Maß ν heißt absolut stetig bezüglich µ, falls die µ-Nullmengen auch ν-Nullmengen sind. Wir sprechen auch von µ dominiert ν dominiert. Notation: µ << ν. Für ein Maß µ und eine positive meßbare Funktion f definiere das Maß ν durch A ∋ A 7→ ν(A) = Z f dµ. A dν . Die Funktion f heißt Radon-Nikodym Wir schreiben ν = f µ oder dν = f dµ oder auch f = dµ Ableitung oder Radon-Nikodym Dichte von ν bzgl. µ. Das Maß ν ist absolut stetig bzgl. µ. Quasi die Umkehrung obigen Beispiels ist der Satz von Radon-Nikodym. Satz 66 (Radon-Nikodym) Seien µ, ν σ-endliche Maße. Dann ist ν absolut stetig bzgl. µ dν . Diese ist µ f.s. eindeutig. äquivalent zur Existenz einer Radon-Nikodym Ableitung f = dµ Die σ-Endlichkeit ist wichtig, wie das Beispiel ν das Lebesguemaß und µ das Zählmaß zeigt. Zwei Maße µ, ν heißen singulär zueinander oder orthogonal, falls es eine meßbare Menge A gibt mit µ(A) = 0 und ν(Ac ) = 0. Notation: µ⊥ν. Die Orthogonalität ist symmetrisch, die absolute Stetigkeit jedoch nicht. Satz 67 (Lebesgue) Seien µ, ν σ-endliche Maße. Dann ist ν eindeutig darstellbar als die Summe eines zu µ absolut stetigen Maßes νc und eines zu µ orthogonalen Maßes ν⊥ . Die obigen Sätze werden wir für endliche Maße beweisen und dann mit Hilfe der σ-Endlichkeit standardmäßig ausdehnen. (Dies überschlagen wir.) Zur Wiederholung, ein Maß heißt σendlich, falls es eine gegen Ω aufsteigende Folge (An )n von Mengen endlichen Maßes gibt. Verwendet wird gerne die äquivalente Bedingung, es gibt eine Partition Bn , n ∈ IN, von Ω in Mengen endlichen Maßes. Die Äquivalenz ersieht man aus ∪ni=1 Bn = An (bzw. Bn = An \An−1 mit A0 = ∅). Viele Sätze über endliche Maße lassen sich auch für σ-endliche Maße zeigen, P indem man µ(·) = n µ(Bn ∩ ·) benutzt oder einen Grenzwert µ(·) = limn µ(An ∩ ·) benutzt. 7.1 Hahn-Jordan Zerlegung∗ Lemma 68 Sei λ die Differenz µ − ν zweier endlicher Maße. Dann gibt es zueinander orthogonale endliche Maße λ+ , λ− mit λ = λ+ − λ− . Die Zerlegung ist eindeutig. 57 WS10/11 Maßtheorie S S Ferner gibt es eine µ + ν eindeutige Partition A+ ◦ A0 ◦ A− = Ω so dass für alle A,die keine (µ + ν)-Nullmengen sind, gilt λ(A) = >0 falls =0 <0 A ∈ A+ A ∈ A0 A ∈ A− Beweis: Das Supremum α aller Werte λ(A), A ∈ A, ist endlich. Sei An ∈ A eine Folge P meßbarer Ereignisse mit λ(An ) ≥ α − ǫn und n ǫn < ∞. Setze A := lim inf n An = ∪m ∩n≥m An . Dann tun’s λ+ , λ− als Einschränkungen von λ auf A bzw. Ac . M := T Die Folge Bm m≤n≤M An , m ≤ M ∈ IN, ist monoton fallend in M bei festem m ∞ und diese ist monoton steigend in m gegen A. gegen eine Menge Bm M ) ≥ α − PM • λ(Bm n=m ǫn für alle m, M ∈ IN. Dies ergibt sich durch Induktion nach M für festes m. Der Induktionsanfang ist trivial. Der wesentliche Induktionsschritt folgt aus λ(B ∩ C) = λ(B) + λ(C) − λ(B ∪ C) ≥ λ(B) + λ(C) − α. Der Rest ist standard. ∞) ≥ α − P • λ(Bm n≥m ǫn . Verwende den Satz über monotone Konvergenz. • λ(A) = α Verwende erneut monotone Konvergenz. • λ(B) ≤ 0 für alle B ⊂ Ac und λ(C) ≥ 0 für alle C ⊂ A. S Ansonsten wäre λ(A ◦ B) > α oder λ(A\C) > α • λ+ ≤ µ, λ− ≤ ν. Einfach. • Eindeutigkeit. Einfach, wird überschlagen. Sei M = {A ∈ A | λ(A) = α} und β = supA∈M (µ + ν)(A). • M ist abgeschlossen bzgl. Infimum und Supremum. Folgt aus λ(B ∩ C) + λ(B ∪ C) = λ(B) + λ(C) und der Definition von α. • β wird angenommen durch ein µ + ν eindeutiges bestimmtes Ω+ ∈ M. Nehme Folge An ∈ M mit absteigendem µ+ν-Maß. OEdA können wir An selbst absteigend wählen. Der Grenzwert Ω+ tut es. • Für A ⊂ Ω+ keine (µ + ν)-Nullmenge gilt λ(A) > 0. Leicht. Definiere Ω− entsprechend für ν − µ und Ω0 := Ωc+ ∩ Ωc− . Ω+ , Ω0 , Ω− ist eine meßbare Partition und es gelten die obigen Aussagen. Die Zerlegung ist eindeutig. q.e.d. Def: Die obige Zerlegung des signierten Maßes λ bzw. des Grundraumes heißt HahnJordan Zerlegung . Lemma 69 Seien µ, ν σ-endliche Maße. Dann gibt es eine µ-fast sicher größte, positive, meßbare Funktion f mit f µ ≤ ν punktweise. Diese ist µ-fast sicher eindeutig. 58 WS10/11 U. Rösler Beweis: Wir zeigen das Lemma für µ, ν endliche Maße. Betrachte F := {f : Ω → IR+ | meßbar, f µ ≤ ν} R und α := supf ∈F f dµ. F versehen mit der punktweisen Ordnung und dem punktweisen Infimum, Supremum ist ein Verband. Der wichtige Punkt ist: f, g ∈ F impliziert f ∨ g ∈ F. Dies folgt aus, B = {f < g}, A ∈ A Z A f ∨ g dµ = Z gdµ + A∩B Z A∩B c f dµ ≤ ν(A ∩ B) + ν(A ∩ B c ) = ν(A) • α wird für ein f ∈ F angenommen. R Die Menge F ist nicht leer. Sei fn ∈ F eine Folge mit fn dν → α. OEdA sei fn aufsteigend. (Gehe über zur Folge ∨i≤n fi ∈ F .) Der aufsteigende Grenzwert f der Folge tut’s. Er ist aus F (Satz von der monotonen Konvergenz) R R Z f dµ = lim A n Z A fn dµ ≤ ν(A) und A f dµ = limn A fn dµ = α. R R • f ist größte. Waere g ∈ F. So folgt α ≥ f ∨ gdµ ≥ f d mu = α und damit 0 ≤ g ∨ f − f ≤ 0 f.s. Die Eindeutigkeit folgt aus demselben Grunde. q.e.d. Beweis des Lebesgue Satzes: Seien µ, ν endlich und f die maximale Funktion mit f µ ≤ ν. Dann tun’s νc = f µ und ν⊥ = ν − νc . Beides sind Maße und νc ist absolut stetig bzgl. µ. Zu zeigen verbleibt ν⊥ ⊥µ. Betrachte λt := ν⊥ − tµ, Ql ∋ t > 0, und sei Ωt der strikte Positivteil aus der Hahn-Jordan Zerlegung von λt . • Die Abbildung Ql> ∋ t 7→ Ωt ist (µ + ν⊥ )-f.s. antiton. Es reicht zu zeigen s < t ⇒ Ωs ⊃ Ωt µ + ν⊥ f.s. Die Menge A = Ωt \Ωs erfüllt λs (A) ≥ λt (A). Wäre A keine (µ + ν⊥ )-Nullmenge, so gilt λt (A) > 0. Dies wäre ein ist ein Widerspruch zur λs -Maximalität von Ωs . • µ(Ωt ) = 0 für t > 0. Auf Ωt gilt ν⊥ ≥ tµ und damit ν⊥ ≥ gµ mit g = t11Ωt . Wäre µ(Ωt ) > 0 so wäre ν ≥ (f +g)µ im Widerspruch zur Maximalität von f. • ν⊥ (Ωc0 ) = 0 ν⊥ (Ω0 ) = limt→0 ν⊥ (Ωt ) = limt λt (Ω) = λ(Ω) = ν⊥ (Ω) • Eindeutigkeit Sei ν = ν1 + ν2 eine weitere Zerlegung, ν1 << µ, ν2 ⊥µ. Auf der µ-Nullmenge Ω0 wie oben stimmen die beiden Maße ν⊥ und ν2 überein. Auf der Menge Ωc0 gilt ν1 + ν2 = ν = νc << µ. Folglich ν2 orthogonal und absolut stetig bzgl. µ auf dieser Menge und damit identisch 0. Damit sind auch νc und ν1 gleich. Die Ausdehnung von endlichen Maßen auf σ-endliche ist Standard. q.e.d. Beweis Radon-Nikodym: Benutze die Lebesgue Zerlegung νc = f µ wie oben. ν⊥ ist gleichzeitig orthogonal und absolut stetig bzgl. µ. Dies bedeutet ν⊥ ist identisch 0. Die Umkehrung ist offensichtlich. Anwendung: Mit Hilfe der Radon-Nikodym Dichte dµ dν läßt sich unsere Beweisführung besser verstehen. Seien f = dm , g = dm die Radon-Nikodym Ableitungen zum Referenzmaß m = µ + ν. Dann hat λ = µ − ν die Darstellung λ = f m − gm. f − g heißt auch Radon-Nikodym Dichte von λ zum Referenzmaß m. Dann sind Ω+ , Ω0 , Ω− die Mengen f − g strikt größer 0, gleich 0 und strikt kleiner 0. 59 WS10/11 Maßtheorie Korollar 70 (Radon-Nikodym Bijektion) Sei µ ein σ-endliches Maß. Es gibt eine Bijektion zwischen den endlichen, absolut stetigen Maßen ν bezüglich µ und den Äquivalenzklassen µ-integrierbarer positiver Funktionen f . Diese Bijektion kann gegeben werden durch die Zuordnung eines Maßes zu der Äquivalenzklasse der Radon-Nikodym Dichte, [f ] 7→ f µ Dies ist eine direkte Folgerung aus dem Satz von Radon-Nikodym. Ein Vektorraumverband ist ein Objekt (V, +, ·, ≤) mit (V, +, ·) ein reeller Vektorraum, (V, ≤) ein Verband und die algebraische und die Ordnungsstruktur sind verträglich (d.h. (ax − z) ∨ (ay − z) = a(x ∨ y) und (ax − z) ∧ (ay − z) = a(x ∧ y) für alle x, y, z ∈ V, a ∈ IR+ ). Folgerung: Sei m ein Maß und V der Raum der m-integrierbaren Funktionen. Dies ist ein Vektorraumverband. Sei L(m) der Raum der Ladungsverteilungen µ − ν mit µ + ν << m. Die Abbildung V ∋ f → f m ∈ L(m) ist ein Vektorraumverbandsisomorphismus. Das Supremum auf M (m) ist definiert durch λ ∧ ρ = (f ∧ g)m λ ∨ ρ = (f ∨ g)µ mit den Radon-Nikodym Ableitungen f, g von λ, ρ bzgl. m. Ladungsverteilung: Sei M die Menge aller endlichen Maße auf einem meßbaren Raum (Ω, A). Die Menge L = M − M = {µ − ν | µ, ν ∈ M } der Differenzen endlicher Maße heißt Vektorraum der signierten Maße bzw. der Ladungsverteilungen.. Elemente daraus heißen signiertes Maß oder Ladungsverteilung. L ist ein Vektorraumverband. Die Ordnung ist die punktweise Ordnung und das Infimum, Supremum wird gegeben durch (ρ ∧ λ)(A) = inf (ρ(B) + λ(A\B)) (ρ ∨ λ)(A) = sup (ρ(B) + λ(A\B)) B⊂A B⊂A (Direktes Nachrechnnen oder leichter mit Hilfe der Radon-Nikodym Ableitung.) Auf dem Raum der Ladungsverteilungen ist die Abbildung k · ktot : V → IR kλktot := sup (λ(A) − λ(B)). (7.1) A,B∈A eine Norm, ganannt die Totalvariationsnorm. Für ein signiertes Mass λ = µ − µ berechnet sich diese zu Z kλktot = |f − g|d(µ + µ) = kλ+ ktot + kλ− ktot mit f, g die Radon-Nikodym Ableitungen von µ, ν bzgl. m = µ + ν. Die Ladungsverteilung λ eingeschränkt auf Ω+ ist das Maß λ+ = µ − µ ∧ ν bzw. (f − g)+ m. Bem: Ladungsverteilungen werden manchmal auch eingeführt als Abbildungen λ von einer σ-Algebra A in die erweiterten reellen Zahlen, die σ-stetig ist. (D.h. für jede aufsteigende (absteigende) Folge An ∈ A gilt λ(An ) → λ(A).) Hat λ endliche Totalvariationsnorm (7.1) so ist λ eine Differenz endlicher Maße. 60 WS10/11 7.1.1 U. Rösler Satz von Fischer-Riesz∗ Sei L∗p (µ) der Raum der stetigen und linearen Abbildungen von Lp in die reellen Zahlen. Satz 71 (Fischer-Riesz) Sei µ ein σ-endliches Maß. Dann ist L∗p (µ) isometrisch zu Lq (µ) mit p1 + 1q = 1, 1 < p, q < ∞. Genauer, für jede Abbildung B ∈ L∗p (µ) gibt es ein g ∈ Lq (µ) R mit B(f ) = f gdµ und kBk = kgkq . Beweis: Sei zuerst µ endlich. Die Abbildung λ : A → IR definiert durch λ(A) = B(11A ) hat eine endliche Totalvariationsnorm, kλktot := sup (λ(A) − λ(Ac )) ≤ sup(kBkk11A kp + kBkk11Ac kp ) ≤ kBk2µ(Ω) < ∞. A∈A A Die Operatornorm kBk von B ist endlich wegen der Stetigkeit des Operators. Damit ist λ ein signiertes Maß. Sei λ = λ+ − λ− die Hahn-Jordan Zerlegung. λ+ und λ− sind absolut stetig relativ zu µ. (Nachrechnen.) Die Funktion g= dλ+ dλ− − dµ dµ tut’s. R • gf dµ = B(f ) für alle beschränkten f ∈ Lp Zeige dies erst für eine Treppe, dann für eine positive Treppenfunktion (Linearität), dann durch Approximation für positive beschränkte f ∈ Lp (σ-Stetigkeit von unten) und schließlich für beschränkte f ∈ Lp . • Die Lq -Norm von g ist beschränkt durch die Operatornorm kBk von B. q Sei fN := |g|g 11|g|≤N . Dies ist eine beschränkte Funktion, daher in Lp , und es gilt |kfN kpp | = Z |B(fN )| = | ∞ > kBk ≤ Z |g|q 11|g|≤N dµ fN gdµ| = Z |g|q 11|g|≤N dµ = kg11|g|≤N kqq |B(fN )| = kg11|g|≤N kqq−q/p → kgkq kfN kp R • gf dµ = B(f ) für alle f ∈ Lp . R R Die Ausdehnung erfolgt (durch σ-Stetigkeit) auf alle f ∈ Lp da | f gdµ| ≤ |f g|dµ ≤ kf kp kgkq endlich ist. • kBk ≤ |gkq . kBk = sup L∗p f 6≡0 kf gk1 |B(f )| ≤ sup ≤ kgkq . kf kp kf kp f • Die Abbildung ∋ B 7→ g ∈ Lq ist wohldefiniert, injektiv und surjektiv. Leicht. • OEdA sei µ ein endliches Maß. Sei An ∈ A, n ∈ IN, eine disjunkte Zerlegung mit µ(An ) < ∞. Sei B ∈ L∗p und fn ∈ Lq P die zugehörige Darstellung, eingeschränkt auf die Menge An . Dann tut es f := ∞ n=1 fn 11An . q.e.d. 61 WS10/11 Maßtheorie Spezialisierung auf IR : Jedem Radonmaß µ (µ(K) < ∞ für Kompakta K) hatten wir bijektiv eine aufsteigende und rechtsstetige Funktion F mit F (0) = 0 zugeordnet via µ((a, b]) = F (b) − F (a). Wir behandeln das Äquivalent für Ladungsverteilungen. P Eine Funktion F : IR 7→ IR heißt absolut stetig, falls sup i |F (ti+1 − F (ti )| < ∞ gilt. Hierbei ist das Supremum über alle Zerlegungen t0 < t1 < . . . < tn genommen. Proposition 72 Es gibt eine Bijektion zwischen Ladungsverteilungen λ und rechtsstetigen, absolut stetigen Funktionen F mit F (0) = 0. Diese Bijektion kann durch λ((a, b]) = F (b) − F (a) (7.2) gegeben werden. Beweis: ⇒ Seien F + , F − die entsprechenden Funktionen für λ+ , λ− . Dann ist die Zuordnung λ = λ+ − λ− 7→ F + − F − = F eindeutig. ⇐ Umgekehrt für gegebenes F definiere F via F (b) := sup X i |F (ti+1 − F (ti )| Das Supremum ist über alle Zerlegungen 0 = t0 < t< . . . < tn = b bzw. b = t0 < t1 < . . . < tn = 0. Die Funktion F ist rechtstetig und aufsteigend. Die Funktionen F + := F +F und 2 F − := F −F sind aufsteigend und rechtsstetig und erfüllen F = F + − F − . Seien λ+ , λ− die 2 zugehörigen Maße. Wir erhalten die Zuordnung F = F + − F − → λ+ − λ− =: λ von Funktionen in Ladungsverteilungen. 7.1.2 q.e.d. Totalstetig ∗ Ein Maß ν heißt totalstetig bzgl. µ, falls ∀ǫ > 0 ∃δ > 0 ∀A ∈ A µ(A) < δ ⇒ ν(A) < ǫ. Proposition 73 Ist ν totalstetig bzgl. µ, so ist ν absolut stetig bzgl. µ. Die Umkehrung gilt für endliche Maße ν. Beweis: Nur die Umkehrung ist zu zeigen. Sei ν nicht totalstetig bzgl. µ. Dann gibt es ein P ǫ > 0 und eine Folge An ∈ A mit ν(An ) > ǫ und µ(An ) →n 0. Wir können n µ(An ) < ∞ annehmen. Die Eigenschaften der Menge A := lim supn An ergeben nun einen Widerspruch. • ν(A) ≥ ǫ. S T Beachte A = m Bm und Bm := i≥m Ai fällt monoton gegen A. Mit Fatou ν(A) = ν(limm Bm ) ≥ limm ν(Bm ) ≥ limm ǫ = ǫ. • µ(A) = 0. P q.e.d. µ(A) = limm µ(Bm ) ≤ limm n≥m µ(An ) = 0. 62 WS10/11 7.2 U. Rösler Bedingte Erwartungen Die bedingte W-keit einer Menge A unter B ist P (A | B) = P P(A∩B) (B) für P (B) > 0. Wie groß ist die W-keit von A, gegeben die Information ω ∈ B oder nicht. Dies wird beschrieben durch die Funktion f = 11B P (A | B) + 11B c P (A | B c ) von Ω → IR. Nehmen wir eine meßbare Partition (Bn )n des Grundraumes, so ergibt sich eine meßbare Funktion X f= 11Bn P (A | Bn ) n Diese erfüllt Z f dP = B Z B 11A dP für alle B ∈ σ(Bn , n ∈ IN ). Die Interpretation von f ist als die W-keit von A gegeben die Information der σ-Algebra σ(Bn , n ∈ IN ). Jetzt die Verallgemeinerung auf allgemeine σ-Algebren. Sei (Ω, A, µ) ein Maßraum und A0 ⊂ A eine Unter-σ-Algebra. Eine A0 − B meßbare Funktion g : Ω 7→ IR heißt bedingte Erwartung von f unter A0 , falls gilt Z f dµ = A0 Z g dµ (7.3) A0 für alle A0 ∈ A0 und beide Seiten sind wohldefiniert im Lebesgueschen Sinne. Notation: E(f | A0 ) oder E A0 (f ). Satz 74 (Existenz der bedingten Erwartung) Sei A0 ⊂ A eine Unter-σ-Algebra von A0 und µ ein σ-endliches Maß. Dann existiert die bedingte Erwartung für positive, erweiterte und meßbare Funktionen f : Ω → IR+ . Sie ist µ fast sicher eindeutig. Beweis: OEdA sei µ ein endliches Maß. Betrachte für positives und integrierbares f das endliche Maß ν := f · µ. Seien ν0 , µ0 die Einschränkungen der Maße ν, µ auf (Ω, A0 ). Es gilt dν0 . Sei erfüllt die definierende ν0 << µ0 . Dann tut’s die Radon-Nikodym Dichte 70 g = dµ 0 Eigenschaft der bedingten Erwartung Z g dµ = A0 Z A0 g dµ0 = Z A0 dν0 = Z dν = A0 Z f dµ A0 Sei jetzt f positiv, erweitert und meßbar. Dann gibt es eine Folge von positiven integrierbaren Funktionen fn , n ∈ IN , die monoton aufsteigend sind gegen f. Dann tut’ E(f | A0 ) = lim E(fn | A0 ). n→∞ • Wohldefiniertheit. Da die fn punktweise aufsteigend in n sind, können wir Funktionen E(fn | A0 ) punktweise aufsteigend in n wählen. (Z.B. wähle erst bedingte Erwartungen E(fn | A0 ) und verwende dann ∨i≤n E(fi | A0 ) als bedingte Erwartung von fn .) Der Rest ist nachrechnen. Z A0 E(f | A0 )dµ = lim n Z A0 E(fn | A0 )dµ = lim n 63 Z fn dµ = Z f dµ WS10/11 Maßtheorie • Eindeutigkeit R Seien g, h bedingte Erwartungen von f und A0 die Menge g > h. Es gilt A0 (g − h)dµ = R q.e.d. A0 (f − f )dµ = 0 und damit µ(A0 ) = 0. Mit Symmetrie foglt g = h. Die Definition für positive Funktionen erweitern wir zu allgemeinen meßbaren Funktionen. f hat eine eindeutige Darstellung f = f+ − f− als Differenz des Positivteils f+ = f ∨ 0 und des Negativteils f− = (−f ) ∨ 0. Setze E(f | A0 ) = E(f+ | A0 ) − E(f− | A0 ) sofern die rechte Seite f.s. wohldefiniert ist. (Wir muessen ∞ − ∞ vermeiden.) Satz 75 (Existenz der bedingten Erwartung 2) Sei A0 ⊂ A eine Unter-σ-Algebra von A und µ ein σ-endliches Maß. Dann existiert die bedingte Erwartung auf L1 (A) und ist eine positive, additive, skalare, σ-stetige Abbildung von L1 (A) nach L1 (A0 ). Beweis: Die Aussagen sind leicht bis auf die letzte, die aus dem nächsten Satz folgt. q.e.d. Mit der bedingten Erwartung können wir umgehen wie mit dem Lebesgueintegral. Insbesonders gelten die Konvergenzsätze und die Standardungleichungen. Satz 76 Es gelten die drei Konvergenzsätze und die Jensen Ungleichung jeweils µ fast sicher: • MonotoneR Konvergenz: fn րn f, R f1 dµ > −∞ ⇒ E(fn | A0 ) րn E(f | A0 ) fn ցn f, f1 dµ < ∞ ⇒ E(fn | A0 ) ցn E(f | A0 ) • Fatou: R inf n fn > −∞ ⇒ lim inf n E(fn | A0 ) ≥ E(lim inf n fn | A0 ) R supn fn < ∞ ⇒ lim supn E(fn | A0 ) ≤ E(lim supn fn | A0 ) • Dominierte Konvergenz: fn →n f, supn |fn | ∈ L1 ⇒ E(fn | A0 ) →n E(f | A0 ) • Jensen Ungleichung: Für eine konvexe Funktion ϕ und ein W-maß µ gilt, sofern wohldefiniert, E(ϕ(f ) | A0 ) ≥ ϕ(E(f | A0 )) Wir überschlagen den Beweis, der analog zum Lebesgueintegral verläuft. Hier noch einige häufig benutzte Eigenschaften. Lemma 77 Sei alles wohldefiniert. Die folgenden Aussagen gelten alle µ-fast sicher. • |E(f | A0 )| ≤ E(|f | | A0 ) • E(f h | A0 ) = hE(f | A0 ) für A0 -meßbare Funktionen h. • Towerproperty: Für A0 ⊂ A1 ⊂ A Unter-σ-Algebren gilt E(E(f | A0 ) | A1 ) = E(f | A0 ) = E(E(f | A1 ) | A0 ) • supn E(fn | A0 ) ≤ E(supn fn | A0 ) 64 WS10/11 U. Rösler Beweis: Standard. Beachte, die bedingten Erwartungen sind nur µ-fast sicher definiert und sind, mathematisch gesehen, eher Äquivalenzklassen bzgl. µ-Nullmengen. Wir rechnen damit allerdings wie mit Funktionen, die nichts anderes als Repräsentanten der Äquivalenzklasse sind. Im Folgenden unterscheiden wir (einfachheitshalber) nicht zwischen Funktionen und Äquivalenzklassen (falls nicht notwendig). Korollar 78 (Eigenschaften der bedingten Erwartung) Unter den Voraussetzungen des obigen Satzes ist die bedingte Erwartung ein linearer, positiver, projektiver, stetiger und σstetiger Vektorraumhomomorphismus, der die 1 auf die 1 abgebildet. Beweis: Nach dem obigen Satz ist die bedingte Erwartung wohldefiniert. Die Eigenschaften werden nachgerechnet. (Eine Projektion ist eine idempotente, lineare Abbildung auf einem Vektorraum in sich selbst.) q.e.d. R Bsp: Sei A0 die triviale σ-Algebra {∅, Ω}. Dann gilt E(f | A0 ) = f dµ. Bsp: Sei A0 eine Unter-σ-Algebra erzeugt von einer abzählbaren, meßbaren Partition Bn , n ∈ IN, mit 0 < µ(Bn ) < ∞. Dann ist die bedingte Erwartung E(f | A0 ) = X 11Bn n R f dµ µ(Bn ) Bn Bsp: Gruppenmittelwert Sei G eine endliche Gruppe von meßbaren, maßerhaltenden Abbildungen g : Ω 7→ Ω, d.h. µg −1 = µ. Sei A0 die σ-Algebra aller G-invarianter Ereignisse, A0 = {B ∈ A | ∀g ∈ G : g −1 (B) = B}. Dann gilt für f ≥ 0 E(f | A0 ) = 1 X f ◦ g. |G| g∈G Beweis: Benutze eine Variablentransformation um ist leicht. R B f dµ = R B f ◦ gdµ zu zeigen. Der Rest q.e.d. Korollar 79 Sei µ ein W-maß. Die bedingte Erwartung E(· | A0 ) : Lp (A) → Lp (A0 ), 1 ≤ p ≤ ∞ ist ein linearer, positiver, σ-stetiger Operator mit Operatornorm 1. Die Fixpunkte der bedingten Erwartung sind die A0 -meßbaren und p-integrierbaren Funktionen. Beweis: Für 1 ≤ p < ∞ verwende die Jensen-Ungleichung für IR+ ∋ x 7→ xp , Z p |E(f | A0 )| dµ ≤ Z |E(|f |p | A0 )dµ = kf kpp . Analog für p = ∞, esssup |E(f | A0 )| ≤ esssup E(|f | | A0 )| ≤ esssup |f |. Der Rest ist Übung. Folgerung: Die bedingte Erwartung ist eine stetige Funktion auf Lp . 65 WS10/11 Lemma 80 Seien 1 ≤ p, q ≤ ∞ dual, 1 p + 1 q Maßtheorie = 1. Dann definiert Lp (A) × Lq (A) ∋ (f, g) 7→ E(f g | A0 ) ∈ L1 (A0 ) eine Bilinearform. Es gilt die bedingte Hölder Ungleichung E(|f g| | A0 ) ≤ (E(|f |p | A0 ))1/p (E(|g|q | A0 ))1/q . Beweis: Der bedingte Erwartungswert als Operator ist wohldefiniert, da Z Z |E(f g | A0 )| ≤ E(|f g| | A0 ) = kf gk1 ≤ kf kp kgkq < ∞. Der Operator ist bilinear. Sei zur Abkürzung X = (E(|f |p | A0 ))1/p und Y = (E(|g|q | A0 ))1/q . Es reicht zu zeigen f g E(| X Y | | A0 ) ≤ 1 auf jeder Menge A0 ∈ A0 . Z f g | | A0 ) dµ ≤ E(| XY A0 ≤ Z |f | |g| 11A0 dµ ≤ X Y Z A0 Z E(|f |p | A0 ) dµ Xp = µ(A0 ) 1/p+1/q 11A0 |f |p dµ Xp 1/p Z A0 1/p Z 11A0 |g|q dµ Yq E(|g|q | A0 ) dµ Yq 1/q 1/q = µ(A0 ) Alternative Einführung der bedingten Erwartung über Hilberträume. Eine Projektion auf einem Hilbertraum H ist eine lineare Abbildung A : H 7→ H mit A ◦ A = A. Eine orthogonale Projektion ist eine selbstadjungierte (A = A∗ ) Projektion. Orthogonale N Projektionen gestatten die Hilbertraumorthogonalzerlegung H = H0 H0⊥ mit H0 = AH und H0⊥ der Orthogonalraum. Dieses setzen wir als bekannt voraus. Lemma 81 Es gibt genau eine surjektive orthogonale Projektion H 7→ H0 . Beweis: Für f ∈ H betrachte die Abbildung Tf : H0 → IR definiert durch Tf (h) =< f, h > . Die Abbildung Tf eingeschränkt auf H0 ist aus dem stetigen Dualraum H0∗ von H0 . Da H0 selbstdual ist, siehe Satz von Riesz, gibt es genau eine Funktion g ∈ H0 mit < f, h >=< g, h > für alle h ∈ H0 . Definiere die Abbildung A : H → H0 durch A(f ) = g. A tut’s. A ist wohldefiniert. Der Bildraum ist H0 , da A auf H0 die Identität ist. Hieraus folgt die Surjektivität und dann die Projektionseigenschaft. Die Orthogonalität rechnen wir nach, < A∗ f, f >=< f, Af >=< Af, Af >=< Af, f > für alle f, f ∈ H. q.e.d. In unserem Fall sei der Hilbert Raum H = L (A) versehen mit der Bilinearform < f, g >= 2 R f gdµ. Für eine Unter-σ-Algebra A0 ist H0 := L2 (A0 ) ⊂ H ein Unterhilbertraum. Dann ist die orthogonale Projektion A auf H0 die bedingte Erwartung. Es verbleibt nachzurechnen in Hilbertraumnotation < A(f ), 11A0 >=< f, 11A0 > für alle A0 ∈ A0 . Dies ist erfüllt. Der Definitionsbereich von A kann dann auf positive Funktionen und auf Lp Funktionen ausgedehnt werden. 66 WS10/11 U. Rösler Umgekehrt, die bedingte Erwartung wie vormals definiert, liefert auf dem Hilbertraum die eindeutige surjektive orthogonale Projektion nach H0 . Die Surjektivität und Projektionseigenschaft ergibt sich durch E(f | A0 ) = f für f ∈ H0 . Die Orthogonalität folgt aus Z E(f | A0 )gdµ = Z f gdµ = Z f E(g | A0 )dµ erst für eine Treppe g = 11A , dann eine Treppenfunktion und mit σ-Stetigkeit für g aus dem Hilbertraum H. 7.2.1 Faktorisierung Seien f : Ω → Ω′ und g : Ω → Ω′′ meßbare Funktionen. f heißt g-meßbar, falls f meßbar ist bezüglich der von g erzeugten σ-Algebra über Ω. In Formeln, falls f −1 (A′ ) ⊂ g −1 (A′′ ). Hintergrund ist das Lemma 82 (Faktorisierungslemma) Seien f : Ω → Ω′ und g : Ω → Ω′′ meßbare Funktionen. Die σ-Algebren A′ , A′′ seien abzählbar erzeugt. Dann gilt f ist g meßbar ⇔ ∃h : Ω′′ 7→ Ω′ meßbar mit f = h ◦ g. Beweis: Die Rueckrichtung folgt aus f −1 (A′ ) = g −1 (h−1 (A′ )) ⊂ g −1 (A′′ ). Für die Hinrichtung betrachte zuerst einen Grundraum Ω′ ⊂ IR in den reellen Zahlen. Für eine g-meßbare Treppenfunktion f gilt der Satz. Ein allgemeines g-meßbares f approximiere von unten durch Treppenfunktionen fn . Das zugehörige hn ist monoton steigend gegen ein h. Dies tut’s. Die Ausdehnung auf allgemeinere W-Räume ergibt sich aus folgendem Lemma. q.e.d. Lemma 83 Jede abzählbar erzeugte σ-Algebra A besitzt einen abzählbaren, isotonen Erzeuger. Ist A abzählbar erzeugt so gibt es eine Menge C in den rellen Zahlen versehen mit der induzierten Borel σ−Algebra B ∩ C, so dass A isomorph (bijektiv und strukturerhaltend) ist zu B ∩ C. Ist A punktetrennend (∀ω1 6= ω2 ∈ Ω∃A ∈ A : ω1 ∈ A, ω2 6∈ A) so gibt es eine Bijektion ϕ : Ω → C die bimeßbar (ϕ and ϕ−1 sind meßbar) ist. Bew: Nehme zuerst an, A sei punktetrennend. Sei En ∈ A, n ∈ IN ein abzählbares Erzeugendensystem der σ-Algebra A. Definiere die Abbildung ϕ1 : Ω → {0, 1}IN , ϕ1 (ω)(i) := 11Ei (ω) und definiere ϕ2 : {0, 1}IN 7→ [0, 1] via ϕ2 ((x1 , x2 , . . .)) = ∞ X 2xi 3−i . i=1 Sei ϕ := ϕ2 ◦ ϕ1 . Die Mengen Aq := ϕ−1 (Bq ), Bq = (−∞, q]), q ∈ Ql tun’s. Die Abbildung ϕ ist injektiv, da ϕ1 , ϕ2 injektiv sind. Sei C das Bild von ϕ und definiere die σ-Algebra C auf C durch C = ϕ(A). Da ϕ : Ω → C eine bijektive Abbildung ist, liefert ϕ auch eine Bijektion der σ-Algebren. • Jeder Erzeuger von A wird unter ϕ auf einen Erzeuger von C abgebildet und umgekehrt. 67 WS10/11 Maßtheorie Sei E ′ ein Erzeuger von A und A′ stets σ-Algebren. Dann gilt ϕ(A) = ϕ(∩E ′ ⊂A′ A′ ) = ∩ϕ(E ′ )⊂ϕ(A′ ) ϕ(A′ ) = σ(E ′ ) = C • C = B ∩ C mit B die Borel σ-Algebra. C wird erzeugt durch die ϕ(En ) = Fn ∩C, n ∈ IN, mit Fn = {y ∈ IR | yn = 2 in der Trialdarstellung y = P −i i∈IN yi 3 }. Die Borelsche σ-Algebra wird von allen Fn , n ∈ IN erzeugt. Damit gilt C = σ(Fn ∩ C, n ∈ IN ) = σ(Fn , n ∈ IN ) ∩ C = B ∩ C. Die Mengen Bq , q ∈ Ql bilden einen Erzeuger der Borelschen σ-Algebra und Bq ∩ C, q ∈ Ql einen Erzeuger von C. Daher sind die Urbilder Aq , q ∈ Ql ein Erzeuger von A. Ist A nicht punktetrennend, so betrachte die Äquivalenzrelation ∼ auf Ω ω ∼ ω ′ ⇔6 ∃A ∈ A : ω ∈ A, ω ′ 6∈ A. Gehe über zu dem Raum Ω∼ der Äquivalenzklassen [ω], nehme hierauf die σ-Algebra A∼ der Mengen [A], A ∈ A. Diese ist isomorph zu A. Mit entsprechender Notation ist ϕ∼ eine Bijektion von Ω∼ auf ein C ⊂ IR. Diese ist eine Isomorphie der σ-Algebren. q.e.d. Bem: Die obige Menge C ⊂ IR kann auch nicht meßbar sein! Wichtig bei dieser Betrachtung ist die Isomorphie der σ-Algebren. Bem: Zwei meßbare Räume (Ωi , Ai ), i ∈ {1, 2}, heißen isomorph zueinander, falls es eine bijektive, meßbare Abbildung ϕ : Ω1 → Ω2 gibt, deren Inverse meßbar ist. Ein meßbarer Raum heißt Standard-Borel, falls er isomorph ist zu einer Borelmenge in IR versehen mit der induzierten Borel σ-Algebra. Zwei Maßräume (Ωi , Ai , µi ), i ∈ {1, 2}, heißen isomorph zueinander, falls es eine bijektive, meßbare Abbildung ϕ : Ω1 → Ω2 gibt, die das Maß erhält (µ2 = µ1 ϕ−1 ) und deren Inverse meßbar ist. In der W-theorie spielen Standard-Borelw-räume eine besondere Rolle, siehe z.B. bedingte W-keiten. Dies umfaßt z.B. alle polnischen Räume. Sei jetzt (Ω, A, µ) ein Maßraum. In der bedingten Erwartung notieren wir die Teil-σAlgebra A0 durch deren Charakterisierung wie z.B. durch ein Erzeugendensystem oder auch Funktionen. Notation: E(f | E) oder E(f | X) für E(f | A0 ) wobei A0 = σ(E) oder σ(X) gesetzt ist. (σ(X) ist die kleinste σ-Algebra, bezüglich der die Funktion X meßbar ist.) Sei X : Ω → IR, f ∈ F + meßbar und E(f | X) eine Version (Repräsentant) der bedingten Erwartung und damit eine feste σ(X) − B-meßbare Funktion Ω → R. Nach dem Faktorisierungslemma gibt es eine reelle Funktion h mit E(f | X) = h ◦ X. Wir benutzen E(f | X = x) für die Abbildung h(x) = E(f | X) ◦ X −1 (x). Sprache: E(f | X = x) heißt bedingte Erwartung von f (bedingt) unter X = x. Beachte, in der Regel ist {X = x} eine Nullmenge. Die obige Funktion h ist µX fast sicher wohldefiniert. Mit der bedingten Erwartung bedingt nach X = x läßt sich rechnen wie mit bedingten Erwartungen. Sei jetzt (Ω, A, µ) ein Maßraum. Das Faktorisierungslemma gilt auch für Äquivalenzklassen (bzgl f.s. Gleichheit), mit den entsprechenden Modifikationen. Die Äquivalenzklasse [f ] ist meßbar bzgl. der Äquivalenzklasse [g] falls für alle f ∈ [f ], g ∈ [g], A′ ∈ A′′ es ein A′′ ∈ A′′ gibt mit der symmetrischen Differenz f −1 (A′ )△g −1 (A′′ ) als Nullmenge. Wir überschlagen die technischen Details. 7.2.2 Weitere Beziehungen * Wir zeigen einige Beispiele aus der Wahrscheinlichkeitstheorie. (Wir setzen den Begriff der Unabhängigkeit voraus. Ein W-maß bezeichnen wir stets mit P.) 68 WS10/11 U. Rösler Proposition 84 Für unabhängige Zgn X, Y gilt P X fast sicher E(f (X, Y ) | X = x) = E(f (x, Y )) Beweis: Sei M die Menge aller Funktionen mit obiger Eigenschaft. M enthält alle Funktionen der Form f (x, y) = 11x∈A 11y∈B Z X C E(f (X, Y ) | X = x)P (dx) = = Z X E(f (x, Y ))P (dx) = C = Z 11X∈C E(f (X, Y ) | X)dP Z 11X∈C f (X, Y )dP = Z ZC 11x∈A ( Z Z Z 11x∈C f (x, y)P X (dx)P Y (dy) 11Y ∈B dP )P X (dx) f (x, y)P Y (dy)P X (dx) C für alle Borelmengen C. Weiterhin ist M abgeschlossen bezüglich Treppenfunktionen und monotoner Grenzwerte. Dies reicht. q.e.d. Beispiel: Ebene Seien X, Y : Ω → IR Zufallsgrößen mit der gemeinsamen Verteilung R gemäß der Dichte f : IRR2 7→ IR, d.h. P ((X, Y ) ∈ ·) = · f (x, y)dxdy. Dann ist g, g(x) := f (x, y)dy, die Dichte von X. g ist meßbar und P (X ∈ A) = Z Z 11x∈A f (x, y)dxdy = Z g(x)dx. A Ferner gilt E(h(Y ) | X) = R h(y)f (X, y)dy , g(X) E(h(Y ) | X = x) = R h(y)f (x, y)dy g(x) für jede integrierbare oder positive meßbare Funktion h. Sei dazu h = 11B und A, B borelsch. Z X −1 (A) E(h(Y ) | X)dP = E(11X∈A 11Y ∈B ) = P ((X, Y ) ∈ (A, B)) = Z Z f (x, y)dydx = A B = Z Z R B A X −1 (A) R f (x, y)dy g(x)dx g(x) h(y)f (X, y)dy dP. g(X) Hieraus folgt die erste Behauptung wegen der fast sicheren Eindeutigkeit der bedingten Erwartung. Alle meßbaren Treppenfunktionen h erfüllen die Behauptung und alle monotonen Grenzwerte hiervon wegen der σ-Stetigkeit. q.e.d.. Lemma 85 Seien A0 und A1 Unter-σ-Algebren und f integrierbar oder positiv und meßbar. Falls σ(A0 , f ) unabhängig von A1 ist, gilt P -f.s. E(f | A0 , A1 ) = E(f | A0 ). 69 WS10/11 Beweis: D := {D ∈ σ(A0 , A1 ) | Z D E(f | A0 , A1 )dP = Maßtheorie Z D E(f | A0 )dP }. Man rechnet leicht nach, daß D ein Dynkin-System ist. E := {A0 ∩ A1 |A0 ∈ A0 , A1 ∈ A1 } ist ein Erzeuger von σ(A0 , A1 ). Für A0 ∈ A0 , A1 ∈ A1 ist Z A0 ∩A1 E(f | σ(A0 , A1 ))dP = P ((11A0 f )11A1 ) = P (11A0 f )P (11A1 ) = P (11A0 E(f | A0 ))P (11A1 ) = P (11A0 E(f | A0 )11A1 ) = Z A0 ∩A1 E(f | A0 )dµ. Daher gilt E ⊂ D. q.e.d. Man beachte hier den Spezialfall A0 trivial: Aus σ(f ) unabhängig von A0 folgt E(f | A1 ) = E(f ). 7.3 Bedingte Wahrscheinlichkeiten∗ Mit der bedingten Erwartung E(. | A0 )(ω) oder auch E(. | X = x) läßt sich rechnen wie mit Erwartungen oder bedingten Wahrscheinlichkeiten. Wann ist für festes ω die bedingte Erwartung E(. | A0 )(ω) als eine Abbildung auf Funktionen darstellbar als ein Integral? Das Problem besteht darin eine Festlegung K(ω, A) von E(11A | A0 )(ω) als Funktion zu finden, die es bis auf eine Nullmenge simultan für alle meßbaren Mengen A tut. Und diese Festlegung soll all die guten Eigenschaften der bedingten Erwartung haben, wie linear, scalar, σ-stetig. Mathematisch ist dies ein Lifting von Äquivalenzklassen zu Funktionen. 7.3.1 Kerne aus bedingten Erwartungen Seien (Ω, A) und (Ω′ , A′ ) meßbare Räume. Ein Kern ist eine Abbildung K : Ω × A′ 7→ IR mit den Eigenschaften (i) für alle ω ist K(ω, ·) : A′ 7→ IR ein Maß, (ii) für alle A′ ∈ A′ ist K(·, A′ ) : Ω 7→ IR meßbar. Ein Wahrscheinlichkeitskern ist ein Kern mit K(ω, ·) ein W-maß für jedes ω. Ein Subwahrscheinlichkeitskern ist ein Kern mit K(ω, Ω′ ) ≤ 1 für jedes ω. Sprache: Wir sprechen von einem Kern von (Ω, A) nach (Ω′ , A′ ). R Wir benutzen die Notation K(ω, f ) := f (x)K(ω, dx) falls das Integral wohldefiniert ist. Satz 86 Sei (Ω, A, P ) ein Standard Borelw-raum. Sei A0 eine Unter-σ-Algebra von A. Dann gibt es einen W-kern K : Ω × A → IR, so daß für alle positiven meßbaren Funktionen f die Funktion K(., f ) : Ω → R fast sicher gleich der bedingten Erwartung E(f | A0 ) ist. Beweis: Der Standard Borelw-raum ist isomorph zu einer Borelmenge versehen mit der Borel σ-Algebra (siehe Lemma (83). Wir führen den Beweis auf den reellen Zahlen. Betrachte den abzählbaren Erzeuger Aq := (−∞, q], q ∈ Ql der Borel σ-Algebra. Wähle für jedes q ∈ Q eine Funktion F (., q) : Ω → IR aus, die fast sicher gleich der bedingten Erwartung E(Aq | A0 ) ist. • Die Funktionen F (., p) sind punktweise aufsteigend in p bis auf ω in einer Nullmenge N1 . 70 WS10/11 U. Rösler Für festes p < q gilt F (., p) ≤ F (., q) bis auf ein Nullmenge. Es gibt nur abzählbar viele rationale Paare p ≤ q und die Vereinigung abzählbar vieler Nullmengen ist eine Nullmenge. • lim inf Ql∋q→−∞ F (ω, q) = 0 bis auf eine Nullmenge N2 . Leicht. • lim inf Ql∋q→∞ F (ω, q) = 1 bis auf eine Nullmenge N3 . Leicht. Sei N = N1 ∪ N2 ∪ N3 . Definiere G : Ω × IR 7→ IR durch G(ω, x) = inf F (ω, q). Q l∋q≥x • G(ω, .) ist eine Verteilungsfunktion für alle ω 6∈ N. Nachrechnen. Übung. Sei µω , ω ∈ N c , das W-maß zur Verteilungsfunktion G(ω, ·) via µω (Bq ) = G(ω, q), q ∈ Ql. Dies W-maß ist eindeutig. Sei µω das Punktmaß in 0 für ω ∈ N. Dann tut’s K(ω, A) := µω (A). • K ist ein Kern. Für festes ω ist K(ω, .) ein Maß. Es verbleibt zu zeigen: D := {A ∈ A | K(., A) : Ω 7→ IR ist meßbar } ist gleich A. Zeige hierzu D ist ein Dynkinsystem. (Ω ∈ D, D ist abgeschlossen bzgl. dem Komplement und disjunkter abzählbarer Vereinigung.) D enthält das durchschnittsstabile Erzeugendensystem Aq , q ∈ Q von A. . Notation: µω (·) heißt bedingte Wahrscheinlichkeit. Folgerung 87 Bis auf eineR gemeinsame Nullmenge gilt µω (A) = E(1A | A0 )(ω) für alle A ∈ A und E(f | A0 )(ω) = f dµω . Beweis: Dies gilt für f eine Treppe, f eine Treppenfunktion, per σ-Stetigkeit für positive f und per Zerlegung f = f + − f − für alle f , sofern die Ausdrücke wohldefiniert sind. q.e.d. Bemerkung: Es existieren nicht immer bedingte Maße, sogar für Teilmengen der reellen Zahlen versehen mit der Borel σ-Algebra. (Wenn der Grundraum zu ’perforiert’ ist. ) Für jede Zg mit Werten in (IR, B) existiert die bedingte W-keit. Bsp: Für ein meßbares B sei 0 < P (B) < 1 und A0 := {∅, B, B c , Ω}. Die bedingte Wahrscheinlichkeit, bedingt auf B, ist das W-maß P (· | B) := PP(·∩B) (B) wohldefiniert. Es gilt P (A | A0 ) = 11B P (A | B) + 11B c P (A | B c ). Sei nun (Bn )n∈IN eine meßbare Partition von Ω, stets 0 < P (Bn ) < 1. Sei A0 die kleinste σ-Algebra erzeugt von der Partition. Die bedingte Erwartung wird durch bedingte W-maße gegeben, X P (A | A0 ) := P (A | Bn )11Bn : Ω → IR n E(f | A0 ) = Z f dP (· | A0 ) = XZ n f dP (· | Bn )11Bn fast sicher. Bedingte W-keit unter X = x sind die Verallgemeinerungen von bedingten W-keiten bedingt auf Ereignisse vom Maß 0. 71 WS10/11 72 Maßtheorie Kapitel 8 Produkträume * Ziel dieses Paragraphen sind Maße auf allgemeinen Produkträumen und der Existenzsatz von Kolmogoroff für Produkträume. Diese werden für die Existenz stochastischer Prozesse benötigt, z.B. für die Existenz einer Folge von unabhängigen Zufallsgrößen. 8.1 Produkträume Wir starten mit dem mengentheoretischen Produktraum. Seien Ωi , i ∈ I, beliebige Mengen, I ein beliebiges Indexsystem. Das kartesische Produkt ΩI := Y Ωi i∈I dieser Mengen ist die Menge aller Funktionen ω : I 7→ ∪i∈I Ωi mit ω(i) ∈ Ωi für alle i ∈ I. Sind alle Ωi , i ∈ I, gleich, etwa E, so benutzen wir die gebräuchliche Notation ΩI = E I . Q Ebenso benutzen wir ΩJ = j∈J Ωj für J ⊂ I. Dies entspricht allen Funktionen ω|J , ω ∈ ΩI eingeschränkt auf J. Projektion: Für K ⊂ J ⊂ I sei ΦJ,K : ΩJ → ΩK die Projektion auf die K-Koordinaten. Formal ist dies die Einschränkung der Funktionen aus ΩJ auf K. Wir benutzen die Notation ΦK := ΦI,K wenn möglich. Die Abbildung Φi := Φ{i} heißt i-te Koordinatenabbildung . Die Menge der Projektionsabbildungen ist transitiv, d.h. sie erfüllen ΦK,L ◦ ΦJ,K = ΦJ,L (8.1) für L ⊂ K ⊂ J. Bsp. Endliche Tupel: Für endliche Mengen I und eine fest vorgegebene Numerierung i1 , i2 , . . . , in der Elemente von I identifizieren wir den Produktraum ΩI mit Ωi1 × Ωi2 × . . . × Ωin . Ein Element ist ein Tupel (ω1 , ..., ωn ). In dieser Darstellung als Tupel ist stets die Reihenfolge der Aufzählung implizit enthalten. Definiere die Abbildung πJ := Φ−1 J ΦJ : ΩI → ΩI . 73 WS10/11 Maßtheorie Proposition 88 Es gilt – die Abbildung J → πJ ist antiton (bzgl. der Enthaltensordung f ’ür Mengen und der punktweisen für Funktionen) – πJ ◦ πK = πJ∩K = πK ◦ πJ für alle K, J ⊂ I. – die Projektionseigenschaft πJ ◦ πJ = πJ für alle J, Beweis: Übung mit Wertebereichen von Funktionen. Zylindermengen: Eine Zylindermenge in ΩI ist eine Menge der Form Φ−1 J (AJ ) mit AJ ⊂ ΩJ , J ⊂ I. Die Koordinatenmenge J heißt Basis des Zylinders. Jede Menge A ⊂ ΩI ist eine Zylindermenge wegen A = Φ−1 I (A) mit Basis I. Interessant sind kleinere Basen, im Sinne der Enthaltenrelations. Dies Beispiel zeigt die Basis eines Zylinders ist nicht eindeutig. (Übung). Proposition 89 Sind J und K zwei Basen einer Zylindermenge, so auch J ∩ K. −1 Beweis: Die Zylindermenge Z habe zwei Darstellungen Φ−1 J (AJ ) = ΦK (AK ) mit J 6= K. Dann gilt πJ (Z) = Z und πK (Z) = Z. Hieraus folgt πJ∩K (Z) = Z und damit Z = Φ−1 J∩K (A) für A ∈ ΩJ∩B . (Ohne Beweis A = ΦJ,J∩K (AJ ) = ΦK,J∩K (AK ).) Rechteckmengen: Eine Rechteckmenge oder auch Rechteckzylinder ist eine Menge der Form \ Φ−1 j (Aj ) j∈J mit Aj ⊂ Ωj , j ∈ J ⊂ I. Ist I endlich, etwa I = {1, 2, . . . , n}, so schreiben wir die Rechteckmengen in der prägnanteren Form A1 × A2 × . . . × An . Beachte die Reihenfolge des Index. Schnitt: Der Schnitt einer Menge A ∈ ΩI in Richtung x ∈ ΩJ c ist x SI,J (A) := ΦJ (A ∩ Φ−1 J c (x)). Eine alternative Beschreibung ist {ω|J | ω ∈ A, ω|J c = x} durch Einschränkung der Funktionen bestimmtes Verhalten auf J c . ✬ ✩ B Bω ω ✫ 8.1.1 ✪ Produkt σ-Algebra Wir kommen jetzt zu Produkträumen mit meßbarer Struktur. Seien (Ωi , Ai ), i ∈ I, beliebige meßbare Räume. Die Produkt σ-Algebra AI ist die kleinste σ-Algebra auf ΩI , bezüglich der alle Koordinatenabbildungen Φi , i ∈ I, meßbar sind. Wir benutzen die Notation AI =: O i∈I 74 Ai WS10/11 U. Rösler N Wir benutzen , da AI nicht das mengentheoretische Produkt ist, sondern eine Struktur enthält. Das Tupel (ΩI , AI ) heißt Produktraum (der meßbaren Räume (Ωi , Ai ), i ∈ I.) Analog verwenden wir AJ für J ⊂ I. Proposition 90 Die Abbildungen ΦI,J , J ⊂ I, sind AI − AJ meßbar. −1 Beweis: i) Die Urbilder ΦJ,{j} (Aj ), Aj ∈ Aj , j ∈ J, bilden ein Erzeugersystem E für die Produkt σ-Algebra AJ . Das Urbild Φ−1 I,J (E) des Erzeugersystems ist in AI wegen der Projek−1 −1 tionseigenschaft (8.1) ΦI,{j} (E) = ΦI,J (Φ−1 J,{j} (E)). Dies reicht im Hinblick auf Proposition 6. q.e.d. Proposition 91 Die Produkt σ-Algebra AI ist gleich der Menge aller meßbarer Zylindermengen mit abzählbarer Basis. Jede meßbare Zylindermenge hat eine Darstellung Φ−1 J (AJ ) mit abzählbarem J und meßbarem AJ ∈ AJ . Beweis: • M ist eine σ-Algebra. c −1 c M ist nicht leer und komplementabgeschlossen, (Φ−1 · (A)) = Φ· (A ). Sie ist abgeschlossen bzgl. der abzählbaren Vereinigung. Dies folgt aus Jn ⊂ I (höchstens) abzählbar, J := ∪n Jn , (höchstens) abzählbar, ( [ n c Φ−1 = Jn (AJn )) = \ n \ n c Φ−1 Jn (AJn ) −1 −1 c Φ−1 J (ΦJ,Jn (AJn )) = ΦJ ( \ n c Φ−1 J,Jn (AJn )) ∈ M • AI ⊂ M M enthält alle Mengen Φ−1 i (Ai ), die wiederum einen Erzeuger E der Produkt σ-Algebra bilden. Aus E ⊂ M folgt AI = σ(E) ⊂ σ(M) = M • M ⊂ AI Einfach, da ΦJ meßbar ist. Daraus folgt M = AI . q.e.d. Die meßbaren Rechteckmengen sind (genau diejenigen) von der Form \ Φ−1 j (Aj ) j∈J mit Aj ∈ Aj , j ∈ J ⊂ I höchstens abzählbar. x (A), x ∈ Ω c , meßbar Proposition 92 Sei J ⊂ I endlich. Für A ∈ AI ist jeder Schnitt SI,J J bzgl. der Produkt σ-Algebra AJ . Beweis: Betrachte die Menge M aller Mengen A ∈ AI mit obiger Eigenschaft. Die Menge M ist eine σ-Algebra. (Nachrechnen, der wesentliche Punkt ist ΦJ (Ac ∩ Φ−1 J c (x)) = ΦJ (A ∩ c .) M enthält einen Erzeuger, da die erzeugenden Abbildungen Φ meßbar sind bezüglich Φ−1 (x)) c i J M − Ai . Damit folgt M = AI . q.e.d. Proposition 93 Rechteckmengen mit höchstens abzählbarer Basis sind genau dann meßbar, wenn in der Darstellung jedes Aj meßbar ist Aj ∈ Aj ist. 75 WS10/11 Maßtheorie I\j,x Beweis: Die Rückrichtung ist einfach. Für die Hinrichtung zeige SI x ∈ ΩI\j und vorgegebenes j ∈ J. Aj muß meßbar sein. = Aj für ein geeignetes q.e.d. Lemma 94 Die Menge R′ der meßbaren Rechteckzylinder mit endlicher Basis bilden einen Semiring. Beweis: Die Eigenschaften eines Semiringes sind nachzuprüfen. ∅ ∈ R0 ist offensichtlich. Die endliche Durchschnittsabgeschlossenheit folgt aus −1 −1 ∩n≤N ∩j∈Jn Φ−1 j (Aj,n ) = ∩j∈I ∩{n|j∈Jn } Φj (Aj,n ) = ∩j∈I Φj (∩{n|j∈Jn } Aj,n ). Daß die Differenz als disjunkte endliche Summe von Semiringmengen darstellbar ist, ist eine unangenehme Schreibarbeit. Wir begnügen uns mit einem Bild im IR2 . B A Dies reicht. 8.2 q.e.d. Maße auf Produkträumen. Wir kommen jetzt zu maßtheoretischen Produkträumen. Ein Produktmaß auf dem Produktraum (ΩI , AI ) ist ein Maß µ darauf mit µ( \ Φ−1 j (Aj )) = j∈J Y µ(Φ−1 j (Aj )) (8.2) j∈J für alle meßbaren Rechteckmengen. Das Produktmaß induziert ein Maß µi auf (Ωi , Ai ), i ∈ I, via µi (Ai ) = µ(Φ−1 i Ai ), Ai ∈ Ai . Umgekehrt, zumindest für Wahrscheinlichkeitsmaße, wie wir gleich zeigen werden, gibt es zu vorgegebenen µi genau ein Produktmaß µ. Daher verwenden wir die Notation µ = µI =: N i∈I µi . Das Tripel (ΩI , AI , µI ) heißt Produktmaßraum oder auch nur Produktraum (bezüglich der Maßräume (Ωi , Ai , µi )i ). Wir kommen jetzt zur Existenz des Produktmaßes. Satz 95 Seien (Ωi , Ai , µi ), i ∈ I, W-Räume. Es gibt genau ein Produktwahrscheinlichkeitsmaß auf dem Produktraum. 76 WS10/11 U. Rösler Beweis: Fall: I bestehe aus den zwei Elementen 1 und 2. Setze für Rechteckmengen µ(A1 × A2 ) = µ1 (A1 )µ2 (A2 ). In Funktionenschreibweise mit Funktionen f = 11A1 ×A2 . Z f (x, y)µ(d(x, y)) = Z Z f (x, y)µ1 (dx)µ2 (dy). Die rechte Seite hängt nicht von der Reihenfolge der Integration ab Satz 41. Dehne die rechte Seiten linear aus auf Treppenfunktionen und dann σ-stetig auf meßbare positive Funktionen. R (Übung.) Dann tut’s µ definiert durch µ(A) = 11A µ1 (dx)µ2 (dy). Fall: I endlich. Argumentiere induktiv über n = |I|. Fall: I abzählbar, oEdA I = IN. Der Beweis folgt obiger Konstruktion mit einem zusätzlichen Kompaktheitsargment. Sei R0 der Semiring aller Rechteckmengen mit endlicher Basis. Definiere µ : R0 7→ IR wie in (8.2) µ(∩j∈J Φ−1 j (Aj ) = Y µj (Aj ) j∈J • Die Mengenfunktion µ ist wohldefiniert und ein Inhalt. Übung. Dies ist keine Trivialität und benötigt die Projektionseigenschaft. Setze diese Mengenfunktion auf den von R0 erzeugten Ring R additiv fort. • µ : R 7→ IR ist ein Prämaß. Wir zeigen die σ-Stetigkeit bei der leeren Menge, welches hinreichend ist. Annahme: An ∈ R0 ist fallend gegen die leere Menge und limn µ(An ) > 0. Nach Fubini gilt Z x1 µ2 (SI\1 (An ))µ1 (dx1 ) µ(An ) = Q x1 (An ) ist der Schnitt von An in mit µ2 der analoge entsprechende Inhalt auf i≥2 Ωi . SI\1 2 Richtung erster Koordinate an der Stelle x1 . (Beachte µ (B2 ×B3 ×. . .) = µ(Ω1 ×B2 ×B3 ×. . .) wie für endliches I.) Der Satzes von der monotonen Konvergenz impliziert lim µ(An ) = n Z x1 (An ))µ1 (dx1 ). lim µ2 (SI\1 n x∗ 1 (An )) > 0. (Wir integrieren über eine echte Folglich gibt es ein x∗1 ∈ Ω1 mit limn µ2 (SI\1 Funktion, keine Äquivalenzklasse.) Ebenfalls nach Fubini und monotoner Konvergenz lim µ n 2 x∗1 (SI\1 (An )) mit µ3 der analoge Inhalt auf Q i≥3 Ωi . = Z (x∗ ,x ) 1 2 lim µ3 (SI\{1,2} (An ))µ2 (dx2 ) n Es gibt ein x∗2 ∈ Ω2 mit limn µ3 (SI\{1,2}(x∗1 ,x∗2 ) (An )) > 0. Analog wähle x∗3 , x∗4 , . . . usw. Dann liegt x∗ := (x∗1 , x∗2 , ...) in dem Durchschnitt aller An . (Übung.) Widerspruch. • Für höchstens abzählbare J ⊂ K gilt µK Φ−1 K,J = µJ . Die Aussage gilt für alle Rechteckmengen in AJ mit endlichem Träger. Die bilden einen Erzeuger der Produkt σ-Algebra AJ . 77 WS10/11 Maßtheorie • Die eindeutige Caratheodory Erweiterung liefert das gewünschte Produktwahrscheinlichkeitsmaß µ = µI . Fall: I beliebig. Definiere µI : AI 7→ IR durch µI (A) = µJ (AJ ) Für Zylindermengen A = Φ−1 (AJ ), AJ ∈ AJ mit höchstens abzählbarer Basis J ⊂ I. µI tut’s. • Wohldefiniertheit. −1 A habe die beiden Darstellungen A = Φ−1 J (AJ ) = ΦK (AK ) mit höchstens abzählba−1 rer Basis J, K. Dann gilt ΦJ∪K (A) = Φ−1 J∪K,J (AJ ) = ΦJ∪K,K (AK ) und damit µJ (AJ ) = −1 µJ∪K (Φ−1 J∪K,J (AJ )) = µJ∪K (ΦJ∪K,K (AK )) = µK (AK ). • µI ist ein W-maß. Nachrechnen. q.e.d. Korollar 96 Voraussetzungen wie im obigen Satz. Es gilt für J ⊂ K ⊂ I µK Φ−1 K,J = µJ Nachrechnen. Bsp. Lebesguemaß: Sei Ωi = {0, 1} und µi (1) = 1/2 für alle i ∈ I = IN. Betrachte die Abbildung ϕ : ΩI → [0, 1] mit ϕ(ω) = ∞ X ωi 2−1 i=1 Die Abbildung ϕ ist surjektiv und, wenn wir eine µI Nullmenge herausnehmen, injektiv. (Die Dualdarstellung ist eindeutig.) Dann ist ϕ(AI ) die Borel σ-Algebra auf [0, 1] und µI ϕ−1 ist das Borelmaß darauf. Projektiver Limes* Wir betrachten eine Klasse O von Objekten derselben mathematischen Struktur, wie Vektorräume, meßbare Räume, Gruppen, oder anderes. Weiterhin gebe es gewisse strukturerhaltende Abildungen zwischen den Objekten, z.B. lineare Abbildungen, meßbare Abbildungen, Gruppenhomomorphismen, usw.. Diese Abbildungen heißen Morphismen. Ein projektives System ist ein Tupel (O, M) einer Menge O von mathematischen Objekten und einer transitiven Menge M von Morphismen. (Transitiv bedeutet, falls ϕα,β : α → β und ϕβ,γ : β → γ Morphismen aus M sind, so auch ϕα,γ = ϕβ,γ ◦ ϕα,β .) Anders formuliert, das folgende Diagramm kommutiert: ✉ △ ✲✉ α ✧ ϕα,β ✲✉ β ϕβ,γ ϕα,γ ✲✉ ✻ ✦ γ ✲✉ ✲ Auf O ist eine transitive Relation durch die Morphismen vorgegeben via, α β ⇔ ∃ϕ ∈ M ϕ : α → β. Der projektive Limes eines projektiven Systems (O, M) ist ein weiteres Objekt △ mit dieser mathematischen Struktur und folgenden Eigenschaften. 78 WS10/11 U. Rösler (i) Es gibt Morphismen ϕ△,α : γ → α für alle α ∈ O, so daß (O ∪ {△}, M ∪ {ϕ△,α | α ∈ O}) ein projektives System derselben mathematischen Struktur bildet. (ii) △ ist das kleinste derartige Objekt. Sei δ ein weiteres Objekt mit Morphismen ϕδ,. wie in (i). Dann gibt es einen Morphismus ϕ : δ → △ mit ϕδ,α = ϕ△,α ◦ ϕδ,△ . Die erste Bedingung fordert die Verträglichkeit der Morphismen ϕ△,α mit der Projektionsstruktur. Sehr einprägsam ist die graphische Darstellung als links abgeschlosser Graph (der nicht linear sein muß): ✉ δ′ ϕδ,△ ✧ ✲✉ δ ϕδ,α ϕδ,α ✲✉ ✻ ✦ α ✲✉ ✲ Beispiel: Produktmaß Der Produktraum von W-räumen ist der projektive Limes eines projektiven Systems. Betrachte die Objekte (ΩJ , AJ , µJ ), für J ⊂ I abzählbar. Dies sind Wahrscheinlichkeitsräume. Die Morphismen sind die Projektionsabbildungen ΦK,J für J ⊂ K. Diese erfüllen die Verträglichkeitsbedingung (8.1), ΦK,L ◦ ΦJ,K = ΦJ,L ΦJ,K µJ = µK J ⊂ K ⊂ L. Das Objekt (ΩI , AI , µI ) mit den Morphismen ΦJ für höchstens abzählbare Teilmengen J ⊂ I ist der projektive Grenzwert. Dies ist das kleinste Objekt mit Morphismen, welches das projektive System projektiv abschließt. Wäre δ = (Ω, A, µ) ein weiterer W-Raum mit den Morphismen Φδ,J , der das projektive System projektiv abschließt. Dann tut es die Abbildung Ω ∋ ω 7→ ϕδ,I (ω) = Y i Φi (ω) ∈ ΩI . Kompakte Klassen * Dieser Abschnitt ist nur der Vollständigkeit halber gegeben und kann beim ersten Lesen überschlagen werden. Eine Teilmenge K ⊂ P(Ω) der Potenzmenge heißt kompakte Klasse, bzw. hat die endliche T Durchschnittseigenschaft, falls für jede abzählbare Folge Kn ∈ K mit N n=1 Kn 6= ∅ für jedes T N ∈ IN auch n∈IN Kn 6= ∅ gilt. T T Äquivalent ist die Forderung n Kn = ∅ für eine Folge impliziert N n=1 Kn = ∅ für ein N ∈ IN. In topologischen Räumen ist die Menge der kompakten Mengen eine kompakte Klasse. (Dies ist das Hauptbeispiel und vielleicht das einzig relevante.) Lemma 97 Ist K eine kompakte Klasse, so auch die Menge der abzählbaren Durchschnitte und die Menge der endlichen Vereinigungen von Mengen aus K. 79 WS10/11 Beweis: Für Durchschnitte ist die Behauptung einfach. Sei nun Dn := T und N n=1 Dn 6= ∅ für alle N ∈ IN. Definiere den Produktraum L := ∞ Y Maßtheorie Sin n i=1 Ki mit Kin ∈ K {1, 2, . . . , in } = {1, 2, . . . , i1 } × {1, 2, . . . , i2 } × . . . n=1 n LN := {(l1 , l2 , . . .) ∈ L | ∩N n=1 Kln 6= ∅}. • LN , N ∈ IN, sind nicht leer und die Folge LN ist fallend. • ∩N LN ist nicht leer. Wähle aus jedem LN ein lN aus. Nach dem Schubfachprinzip gibt es ein 1 ≤ l1∗ ≤ i1 mit #{N ∈ IN | l1∗ = l1N } = ∞. Ebenso findet man ein l2∗ mit #{N ∈ IN | l1∗ = l1N , l2∗ = l2N } = ∞ usw. Damit gilt (l1∗ , l2∗ , l3∗ , . . .) ∈ ∩N LN . Damit gilt ∩n≤N Klnn∗ 6= ∅ für alle N ∈ IN. K ist eine kompakte Klasse, also ∩n Klnn∗ 6= ∅. Hieraus folgt ∩n Dn 6= ∅. q.e.d. Lemma 98 Sei I eine beliebige Indexmenge, Ki ⊂ P(Ωi ), i ∈ I, kompakte Klassen. Dann ist K := {Φ−1 i (Ki ) | i ∈ I, Ki ∈ Ki } eine kompakte Klasse. −1 n n n Beweis: Sei K n eine Folge aus K mit ∩N n=1 K 6= ∅ für alle N ∈ IN. Für K = Φin (Kin ) ∈ K, n ∈ IN, in ∈ I, Kinn ∈ Kin . gilt −1 −1 n n n ∩N n=1 K = ∩i ∩{n≤N |in =i} Φi (Ki ) = ∩i Φi (∩{n≤N |in =i} Ki ). Der Durchschnitt wird über alle i ∈ I genommen, mit {n ≤ N | in = i} nicht leer. Für jedes solche i sind die endlichen Durchschnitte ∩{n≤N |in =i} Kin nicht leer (wegen n 6= ∅.) Da K eine kompakte Klasse ist, ist der abzählbare Durchschnitt A := ∩N i i n=1 K n = ∩ Φ−1 (A ) nicht. K q.e.d. ∩{n|in =i} Kin nicht leer. Folglich auch ∩∞ i i n=1 i 8.2.1 Die Kolmogoroffschen Erweiterungssätze Seien (Ωi , Ai ), i ∈ I, meßbare Räume und (ΩJ , AJ ), J ⊂ I endlich, der Produktraum versehen mit der Produkt σ-Algebra. Eine maßerhaltende Abbildung ist eine Abbildung zwischen Maßräumen, die die Maße erhält. Satz 99 (Daniell-Kolmogoroff ) Seien (Ωi , Ai , µi ), i ∈ I W-räume mit beliebiger Indexmenge I. Für jedes i ∈ I gebe es ein kompaktes System Ki derart, daß ∀ǫ > 0 ∀Bi ∈ Ai ∃Ki ∈ Ki ∃Ai ∈ Ai : Ai ⊂ Ki ⊂ Bi und µi (Bi \Ai ) < ǫ. Seien (ΩJ , AJ ) die Produkträume für endliches J ⊂ I. Seien µJ W-maße auf (ΩJ , AJ ) so dass (ΩJ , AJ , µJ ), J ⊂ I endlich mit den Projektionen Φ.,. ein projektives System bilden bzgl. W-räumen und maßerhaltenden Abbildungen. Dann gibt es einen projektiven Grenzwert und dieser ist (ΩI , AI , µI ) zusammen mit den Projektionsabbildungen als Morphismen. 80 WS10/11 U. Rösler Dieser Satz wird häufig in folgender Form verwendet. Satz 100 (Kolmogoroff ) Sei E ein polnischer Raum mit der Borelschen σ-Algebra B. Seien (E J , B J , µJ ), J ⊂ I endlich, W-räume und die Projektionsabbildungen seien maßerhaltend. Dann ist der projektive Limes (ΩI , B I , µI ) mit einem W-maß µI . Beweis erste Version: Sei R0 die Menge aller meßbarer Rechteckzylinder mit endlicher Basis. R0 ist ein Semiring, Proposition 94. Auf R0 betrachten wir die additive Mengenfunktion µ : R0 7→ IR definiert durch µ(Φ−1 J (AJ )) := µJ (AJ ) für meßbare Rechteckzylinder AJ . (Die Wohldefiniertheit von µ verwendet die Verträglichkeitsbedingung und ist keine Trivialität.) Erweitere µ (eindeutig) zur additiven Mengenfunktion auf dem von R0 erzeugten Ring R, Lemma 16. Die additive Mengenfunktion µ auf R ist ein Prämaß, d. h. σ-stetig bei der leeren Menge. Dazu zeigen wir: K := {∩j∈J Φ−1 j (Kj ) | |J| < ∞, Kj ∈ Kj , j ∈ J} ist ein kompaktes System, siehe vorhergenden Abschnitt. • Für alle ǫ > 0 und alle meßbaren Rechteckzylinder B mit endlichen Zylinder J gibt es eine Menge K ∈ K mit Basis J und einen meßbaren Rechteckzylinder A mit A ⊂ K ⊂ B und µ(B\A) < ǫ. Sei B = ∩j∈J Φ−1 j (Bj ) ∈ R0 . Wähle zu vorgegebenen ǫj , Bj Mengen Kj ∈ Kj und Aj ∈ Aj −1 mit Aj ⊂ Kj ⊂ Bj und µj (Bj \Aj ) < ǫj . Setze K = ∩j∈J Φ−1 j (Kj ) ∈ K, A = ∩j∈J Φj (Aj ) und P P schließe und schließe µ(B\A) ≤ j µj (Bj \Aj ) ≤ j ǫj kann beliebig klein gewählt werden. Sei oEdA J = {1, 2, . . . , n}. (Ansonsten wähle eine Indizierung j1 , j2 , . . . , jn der Elemente von −1 J.) Betrachte C0 = B, Cl = (∩0<i≤l Φ−1 1 (Ai )) ∩n>i>l Φi (Bi ) für l ∈ IN≤n . Dann gilt [n B\A = ◦ i=1 [n Ci \Ci−1 ⊂ ◦ i=1 Φ−1 i (Bi \Ai ) (Mache ein Bild für eine zweielementige Menge J.) Unter Anwendung von Caratheodory erhalten wir eine Fortsetzung von µ zu einem Maß auf der σ-Algebra σ(R0 ) = AI . Die Eindeutigkeit ist einfach. Ebenso, daß dies das kleinste projektive Objekt ist. q.e.d. Beweis zweite Version: Nehme als kompakte Klasse Ki die Menge aller kompakten Mengen in E. Diese tun’s. q.e.d. Bemerkung: Der Satz von Kolmogoroff gibt nicht nur die Existenz des projektiven Limes, sondern auch die Produktgestalt des meßbaren Raumes (ΩI , AI ). Beispiel von Jessen*: Ohne Kompaktheitsbedingung können wir für den projektiven Limes nicht den Produktraum nehmen. Betrachte Ω = [0, 1) mit der Borel σ-Algebra B und dem Lebesguemaß λ. Für eine Menge A betrachten wir den eingeschränkten Raum ΩA := Ω ∩ A versehen mit der eingeschränkten σ-Algebra B|A := {B ∩ A | B ∈ B} und dem eingeschränkten Maß λ|A auf B|A mit λ|A (C) = inf{λ(B) | B ∈ B, C ⊂ B} (Nachrechnen, dies ist ein Maß. Es ist das äußere Maß λ∗ eingeschränkt auf B|A .) Betrachte die Reellen Zahlen als Vektorraum über den rationalen Zahlen. Definiere die Äquivalenzrelation x ∼ y ⇔ x − y ∈ Ql auf [0, 1). Sei A ⊂ [0, 1) ein Representantensystem der Äquivalenzklassen. Die Mengen Aq = A + q modulo 1 für q ∈ Ql ∩ [0, 1) bilden eine paarweise disjunkte Zerlegung von [0, 1). Für jedes q ∈ Ql ist Aq nicht Lebesguemeßbar, Abschnitt 2.1.3. 81 WS10/11 Maßtheorie Das innere Lebesguemaß von jedem Aq ist 0. (B ∋ B ⊂ Aq ⇒ λ(B) = 0.) Das innere Lebesguemaß von jeder endlichen Vereinigung von Aq ist 0. (Übung). Sei Ωq := Acq versehen mit der σ-Algebra Aq := B|Ωq und dem W-maß µq := λ|Ωq . Auf dem Produktraum (ΩJ , AJ ), J ⊂ Ql endlich, definiere die W-Maße µJ durch µJ (C) = λ∗ ({x ∈ [0, 1] | ∩j∈J Φ−1 j (x) ∈ C}). (Nachrechen, dies ist ein wohldefiniertes W-maß.) Die W-räume (ΩJ , AJ , µJ ), J ⊂ Ql endlich, bilden eine projektive Familie (bezüglich den Objekten der W-räume und den Projektionsabbildungen als maßerhaltende Morphismen.) (Übung). Angenommen, der projektive Limes wäre (ΩQl, AQl, µ). Sei q1 , q2 , . . . eine Abzählung der rationalen Zahlen. Die Mengen Dn := {ω ∈ ΩQl | ω(qi ) = ω(qj ) für 1 ≤ i, j ≤ n} konvergieren fallend gegen die Diagonale {ω ∈ ΩQl | ω(q) = ω(r) ∈ [0, 1) für alle q, r ∈ Ql in ΩQl}. Dies ist die leere Menge, da es für jedes x ∈ [0, 1) ein q ∈ Q gibt mit x 6∈ Ωq . Dies ergibt den Widerspruch, Jn := {q1 , . . . , qn }, lim µ(Dn ) = lim µJn (ΦJn (Dn )) = 1 6= 0 = µ(lim Dn ) = lim µ(Dn ) n n n im Widerspruch zur σ-Stetigkeit von µ. 8.3 n q.e.d. Maße aus Kernen Bedingte W-keiten lassen sich als Kerne interpretieren und umgekehrt, zu vorgegebenen Kernen lassen sich W-Maße mit zugehörigen bedingten W-verteilungen konstruieren. 8.3.1 Kerne Seien (Ω, A), (Ω′ , A′ ) meßbare Räume. Ein Kern ist eine Abbildung K : Ω × A′ → IR mit i) K(x, .) : A′ → IR ist ein Maß für alle x ∈ E, ii) K(., A′ ) : Ω → IR ist eine meßbare Funktion für alle A′ ∈ A′ . Wir sprechen von einem endlichen Kern, falls alle Maße K(e, .) endlich sind. Ein Kern heißt Wahrscheinlichkeitskern oder auch Markoff Kern oder Übergangskern, falls alle Maße in i) W-Maße sind. Ebenso sprechen wir von σ-endlichen Kernen usw. Ein Kern K induziert eine lineare, σ-stetige Abbildung F(Ω′ , IR+ ) → F(Ω, IR+ ) auf positiven, erweiterten und meßbaren Funktionen via f 7→ Z f (y)K(., dy). Wir benutzen die Notation K(., f ). Diese Abbildung läst sich via K(x, f ) = K(x, f + ) − K(x, f − ) ausdehnen. Ebenso induziert ein Kern eine isotone, lineare Abbildung von Maßen auf A nach Maßen auf A′ via Z µ 7→ K(x, .)µ(dx). E Wir benutzen die Notation K(µ, .) und K(µ, f ) analog. 82 WS10/11 U. Rösler Die Komposition von Kernen K : Ω × A′ 7→ IR und L : Ω′ × A′′ 7→ IR ist gegeben durch KL = K ◦ L : Ω × A′′ → IR ′′ KL(e, A ) := Z L(e′ , A′′ )K(e, de′ ). E′ Lemma 101 Die Komposition von Kernen ist ein Kern. Die Komposition ist assoziativ. Beweis: • KL ist ein wohldefinierter Kern. KL ist wohldefiniert. Für festes x ist KL(x, .) ein Maß. Für die zweite Eigenschaft eines Kerns approximiere L(x′ , A′′ ) von unten durch Treppenfunktionen, für die wiederum die Aussage gilt. • Assoziativitäet. Zu zeigen ist (K ◦ L) ◦ M = K ◦ (L ◦ M ). Dies folgt aus Fubini KLM (x, A′′′ ) := R R ( M (x′′ , A′′′ )L(x′ , dx′′ ))K(x, dx′ ) durch vertauschen der Integrationsreihenfolge. q.e.d. Hier sind einige Beispiele von Kernen K. Maß: Sei µ′ ein Maß auf A′ . Definiere K(x, A′ ) := µ′ (A′ ). Der Kern K ist unabhängig von der ersten Koordinate. Faltungskern: Wir betrachten die reellen Zahlen und ein Maß µ auf der Borelschen σ-Algebra B. Definiere für x ∈ IR, B ∈ B K(x, B) := µ(B − x). Matrizen: Sei M eine positive n × n Matrix, M : ⌊1, n⌋ × ⌊1, n⌋ 7→ IR. Definiere K(i, A) := X M (i, j). j∈A M ist eine stochastische Matrix genau dann wenn K ein W-kern ist. Bedingte Erwartung: Sei (Ω, A) = (Ω′ , A′ ) und An ∈ A, n ∈ IN, eine disjunkte meßbare Zerlegung von E. Alle Ereignisse haben strikt positives endliches Maß µ(An ) > 0. Definiere K(ω, A) := X n 11ω∈An µ(A | An ) mittels der bedingten Maße µ(A | B) := µ(A ∩ B)/µ(B). K ist gleichzeitig die bedingte Erwartung K(ω, A) = E(11A | σ(An , n ∈ IN ))(ω) bezüglich der von (An )n aufgespannten σ-Algebra. Integralkern: Sei k : Ω × Ω′ 7→ IR+ eine positive meßbare Funktion bzgl. der Produkt σ-Algebra A ⊗ A′ . Sei µ′ ein σ-endliches Maß auf A′ . Dann ist K K(x, A′ ) := Z A′ ein Kern. 83 k(x, y)µ′ (dy) WS10/11 Maßtheorie W-Maße aus Kernen Zur weiteren Orientierung zeigen wir beispielhaft die Konstruktion von W-Maßen durch Kerne. Dies entspricht der Vorstellung eines Wahrscheinlichkeitsbaums mit bedingten Wahrscheinlichkeiten in elementarer Notation. Proposition 102 Seien (Ω1 , A1 , µ) ein W-raum, (Ω2 , A2 ) ein meßbarer Raum und K : Ω1 × A2 → IR ein W-kern. Dann ist P, definiert durch Z f dP = Z Z f (x, y)K(x, dy)µ(dx) für positive meßbare Funktionen f ein W-maß auf dem Produktraum (Ω = Ω1 × Ω2 , A = A1 ⊗ A2 ). Die bedingte Erwartung unter der σ-Algebra Φ−1 1 (A1 ) =: A0 ⊂ A ist E(11A | A0 )(ω) = Φ1 (ω) K(Φ1 (ω), S2 (A)) f.s. und die bedingte W-keit P (A | Φ1 = x)(x) = K(x, S2x (A)) für A ∈ A. Beweis: • P ist wohldefiniert. Ist f eine meßbare Funktion, so ist f (x, .) : Ω2 → IR meßbar. (Dies entspricht dem Schnitt x S{1,2},2 (A) einer meßbaren Menge A.) • P ist ein W-maß. Einfach. • P Φ−1 1 =µ Für die bedingte Erwartung berechne durch Variablenwechsel, A0 ∋ B = Φ−1 (C), C ∈ A1 , Z B Φ (ω) K(Φ1 (ω), S2 1 (A))P (dω) = = Z C K(x, S2x (A))µ(dx) = P (B ∩ A) = Z B = Z 11C (x)11A (x, y)K(x, dy)µ(dx) E(11A | A0 )dP Die fast sichere Eindeutigkeit der bedingten Erwartung liefert die Behauptung. q.e.d. Dies Beispiel läßt sich erweitern auf endliche Produkte durch die Hintereinanderschaltung mehrerer Kerne. Das Maß P wird sinngemäß definiert durch Z f dµ = Z ... Z f (x1 , . . . , xn )K n−1 ((x1 , . . . , xn−1 ), dxn ) . . . K 1 (x1 , dx2 )µ1 (dx1 ). (8.3) Der Kern hat wieder die Interpretation als bedingte W-keit. (Genaue Formulierung als Übung.) Beispiel: Polyas Urnenmodell Aus einer Urne mit S schwarzen und W weißen Kugeln wird zufällig mit Gleichverteilung eine Kugel gezogen, die Farbe angesehen und anschließend werden insgesamt c + 1 ∈ IN Kugeln derselben Farbe zurückgelegt. Wie groß ist die Wahrscheinlichkeit, daß im dritten Ziehen eine schwarze Kugel gezogen wird, gegeben die erste Kugel war weiß und die zweite schwarz? Oder wie groß ist die Wahrscheinlichkeit als dritte Kugel eine schwarze zu ziehen gegeben die erste war weiß. Als meßbare Räume wählen wir Ω1 = Ω2 = Ω3 = {0, 1} jeweils versehen mit der Potenzmenge als σ-Algebra. 0 entspricht einer weißen Kugel und 1 einer schwarzen. Das WS Maß µ1 auf (Ω1 , P(Ω1 )) ist gegeben durch µ1 (1) = S+W = 1 − µ(0). Die Übergangskerne 1 2 K : Ω1 × P(Ω2 ) 7→ IR und K : Ω1 × Ω2 × P(Ω3 ) 7→ IR sind gegeben durch K 1 (1, {1}) = S+c = 1 − K 1 (1, {0}) W +S+c 84 WS10/11 K 1 (0, {1}) = U. Rösler S = 1 − K 1 (0, {0}) W +S+c und für das dritte Ziehen K 2 ((1, 1), {1}) = S + 2c W + S + 2c S+c = K 2 ((0, 1), {1}) W + S + 2c S K 2 ((0, 0), {1}) = W + S + 2c K 2 ((1, 0), {1}) = Q Q usw. Das W-Maß P auf dem Produktraum ( i Ωi , P( i Ωi ) i ∈ I = {1, 2, 3} sei das Kernmaß µ aus (8.3). Die Projektionsabbildungen Φi geben die Farbe der i-ten gezogenen Kugel an. Damit ist die erste gesuchte Wahrscheinlichkeit P (Φ3 = 1 | Φ1 = 0, Φ2 = 1) = = P (Φ1 = 0, Φ2 = 1, Φ3 = 1) P (Φ1 = 0, Φ2 = 1) S+c µ1 (0)K 1 (0, {1})K 2 ((0, 1), {1}) = K 2 ((0, 1), {1}) = 1 µ1 (0)K (0, {1}) S + W + 2c und die zweite P (Φ3 = 1 | Φ1 = 0) = P i P (Φ1 = 0, Φ2 = i, Φ3 = 1) P (Φ1 = 0) = K 1 (0, {0})K 2 ((0, 0), {1}) + K 1 (0, {1})K 2 ((0, 1), {1}) = S . S+W +c Halbgruppen Seien (Ωt , At ), t ∈ T meßbare Räume nd (T, ≤) sei eine halbgeordente Menge. Eine Halbgruppe von Kernen ist eine transitive Familie K s,t : Ωs ×At 7→ IR von Übergangskernen für s < t ∈ T. Transitiv bedeutet K s,t ◦ K t,u = K s,u für alle s < t < u ∈ T . Sind alle meßbaren Räume (Ωt , At ) = (E, {E}) gleich, so sprechen wir von einer Halbgruppe von Kernen über E. Jede solche Familie läßt sich stets erweitern um K t,t , t ∈ T durch K t,t (x, A) = 11A (x). Wir betrachten nur erweiterte Familien und nehmen dies mit in die Definition hinein. Im folgenden betrachten wir nur Halbgruppen über E. Sei (T, +) selbst eine Halbgruppe (+ : T × T → T ist assoziativ). Eine Halbgruppe von Kernen über E heißt zeitlich homogen oder zeittranslationsinvariant (bezüglich (T, +)) falls mit s, t, u, s + u, s + t ∈ T gilt K s,t = K s+u,t+u Wir schreiben, falls möglich, dann K t für K s,s+t . Analog sei (E, +) eine Halbgruppe mit einer meßbaren Verknüpfung + : E × E → E. Eine Halbgruppe von Kernen über E heißt räumlich homogen oder raumtranslationsinvariant falls für alle x, y ∈ E, A ∈ E K .,. (x, A) = K .,. (x + y, A + y) gilt. 85 WS10/11 Maßtheorie T hat in den meisten Fällen die Interpretation als Zeit und heißt daher Zeitparameterraum. Insbesondere ist für T ⊂ IR dies eine gängige Interpretation. Wir können auch andere Objekte zulassen, z.B. Bäume. E hat die Bedeutung eines Raumes und heißt Zustandsraum. Kompositionshalbgruppe: Sei K ein Kern auf E. Definiere induktiv K n , n ∈ IN, durch K n+1 := KK n = K n K. Die Familie K m,n := K n−m , m ≤ n ∈ IN, ist eine Halbgruppe von Kernen. Diese heißt Kompositionshalbgruppe von K. Diese ist zeittranslationsinvariant. K wird gerne als eine Matrix M geschrieben mit Einträgen K(i, {j}). Dann ist K n die Matrixmultiplikation M n . Faltungshalbgruppen: Sei E eine additive Gruppe (E, +) mit meßbaren Gruppenoperationen + und −. Eine Faltungshalbgruppe von Maßen ist eine Familie µs,t , s < t ∈ T ⊂ IR+ von Wahrscheinlichkeitsmaßen mit µs,t ⋆ µt,u = µs,u , ⋆ bezeichne die Faltung Z f (x + y)µ(dx)ν(dy) = inf f (z)(µ ∗ ν)(dz)(dz) Mit K s,t (x, A) = µs,t (A − x) ergibt dies eine räumlich homogene Faltungshalbgruppe von Kernen. (Übung). Gauß Halbgruppe: Sei E = IR, E = B, T = IR+ . Die Gaußsche Halbgruppe wird gegeben durch Z K s,t (x, B) := ϕx,t−s (y)dy B für s < t. Hierbei ist ϕm,σ2 die Dichte der Normalverteilung mit Erwartung m ∈ R und Varianz 0 < σ 2 < ∞, 1 (y − m)2 . ϕm,σ2 (y) := √ exp − 2σ 2 2πσ 2 (Hier ist einiges nachzurechnen.) Sie ist eine räumlich und zeitlich invariante Faltungshalbgruppe. K s,t ist ein Integralkern mit der Dichte k s,t (x, y) = ϕx,t−s (y − x) bzgl. dem Lebesguemaß. Poisson Halbgruppe: Sei E = ZZ + , E = P(E), T = IR+ . Definiere für s < t K s,t (x, A) := ∞ X n=0 exp(−(t − s)) (t − s)n 11x+n∈A = P ois(t − s)(A − x). n! Diese Markoffsche Halbgruppe heißt Poisson Halbgruppe. Sie ist eine räumlich und zeitlich invariante Faltungshalbgruppe. 8.4 Maße aus Kernen Seien (Ei , Ei ), i ∈ I = IN0 meßbare Räume und K n,n+1 : En × En+1 → IR Übergangskerne. Durch Komposition erhalten wir hieraus eine Halbgruppe K s,t , s ≤ t. Für i < j1 < j2 < . . . < jl , J := {j1 , . . . , jl } sei der Übergangskern K i,J : Ei × EJ → IR gegeben durch K i,J (e, f ) := Z ... Z f (x1 , . . . , xl )K jl−1 ,jl (xl−1 , dxl )K jl−2 ,jl−1 (xl−2 , dxl−1 ) . . . K jl ,j2 (x1 , dx2 )K i,j1 (e, x1 ) analog wie das Kernmaß für positive meßbare Funktionen f . 86 WS10/11 U. Rösler Satz 103 (Ionescu-Tulcea) In obigem Set-up gibt es einen W-Kern K : E0 × EIN → IR mit 0,J K(e0 , Φ−1 (e0 , AJ ) J (AJ )) = K (8.4) für alle J = {1, 2, . . . , n}, AJ ∈ EJ . Beweis: • Die Objekte der Übergangskerne K 0,⌊1,n⌋ ⌊1, n⌋ := {1, . . . , n} mit den Projektionen Φ : E⌊1,n⌋ → E⌊1,m⌋ bilden ein projektives System. Das wesentliche hierbei benötigte Argument ist K 0,⌊1,n+1⌋ (e0 , A1 × . . . × An × En+1 ) = K 0,⌊1,n⌋ (e0 , A1 × . . . × An ) für alle n ∈ IN. Sei R0 die Menge aller Rechteckmengen in EIN . Definiere die Abbildung K : E0 ×R0 7→ IR wie in (8.4) • K ist wohldefiniert. Dies ist die projektive Eigenschaft des Systems. Die Menge R0 der Rechteckmengen ist ein Semiring. Erweitere für jedes feste e0 ∈ E0 die Abbildung K zu einer additiven Mengenfunktion auf dem von R0 erzeugten Ring R, Lemma (18). • Für jedes A ∈ R gibt es ein n ∈ IN mit K(e, A) = K 0,⌊1,n⌋ (e0 , Φn (A)) für alle e0 ∈ E0 . Die Behauptung gilt für jede Rechteckmengen A. Da jede Menge A ∈ R eine disjunkte endliche Vereinigung von Rechteckmengen ist und beide Seiten additiv sind, folgt die Behauptung. • Der Inhalt K(e0 , .) ist für jedes e0 ∈ E0 ein Prämaß. Wir zeigen die σ-Stetigkeit in der leeren Menge. Dazu sei An ∈ R, n ∈ IN, eine Folge von Ringmengen aus R monoton fallend gegen die leere Menge. Wir haben limn K(e0 , An ) = 0 zu zeigen. Nehmen wir an limn K(e0 , An ) > 0 wäre strikt positiv. OEdA durch Umnummerierung sei An = (Φn )−1 Φn An und damit K(., An ) = K 0,⌊1,n⌋ (., Φn (An )) an. Wir benutzen hier fn für 11Φn (An ) . K(e0 , An ) = Z E1 Z fn (e1 , . . . , en )K 1,⌊2,n⌋ (e1 , d(e2 , . . . , en ))K 0,1 (e0 , de1 ) Wegen monotoner Konvergenz n 0 < lim K(e0 , A ) = n Z lim n Z fn (e1 , . . . , en )K 1,⌊2,n⌋ (e1 , d(e2 , . . . , en ))K 0,1 (e, de1 ) können wir ein e∗1 ∈ E1 finden mit strikt positivem Integranden an der Stelle (e0 , e∗1 ). Analog können wir wegen 0 < lim n = Z Z fn (e1 , . . . , en )K 1,⌊2,n⌋ (e1 , d(e2 , . . . , en )) lim fn (e∗1 , . . . , en )K 2,⌊3,n⌋ (e2 ), d(e3 , . . . , en ))K 1,2 (e∗1 , de2 ) E2 n ein e∗2 ∈ E2 finden mit strikt positivem Integranden an der Stelle (e0 , e∗1 , e∗2 ). 87 WS10/11 Maßtheorie Fahren wir so fort, so finden wir induktiv ein e∗ := (e0 , e∗1 , e∗2 , e∗3 , ...). Dies e∗ ist Element von jedem An . (Konstruktion). Dies ist ein Widerspruch. Wir erweitern K(e0 , .) mit Caratheodory eindeutig zu einem W-Maß auf EIN . Es verbleibt zu zeigen, daß die Abbildung K(., A) meßbar ist für jedes A ∈ EIN . Die Menge der A’s mit dieser Eigenschaft bildet ein Dynkin-System. Dieses Dynkin-System enthält den durchschnittstabilen Erzeuger der Rechteckmengen R0 . Damit ist dies die Produkt σ-Algebra selber. q.e.d. Wir erweitern dies zu überabzählbar vielen vorgegebenen Kernen. Wir beschränken uns der Einfachheit halber auf den Zeitparameter T ⊂ IR+ . Satz 104 Sei K s,t , 0 ≤ s ≤ t ∈ T = IR+ , eine Markoff Halbgruppe auf einem polnischen Raum E versehen mit der Borel σ-Algebra. Dann existiert ein Markoff Kern K : E × EIR+ 7→ IR mit 0,t K(e, Φ−1 t (At )) = K (e, At ) s ≤ t, At ∈ E, e ∈ E. Beweis: Sei e fest. Betrachte die W-Maße K 0,J (e, .) für J ⊂ T auf den meßbaren Räumen (EJ , EJ ). Mit den Projektionen bilden diese ein projektives System. Das wesentliche Argument ist wieder von der Bauart K 0,{j1 ,j2 ,j3 } (e, Aj1 × Ej2 × Aj3 ) = K 0,{j1 ,j3 } (e, Aj1 × Aj3 ) (Bachte, das neue Element j2 wurde zwischen die anderen eingefügt, nicht notwendigerweise am Schluss.) Nach dem Satz von Kolmogoroff 100 existiert das projektive Maß K(e, .) auf + N (E IR , t∈T E) mit den Koordinatenabbildungen als Morphismen. Dieses konstruierte Maß K(e, .) tut‘s. Die Kerneigenschaft wird standardmäßig nachgerechnet ({A ∈ . | K(., A) ist meßbar} = ...) q.e.d. Bem: Wir haben hier die kompakten Mengen des polnischen Raumes als kompakte Klasse benutzt. Sollte auch ohne gehen(?). Brownsche Maß und Brownsche Bewegung: Das Brownsche Maß ist das Maß (auf + dem Produktraum IRIR versehen mit der Produkt σ-Algebra zu der Gaußschen Halbgruppe K s,t (x, B) := Z B ϕx,t−s (y)dy. Eine Zufallsvariablen mit dieser Verteilung und (zusätzlich) stetigen Pfaden heißt Brownsche Bewegung. Poisson Prozess: Zu der Poissson Halbgruppe K s,t (x, A) := ∞ X exp(−t + s) n=0 + (t − s)n 11x+n∈A = P ois(t − s)(A − x) n! + gibt es ein Maß auf ZZ IR bzw. IRIR . Eine Zufallsgröße mit diesem (Markoff) Maß als Verteilung und (zusätzlich) rechtsstetigen Pfaden heißt Poisson Prozess. Beide Prozesse haben räumlich und zeitlich invariante Übergangskerne. Mehr über die inhaltliche Bedeutung dazu in der Sektion über Prozesse. Bemerkung: Die Existenz von stetigen bzw. rechtsstetigen Versionen muß bewiesen werden und ist keine Trivialität. 88 WS10/11 U. Rösler Beispiel: Produktmaße Produktmaße auf endlichen Produkträumen lassen sich als Spezialfall der Konstruktion durch Kerne sehen. Der Kern hängt nicht von der ersten Koordinate ab. In der Sprache der Wahrscheinlichkeitstheorie liefert dies die Existenz einer Folge von unabhängigen Zufallsgrößen Xi , i ∈ IN, mit den µi als Verteilung der Xi . Die Projektionsabbildung Φi auf dem Produktraum spielt die Rolle von Xi . Markoffketten: Der Satz von Ionescu-Tulcea hat Anwendung in der Konstruktion von Markoff Ketten auf einem endlichen (oder abzählbaren) Zustandsraum E. Gegeben sei eine stochastische Matrix (positive Einträge und Zeilensumme stets 1) und eine Startwahrscheinlichkeit π auf (E, E). Die Kompositionen P n , n ∈ ZZ + bilden eine Halbgruppe. Die Zufallsgrößen Φi = Xi , i ∈ IN, auf dem Produktraum E IN mit der Produkt σ-Algebra ist eine Markoff Kette mit den Übergangswahrscheinlichkeiten P (Xn+1 = j | Xn = i) = P (i, j). n Bsp. Baumindex: Sei V = ∪∞ n=0 IN die Menge endlicher Folgen einschließlich der leeren Folge. Diese Menge ist ein gerichteter Graph mit den Kanten (v, vi), v ∈ V, i ∈ IN. Jedem N Knoten v ∈ V ordnen wir einen meßbaren Raum (Ev , Av ) zu. Sei K v,(vi)i : Ev × i∈IN Avi → IR ein Übergangskern für alle (v, (vi)i ). Solche Kerne können wir hintereinanderschalten im Sinne K v,(vi)i (L vi,(vij)j )i (x, A) = Z 11A ((yi,j )i,j ) Y Lvi,(vij)j (yi , d(yij )j )K v,(vi)i (x, d(yi )i ) i∈IN Wir erhalten W-Kerne auf K v,(vVn ) : Ev × AvVn → IR mit Vn die Menge der Folgen der Länge n. Dann ist für jedes x ∈ E∅ das Tupel (ΩVn , AVn , K ∅,Vn (x, .)), n ∈ IN, versehen mit den Projektionen ΦVn ,Vm , m ≤ n ein projektives maßerhaltendes System. Dieses hat, analog zu Ionescu-Tulcea, einen projektiven Grenzwert (ΩV , AV , K(x, .)). 89 WS10/11 8.5 Maßtheorie Prozesse Durchgehend benutzen wir denselben W-raum (Ω, A, P ). Alle Prozesse sind auf diesem Wraum definiert. Ein stochastischer Prozess ist eine Familie von Zufallsgrößen Xt : Ω 7→ Et , t ∈ T. Die Indexmenge T ist in der Regel eine geordnete Menge. Sehr häufig ist die Indexmenge eine Teilmenge der reellen Zahlen und erhält dann die Interpretation als Zeitparameterraum. In vielen Fällen ist (Et , Et ) = (E, E) für alle t ∈ T. Wir sprechen dann von einem Prozess mit Zustandsraum E. In diesem Sinne ist jede deterministische Funktion f : T 7→ E ein (degenerierter) stochastischer Prozeß. Allgemein ist die Abbildung T ∋ t 7→ Xt (ω) ein Pfad des Prozesses (zu ω). Q Sei ET = t∈T Et der Produktraum. Jeder stochastische Prozeß X = (Xt )t∈T ist eine Zufallsgröße X : Ω 7→ ET , meßbar bzgl. der Produkt-σ-Algebra ET definiert durch Φt (X(ω)) = (X(ω))(t) = Xt (ω). Die Verteilung eines Prozesses X ist das Maß P X = P (X −1 (·)) auf dem Produktraum (ET , ET ). Eine Marginalverteilung zur Basis S ⊂ T ist das W-Maß P ΦS X = P (XS ∈ ·) auf ES . Wir sprechen von eindimensionanlen, endlich dimensionalen (usw. ) Marginalverteilungen für S einelementig, mit endlich vielen Elementen usw.. Die endlich dimensionalen Verteilungen bestimmen im Regelfall (Kolmogoroff oder Ionescu-Tulcea) die Verteilung des Prozesses. Zwei Zgn X und Y, nicht unbedingt auf demselben W-raum definiert, heißen Kopien voneinander, falls deren Verteilung übereinstimmt, P X = P Y . Durch Vergrößern, (=Produktbildung) des zugrunde liegenden W-raumes könnten wir X, Y auf demselben W-raum betrachten. Dies ist der Regelfall. Zwei Zgn X und Y auf demselben W-Raum heißen Version voneinander, falls sie fast sicher ununterscheidbar sind auf dem Bildraum. In Formeln, P ({X ∈ A}△{Y ∈ A}) = 0 für alle meßbaren Mengen A. Sie heißen fast sicher gleich oder ununterscheidbar, falls P (X 6= Y ) = 0 gilt. Der Begriff Kopie betrifft die Verteilung einer Zg, Version und Gleichheit die Ausprägung der Zgn, einmal bzgl. dem Bildraum und einmal auf dem Definitionsraum. Gleichheit impliziert Version und Version impliziert Kopie, aber im allgemeinen nicht umgekehrt. Betrachten wir jetzt Prozesse X, Y : Ω → ET . Diese sind Kopien voneinander, falls alle endlich dimensionalen Marginalverteilungen übereinstimmen. Sie sind Versionen voneinander, falls P (Xt 6= Yt ) = 0 für alle t ∈ T gilt. (Argumentiere über das Erzeugendensystem Φ−1 t (.) der Produkt-σ-Algebra. Die Produkt-σ-Algebra ist die Menge aller meßbaren Zylindermengen mit abzählbarer Basis.) Für die Ununterscheidbarkeit sei angemerkt, dass die Menge X 6= Y eventuell garnicht ET meßbar ist. Standardbeispiel: Sei Ω das Einheitsintervall, B die Borel σ-Algebra darauf, λ das Lebesgue Maß. Definiere die Prozesse Xt (ω) = 11t=ω und Yt ≡ 0, t ∈ T = [0, 1]. Diese Prozesse sind Versionen voneinander, da P ({ω | Xt (ω) 6= Yt (ω)}) = 0 für alle t ∈ T gilt. Sie sind nicht fast sicher gleich, die Menge X 6= Y ist der gesamte Raum Ω. Warnung: Die Menge {X 6= Y } = {ω ∈ Ω | ∀t ∈ T | Xt (ω) 6= Yt (ω)} ist im allgemeinen nicht meßbar. Dazu sei, (Ω, B, λ, T ) wie im obigen Beispiel und A ⊂ [0, 1] eine nicht Lebesgue meßbare Menge. Die Prozesse Xt (ω) := 11A (t)11t (ω), Yt ≡ 0, t ∈ T sind Versionen voneinander, aber X 6= Y ist die nicht meßbare Menge A. 90 WS10/11 8.5.1 U. Rösler Pfadmengen Sei X : Ω → E T , Xt (ω) = X(ω)(t) ein stochastischer Prozesss mit Zeitparametermenge T in den reellen Zahlen. Die Funktion ω 7→ supt∈T Xt (ω) ist eventuell nicht meßbar. Das Problem taucht nur für überabzählbare T auf. Für T abzählbar ist das obige Supremum und auch Y : Ω × T → E mit Y (ω, t) := Xt (ω) meßbar bzgl. A ⊗ ET − E, jedoch im allgemeinen nicht für überabzählbere T. Das Meßbarkeitsproblem ließe sich umgehen, wenn jeder Pfad ω T ∋ t 7→ Xt (ω) durch abzählbar viele Werte Xt (ω) mit t aus einer abzählbaren Menge bestimmt wäre. Eine derartige Theorie separabler Prozesse wurde von Doob ausgeführt (siehe Meyer [8]). Wir sind nicht ganz so anspruchsvoll. Unser Ziel sind zwei wichtige Prozesse, die Brownsche Bewegung und der Poissonsche Zählprozess. Die Brownsche Bewegung Ein Prozess Xt , t ∈ T ⊂ IR, mit unabhängigen Zuwächsen ist ein Prozess mit Xti − Xti−1 , i = 1, ..., n, unabhängig für alle t0 < t1 < ... < tn ∈ T. Eine Brownsche Bewegung zu σ 2 > 0 ist ein stochastischer Prozeß Xt : Ω 7→ IR, t ∈ T = IR+ , mit den Eigenschaften i) Die Zuwächse sind unabhängig. ii) Xt − Xs hat eine N (0, σ(t − s)) Normalverteilung für alle s < t. iii) X0 ≡ 0. iv) Die Pfade T ∋ t 7→ Xt (ω) sind stetig. Die Standard Brownsche Bewegung ist eine Brownsche Bewegung (BB) mit σ 2 = 1. Die Standardnotation ist Bt oder Wt . (Norbert Wiener hat als erster die BB mathematisch exakt definiert, Brown war Physiker.) Satz 105 Die Brownsche Bewegung existiert. Beweis: Sei µs,t die Normalverteilung N (0, (t − s)σ 2 ) für s < t. Sei K s,t , s < t ∈ IR+ , die Gaußsche Halbgruppe, K s,t (x, A) = µs,t (A − x). Nach Kolmogoroff existiert zu dieser Halbgruppe ein W-Kern K T : IR × B T → IR als projektiver Limes. Nehme als Xt die Projektionen Φt auf die t-te Koordinate zu dem Maß K T (0, ·) auf RT . Es gilt X0 = 0. Die ersten zwei Eigenschaften werden nachgerechnet, die dritte ist einfach. Die Idee zum Nachweis der vierten und letzten Eigenschaft besteht in der Einschränkung dieses Maßes auf stetige Funktionen. Beachte, die Menge C der stetigen Funktionen ist nicht Produkt-σAlgebra meßbar (da sie keine Zylindermenge mit abzählbarer Basis ist). Eine entsprechende Theorie entwickeln wir jetzt allgemein. Sei (Ω, A, P ) ein W-raum. Das äußere Maß zu P ist die Abbildung P ∗ von der Potenzmenge über Ω in die erweiterten reellen Zahlen definiert durch P ∗ (Q) = inf{P (A) | Q ⊂ A ∈ A}. Das äußere Maß ist wohldefiniert, isoton und ist eine Erweiterung des Maßes (=stimmt mit µ auf der σ-Algebra A überein). 91 WS10/11 Maßtheorie Proposition 106 Sei (Ω, A, P ) ein W-Raum und Q ⊂ Ω eine Menge von P -äußeren Maß 1. Dann ist die Einschränkung P|Q von P auf Q, definiert durch P|Q (A ∩ Q) = P (A) für alle A ∈ A, ein W-maß auf (Q, A|Q = {A ∩ Q | A ∈ A}). Beweis: • P|Q ist wohldefiniert. Sei A ∩ Q = B ∩ Q mit A, B ∈ A. Es folgt A△B ⊂ Qc . Dies impliziert Q ⊂ (A△B)c . Aus der Istonie des äußeren Maßes folgt 1 = P ∗ (Q) ≤ P ∗ ((A△B)c ) = P ((A△B)c ) ≤ 1 und damit P (A△B) = 0 und P (A) = P (B). Der Rest ist einfach. q.e.d. Für Produktw-räume (IRT , B T , P ) ist Q eine Menge von P -äußerem Maß 1 genau dann, wenn P (A) = 1 gilt für alle Zylindermengen A mit abzählbarer Basis, die Q ⊂ A erfüllen. (Die Produkt-σ-Algebra ist die Menge aller Zylindermengen mit abzählbarer Basis.) Wir werden diese Aussage anwenden auf hölderstetige Funktionen. Für 0 ≤ γ ≤ 1, d > 0 sei Hγ,d (S) die Menge der Funktionen f : S → IR mit |f (x) − f (y)| ≤ d|x − y|γ für alle x, y ∈ S ⊂ T. Wir verwenden zur Abkürzung Φ−1 T,S (H. (S)) = H. (S, T ). Die Abbildung d 7→ Hγ,d (S, T ) ist isoton (für festes γ, S) und die Abbildung S 7→ Hγ,d (S, T ) ist antiton (für festes γ, d) und σ-stetig von unten (=für aufsteigende Mengen Sn , n ∈ IN, gegen S gilt Hγ,d (Sn ) →n Hγ,d (S, T )). Ein Element aus Hγ (S) := ∪d>0 Hγ,d (S) heißt (gleichmäßig) γ-hölderstetig auf S. Beachte, Hγ (S) ist der aufsteigende Grenzwert der Mengen Hγ,dn (S), n ∈ IN, einer gegen ∞ aufsteigenden, abzählbaren Folge (dn )n . Hölderstetige Funktionen sind stetig. Die 1-Hölderstetigkeit wird auch Lipschitzstetigkeit genannt. Warnung, die Abbildung S 7→ Hγ (S, T ) ist antiton, aber im allgemeinen nicht mehr σ-stetig von unten. Proposition 107 Sei S eine Teilmenge der reellen Zahlen und sei f : S → IR (γ, d)-hölderstetig. Dann gibt es eine (γ, d)-hölderstetige Fortsetzung von f auf den reellen Zahlen. Ist S dicht in den reellen Zahlen, so ist die Erweiterung eindeutig. Bew: Definiere eine Fortsetzung g : S → IR von f auf dem Abschluss S von S durch g(t) = limS∈s→t f (s). g ist wohldefiniert als Funktion, ist (γ, d)-hölderstetig und die einzige mögliche Fortsetzung in Hγ,c (S). (Nachrechnen.) c c Für x ∈ S gibt es ein größtes offenes Intervall in der offenen Menge S mit x als innerem Punkt. Sei (a, b) dies Intervall und a, b ∈ S. Setze g linear fort auf dem Intervall [a, b] mit den x−a Stützwerten g(a) auf a und g(b) auf b, formal h(x) := b−x b−a g(a) + b−a g(b). Ist a = −∞ oder b = ∞ so wähle h(x) = g(b) bzw. = g(a). Die Fortsetzung h : IR → IR tut’s. q.e.d. Lemma 108 Sei P ein W-Maß auf (IRT , B T ), T ⊂ IR. Dann hat die Menge Hγ (T, T ) der γhölderstetigen Funktionen auf T äußeres Maß 1 genau dann, wenn für jede abzählbare Menge S ⊂ T gilt P (Hγ (S, T )) = 1. 92 WS10/11 U. Rösler S Beweis: • Hγ (S, T ) ∈ Φ−1 S (B ) für höchstens abzählbare S. Sei S abzählbar und ϕ : S → IN eine Abzählung von S (=ϕ ist bijektiv) und Sn = Sn ϕ−1 ({1, 2, . . . , n}). Die Menge Hγ,d (Sn , T ) ist in Φ−1 Sn (B ) und konvergiert gegen Hγ,d (S, T ) ∈ S Φ−1 S (B ), −1 −1 −1 Sn S Sn Hγ,d (Sn , T ) ∈ Φ−1 Sn (B ) = ΦS ΦS,Sn (B ) ∈ ΦS (B ). Mit einer abzählbaren Folge 0 < di րi ∞ folgt die Behauptung. • ’Hinrichtung’: Die ’Hinrichtung’ folgt aus der Isotonie des äußeren Maßes, 1 ≤ P ∗ (Hγ (T, T )) ≤ P ∗ (Hγ (S, T )) = P (Hγ (S, T )) ≤ 1 für S wie oben. • ’Rückrichtung’: Sei Hγ (T, T ) ⊂ A ∈ B T . Dann ist A = Φ−1 S (Z) eine Zylindermenge mit (höchstens) abzählbarer Basis S, Z ∈ B S . Es reicht zu zeigen Hγ (S, T ) ⊂ A, denn dies impliziert P (A) = 1. Sei f ∈ Hγ (S, T ). Dann existiert eine Funktion g ∈ Hγ (T, T ) mit f|S = g|S , Proposition 108. Damit −1 −1 −1 −1 −1 −1 f ∈ Φ−1 S (f|S ) = ΦS (g|S ) = ΦS ΦS (g) ⊂ ΦS ΦS (A) = ΦS ΦS ΦS (Z) = ΦS (Z) = A. q.e.d. Theorem 109 Sei P ein W-maß auf dem Produktraum (IRT , B T ) mit T = [0, 1]. Falls es Konstanten 0 < α, 1 < β und a gibt mit Z |f (t) − f (s)|α P (df ) ≤ a|t − s|β für alle s < t ∈ T , so hat Hγ (T ) äußeres P -maß 1 für alle γ < β−1 α . Beweis: Sei Dn die Menge der reellen Zahlen 2in , 0 ≤ i ≤ 2n , und D der Grenzwert der n i aufsteigenden Folge Dn . Definiere Bd = ∩n∈IN ∩2i=1 Hγ,d ({ i−1 2n , 2n }, T ) und B = ∪d>0 Bd . • P (B) = 1. Die Markoffungleichung liefert, δ := β − 1 − γα > 0, c P (Hγ,d ({s, t}, T )) P (Bdc ) ≤ R ≤ 2 X X ≤ ≤ = a |f (t) − f (s)|α P (df ) ≤ αγ |t − s|β−αγ α α γ (d |t − s| ) d n c P (Hγ,d ({ n∈IN i=1 i−1 i , }, T )) 2n 2n n 2 a X X 2−n(β−αγ) dαγ n∈IN i=1 a X −nδ 2 dαγ n∈IN 1 a2−δ →d→∞ 0 dαγ 1 − 2−δ Die Abbildung d → Bd ist aufsteigend, die Bd sind meßbar und damit auch der Grenzwert B. 93 WS10/11 Maßtheorie • ∀d > 0 ∃d′ ≥ d ∀S ⊂ T, D ⊂ S : Bd ∩ C(S, T ) ⊂ Hγ,d′ (S, T ) mit C(S, T ) = {f : T → IR | f|S stetig }. P Sei f ∈ Bd , s < t ∈ S. Wir benutzen die Dualdarstellung x = i∈IN xi 2−i , xi ∈ {0, 1} P und nicht alle Koordinaten sind 1 ab einer gewissen Stelle. Für t = i ti 2−i und entsprechend s sei i0 das kleinste i ∈ IN mit si 6= ti . Aktuell gilt si0 = 0 < 1 = ti0 . Sei i1 das kleinste i > i0 mit ti = 1 und ∞, falls keine solches i existiert. Definiere die aufsteigende Folge tn = Pn −i ∈ D , n ∈ IN reeller Zahlen. Es gilt tn ↑ t, ti −ti−1 = t 2−i , t−u = P∞ (ti+1 −ti ) n i i=i0 i=1 ti 2 P für u = ti0 und f (t) − f (u) = i=i0 (f (ti+1 ) − f (ti )) wegen der Stetigkeit. Es folgt |f (t) − f (u)| ≤ ∞ X |f (ti+1 ) − f (ti )| i=i0 ∞ X ≤ d ≤ d i=i0 ∞ X |ti+1 − ti |γ = d 2−iγ = d2−i1 γ ∞ X ti+1 2−(i+1)γ i=i0 ∞ X 2−iγ i=0 i=i1 1 d ≤ |t − u|γ 1 − 2−γ 1 − 2−γ ≤ c1 |t − u|γ = d2−i1 γ P mit einer Konstanten c1 . Mit einem symmetrischen Argument, schreibe u − s = i xi 2−i in P der Dualdarstellung und mit der Folge xn = ni=0 xi 2−i →n u − s erhalten wir |f (u) − f (s)| ≤ c2 |u − s|γ mit eventuell einer anderen Konstanten c2 . Dies ergibt |f (t) − f (s)| ≤ |f (t) − f (u)| + |f (u) − f (s)| ≤ c1 |t − u|γ + c2 |u − s|γ ≤ c3 |t − s|γ mit einer Konstanten c3 ≥ d. Die oben angeführten Abschätzungen gelten gleichmäßig in S ⊃ D. • Bd ⊂ C(D, T ) Hölderstetigkeit impliziert Stetigkeit. • Hγ (D, T ) = B Aus Hγ,d (D, T ) ⊂ Bd ∩ C(D, T ) ⊂ Hγ,d′ (D, T ) folgt die Teilaussage mit d → ∞. • ∀S ⊂ T, D ⊂ S : Hγ (S, T ) = B ∩ C(S, T ) Die Aussage folgt aus Hγ,d (S, T ) ⊂ Bd ∩ C(S, T ) ⊂ Hγ,d′ (S, T ) mit d → ∞ für eine Folge. • P (B ∩ C(S, T )) = 1 für höchstens abzählbare S. OEdA gilt D ⊂ S. Für jedes s ∈ S\D sei dn ∈ D eine Folge mit |dn − s| → 0 schnell genug. Sei As,m = ∩n≥m Hγ,d ({dn , s}) und As der Grenzwert der aufsteigenden Folge As,m in m. Wegen X |dn − s|β−γα < ∞ P (Acs,m ) ≤ c3 n≥m mit c3 eine Konstante und Wahl der dn , konvergiert P (Acs,m ) in m gegen 0. Damit gilt P (As,m ) →m P (As ) = 1. Damit ist A := ∩s∈S\D As meßbar und hat Maß 1. Aus B ∩ A ⊂ B ∩ C(S, T ) folgt die Behauptung. • P (Hγ (S, T )) = 1 für höchstens abzählbare S. OEdA sei D ⊂ S. Aus Hγ,d (S, T ) ⊂ Bd ∩ C(S, T ) ⊂ Hγ,d′ (S, T ) folgt B ∩ C(S, T ) = Hγ (S, T ) und damit die Teilaussage. Mit der Proposition 107 ergibt sich der Satz. q.e.d. Jetzt in stochastischer Schreibweise die stochastische Formulierung: 94 WS10/11 U. Rösler Korollar 110 Sei X = (Xt )t∈T =[0,1] ein reellwertiger Prozeß. Falls es Konstanten 0 < α, 1 < β und a gibt mit E|Xt − Xs |α ≤ a|t − s|β für alle s < t ∈ T , so gibt es eine γ-hölderstetige Kopie von X für alle γ < β−1 α . Beweis: Die ω’s ersetzen die Funktionen. Nehme die Einschränkung von P auf die Menge {ω ∈ Ω | ∃d > 0 ∀s, t ∈ T : |Xt (ω) − Xs (ω)| ≤ d|t − s|γ }. Diese tut’s, Proposition 106 und Satz 109. q.e.d. Der obige Satz und das Korollar lassen sich schnell ausdehnen auf kompakte T, nicht jedoch auf ganz IR+ . Bsp: Brownsche Bewegung Die Pfade der Brownschen Bewegung √ auf [0, 1] sind fast sicher γ-hölderstetig für jedes γ < 1/2. Es gilt Xt − Xs ∼ N (0, t − s) ∼ t − sN (0, 1) und damit E|Xt − Xs |α ≤ aα |t − s|α/2 1 für α > 2. γ < α/2−1 = α−2 α α →α→∞ ↑ 2 . Insbesondere ist die Menge C der stetigen Funktionen eine 1-Menge für das äußere Maß. Die Menge Hγ (T ) ist nicht B T meßbar, hat äußeres Maß 1 und ist in C enthalten. Standardmäßig nimmt man in die Definition der BB bereits die Stetigkeit der Pfade mit hinein, nicht die Hölderstetigkeit. Fortsetzung des Existenzbeweises der BB: Zu n ∈ IN sei Wtn : Ωn → IR eine BB auf dem Intervall t ∈ Tn = [n − 1, n] mit stetigen Pfaden. Sei Pn das W-maß dazu. Durch Übergang auf den Produktraum Ω = ΩIN versehen mit der Produkt-σ-Algebra und dem Produktmaß können wir von unabhängigen Zgn (Wtn )t∈Tn : Ω → IRTn , n ∈, IN definiert auf demselben W-raum ausgehen. Definiere für t ∈ IR+ , n = ⌊t⌋, die untere Gaussklammer n+1 Wt = Wt−n + n X W1i i=1 Dies ist eine standard Brownsche Bewegung. (Hier ist einiges Nachzurechnen.) q.e.d. Alternative Konstruktion: Für die Konstruktion des Prozesses ergeben sich gute Alternativen durch stetige (oder hölderstetige) Funktionen. Wir könnten einen Prozess konstruieren bzgl. der vorgegebenen Halbgruppe K s,t , s ≤ t ∈ D auf einer dichten und abzählbaren Teilmenge D von T, wie zum Beispiel das oben verwendete D. Zeige dann µD (C(D)) = 1 oder µD (Hγ (D)) = 1 und erweitere das Maß µD von (IRD , B D ) auf (IRT , B T ). (Hintergrund ist, jede stetige (hölderstetige) Funktion auf S kann zu genau einer auf T erweitert werden.) Noch einmal abstrakt die (gemachte) Konstruktion. Sei (IRT , B T , µ) ein W-raum und die Menge C(T ) der stetigen Funktionen auf T habe äußeres Maß 1. Dann ist die Abbildung T T T ϕ1 : (C(T ), B|C(T ) , µ|C(T ) ) → (R , B , µ) definiert als Einbettung ein Maßraummorphismus, d.h. meßbar und maßerhaltend (µϕ−1 = µ|C(T ) ). Sei D eine dichte, abzählbare Teilmenge von T. Die Abbildung D T ϕ2 : (C(D), B|C(D) , µ|C(D) ) → (C(T ), B|C(T ) , µ|C(T ) ) definiert durch die Einbettung ist ein Maßraumisomorphismus, d.h. ϕ2 ist bijektiv ϕ2 , ϕ−1 2 sind Maßraummorphismen. 95 WS10/11 Maßtheorie Proposition 111 Sei Xt , t ∈ T = IR+ ein stochastischer Prozess auf (Ω, A, P ) mit stetigen Pfaden. Dann ist X ′ : Ω × T → IR definiert durch X ′ (ω, t) = Xt (ω) meßbar bzgl. der ProduktN σ-Algebra A B und der Borelschen. Bew: OEdA sei T = [0, 1). Sei S eine dichte, abzählbare Teilmenge von T. Wie oben dargelegt (allerdings für Ω = IRT ), ist XT : Ω → IRT A − B T -meßbar äquivalent zu XS : Ω → (IRS , B S ) meßbar wegen der Pfadstetigkeit. Die letztgenannte Zg ist genau dann meßbar, wenn X̃ : Ω × S → IR, definiert durch X̃(ω, s) = Xs (ω), meßbar ist bzgl. der Produkt-σ-Algebra. (Die Hinrichtung ist offensichtlich. Für die Rückrichtung verwende, für A ∈ A × Pot(S) ist jeder Schnitt {ω ∈ Ω | (ω, s) ∈ A} in Richtung s ∈ S meßbar in A.) Eigenschaften Proposition 112 Sei Wt , t ∈ IR+ , eine Brownsche Bewegung zu σ 2 = VarW1 . • Für a > 0 ist Wat , t ∈ IR+ , eine Brownsche Bewegung zum Parameter aσ 2 . • Für a > 0 ist aWt , t ∈ IR+ , eine Brownsche Bewegung zum Parameter a2 σ 2 . • Für s > 0 ist Xt+s − Xs , t ∈ IR+ , eine Brownsche Bewegungvzu σ 2 . • Yt := tX1/t für t > 0 und Y0 := 0 ist f.s. eine Brownsche Bewegung zu σ 2 . Beweis: Die ersten drei Aussagen sind einfach. Nur die vierte Aussage benötigt eine Argumentation. Die Unabhängigheit der Zuwächse von Yt = tX1/t ist etwas Schreibarbeit, läßt sich jedoch auf die Unabhängigkeit der Zuwächse des X-Prozesses zurückführen. Der Zuwachs Yt − Ys = tX1/t − sX1/s = −s(X1/s − X1/t ) + (t − s)(X1/t − 0) ist eine Summe von zwei unabhängigen Zgn mit Gaussverteilung zu den Parametern (0, s2 σ 2 ( 1s − 1t )) 2 und (0, (t − s)2 σt ). Diese ist Gaussverteilt mit Parameter die Summe der Einzelparameter (=(0, σ 2 (t − s))). Es verbliebe zu zeigen limt→0 tX1/t = 0 = limt→∞ Wt t . Verwende für n2 ≤ t < (n + 1)2 Wt = Wn2 + (Wt − Wn2 ) und Borel-Cantelli gilt W limn→∞ nn22 X P( n n ≤ |Wn2 | n2 + An n2 = 0 f.s. wegen mit An := supn2 ≤s≤(n+1)2 |Ws − Wn2 |. Mit X EW 22 X 1 Wn2 n ≥ a) ≤ = <∞ 2 4 2 2 2 n n n a n n a Borel-Cantelli liefert ebenfalls X |Wt | t An n2 P( D D → 0 wegen An = sup0≤t≤2n+1 |Wt | = X An > a) ≤ n2 n √ √ 2n + 1A0 und 2n + 1 EA0 < ∞. n2 q.e.d. 96 WS10/11 8.5.2 U. Rösler Der Poissonsche Zählprozess Ein Poissonprozess oder auch Poisson Zählprozess λ > 0 ist ein stochastischer Prozeß Xt : Ω 7→ IR, t ∈ T = [0, ∞), mit den Eigenschaften • Die Zuwächse sind unabhängig. • Xt − Xs hat eine P oi(λ(t − s)) Poissonverteilung für alle s < t. • Die Pfade t 7→ Xt (ω) sind rechtsstetig, isoton und haben nur Sprünge der Größe 1. • X0 = 0. Der Standard Poissonprozess ist ein Poissonprozess mit λ = 1. Lemma 113 Der Poissonprozess existiert. Beweis: Sei µs,t die Poissonverteilung P oi(λ(t−s)) für s < t. Sei K s,t , s < t ∈ IR+ , die Poisson Halbgruppe, K s,t (x, A) = µs,t (A − x). + Nach Kolmogoroff existiert zu dieser Halbgruppe ein W-Maß P = K T (0, ·) auf IRIR als projektiver Limes. Nehme als Xt die Projektionen auf die t-te Koordinate. Es gilt X0 = 0. Ersten beiden Eigenschaften: Für 0 = t0 < t1 < ... < tn , Ai ∈ B, ist zu zeigen P (Xti − Xti−1 ∈ Ai , i = 1, ..., n) = n Y µti ,ti−1 (Ai ). i=1 Dies folgt durch die Konstruktion via den Kernen. Zum Nachweis der dritten und letzten Eigenschaft werden wir den Prozess Xs : Ω 7→ + ZZ , s ∈ S abzählbar mit obigen Eigenschaften betrachten und dann fortsetzen mittels X̃t = limS∋sցt Xs punktweise. X̃t tut’s. Sei S die Menge der dyadischen Zahlen { 2in | i ∈ IN, n ∈ IN.}. Dies ist eine dichte und abzählbare Menge in T . • Fast alle Pfade s 7→ Xs (ω), s ∈ S, sind stückweise konstant und haben nur Sprünge aufwärts der Größe 1. n i i−1 Eine Funktion f : IR+ 7→ IR mit f ∈ limn ∪n2 i=1 {g | g( 2n ) − g( 2n ) 6∈ {0, 1}} ist stückweise konstant und hat nur Sprüngen aufwärts der Größe 1. (Übung). Wir schätzen ab n P (∪n2 i=1 {X i 2n 6∈ {0, 1}} ≤ − X i−1 n 2 ≤ ≤ ≤ n n2 X i=1 n n2 X i=1 n n2 X i=1 n n2 X i=1 Dies zeigt die Behauptung. 97 P (X i 2n 6∈ {0, 1}) − X i−1 n 2 −n exp(−λ2 ) ∞ X (λ2−n )j j=2 j! exp(−λ2−n )(λ2−n )2 ∞ X (λ2−n )j j=0 j! (λ2−n )2 ≤ nλ2 2−n →n→∞ 0. WS10/11 Maßtheorie • X̃t ist wohldefiniert wegen der Isotonie der Pfade. • X̃t hat die richtige Verteilung. Die Verteilung P oi(λs) konvergiert mit s → t gegen P oi(λt). Wegen Xs →S∋sցt X̃t hat X̃t eine P oi(λt) Verteilung. Analog erhält man D (Xt1 , ..., Xtn ) = (X̃t1 , ..., X̃tn ). q.e.d. Beachte, wir benötigen hier nicht T = [0, 1) und die Aneinandersetzung des Prozesses. Wir können die schöne“Version auch sofort einfacher angeben. ” Sei Sn eine Summe von uiv Zgn zu einer Exponentialverteilung mit Parameter λ. Definiere Nt als das größte n ∈ IN0 mit Sn ≤ t. Lemma 114 Der Prozess (Nt )t∈IR+ ist eine Version des PP zum Parameter Pfadeigenschaften. 1 λ mit obigen (Für die Gleichheit der endlich dimensionalen Verteilungen zeigt man die Markoffeigenschaft von N und die bedingte Verteilung von Nt unter Ns ist die von Nt−s . Dies liegt an der altwie-neu-Eigenschaft einer exponentialverteilten Zg: P (X > t | X > s) = P (X < t − s) für s < t. [?]) Eigenschaften Proposition 115 Sei Xt : Ω → IN0 , t ∈ IR+ , ein Poissonprozess zum Parameter λ. Es gilt • Für a > 0 ist Xat , t ∈ IR+ , ein Poissonprozess zum Parameter aλ. • Für s > 0 ist Xt+s − Xs , t ∈ IR+ , ein Poissonprozess zu λ. • Die Abbildung T ∋ t 7→ Xt (ω) ist fast sicher stetig in jedem t ∈ T. • Fast alle Pfade haben unendlich viele Sprünge. Beweis: Die ersten beiden Eigenschaften sind einfach. Für die dritte verwende die Abschätzung P( sup t−ǫ≤s≤t+ǫ |Xt − Xs | > 0) ≤ P (|Xt+ǫ − Xt−ǫ | > 0) ≤ 1 − Poi(2λǫ)(0) = 1 − e−2λǫ →ǫ 0. Für die vierte Eigenschaft verwende lim P (Xt ≤ n) = Poi(λt)({0, ..., n}) = t n X j=0 exp(−λ) (λt)j →t→∞ 0. j! q.e.d. 98 WS10/11 8.5.3 U. Rösler Punktprozesse Ein Punktprozess auf den reellen Zahlen versehen mit der Borel σ-Algebra B zum Radon Maß µ auf den reellen Zahlen als Parameter ist ein stochastischer Prozeß Xt : Ω 7→ IN0 , t ∈ T = B, mit den Eigenschaften • Für paarweise disjunkte Mengen Bi ∈ B, i = 1, . . . n sind die XBi , ı = 1, . . . n unabhängig. • XB hat eine Poi(µ(B))-Verteilung für B ∈ B. • X∅ = 0. • Die Pfade t 7→ Xt (ω) sind isoton bzgl. der Enthaltensordnung auf T. Hierbei benutzen wir die Konvention, die Poissonverteilung zum Paramter ∞ ist das Punktmaß auf unendlich. Das Maß µ heißt Intensitätsmas̈. Das Intensitätsmaß eines Punktprozesses ist festgelegt durch die Erwartungswerte XI von Intervallen. Der standard Punktprozess hat das Lebesmaß als Intensitätsmaß. Damit ist X[0,t] , t ∈ IR+ ein Poisson Prozess zu λ = 1. Existenz: Sei µ ein endliches Mas̈. Seien Zn , n ∈ IN uiv Zgn mit Verteilung µ(IµR) und N P sei Poi(µ(IR)) verteilt. Sei ν = N i=1 δZi ein zufälliges Maß. Dann tut es XA := ν(A). Die Ausdehnung auf σ-endliche Maße ist standard. Wir können jetzt noch einen Schritt weitergehen. Seien Yn , n ∈ IN weitere uiv Zgn unP abhängig von allem anderen. Setze ν = i∈IN δ(Zi ,Yi ) . Dann ist ν ein zufälliges Maß auf IR2 mit besonderen, schönen Eigenschaften. Wir gehen nicht in die Einzelheiten. Bild 99 WS10/11 100 Maßtheorie Literaturverzeichnis [1] H. Bauer Wahrscheinlichkeitstheorie und Grundzüge der Maßtheorie De Gruyter, Berlin 1968 [2] P.J. Bickel and D.A. Freedman Some asymptotic theory for the bootstrap. Annals of Probability 9 1196-1217, 1981. [3] N. Dunford und J. Schwartz Linear Operators, Part I to III Wiley Interscience 1988. [4] K.J. Falconer The Geometry of Fractal Sets. Cambridge University Press 1985 [5] P. Gaenssler und W. Stute, Seminar on empirical processes. DMV Seminar, Bd. 9, Birkhuser Verlag. [6] Hahn-Rosenthal Set Functions Albuquerque, New Mexico 1948. [7] P. R. Halmos Measure Theory Springer-Verlag 1974. [8] P. A. Meyer Probability and Potentials Waltham-Toronto-London 1966 [9] Pedersen Analysis Now Springer-Verlag 1988, 101 WS10/11 102 Maßtheorie
© Copyright 2024 ExpyDoc