Maßtheorie - Mathematisches Seminar

Maßtheorie
Vorlesungsmitschrift
Kiel WS2008/09
Professor Dr.Uwe Rösler
20. Dezember 2016
Kapitel 1
Objekte und Morphismen
Wir beschreiben im folgenden die hier behandelten Objekte, die Maßräume, und ihre Morphismen (strukturerhaltende Abbildungen), die meßbaren Abbildungen.
1.1
Mengensysteme
Sei Ω stets eine nichtleere Menge. Ein Mengensystem A ist eine Teilmenge der Potenzmenge
P(Ω). Ein Mengensystem heißt abgeschlossen unter einer Mengenoperation (P(Ω))I → P (Ω)
oder stabil , falls diese Operation angewandt auf Mengen aus A wieder ein Element aus A
liefert. Beispiele für Mengenoperationen sind:
S S S
- (endliche, abzählbare, beliebige) Vereinigung e , a , ,
T T T
- (endliche, abzählbare, beliebige) Durchschnitte e , a , ,
S
- Vereinigung paarweiser disjunkter Mengen ◦ ,
- Komplementbildung Ac = {ω ∈ Ω | ω 6∈ A},
- Differenz A\B = A ∩ B c ,
- symmetrische Differenz A△B = (A\B) ∪ (B\A),
- aufsteigender (absteigender) Limes,
T
S
- Limes superior lim supn∈IN An := m∈IN n≥m An = {ω | |{n | ω ∈ An }| = ∞},
S
T
- der Limes inferior lim inf n∈IN An := m∈IN n≥m An = {ω | |{n | ω 6∈ An }| < ∞}
- der Limes falls lim sup = lim inf usw..
- Obermengen (A ∈ A, A ⊂ B ⇒ B ∈ A)
Besonders wichtige Mengensysteme sind Topologien und σ-Algebren. Eine Topologie ist
ein Mengensystem, welches die Grundmenge enthält und abgeschlossen ist bezüglich beliebiger
Vereinigung und endlichem Durchschnitt.
Not: (Ω, τ ) für einen topologischen Raum.
Eine Menge heißt offen, genau dann wenn sie Element der Topologie ist. Das Komplement
einer offenen Menge heißt abgeschlossen. Topologien sind grundlegend für Konvergenzen.
(Alle) Konvergenzbegriffe beruhen auf Topologien (siehe Pedersen [9]). (Ω ∋ xn →n→∞ x ∈
Ω ⇔ ∀U ∈ τ, x ∈ U ∃n0 ∈ IN ∀n ≥ n0 : xn ∈ U .) Die Morphismen (=strukturerhaltenden
Abbildungen) sind die stetigen Funktionen (f : (Ω, τ ) → (Ω′ , τ ′ ) stetig ⇔ ∀x ∈ Ω ∀V ′ ∈
τ ′ , f (x) ∈ V ′ ∃U ∈ τ, x ∈ U : f (U ) ⊂ V ).
Eine σ-Algebra A ist ein nichtleeres Mengensystem abgeschlossen bezüglich Komplementbildung und abzählbarer Vereinigung. Eine Menge heis̈t mes̈bar, genau dann wenn sie Element der σ-Algebra ist. Die Morphismen sind die mes̈baren Funktionen bzw. Zufallsgrös̈en
1
WS10/11
Maßtheorie
(f : (Ω, A) → (Ω′ , A′ ) meßbar ⇔ ∀A′ ∈ A′ : f −1 (A′ ) ∈ A).
Not: (Ω, A) ist ein mes̈barer Raum.
σ-Algebren sind grundlegend für die Mas̈theorie und die Wahrscheinlichkeitstheorie. Weitere Beispiele sind Filter . Ein Filter ist ein nichtleeres Mengensystem ungleich der Potenzmenge, welches abgeschlossen ist bzgl. endlichem Durchschnitt und Obermengen.
In diesem Skript erscheinen weiterhin Algebren und Ringe . Eine Algebra ist ein nicht
leeres Mengensysteme, welches abgeschlossen ist bzgl. Komplement und endlicher Vereinigung.
Ein Ring ist ein Mengensystem mit der leeren Menge und abgeschlossen bzgl. endlichem
Durchschnitt und der symmetrischen Differenz.
Bemerkung: Die Namensgebung Ring, siehe Elstrodt, stammt von dem algebraischen
Ring der Funktionen 11A , A aus dem Mengenring, über dem binären Körper, versehen mit
der Addition 11A + 11B := 11A△B und der Multiplikation 11A 11B := 11A∩B .
Der Zusatz σ deutet auf etwas abzählbares hin, vgl. Algebra und σ-Algebra.
Erzeuger: Mengensysteme A werden oft nicht explizit angegeben, sondern als kleinstes
Mengensystem charakterisiert, welches ein Mengensystem E enthält und abgeschlossen ist
bzgl. gewisser Mengenoperationen. Dieses kleinste Mengensystem A, wenn es existiert, ist der
Durchschnitt aller Mengensysteme, abgeschlossen bzgl. der Operationen und E enthaltend.
Das Mengensystem E heis̈t Erzeuger von A (bzgl. den Operationen ...) und A heis̈t das von
E erzeugte Mengensystem.
Beispiele: Die Borelsche σ-Algebra für einen topologischen Raum (Ω, τ ) ist die kleinste
von der Topologie erzeugten σ-Algebra. Die übliche Topologie auf den reellen Zahlen wird
erzeugt von allen offenen Intervallen.
1.1.1
σ-Algebren
Eine σ-Algebra A ist ein nichtleeres Mengensystem abgeschlossen bezüglich Komplementbildung und abzählbarer Vereinigung. Ausführlicher: A ⊂ P(Ω) erfüllt
i) A =
6 ∅
ii) A ∈ A ⇒ Ac ∈ A
S
iii) An ∈ A, n ∈ IN ⇒ n An ∈ A.
Ein mes̈barer Raum ist ein Tupel (Ω, A). Hierbei ist Ω eine nichtleere Menge und A eine
σ-Algebra darüber. Eine mes̈bare Menge ist ein Element der σ-Algebra.
Proposition 1 Jede σ-Algebra enthält die leere Menge und die Grundmenge Ω. Sie ist abgeschlossen bzgl. endlicher und abzählbarer Vereinigung, endlichem und abzählbarem Durchschnitt, Differenz, symmetrischer Differenz, aufsteigenden oder absteigenden Folgen, Limes
superior und dem Limes inferior.
Beweis: Ist A aus der σ-Algebra, so auch das Komplement Ac . Die Vereinigung über aller
Glieder der Folge A, Ac , Ac , Ac . . . ist in A. Damit ist die Grundmenge Ω in der σ-Algebra.
Die leere Menge ist das Komplement der Grundmenge Ω.
Jede endliche Folge läs̈t sich zu einer abzählbaren Folge erweitern durch hinzunehmen der
leeren Menge. Daher ist A abgeschlossen bzgl. endlicher Vereinigung.
T
S
Für den Durchschnitt argumentiere ( An )c = Acn ist mes̈bar. Der Rest ist Übung. q.e.d.
Für E ∈ P(Ω) sei σ(E) die kleinste σ-Algebra, die E enthält. Formaler ausgedrückt:
\
σ(E) :=
E⊂A σ−Algebra
2
A.
WS10/11
U. Rösler
(Übung: Dies ist die kleinste E enthaltende σ-Algebra.) Ein Erzeuger E einer σ−Algebra A ist
ein Mengensystem mit σ(E) = A. Der Operator σ hat u.a. die Eigenschaften σ(σ(E)) = σ(E)
und E ⊂ E ′ ⇒ σ(E) ⊂ σ(E ′ ).
Beispiele: – Die kleinste σ-Algebra ist stets {∅, Ω}, die nächst grös̈ere ist {∅, A, Ac , Ω}
für ein A 6= ∅, Ω. (Übung: Nächstgrös̈ere?)
– Die Potenzmenge P(Ω) ist die grös̈te σ-Algebra.
– Die Menge {A ⊂ Ω | A oder Ac abzählbar} ist eine σ-Algebra.
– Sei A eine σ-Algebra und B eine beliebige Menge aus Ω. Die eingeschränkte σ-Algebra
ist A|B := {A ∩ B | A ∈ A}.
– Die Borel σ-Algebra B = σ(τ ) wird von einer Topologie τ auf Ω erzeugt. Die Baire
σ-Algebra wird erzeugt von der kleinsten Topologie, so das̈ alle stetigen Funktionen (bzgl. τ )
mit kompaktem Träger stetig sind.
Spezialisierung auf IR : Der euklidische Abstand definiert eine Metrik auf den reellen
Zahlen. Die offenen Kugeln bezüglich dieser Metrik sind die offenen Intervalle ]a, b[, a, b ∈ IR.
Diese erzeugen die (metrische) Topologie auf den reellen Zahlen. Jede offene Menge in IR ist
darstellbar als Vereinigung abzählbar vieler offener Intervalle. Daher wird die Borel σ-Algebra
auch von allen offenen Intervallen erzeugt.
Andere Erzeuger für die Borel σ-Algebra B auf IR sind die Topologie selber, das Mengensystem aller kompakten Mengen, die Mengensysteme E[,] := {[a, b] | a, b ∈ IR} aller abgeschlossenen Intervalle oder analog E],] , E[,[ aller halboffenen Intervalle. Es reicht hier a, b aus
einer dichten Teilmenge von IR, z.B. Ql, zu fordern. Ebenso reichen einseitige Intervalle, denn
es kann stets a = −∞ oder auch b = ∞ gesetzt werden.
Stellvertretend zeigen wir nur die Richtung σ(E],[ ) ⊂ σ(E[,[ ). Es reicht zu zeigen ]a, b[∈
σ(E[,] ) für jedes a, b. Dies folgt aus E[,] ∋ ∪n [a + 1/n, b[=]a, b[.
Die Borel σ-Algebra auf den reellen Zahlen wird erzeugt von allen Kompakta.
Diverses: – Eine σ−Algebra A heis̈t separierend, falls es für alle ω 6= ω ′ eine mes̈bare
Mengen A ∈ A gibt mit ω ∈ A und ω ′ 6∈ A. Durch Äquivalenzklassenbildung auf dem Grundraum Ω können wir eine σ-Algebra überführen in eine separierende σ-Algebra. Betrachte auf
dem Grundraum Ω die Äquivalenzrelation ω ∼ ω ′ ⇔6 ∃A ∈ A : ω ∈ A, ω ′ 6∈ A. Seien [ω] die
Äquivalenzklassen. Dann ist A/ ∼:= {{[a] | a ∈ A} | A ∈ A}) eine separierende σ−Algebra
bezüglich Ω/ ∼:= {[ω] | ω ∈ Ω}.
– Ein Atom einer σ−Algebra ist eine mes̈bare Menge, die nicht in echt kleinere meßbare
Mengen zerlegt werden kann. (∀ B ∈ A, B ⊂ A ⇒ B = ∅ ∨ B = A)
Im Regelfall sind die Atome genau die Punktmengen {ω}. Jede separierende σ−Algebra
über einem abzählbaren Grundraum ist die Potenzmenge. Die Atome sind die einelementigen
Mengen {ω}.
1.1.2
Nachweis einer σ-Algebra
Zum Nachweis eines Mengensystems als σ-Algebra sind zwei Methoden wichtig, über Dynkinsysteme und über monotone Klassen.
Dynkinsystem: Ein Dynkinsystem D ist ein nicht leeres Mengensystem abgeschlossen
bzgl. der Differenz aufsteigender Mengen und bzgl. der abzählbaren Vereinigung paarweise
disjunkter Mengen. (Ausführlicher: ∅ =
6 D ⊂ P(Ω) erfüllt
i) D ∋ A ⊂ B ∈ D ⇒ B\A ∈ D
S
ii) An ∈ D, n ∈ IN, paarweise disjunkt ⇒ ◦ n An ∈ D.
3
WS10/11
Maßtheorie
Lemma 2 Ein Dynkinsystem D ist genau dann eine σ-Algebra, wenn D den Grundraum Ω
enthält und bzgl. endlichem Durchschnitt abgeschlossen ist.
Beweis: Jede σ-Algebra ist ein Dynkinsystem, welches abgeschlossen ist bzgl. endlichem
Durchschnitt. Für die Umkehrung sind die drei Eigenschaften einer σ-Algebra zu zeigen. Für
die dritte argumentiere: Zu Dn ∈ D definiere Bn := Dn \∪i<n Di . Diese Mengen sind paarweise
S
S
S
disjunkt und erfüllen Bn = Dn ∩ ∩i<n Dic ∈ D und ◦ n≤N Bn = n≤N Dn für N ∈ IN {∞}.
S
q.e.d.
Hieraus folgt n∈IN Dn ∈ D.
T
Bezeichne D(E) das kleinste von E erzeugte Dynkinsystem. (Formaler: D(E) := E⊂B Dynkinsystem B
tut’s.) Ein Erzeuger eines Dynkinsystems D ist ein Mengensystem E mit D(E) = D.
Lemma 3 Ein Dynkinsystem mit Ω ist genau dann eine σ-Algebra, wenn es einen Erzeuger
abgeschlossen bzgl. endlichem Durchschnitt besitzt.
Beweis: Ist das Dynkinsystem D eine σ-Algebra, so ist D selbst ein Erzeuger und abgeschlossen
bzgl. endlichem Durchschnitt. Für die Umkehrung betrachte DA := {B ∈ D | A ∩ B ∈ D} mit
A ∈ D. Dies ist ein Dynkinsystem (Übung). Für jedes Element E aus dem durchschnittstabilen
Erzeuger E von D enthält DE den Erzeuger E. Damit gilt E ⊂ DE ⊂ D und wegen der
Sandwichposition D(E) = DE = D.
Als direkte Folgerung enthält jedes DA , A ∈ D den Erzeuger E und die Sandwichposition
impliziert gilt D(E) = DA = D.
Damit ist D durchschnittstabil und nach Lemma 2 eine σ-Algebra.
q.e.d.
Monotone Klasse: Eine monotone Klasse ist ein Mengensystem abgeschlossen bzgl.
aufsteigenden und absteigenden Folgen. Sei M(E) die von E erzeugte kleinste monotone
Klasse. Hierbei ist M(E) die kleinste monotone Klasse welche E enthält. (Formaler: M(E) :=
T
E⊂B monotone Klasse B.)
Eine Algebra ist ein Mengensystem welches Ω enthält und abgeschlossen ist bzgl. Komplement und endlicher Vereinigung.
Lemma 4 Eine monotone Klasse erzeugt von einer Algebra ist eine σ-Algebra.
Beweis: Sei A die Algebra und M = M(A) die erzeugte monotone Klasse.
• M ist komplementabgeschlossen.
Das Mengensystem {A ∈ M | Ac ∈ M} ist eine monotone Klasse und enthält die Algebra
A (Übung). Damit ist das Mengensystem bereits M selbst.
• M ist eine Algebra.
Wir haben nur die endliche Durchsschnittsabgeschlossenheit zu zeigen. Für A ∈ M betrachte
MA := {B ∈ M | A ∪ B ∈ M}.
Dies ist eine monotone Klasse. Für A aus der Algebra enthält MA das Erzeugersystem A und
ist damit M selber (Sandwichposition). Die Menge {A ∈ M | MA = M} ist eine monotone
Klasse und enthält die Algebra. Damit ist dies M selbst.
• Eine Algebra, die auch eine monotone Klasse ist, ist eine σ-Algebra.
Nur die Abgeschlossenheit gegenüber abzählbarer Vereinigung ist zu zeigen. Sei An eine
Folge aus der Algebra. Die Folge ∪i≤n Ai ist aus der Algebra und konvergiert aufsteigend
gegen ∪i Ai . Der Grenzwert ist in der monotonen Klasse.
q.e.d.
4
WS10/11
1.2
U. Rösler
Meßbare Abbildungen
Meßbare Abbildungen sind die Morphismen, d.h. die strukturerhaltenden Abbildungen bezüglich
mes̈barer Räume.
Eine Abbildung zwischen meßbaren Räumen heißt meßbar , falls das Urbild jeder meßbaren
Menge meßbar ist. Formaler formuliert, eine Abbildung f : Ω → Ω′ von einem meßbaren Raum
(Ω, A) in einen anderen meßbaren Raum (Ω′ , A′ ) ist meßbar, falls für jede Menge A ∈ A gilt
f −1 (A′ ) ∈ A. Kürzer formuliert f −1 (A′ ) ⊂ A.
Merkregel:
Die mengentheoretische Struktur wird durch Funktionen zurückgeholt.
Das Urbild einer σ-Algebra ist stets eine σ-Algebra. Das Bild f (A) einer σ-Algebra ist im
allgemeinen keine σ-Algebra.
Bemerkung: Die Morphismen für topologische Räume sind die stetigen Funktionen. Eine
Funktion auf topologischen Räumen heißt stetig, falls das Urbild offener Mengen offen ist.
Proposition 5 Die Komposition meßbarer Funktionen ist meßbar.
Beweis: Mit entsprechender Notation (f ◦ g)−1 (A′′ ) = g −1 (f −1 (A′′ )) ⊂ A.
q.e.d.
Proposition 6 Eine Funktion ist genau dann meßbar, wenn das Urbild eines (und dann
jedes) Erzeugers in der σ-Algebra liegt.
Beweis: Nur die Rückrichtung ist zu zeigen. Sei f : Ω 7→ Ω′ die Funktion und E ′ ein Erzeuger
von A′ . Dann ist {A′ ∈ A′ | f −1 (A′ ) ∈ A} eine E ′ enthaltende σ-Algebra und damit gleich A′ .
q.e.d.
Folgerung: Jede stetige Funktion ist Borel meßbar. (Per Definition der Stetigkeit ist das
Urbild jeder offenen Menge offen ist). Jede stetige Funktion mit kompaktem Träger ist meßbar
bezüglich der Baire σ-Algebra. (Die kleinste Topologie, bzgl. der alle stetigen Funktionen mit
kompaktem Träger stetig sind, ist ein Erzeugendensystem der Baire σ-Algebra.)
Notation: F((Ω, A), (Ω′ , A′ )) bezeichne die Menge aller A − A′ meßbaren Funktionen
f : Ω 7→ Ω′ . Der Einfachheit halber benutzen wir auch F(Ω, A) oder aber F.
Notation: Anstelle der korrekten Schreibweise {ω ∈ Ω | f (ω) ∈ A′ } für das Urbild von A′
unter f benutzen wir {f ∈ A′ } oder auch f ∈ A′ . Allgemein wird die Realisierung ω weggelassen wenn immer möglich. Dies ist ein allgemein akzeptierter (kleiner) Notationsmißbrauch.
Spezialisierung auf IR: Die reellen Zahlen seien stets mit der Borel σ-Algebra B versehen. Sei f : Ω 7→ IR eine Funktion. In Formeln unterdrücken wir nach Möglichkeit das ω
aus Gründen der Übersichtlichkeit. Dies führt zuweilen zu einem Notationsmißbrauch. Wir
schreiben z.B.
{f ≥ x} für {ω ∈ Ω | f (ω) ≥ x}.
Eine Funktion f : Ω 7→ IR ist genau dann meßbar, wenn eine der äquivalenten Kriterien
erfüllt ist:
- ∀x ∈ IR : {f ≥ x} ∈ A,
- ∀x ∈ IR : {f > x} ∈ A,
- ∀x ∈ IR : {f ≤ x} ∈ A,
- ∀x ∈ Ql : {f < x} ∈ A.
Die Aussage gilt auch, falls obiges nur für x aus einer dichten Teilmenge von IR gefordert
wird.
5
WS10/11
Maßtheorie
Proposition 7 Seien fn : Ω 7→ IR, n ∈ IN, mes̈bare Funktionen. Dann sind meßbar, sofern
wohldefiniert und endlich, f1 +f2 , −f1 , f1 f2 , 1/f1 , supn fn , inf n fn , lim supn fn , lim inf n fn , limn fn .
S
Beweis: Die Kernpunkte für die Meßbarkeit sind {f + g < x} = q∈Ql{f < x + q, g < −q},
S
{−g < x} = {g > −x}. Bezüglich der Multiplikation argumentiere {f g < x} = q∈Ql{f <
x/q, g < q} ist meßbar für f, g überall strikt grös̈er als 0. Allgemeine f, g zerlege in Positivund Negativteil. {lim supn fn > x} = lim supn {fn > x}, lim sup fn = − lim inf −fn , lim fn =
S
11lim sup fn =lim inf fn lim sup fn , {supn fn > x} = n {fn > x}, inf fn = − sup(−fn ).
q.e.d
Warnung: In obiger Proposition ist die Abzählbarkeit der Operationen wichtig. Das Supremum überabzählbar vieler meßbarer Funktionen ist im allgemeinen nicht mehr meßbar.
Jedoch ist es schwer, eine nicht messbare Funktion anzugeben. Dies ist (im ZFC-Axiomensystem)
nur mit Hilfe des Auswahlaxiomes möglich.
Wir erweitern die reellen Zahlen um +∞, −∞ zu IR. Sei eine isotone (ordnungserhalx
tende) und bijektive Abbildung von IR auf (−1, 1) gegeben, etwa x 7→ 1+|x|
. Erweitere diese
Abbildung durch Zuordnung von +∞, −∞ nach +1, −1. Versehe IR mit der zurückgeholten
Topologie und entsprechenden Borel σ-Algebra. (Diese ist unabhängig von der gegebenen Bijektion.) Wir benutzen ebenso IN , Ql und ZZ. Die obigen Aussagen gelten sinngemäß auch für
erweiterte Funktionen f : Ω 7→ IR.
Der Raum der meßbaren, reellwertigen Funktion ist ein Vektorraum. Dies gilt nicht, falls
wir die Werte +∞, −∞ zulassen.
Die Baire σ-Algebra ist gleich der Borel σ-Algebra für die reellen Zahlen.
1.3
Mengenfunktionen
Wir betrachten Mengenfunktionen von einem Mengensystem in die reellen oder erweiterten
reellen Zahlen.
Eine Mengenfunktion µ : A 7→ IR oder erweiterte Mengenfunktion µ : A 7→ IR heißt
- positiv , falls µ(A) ≥ 0 für alle A ∈ A,
- isoton bzw. ordnungserhaltend , falls µ(A) ≤ µ(B) für A ⊂ B,
S
- additiv , falls µ(A ◦ B) = µ(A) + µ(B)
S
P
- σ-additiv , falls µ( ◦ n∈IN An ) = n∈IN µ(An ),
- σ-stetig von unten , falls limn µ(An ) = µ(limn An ) für aufsteigende An ,
- σ-stetig von oben, falls limn µ(An ) = µ(limn An ) für absteigende An ,
- σ-stetig in der leeren Menge, falls µ(An ) ց µ(∅) für An ց ∅,
P
S
- subadditiv , falls µ( i∈I Ai ) ≤ i∈I µ(Ai ) gilt für I endlich.
- σ-subadditiv , falls obiges gilt für abzählbare Indexmengen I abzählbar.
S
S
Hierbei sind A, B, A B, An , n An aus dem Mengensystem.
Bemerkung: σ steht stets für etwas Abzählbares.
1.3.1
Maße
Ein Maß ist eine positive, σ-additive, erweiterte Mengenfunktion nicht identisch unendlich
auf einer σ-Algebra. Die Eigenschaften in äquivalenten (Übung), formelmäßigen Aussagen,
sind
i) µ(∅) = 0
ii) ∀A ∈ A ⇒ µ(A) ≥ 0
6
WS10/11
S
U. Rösler
P
iii) An ∈ A, n ∈ IN, paarweise disjunkt ⇒ µ( ◦ n An ) = n µ(An ).
Ein Maßraum (Ω, A, µ) ist ein meßbarer Raum versehen mit einem Maß. Ein endliches
Maß ist ein Maß µ(Ω) < ∞. Ein Wahrscheinlichkeitsmaß ist ein Maß mit µ(Ω) = 1. Ein
Wahrscheinlichkeitsraum ist ein Maßraum mit einem Wahrscheinlichkeitsmaß. Jedes endliche Maß µ läßt sich zu einem W-maß transformieren via cµ mit c = 1/µ(Ω). Notation: P
(=Probability) für ein W-maß.
Proposition 8 (Mas̈eigenschaften) Jedes Maß ist additiv, isoton, endlich subadditiv und
σ-subadditiv.
Beweis: • Additiv
Erweitere die endliche Folge durch die leere Menge zu einer abzählbaren Folge und verwende die σ-Additivität.
• Isoton
Für mes̈bare Mengen A ⊂ B gilt µ(B) = µ(A) + µ(B\A) ≥ µ(A).
• Subadditiv und σ-Subadditiv
Wir verwenden die Disjunktifizierung. Für eine Folge An mes̈barer Mengen definiere rekurS
S
siv B1 = A1 und Bn = An \ ∪i<n Ai . Dann sind die Bn paarweise disjunkt, ◦ i≤n Bi = i≤n Ai
und es gilt
X
[
X
µ(An ).
µ(Bn ) ≤
µ(∪n An ) = µ( ◦ Bn ) =
n
n
n
q.e.d.
Ein Punktmaß auf ω ∈ Ω ist ein W-maß δω mit δω (A) = 11A (ω). Ein diskretes Maß ist
eine positiv gewichtete Summe von Punktmaßen. Jedes diskrete Maß hat eine Darstellung
P
+
µ = ω∈Ω f (ω)δω mit einer Funktion f : Ω → R . Die Abbildung zwischen diskreten Maßen
und erweiterten Funktionen f wie oben ist bijektiv (vorausgesetzt die σ−Algebra umfaßt alle
Punktmengen {ω}). Es gilt
X
f (ω).
µ(A) =
ω∈A
Ein diskreter Wahrscheinlichkeitsraum ist ein Maßraum mit diskretem W-maß.
Ein Laplaceraum ist ein diskreter Wahrscheinlichkeitsraum mit endlicher Grundmenge
und dem Maß
|A|
P (A) =
.
|Ω|
Das Zählmaß ist das Maß µ mit µ(A) = |A|.
Hier einige Beispiele und Standardkonstruktionen
Bernoulliverteilung Ber(p) zum Parameter 0 ≤ p ≤ 1. Ω = {0, 1}, A = Pot(Ω), µ({1}) =
p = 1 − µ({0}) =: 1 − q.
Geometrische Verteilung Geo(p) zum Parameter 0 ≤ p ≤ 1. Ω = IN0 , A = Pot(Ω), µ({k}) =
qpk.
Poissonverteilung Poi(λ) zum Parameter λ > 0. Ω = IN0 , A = Pot(Ω), µ({k}) =
k
e−λ λk! .
Binomialverteilung Bin(n,p) zu den Parametern n ∈ IN und p ∈ [0, 1]. Der W-raum ist
(Ω = {0, 1, . . . , n}, P(Ω), P ) mit
P (k) =
!
n k
p (1 − p)n−k
k
7
WS10/11
Maßtheorie
für k ∈ Ω.
Beispiel: Sei Ω überabzählbar. Das Mengensystem der Teilmengen A ⊂ Ω mit A abzählbar oder Ac abzählbar ist eine σ-Algebra. Die Mengenfunktion µ mit µ(A) = 0 falls A abzählbar und ∞ anderenfalls ist ein Maß.
Eingeschränktes Maß: Sei Q eine meßbare Menge. Die Einschränkung
(Q, A|Q ) := {Q ∩ A | A ∈ A}),
µ|Q := µ)
mit µ|Q : A|Q → IR die Einschränkung, ist ein Maßraum.
bedingte Wahrscheinlichkeit: Ist P ein W-mass und P (Q) > 0, so sprechen wir von
A ∋ A 7→ P (A | Q) :=
P (A ∩ Q)
P (Q)
als bedingte W-keit von P unter Q.
Erweitertes Maß: Durch Umkehrung obiger Konstruktion läßt sich ein Maß erweitern.
Übung.
Mit M = M (Ω, A) bezeichnen wir den Raum der Maße über dem meßbaren Raum (Ω, A).
Dies ist ein konvexer Kegel (= eine konvexe Menge, die positive Vielfache enthält). (Die
Addition ist gegeben durch (µ + ν)(·) = µ(·) + ν(·) und die Multiplikation durch (cµ)(·) =
c(µ(·)) für c ≥ 0). Die W-maße bilden eine konvexe Menge.
Die Menge V := {µ − ν | µ, ν endliche Maße } ist ein Vektorraum. Die Element heißen
Ladungsverteilung .
Bildmaß: Sei f : Ω 7→ Ω′ eine meßbare Funktion, (Ω, A, µ) ein Maßraum und (Ω′ , A′ ) ein
meßbarer Raum. Die Mengenfunktion µf , definiert durch
A′ ∋ A′ 7→ µ(f −1 (A′ ))
ist ein Maß auf A′ . Es heißt transportiertes Maß oder auch Bildmaß .
Eine maßerhaltende Abbildung ist eine messbare Funktion f : Ω 7→ Ω′ auf Maßräumen
(Ω, A, µ), (Ω′ , A′ , µ′ ) mit µf = µ′ .
Isomorphismen Die Isomorphismen auf Mas̈räumen sind mas̈erhaltende Isomorphismen
der mes̈baren Räumen. (Isomorphismen der meßbaren Räume sind meßbare bijektive Funktionen der Grundräume, deren Inverses meßbar ist.
1.3.2
Warum σ-Additivität?
Die σ−Additivität ist äquivalent zu einer σ-Stetigkeit. Grundlegend ist das
Theorem 9 Sei (Ω, A) ein meßbarer Raum und µ : A 7→ IR eine positive, additive, erweiterte
Mengenfunktion mit µ(∅) = 0. µ ist ein Maß genau dann, wenn es σ-stetig von unten ist. Ist
µ endlich, so sind äquivalent:
i) µ ist σ-stetig von unten.
ii) µ ist σ-stetig von oben.
iii) µ ist σ-stetig in der leeren Menge.
iv) µ ist σ-stetig.
8
WS10/11
U. Rösler
Beweis: ’⇒’ War schon beweisen.
’⇐’ Sei An ∈ A, n ∈ IN eine Folge paarweise disjunkter meßbarer Menge. Dann ist
Bn := ∪i≤n Ai aufsteigend gegen B = ∪n An . Es folgt
µ(B) = lim µ(Bn ) = lim
n
n
n
X
µ(An ) =
i=1
X
µ(An ).
n
i) ⇒ ii) Sei Bn ց B ∈ A. Betrachte Bnc ր B c und verwende
µ(Ω) − µ(Bn ) = µ(Bnc ) ր µ(B c ) = µ(Ω) − µ(B).
ii) ⇒ i) Für An ր A betrachte Acn ց Ac und argumentiere analog.
ii) ⇒ iii) Spezialisierung.
iii) ⇒ ii) Für An ց A betrachte An \A ց ∅.
i) ⇔ iv) Benutze ii) und Definition.
1.3.3
q.e.d.
Vollständige und σ-endliche Mas̈räume
Sei (Ω, A, µ) ein Maßraum. Eine µ-Nullmenge ist eine Menge aus dem Grundraum, für die es
eine meßbare Obermenge A mit µ(A) = 0 gibt. Eine Nullmenge braucht nicht mes̈bar zu sein.
Die Menge N aller Nullmengen (bzgl. µ) ist abgeschlossen bzgl. abzählbarer Vereinigung und
Teilmengen. Ein Maßraum heis̈t vollständig falls die σ-Algebra alle Nullmengen enthält. Die
kleinste σ-Algebra Av erzeugt von A und allen µ-Nullmengen heißt Vervollständigung von A
bzgl. µ.
Proposition 10
Av = {A ∪ N | A ∈ A, N ∈ N }
= {B ⊂ Ω | ∃A, C ∈ A : A ⊂ B ⊂ C, µ(C\A) = 0}
Beweis: Einfach. Die Mengensysteme sind σ-Algebren und enthalten A und N . Sie sind auch
nicht größer.
q.e.d.
Wir können stets das Maß µ auf die vervollständigte σ-Algebra Av als Maß fortsetzen
durch
µv (Av ) = µ(A)
mit Av = A ∪ N, Av ∈ Av , A ∈ A, N ∈ N . Übung.
Eine Aussage A über Realisierungen ω gilt fast sicher , (f.s.), falls sie bis auf eine Nullmenge
für alle Realisierungen gilt.
σ-Endlichkeit: Viele Aussagen über Mas̈e werden zuerst für endliche Mas̈e gezeigt und
dann für σ-endliche. Ein Mas̈ µ heißt σ-endlich, falls es eine gegen Ω aufsteigende Folge von
Mengen An ∈ A endlichen Mas̈es gibt. Äquivalent ist die Existenz einer Zerlegung (Bn )n von Ω
S
in abzählbar viele Mengen endlichen Maßes gibt. (∃Bn ∈ A, n ∈ IN ◦ n Bn = Ω, µ(Bn ) < ∞.)
(Die Äquivalenz ersieht man aus Bn = An \An−1 .) Der Schritt von endlichem Mas̈ auf σendliches Mas̈ beruht in der Regel auf der abzählbaren disjunkten Zerlegung Bn . Zeige die
Eigenschaft auf jedem Bn und setze dann zusammen. (Genauer, erst für das Mas̈ A ∋ A →
P
µ(A ∩ Bn ) und dann für A ∋ A 7→ µ(A) = n µ(A ∩ Bn ).)
Der Schritt von endlichem Mas̈ auf beliebiges, nicht σ-endliches Mas̈ beruht häufig auf
einer lokalen Form der Aussage. Argumentiere die Eigenschaft gilt lokal, d.h. in allen (geeigneten) Mengen von endlichem Mas̈, wobei hierauf angewandt das Mas̈ endlich ist. Der Satz
von Caratheodory ist von dieser Struktur.
9
WS10/11
10
Maßtheorie
Kapitel 2
Über die Existenz von Maßen
Dieser Abschnitt zeigt die Existenz von nicht diskreten Maßen via der Caratheodory Maßerweiterung. Anschließend betrachten wir Maße auf den reellen Zahlen, insbesonders das
Lebesguemaß, und zeigen einige Eigenschaften.
Heuristik: Es geht um die Existenz von allgemeinen Maßen. Dazu wird auf einem speziellen Mengensystem einfacher Struktur eine additive Mengenfunktion konstruiert und dann
zu einem Maß fortgesetzt. Der (vielleicht) mathematisch natürlichere Zugang ist eine Erweiterung über Kapazitäten, siehe Meyer [8]. Wir benutzen den elementareren Zugang über das
äußere Maß. Standardbeispiele sind das Lebesgue Maß und Maße auf Produkträumen.
Ein Ring ist ein Mengensystem mit der leeren Menge und abgeschlossen bzgl. endlichem
Durchschnitt und der symmetrischen Differenz. (Äquivalent ist, enthält die leere Menge und
ist abgeschlossen bzgl. endlicher Vereinigung und der Differenz.) Ein Inhalt auf einem Ring
ist eine positive, additive und erweiterte Mengenfunktion. Ein Prämaß auf einem Ring ist ein
von unten σ-stetiger Inhalt. Ein Prämaß auf einer σ-Algebra ist ein Maß.
Satz 11 (Caratheodory) Jedes Prämaß auf einem Ring läßt sich fortsetzen zu einem Maß
auf die vom Ring erzeugte σ-Algebra.
2.0.4
Beweis und Eindeutigkeit von Caratheodory
Ein äußeres Maß ist eine isotone, σ-subadditive, erweiterte Mengenfunktion auf der Potenzmenge, die die leere Menge auf die Null abbildet. In Formeln, µ∗ : P(Ω) 7→ IR mit
i) µ∗ (∅) = 0
ii) A ⊂ B ⇒ µ∗ (A) ≤ µ∗ (B)
Isotonie
P
S
Subadditivität.
iii) An ∈ P(Ω), n ∈ IN ⇒ µ∗ ( n An ) ≤ n µ∗ (An )
Hierbei wird die Konvention inf ∅ = ∞ benutzt. Eine µ∗ -meßbare Menge ist eine Menge
A ⊂ Ω, die
µ∗ (Q) ≥ µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac )
(2.1)
für alle Q ⊂ Ω erfüllt. Wegen der σ-Subadditivität folgt dann Gleichheit. Sei A∗ die Menge
aller µ∗ -meßbaren Menge.
Lemma 12 Für jedes äußere Maß µ∗ ist (Ω, A∗ , µ∗ ) ein Maßraum.
Beweis: • A∗ ist eine Algebra.
11
WS10/11
Maßtheorie
Das Mengensystem A∗ enthält Ω und ist komplementabgeschlossen. Seien A, B ∈ A∗ .
Dazu etabliere
µ∗ (Q) = µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac )
= µ∗ (Q ∩ A ∩ B) + µ∗ (Q ∩ A ∩ B c ) + µ∗ (Q ∩ Ac ∩ B) + µ∗ (Q ∩ Ac ∩ B c )
Q durch Q ∩ (A ∪ B) ersetzt in (2.1) ergibt
µ∗ (Q ∩ (A ∪ B)) = µ∗ (Q ∩ A ∩ B) + µ∗ (Q ∩ A ∩ B c ) + µ∗ (Q ∩ Ac ∩ B).
Die Subtraktion beider Zeilen ergibt die Behauptung.
• µ∗ ist ein Inhalt auf A∗ .
S
Setze Q = A ◦ B in (2.1).
• A∗ ∋ An ր A ⇒ µ∗ (Q ∩ An ) ր µ∗ (Q ∩ A)
Definiere Bn := An \An−1 . Bn , n ∈ IN, ist eine Folge paarweiser disjunkter Mengen aus
S
∗
A mit ◦ ni=1 Bi = An . Per Induktion nach n zeige
n
X
i=1
µ∗ (Q ∩ Bi ) = µ∗ (Q ∩ An ).
Dies ist leicht. Damit folgt die obere Behauptung via
lim µ∗ (Q ∩ An ) =
n
X
n
µ∗ (Q ∩ Bn ) ≥ µ∗ (Q ∩ (
[
n
Bn )) = µ∗ (Q ∩ A).
• A∗ ist σ-Algebra.
Mit An wie oben
µ∗ (Q) = µ∗ (Q ∩ An ) + µ∗ (Q ∩ Acn ) ≥ µ∗ (Q ∩ An ) + µ∗ (Q ∩ Ac )
liefert das gewünschte µ∗ (Q) ≥ µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac ).
• µ∗ ist ein Maß auf A∗ .
µ∗ ist Inhalt auf A∗ und σ-Stetigkeit von unten.
q.e.d.
Proposition 13 Die σ-Algebra A∗ ist vollständig bzgl. dem äußeren Maß µ∗ .
Bew: Sei N eine µ∗ -Nullmenge, d.h. ∃A ∈ A∗ : N ⊂ A ∈ A∗ , µ∗ (A) = 0. Dann impliziert
µ∗ (Q ∩ N ) + µ∗ (Q ∩ N c ) ≤ µ∗ (A) + µ∗ (Q) die Aussage.
Über die Eindeutigkeit gibt der folgende Satz Auskunft.
Satz 14 Seien µ, ν zwei Maße, die auf einem Erzeuger der σ-Algebra A übereinstimmen. Der
Erzeuger sei abgeschlossen bzgl. endlichem Durchschnitt und es gebe eine gegen Ω aufsteigende
Folge En aus dem Erzeuger mit endlichem µ-Maß. Dann sind µ und ν identisch.
Beweis: Sei E aus dem Erzeuger mit µ(E) < ∞ und
DE := {A ∩ E | A ∈ A, µ(A ∩ E) = ν(A ∩ E)}.
• DE ist die Einschränkung A|E der σ-Algebra A auf E.
12
WS10/11
U. Rösler
Das Mengensystem DE ist ein Dynkinsystem (leicht) und enthält den ∩-stabilen Erzeuger
eingeschränkt auf E. Nach (Lemma 2) ist DE eine σ-Algebra und damit = A|E .
•µ=ν
Argumentiere µ(A) = limn µ(A ∩ En ) = limn ν(A ∩ En ) = ν(A).
q.e.d.
Bem: Ohne die σ-Endlichkeit auf dem Erzeuger ist die Eindeutigkeit nicht gegeben. Betrachte als Erzeuger die Menge aller halboffenen Intervalle (a, b] mit a < b. Als Mas̈e wähle
das Zählmaß und das triviale Maß, welches jeder Menge ungleich der leeren Menge den Wert
∞ zuordnet. Beide Maße sind gleich auf dem Erzeuger, aber verschieden auf der erzeugten
σ-Algebra, hier die Borel σ-Algebra. (Auch die Hausdorffmaße tun’s.)
Proposition 15 Sei M ein Mengensystem mit der leeren Menge und µ eine positive, erweiterte Mengenfunktion auf M mit µ(∅) = 0. Dann ist die Mengenfunktion µ∗ : P(Ω) 7→ IR
definiert durch
X
[
µ∗ (Q) := inf{
µ(Mn ) | Vn ∈ M, Q ⊂ Mn }
n
n∈IN
ein positives äußeres Maß.
Beweis: Nur die dritte Eigenschaft ist zu zeigen. Sei Q = ∪n Qn . Wähle zu vorgegebenen ǫn > 0
P
eine Überdeckung Mn,m ∈ M, m ∈ IN, von Qn mit µ∗ (Qn ) ≤ m µ(Mn,m ) ≤ µ∗ (Qn ) + ǫn .
S
S
Aus Q ⊂ n Qn ⊂ n,m Mn,m folgt
µ∗ (Q) ≤
X
n,m
µ(Mn,m ) ≤
X
(µ∗ (Qn ) + ǫn ).
n
P
Dies gilt für alle Folgen ǫn , d.h. µ∗ (Q) ≤ n µ∗ (Qn ).
q.e.d.
Beweis von Caratheodory: Sei µ das Prämaß auf dem Ring R und sei µ∗ das äußere
Maß dazu (Proposition 15).
• µ = µ∗ auf R.
Die Richtung µ∗ ≤ µ auf dem Ring folgt aus der Definition des äußeren Maßes. Für die
P
Umkehrung sei R ∈ R und Rn ∈ R eine Überdeckung von R mit µ∗ (R) ≤ n µ(Rn ) ≤
µ ∗ (R) + ǫ für gegebenes ǫ > 0.
µ(R) = lim µ(R ∩ ∪i≤n Rn ) ≤ lim µ(∪i≤n Rn ) ≤ lim
n→∞
n
n
X
i≤n
µ(Ri ) ≤
X
n
µ(Rn ) ≤ µ∗ (R) + ǫ
• R ⊂ A∗
P
Sei R ∈ R und Rn ∈ R, n ∈ IN eine Überdeckung von Q mit µ∗ (Q) ≤ n µ(Rn ) ≤
µ ∗ (Q) + ǫ.
µ∗ (Q) + ǫ ≥
X
n
µ(Rn ) =
X
n
(µ(Rn ∩ R) + µ(Rn ∩ Rc ) ≥ µ∗ (Q ∩ R) + µ∗ (Q ∩ Rc )
Dies gilt für alle ǫ > 0. Mit σ(R) ⊂ A∗ endet der Beweis.
q.e.d.
Bem: Die µ∗ -meßbaren Mengen A sind genau diejenigen, so dass für jedes R aus dem
Ring von endlichem Maß und jedes ǫ ein Ringelement S existiert mit µ∗ ((A ∩ R)△S) < ǫ gilt.
Noch anders ausgedrückt,
∪i ∩n Rn,i ⊂ A ∩ R ⊂ ∩i ∪n Sn,i
mit R· , s· Ringelemente und die rechte Menge minus der linken ist eine µ∗ -Nullmenge.
13
WS10/11
2.0.5
Maßtheorie
Wann ist ein Inhalt ein Prämaß
Wann ist ein Inhalt σ-stetig von unten?
Eine kompakte Klasse oder ein Mengensystem mit der endlichen Durchschnittseigenschaft ist ein Mengensystem, sodaß jede abzählbare Auswahl mit gemeinsamem leeren
Durchschnitt bereits eine endliche Teilauswahl mit leerem Durchschnitt enthält. In Formeln,
K ⊂ P(Ω) ist ein kompaktes Mengensystem genau dann, wenn
T
T
* ∀Kn ∈ K, n ∈ IN : ( n∈IN Kn = ∅) ⇒ ∃J ⊂ IN |J| < ∞ : j∈J Kj = ∅.
Durch Negation erhalten wie die äquivalente Bedingung
T
T
* ∀Kn ∈ K, n ∈ IN : (∀J ⊂ IN |J| < ∞ j∈J Kj 6= ∅) ⇒ n∈IN Kn 6= ∅.
Anstelle der endlichen Teilmengen J reicht es {1, . . . , n0 } mit n0 ∈ IN zu nehmen.
Ein Beispiel, vielleicht das einzig wichtige, ist die Menge der kompakten Mengen eines
topologischen Raumes. (Siehe auch 8.2.) (Diese erfüllen etwas mehr, da wir uns auf abzählbare
Folgen beschränken.)
Lemma 16 Sei R ein Ring, µ ein endlicher Inhalt darauf und K ein kompaktes System. Falls
es für alle R ∈ R und alle ǫ > 0 eine Menge K ∈ K und ein B ∈ R gibt mit
B⊂K⊂R
µ(R\B) < ǫ
gibt, so ist µ ein Prämaß auf dem Ring.
Beweis: Wir zeigen, vergleiche Satz (9), die σ-Stetigkeit in der leeren Menge, d.h. R ∋ Rn ց
∅ ⇒ µ(Rn ) ցn 0. Dies reicht.
P
Zu obigen Rn wähle Bn ∈ R, Kn ∈ K mit Bn ⊂ Kn ⊂ Rn und n µ(Rn \Bn ) hinreichend
T
T
T
T
klein. Wegen n Kn ⊂ n Rn = ∅ gibt es ein n0 mit n≤n0 Kn = ∅. Dies impliziert n≤n0 Bn =
∅. Es folgt
µ(Rn0 ) = µ(Rn0 \
= µ(
[
n≤n0
≤
X
n≤n0
\
Bn )
n≤n0
Rn0 \Bn ) ≤ µ(
µ(Rn \Bn ) ≤
X
n
\
n≤n0
Rn \Bn )
µ(Rn \Bn )
Die rechte Seite ist hinreichend klein.
q.e.d.
Die Standardanwendung dieses Lemmas betrifft einen topologischen Raum Ω und das
kompakte System der kompakten Mengen.
2.0.6
Konstruktion von Inhalten und Algebren
Ein Halbring ist ein Mengensystem mit der leeren Menge, abgeschlossen bzgl. endlichem
Durchschnitt und die Differenz zweier Halbringmengen ist darstellbar als endliche Vereinigung
von paarweise disjunkten Halbringmengen.
Proposition 17 Der von einem Halbring erzeugte Ring besteht genau aus den endlichen,
paarweise disjunkten Vereinigungen von Halbringmengen.
14
WS10/11
U. Rösler
In Formeln, für einen Halbring H gilt
[
R(H) = { ◦
n≤N
Hn | N ∈ IN, Hn ∈ H paarweise disjunkt }.
Beweis: Zeige die bestimmenden Eigenschaft für einen Ring, hier abgeschlossen bzgl. der
Differenz endlicher Vereinigung und enthält die leere Menge. Der Rest ist nachrechnen. q.e.d.
Standardbeispiel: Das Mengensystem aller halboffenen Rechtecke (a, b], 0 < a ≤ b < 1
in (0, 1] ist ein Halbring. (Übung). Dasselbe gilt für alle halboffenen Rechtecke (a1 , b1 ]×(a2 , b2 ]
im (0, 1]2 mit 0 < ai ≤ bi ≤ 1. Dies läßt sich auf höhere Dimensionen und ganz IRd ausdehnen.
Proposition 18 Eine positive, additive, erweiterte Mengenfunktion auf einem Halbring hat
eine eindeutige additive Fortsetzung auf den vom Halbring erzeugten Ring.
Beweis: Die einzig mögliche additive Fortsetzung der Mengenfunktion µ auf den Ring ist
[n
µ̃( ◦
i=1
Ai ) =
n
X
µ(Ai ).
i=1
µ̃ tut’s.
S
S
Die Abbildung ist wohldefiniert wegen ◦ i Ai = ◦ j Bj
X
i
µ(Ai ) =
X
i
[
µ( ◦ Ai ∩ Bj ) =
j
XX
i
j
µ(Ai ∩ Bj ) =
XX
j
und offensichtlich additiv.
2.0.7
i
µ(Ai ∩ Bj ) =
X
µ(Bj )
j
q.e.d.
Beispiele
Wir zeigen das Zusammenspiel der Resultate und Strukturen an zwei Beispielen.
Borelmaß: Das Maß auf dem Einheitsintervall versehen mit der Borel σ-Algebra, welches
jedem Intervall darin seine Länge zuordnet, heißt Borelwahrscheinlichkeitsmaß .
Satz 19 Das Borelwahrscheinlichkeitsmaß auf (0, 1] existiert. Es ordnet jeder einelementigen
Menge das Maß 0 zu.
Beweis: Betrachte das Mengensystem H aller halboffenen Intervalle (a, b] mit 0 ≤ a ≤ b ≤ 1.
Dies ein Halbring bzgl. Ω = (0, 1]. Definiere die Mengenfunktion µ auf H durch
µ(a, b] := b − a.
µ ist ein Inhalt auf der vom Halbring erzeugten Ring, Proposition 18.
• Der Inhalt µ ist ein Prämaß.
Wir verwenden das Lemma (16). Als kompakte Klasse nehmen wir alle kompakten Mengen
in (0, 1]. Die Einschachtelung für ein Intervall (a, b) mit a < b ist
(a + ǫ, b] ⊂ [a + ǫ, b] ⊂ (a, b]
mit µ((a, b]\(a + ǫ, b]) ≤ ǫ. Für die disjunkte Vereinigung endlich vieler läuft dies analog.
Die Fortsetzung µ des Prämaßes auf die von H erzeugte σ-Algebra ist eindeutig, Satz von
Caratheodory (11) und (14).
µ tut’s.
15
WS10/11
Maßtheorie
Ein Nachrechnen liefert µ ist ein Wahrscheinlichkeitsmaß und
µ({a}) = lim µ((a −
n→∞
1
1
, a]) = lim = 0
n n
n
und µ(I) ist die Länge des Intervall.
q.e.d.
Um das Borelmaß µ auf den gesamten reellen Zahlen zu definieren, betrachte die reellen
Zahlen als disjunkte Vereinigungen von den Intervallen In = (n, n + 1], n ∈ ZZ. Sei µn das
Borelmas̈ auf In versehen mit der Borel σ-Algebra Bn hierauf. Beachte, jede Borelmenge
B ∈ B schreibt sich als disjunkte Vereinigung von Mengen B ∩ In ∈ Bn . Dann tut es µ(B) :=
P
n∈ZZ µn (B ∩ In ).
Das Lebesguemaß ist die Erweiterung des obigen Borelmaßes auf die vervollständigte
Borel σ-Algebra. Die Standardnotation ist λ. Das Lebesguemaß auf einem Intervall I ist die
Einschränkung λI des Lebesguemaßes auf dieses Intervall.
Maße auf endlichen Produkträumen: Seien (Ωi , Ai , µi ), 1 ≤ i ≤ n, endliche Maßräume.
Der Produktraum ist
n
Y
i=1
Ωi := Ω1 × Ω2 × . . . × Ωn = {f : {1, . . . , n} 7→
n
[
i=1
Ωi | f (j) ∈ Ωj , j ∈ {1, . . . , n}}.
Eine Rechteckmenge ist eine Menge
A1 × A2 × . . . × An ,
Ai ∈ Ai .
Sei H die Menge aller Rechteckmengen. Die hiervon erzeugte σ-Algebra σ(H) heißt Produkt
σ-Algebra.
N
Notation i Ai := A1 ⊗ A2 ⊗ . . . ⊗ An .
N
Ein Maß µ : i Ai 7→ IR mit
µ(A1 × A2 × . . . × An ) = µ1 (A1 )µ2 (A2 ) . . . µn (An ),
Ai ∈ Ai , 1 ≤ i ≤ n, heißt Produktmaß .
Q
N
Notation i µi = µ1 ⊗ µ2 ⊗ . . . ⊗ µn = i µi .
Proposition 20 Das Produktmaß existiert und ist eindeutig.
Beweisskizze: Das Mengensystem der Rechteckmengen ist kein Halbring, aber der davon
erzeugte Ring besteht aus allen endlichen disjunkten Vereinigungen von Rechteckmengen.
Definiere auf den Rechteckmengen die Mengenfunktion µ : R → IR durch
µ(A1 × A2 × . . . × An ) := µ1 (A1 )µ2 (A2 ) . . . µn (An ).
µ ist additiv auf dem Halbring H. Erweitere µ additiv auf dem von den Rechteckmengen
erzeugten Ring, Proposition 18. Wenn wir zeigen könnten, daß diese Mengenfunktion ein
Prämaß ist, (genauen Beweis später, vgl. auch Fubini) dann impliziert der Satz von Caratheodory 11 eine Erweiterung zum Maß auf σ(R). Die Eindeutigkeit folgt aus Satz 14.
q.e.d.
Q
N
N
Das Tripel ( i Ωi , i Ai , i µi ) heißt Produktmaßraum oder Produktraum. Der Produktraum von W-räumen ist ein W-raum.
Später betrachten wir Produkträume über beliebige Indexmengen.
16
WS10/11
2.1
U. Rösler
Maße auf den reellen Zahlen
Wieviele Maße gibt es auf den reellen Zahlen versehen mit der Borel σ−Algebra B?
Sei f eine Funktion von den reellen Zahlen in die reellen Zahlen. Wir benutzen die Notation
f (x+) für den Grenzwert limyցx f (y). Eine Funktion f : IR → IR heißt rechtsstetig in x, falls
f (x+) = f (x) gilt. Sie heißt rechtsstetig, falls sie rechtsstetig in jedem Punkt x ist. Analog
definiert man f (x−) und linksstetig.
Ein Radonmaß auf den reellen Zahlen ist ein Maß auf der Borel σ-Algebra mit endlichem
Maß für jedes Kompaktum.
Satz 21 Es gibt eine bijektive Abbildung zwischen isotonen, rechtsstetigen Funktionen F :
IR 7→ IR mit F (0) = 0 und Radonmaßen µ auf den reellen Zahlen. Diese Bijektion kann durch
F (b) − F (a) = µ((a, b]),
(2.2)
a < b ∈ IR gegeben werden.
Beweis: Jedes Radonmaß definiert eindeutig durch die obige Bijektion 2.2 eine Funktion wie
oben beschrieben. Die Umkehrung folgt dem Beweis von Satz 19. Jede Funktion wie oben liefert eine additive und isotone erweiterte Mengenfunktion µ auf dem Halbring aller halboffenen
Intervalle {(a, b] | a ≤ b ∈ IR}. Die Mengenfunktion µ wird (eindeutig) zu einem Inhalt auf
dem erzeugten Ring erzeugten Ring fortgesetzt, Proposition 18. Dieser Inhalt ist ein Prämaß
nach Lemma 16. Wähle dazu als kompakte Klasse das Mengensystem C der kompakten MenS
gen. Für vorgegebenes A = ◦ ni=1 (ai , bi ] und µ(A) < ∞ wähle die Mengen Bi := (ai +ǫi , bi ] ∈ E
und Ci = [ai + ǫi , bi ]. Dann erfüllen B := ∪i Bi und C := ∪i Ci ∈ C die Bedingung B ⊂ C ⊂ A
und
X
(F (ai + ǫi ) − F (ai )
µ(A\B) =
i
wird beliebig klein für geeignet gewählte ǫi .
Der Satz von Caratheodory 11 liefert die Existenz und der Satz 14 die Eindeutigkeit. q.e.d.
Bem: Es mag einfacher erscheinen, erst auf Ω = (z, z + 1], z ∈ ZZ die Konstruktion zu
machen, da dann das Maß endlich ist. Anschließend wird via der Partition IR = ∪z∈ZZ (z, z +1]
P
q.e.d.
das Maß µ = z∈ZZ µz definiert. Dies tut’s.
Lebesguemaß: Die Lebesgue σ-Algebra ist die Vervollständigung der Borel σ-Algebra
unter dem Borelmaß, welches jedem Interval seine Länge zuordnet. Die zugehörige Funktion
F ist die Identität. Die Standardnotation ist λ. Der Sprachgebrauch zieht das Lebesguemaß
dem Borelmaß vor und unterscheidet i.a. nicht dazwischen.
Verteilungsfunktion: Eine Verteilungsfunktion ist eine rechtsstetige, aufsteigende Funktion F : IR 7→ IR mit F (−∞) := limx→−∞ F (x) = 0, F (∞) := limx→∞ F (x) = 1.
Korollar 22 Es gibt eine bijektive Abbildung zwischen Verteilungsfunktionen und W-Maßen
auf der Borel σ-Algebra über IR. Diese Bijektion kann durch
F (b) − F (a) = µ((a, b])
a < b ∈ IR gegeben werden.
17
WS10/11
Maßtheorie
Beweis: Einfach aus Satz 21.
d-dimensionaler Raum: Die Konstruktion des Lebesguemaßes auf IRd verläuft ganz
analog. Die halboffenen Intervalle (a1 , b1 ] × ... × (ad , bd ], 0 ≤ ai ≤ bi ≤ 1 im Einheitswürfel
einen bilden einen Halbring. Die Mengenfunktion
λ((a1 , b1 ] × ... × (ad , bd ]) :=
d
Y
i=1
(bi − ai )
ist ein Prämaß auf dem Hiervon erzeugten Ring. Der Satz von Caratheodory liefert eine
Fortsetzung als Maß auf dem Einheitsintervall. Anschließend erweitere dieses Maß translationsinvariant auf ganz IRd durch Partitionierung. Übung.
Notation: λd bezeichnet das Lebesguemaß auf IRd versehen mit der Lebesgue σ-Algebra,
der Vervollständigung der Borel σ-Algebra.
Bemerkung: Im IRd ist die Charakterisierung von Maßen über (Verteilungs-)Funktionen
schwieriger. Wie würde die Charakterisierung lauten? (Siehe Gänzler-Stute [5])
2.1.1
Hausdorff Maße und Cantor Menge
Haufsdorffmaß: Es gibt andere Maße auf den reellen Zahlen von Interesse, die eventuell
einer kompakten Menge keinen endlichen Wert zuordnen. Wir geben als Beispiel Hausdorff
Maße an. Sei 0 < α. Definiere
µα (Q) = lim inf{
ǫց0
X
n∈IN
diamα (Bn ) | diam(Bn ) < ǫ, Q ⊂ ∪n Bn }.
B. bezeichnet offene Kugeln und diam steht für den Durchmesser der Kugel. (Der Limes
existiert, da die Folge monoton steigend ist in ǫ. Siehe Falconer [4].) µα ist ein äußeres Maß.
Das Maß µα auf der σ-Algebra A∗α der µα -meßbaren Mengen heißt Hausdorffmaß zum Index α. Das Hausdorffmaß ist ein translationsinvariantes Maß auf A∗α . A∗α enthält die Borel
σ−Algebra. Alle offenen, nicht leeren Mengen U in IRd haben den Wert µα (U ) = ∞ für
0 < α < d. Das Lebesguemaß λd ist ein Vielfaches des Hausdorffmaßes µd auf IRd .
Die Hausdorff Dimension einer Menge ist das Infimum der α mit endlichem Hausdorffmaß
µα (Q) < ∞ [4]. Offene, beschränkte, reelle Mengen in IRd haben die Hausdorff Dimension d.
Das Hausdorffmaß einer Menge C ist das Maß µα (C ∩ ·) : A∗α → IR mit α die Hausdorff
Dimension der Menge C.
Cantormenge: Als Beispiel wollen wir die Cantormenge und das Cantormaß , das Hausdorffmaß zu der Cantormenge, betrachten.
0r
♣
♣
♣ ♣ ♣ ♣
♣♣♣♣ ♣♣♣♣
r1/3
♣
♣
♣ ♣ ♣ ♣
♣♣♣♣ ♣♣♣♣
r2/3
♣
♣
♣ ♣ ♣ ♣
♣♣♣♣ ♣♣♣♣
Cantorset Cantorset Can
r1
♣
♣
♣ ♣ ♣ ♣
♣♣♣♣ ♣♣♣♣
Cantorset Cantorset Can
Die formale Definition der Cantormenge C lautet:
Cn := {x =
∞
X
xi
i=1
3i
| xi ∈ {0, 1, 2}, xj 6= 1 für j ≤ n, i ∈ IN }
18
WS10/11
C :=
\
n
Cn = {x =
∞
X
xi
i=1
3i
U. Rösler
| xi ∈ {0, 2}}.
Die Cantormenge hat interessante Eigenschaften:
• Die Cantor Menge ist überabzählbar, abgeschlossen, kompakt, nirgends dicht (=das
Innere vom Abschluß ist leer) und perfekt (=jeder Punkt ist Häufungspunkt). (Übung)
• Die Cantor Menge ist Borel meßbar und das Lebesgue Maß der Cantor Menge ist 0.
Übung
2
• Die Hausdorff Dimension ist α = ln
ln 3 < 1. (Keine Übung)
• Die Abbildung ϕ : C 7→ [0, 1]
x=
∞
X
xi
i=1
3i
7→ ϕ(x) =
∞
1X
xi
2 i=1 2i
(2.3)
ist isoton, stetig, und surjectiv. Seien B3 und B2 diejenigen reellen Zahlen, deren Trialdarstellung bzw. Dualdarstellung nicht eindeutig ist. Dann ist ϕ : C\B3 → [0, 1]\B2 bijektiv. (ϕ
bildet z.B. die Punkte 1/3 und 2/3 beide auf 1/2 ab.) B3 und B2 sind abzählbar.
• Das Cantor Maß ist ein Wahrscheinlichkeitmaß mit der stetigen, fast überall (bis auf C)
unendlich oft differenzierbaren Verteilungsfunktion
F (x) = inf{1, ϕ(y) | C ∋ y ≥ x}
mit Ableitung 0 f.s. (Die Ableitung auf C ist ∞.) Ein Bild ist sehr hilfreich. (Übung) Das
Bildmaß des Cantor Maßes unter ϕ bzw. F ist das Lebesgue Maß.
• Die Cantormenge ist die größte kompakte invariante Menge bzgl. der Funktion f : IR 7→
IR, f (x) = 11x≤1/2 3x+11x>1/2 (3−3x). (Eine Menge A heißt invariant unter f, falls f −1 (A) = A
gilt.) (Übung: Benutze die Trialdarstellung einer reellen Zahl.) Die Iteration f n (x), n ∈ IN
eines Punktes x unter f bleibt beschränkt genau dann, wenn x aus C ist.
2.1.2
Translationsinvariante Maße
Ein Maß auf (IR, +) heißt translationsinvariant, falls es invariant ist bezüglich aller Translationen. (D.h. µ(A + x) = µ(A) für alle x ∈ IR, A ∈ A).
Beispiele translationsinvarianter Mäse sind
(i) das triviale Maß auf der Potenzmenge, welches jeder nichtleeren Menge ∞ zuordnet,
(ii) das Maß auf der Potenzmenge, welches genau den abzählbaren Mengen den Wert 0
zuordnet, ansonsten aber ∞ ist
(iii) das Zählmaß auf der Potenzmenge,
(iv) das Hausdorffmaß auf der Hausdorff σ-Algebra zu vorgegebenem α ∈ (0, 1)
(v) das Lebesguemaß auf der Borel- bzw. Lebesgue σ-Algebra.
Proposition 23 Das Lebesgue Maß ist bis auf Vielfache das einzige translationsinvariante
Radonmaß auf den reellen Zahlen versehen mit der Borel σ-Algebra.
19
WS10/11
Maßtheorie
Beweis: • Das Lebesguemaß ist translationsinvariant.
Betrache D := {A ∈ B | ∀x ∈ IR : λ(A) = λ(A + x)}. Dies ist ein Dynkin System
und enthält den durchschnittabgeschlossenen Erzeuger der halboffenen Intervalle (a, b]. Nach
Lemma 3 gilt D = B.
Eindeutigkeit: Durch den Wert µ((0, 1]) wird, verwende Additivität und Translationsinvarianz das Maßes µ, das Maß für alle halboffenen Intervalle (p, q], p, q ∈ Ql festgelegt. Diese
bilden ein Erzeugersystem der Borel σ-Algebra.
q.e.d.
2.1.3
Nichtmeßbare Mengen
Lemma 24 Es gibt nicht lebesguemeßbare Mengen auf dem Einheitsintervall.
Beweis: Definiere auf den reellen Zahlen die Äquivalenzrelation
x ∼ y ⇔ x − y ∈ Ql.
Aus jeder Äquivalenzklasse [x] := {y ∈ IR | x ∼ y} wähle einen Repräsentanten aus [0, 1].
Dies ist möglich nach dem Auswahlaxiom. A tut’s.
Angenommen A ist lebesguemeßbar. Die Mengen A + q, q ∈ Ql, sind paarweise disjunkt.
S
Das Lebesguemaß von B := ◦ q∈Ql ∩[−1,1] (A + q) berechnet sich via der Translationsinvarianz
zu
X
X
λ(B) =
λ(A + q) =
λ(A + q) = ∞λ(A)
q∈Q
l ∩[−1,1]
q∈Q
l ∩[−1,1]
mit den möglichen Werten 0 oder ∞. Andererseits gilt [0, 1] ⊂ B ⊂ [−1, 2] und damit 1 ≤
λ(B) = ∞λ(A) ≤ 3. Dies ist ein Widerspruch.
q.e.d.
Proposition 25 Es gibt lebesguemeßbare Mengen, die nicht borelmeßbar sind.
Bew: Betrachte dazu die Cantorabbildung ϕ : C\B3 → [0, 1]\B2 aus (2.3). ϕ ist bijektiv und
wegen der Monotonie sind ϕ und ϕ−1 borelmeßbar.
Sei A eine nicht lebesguemeßbare Menge. Dann ist ϕ−1 (A) ⊂ C als Nullmenge lebesguemeßbar, aber nicht borelmeßbar.
q.e.d.
Bemerkung: Auch nicht meßbare Mengen sind manchmal nützlich. Sei (Ω, A, µ) ein
beliebiger Maßraum und C eine eventuell nicht meßbare Menge. Dann ist die Einschränkung
(Ω|C = C, A|C = {A∩C | A ∈ A}, µ∗|C ) mit µ∗|C (A) := µ∗ (A∩C) = inf{µ(B) | B ∈ A, A∩C ⊂
B} ein Maßraum. Ist µ ein W-maß und hat C das äußere Maß 1, so ist µ∗C ein W-maß.
2.2
2.2.1
Diverses
Regularität∗
Sei (Ω, A, µ) ein Maßraum. Ein Maß µ heißt von außen regulär oder von oben regulär
bzgl. einem Mengensystem C, falls für alle meßbaren Mengen A gilt
µ(A) = inf{µ(C) | A ⊂ C ∈ C}.
Analog definiert man von innen regulär oder unten durch
µ(A) = sup{µ(C) | C ∋ C ⊂ A}.
20
WS10/11
U. Rösler
µ heißt regulär bzgl. C, falls es von außen und innen regulär ist.
Ein Maß µ heißt von außen σ−regulär oder von oben bzgl. einem Mengensystem C,
falls für alle meßbaren Mengen A gilt
µ(A) = inf{
X
n
µ(Cn ) | A ⊂ ∪n Cn , Cn ∈ C}.
Regularität ist eine Art σ-Stetigkeit des Maßes bzgl. gewisser Mengensysteme.
Lemma 26 Jedes Radonmaß auf den reellen Zahlen ist regulär von innen bzgl. kompakten
Mengen, regulär von außen bzgl. offenen Mengen und σ−regulär von außen bzgl. kompakten
Mengen.
Beweis: Sei zuerst µ ein endliches Maß. Betrachte die Menge D aller meßbaren Mengen,
die sich dem Maße nach beliebig gut von außen durch offene Mengen und von innen durch
abgeschlossene Mengen approximieren lassen.
• D enthält alle abgeschlossenen beschränkte Intervalle.
Das Intervall [a, b] ist abgeschlossen und enthalten in der offenen Menge (a − ǫ, b + ǫ). Die
σ-Stetigkeit des Maßes liefert µ((a − ǫ, b + ǫ)) →ǫ→ µ([a, b]).
• D ist ein Dynkinsystem mit IR.
D enthält die reellen Zahlen und ist abgeschlossen bzgl. der Differenz aufsteigender Mengen
ist einfaach zu zeigen. Für die Abgeschossenheit bzgl. abzählbarer disjunkter Vereinigung seien
Dn ∈ D paarweise disjunkt. Wähle zu vorgegebenem ǫ abgeschlossene Mengen An und offene
P
Mengen Un mit An ⊂ Dn ⊂ Un und µ(Un \An ) ≤ ǫn und n ǫn < ǫ. Sei N ∈ IN. Dann sind
A = ∪n≤N An abgeschlossen, U = ∪n Un offen und erfüllen A ⊂ ∪n Dn ⊂ U und
µ(U \A) ≤ µ(
[
n
Un \
[
m
Am ) + µ(
[
m
Am \A) ≤
X
n
µ(Un \An ) +
X
µ(Dm ) < 2ǫ.
m>N
P
Die zweite Summe ist klein für große N wegen der Endlichkeit des Maßes ( n µ(Dn ) <
∞)).
• D ist die Borel σ-Algebra.
Die Menge der abgeschlossenen Intervalle erzeugen die Borel σ-Algebra, sind durchschnittstabil und in D. Damit ist das Dynkinsystem eine σ-Algebra.
• µ ist regulär von oben durch offenen und von unten durch abgeschlossene.
Folgt aus obigem.
• µ ist regulär von unten durch kompakte.
Die abgeschlossenen beschränkten Mengen sind nach dem Satz von Heine-Borel genau
die kompakten Mengen. Zu jeder abgeschlossenen Menge A gibt es eine enthaltene kompakte
Menge K mit µ(A\K) beliebig klein wählbar. (A ∩ [−n, n] ist kompakt und aufsteigend gegen
A.)
• Jedes µ ist σ−regulär von oben durch kompakte.
Jede offene Menge U läßt sich schreiben als höchstens abzählbare disjunkte Vereinigung
von offenen Intervallen. Jedes offene Intervall I läßt sich beliebig gut durch höchstens abzählbar viele Kompakta [a, b] ⊂ I überdecken mit µ(a) = 0 = µ(b). Fertig. (Formal: Zu vorgebenem B ∈ B wähle eine offene Obermenge U mit µ(U \B) < ǫ. U ist darstellbar als disjunkte
S
Vereinigung ◦ In von abzählbar vielen offenen Intervallen In . Überdecke jedes Intervall In wie
oben beschrieben durch abzählbar viele kompakte Intervalle Kn,m = [an,m , an,m+1 ], m ∈ ZZ
mit µ(an,m ) = 0, deren Innere alle disjunkt sind. Dies ist möglich, da {x | µ({x}) > 0}
P
höchstens abzählbar ist (Übung). Es gilt 0 ≤ m µ(Kn,m ) − µ(In ) = 0.
21
WS10/11
Maßtheorie
Damit folgt B ⊂ U ⊂ ∪n,m Kn,m und
P
n µ(In ) = µ(U ) ≤ µ(B) + ǫ.)
n,m µ(Kn,m ) =
• Der Satz gilt auch für nichtendliche Maße.
Finde eine Folge xn ∈ IR mit xn →n→∞ = ∞ und xn →n→−∞ −∞ und µ({xn }) = 0. dies
ist möglich. Dann zerlege IR in die disjunkten Intervalle (xn , xn+1 ], n ∈ ZZ und das Maß in
die Summe abzählbar vieler eingeschränkte Maße µn = µ(· ∩ (xn , xn+1 ). Der Rest ist Übung.
q.e.d.
P
Das folgende Lemma besagt in Worten, jede Borelmenge ist irgendwo dick.
Lemma 27 Sei λ das Lebesguemaß auf IR und B eine Borelmenge von strikt positivem Lebesguemaß. Dann existiert für alle ǫ > 0 ein offenes, nichtleeres Intervall I mit
λ(I ∩ B)
≥ 1 − ǫ.
λ(I)
Beweis: OEdA sei B beschränkt. Wähle eine offene Obermenge U von B mit λ(U \B) < δ.
S
Die offene Menge hat eine Darstelllung U = ◦ n∈IN In mit In offene Intervalle. Schätze ab
λ(B) =
X λ(In ∩ B)
n
λ(In )
λ(In ) ≤ sup
m
λ(Im ∩ B) X
λ(Im ∩ B)
(λ(B) + δ).
λ(In ) ≤ sup
λ(Im )
λ(Im )
m
n
Für δ hinreichend klein muß das Supremum dicht bei 1 liegen.
q.e.d.
Proposition 28 Sei B eine Borelmenge von strikt positivem Lebesguemaß. Dann ist 0 ein
innerer Punkt von B − B = {x − y | x, y ∈ B}.
Beweis. Sei I ein Intervall mit λ(I ∩ B) > 34 λ(I) > 0. Sei A := I ∩ B. Hieraus folgt
λ(A ∩ (A + ǫ)) = λ(A) + λ(A + ǫ) − λ(A ∪ (A + ǫ))
≥ 2λ(A) − λ(I ∪ (I + ǫ)) ≥ 2λ(A) − λ(I) − ǫ ≥
λ(I)
−ǫ
2
Für hinreichend kleine ǫ hat A ∩ (A + ǫ) strikt positives Maß und ist daher nicht leer. Daher
enthält B − B ⊃ A − A die Werte ǫ und auch −ǫ. Dies reicht.
q.e.d.
2.2.2
Isomorphien und standard Lebesgueräume*
Weshalb spielen Maße auf den reellen Zahlen versehen mit der Borel-σ-Algebra solch eine prominente Rolle? Antwort: Abzählbar erzeugte σ-Algebren sind isomorph zur Borel σ-Algebra
auf den rellen Zahlen eingeschränkt auf eine Teilmenge.
Zwei meßbare Räume heißen isomorph, falls es eine bimeßbare Bijektion der Grundräume
gibt. (Eine Funktion heißt bimeßbar, falls sie bijektiv ist und sie und ihre Inverse meßbar
sind.) Beachte, die σ-Algebren sind isomorph als geordnete Räume bzgl. der Mengeninklusion.
(Der Isomorphiebegriff von σ-Algebren bezieht sich nur auf eine bijektive, strukturerhaltende
Abbildung zwischen den σ-Algebren. Für meßbare Räume nimmt man den Grundraum mit
hinzu.)
Ein Borelraum ist eine Borelmenge versehen mit der induzierten Borel-σ-Algebra eines
topologischen Raumes. Ein meßbarer Raum heißt separabel oder abzählbar erzeugt, falls es
einen abzählbaren Erzeuger gibt. Ein meßbarer Raum heißt punktetrennend oder hausdorffsch
falls es zu jedem ω 6= ω ′ eine meßbare Menge A gibt, die ω, aber nicht ω ′ enthält.
22
WS10/11
U. Rösler
Durch Äquivalenzbildung läßt sich jeder meßbare Raum hausdorffsch machen. Die Relation ω ∼ ω‘ ⇔ ∃A ∈ A : ω ∈ A, ω ′ 6∈ A ist eine Äquivalenzrelation auf Ω. Der Raum Ω/∼
der Äquivalenzklassen versehen mit der σ-Algebra
A/∼ := {{[ω] | ω ∈ A} | A ∈ A})
ist ein Hausdorffscher meßbarer Raum.
Satz 29 Sei (Ω, A) ein separabler, hausdorffscher, meßbarer Raum. Dann ist (Ω, A) isomorph
zu einer (nicht notwendig meßbaren) Menge in IR versehen mit der eingeschränkten Borel σAlgebra. Diese Bijektion kann gegeben werden durch
f :=
X
3−n 211En .
n∈IN
Hierbei ist {En ∈ A | n ∈ IN } ein abzählbarer Erzeuger für A. Die Abbildung f : E → f (E)
ist bimeßbar.
Beweis: f ist wohldefiniert und bijektiv. Für die Bimeßbarkeit argumentiere über Erzeuger
und der Trialdarstellung f (En ) = {x ∈ f (Ω) | xn = 2}.
q.e.d.
Alle separablen metrischen Räume sind isomorph bzgl. der meßbaren Struktur zu einer
Teilmenge der reellen Zahlen versehen mit der Borel σ-Algebra. Wählen wir als abzählbaren
Erzeuger der σ-Algebra einen abzählbaren Erzeuger der Topologie, z.B. die offenen Bälle mit
rationalem Radius, so erhält obige Konstruktion zwar die Topologie, nicht aber die Metrik.
Zwei Maßräume heißen isomorph, falls es eine maßerhaltende Isomorphie der meßbaren
Räume gibt.
Maße werden durch einen Isomorphismus der meßbaren Struktur eindeutig transportiert.
Für alle abzählbar erzeugten σ-Algebren reicht es daher Maße auf reellen Zahlen genauer zu
studieren.
Wir sprechen von einem Standardlebesgueraum, falls die meßbaren Räume vollständig sind
und, nach eventueller Entfernung einer Nullmenge, maßtheoretisch isomorph zur Lebesgueσ-Algebra auf IR versehen mit dem Lebesguemaß und eingeschränkt auf eine Menge ist.
Bemerkung: Die Konstruktion von Satz 29 geht auch mit der Binär- anstelle der Trialdarstellung. Es treten dabei abzählbar viele Punkte auf, deren Dualdarstellung nicht eindeutig
ist. Dies ist eine Lebesguenullmenge. Der Vorteil der Konstruktion per Binärdarstellung ist
eine zusammenhängendere Menge als in der Trialdarstellung.)
23
WS10/11
24
Maßtheorie
Kapitel 3
Integrale
Ziel dieser Sektion ist der Integralbegriff als lineare und σ-stetige Fortsetzung I des Maßes µ
auf Funktionen.
Ein Maß µ fassen wir als eine Abbildung auf Indikatorfunktionen 11A auf, I(11A ) = µ(A).
Diese Abbildung setzen wir linear fort zu einer Abbildung I auf der Menge T + der positiven
P
Treppenfunktionen f = ni=1 ai 11Ai via
I(f ) :=
X
ai µ(Ai ).
i
Damit ist die algebraische Erweiterung beendet.
Wir erweitern die Abbildung I zu I˜ durch einen geeigneten Konvergenzbegriff via
˜ ) = lim I(fn )
I(f
n
mit Treppenfunktionen fn konvergiert gegen f. Als Konvergenzbegriff benutzen wir Ordnungskonvergenz, fn konvergiert aufsteigend punktweise gegen f .
Mengentheoretischer Zugang: Eine Alternative ist der mengentheoretische Zugang.
Wir identifizieren eine positive Funktion f : Ω 7→ IR+ mit der Menge {(ω, x) | 0 ≤ x ≤ f (ω)}
auf dem Produktraum Ω × IR und definieren das Integral als das Mas̈ dieser Menge bezüglich
dem Produktmas̈. (IR ist versehen mit der Borel σ-Algebra und dem Lebesguemaäß.)
Vektorraumstruktur Ein anderer gern gewählter Zugang ist es, die Menge T der Treppenfunktionen als Vektorraum zu betrachten, mit einer Norm zu versehen, bezüglich dieser
Norm T abzuschließen und dann das Funktional I auf den Abschluß von T stetig zu erweitern.
Wir kommen hierauf bei banachraumwertigen Funktionen zurück.
3.0.3
Algebraische Erweiterung
Eine Treppenfunktion ist eine Funktion der Form
f=
n
X
ai 11Ai
(3.1)
i=1
mit reellen Zahlen a1 , . . . , an und meßbaren Mengen A1 , . . . , An . Die Standarddarstellung
einer Treppenfunktion ist eine Darstellung wie oben mit der zusätzlichen Forderung alle
a1 , . . . , an sind verschieden und die die Mengen A1 , . . . , An bilden eine meßbare Zerlegung
25
WS10/11
Maßtheorie
(=Partition) des Stichprobenraumes Ω. (Zerlegung=Menge von Teilmengen, die paarweise
disjunkt sind und deren Vereinigung der ganze Raum ist. Wir sprechen von meßbarer Zerlegung, falls die Mengen stets meßbar sind.)
Proposition 30 Die Treppenfunktionen sind genau die meßbaren Funktionen mit endlichem
Bildraum. Jede mb. Treppenfunktion hat eine eindeutige Standarddarstellung gegeben durch
f=
n
X
ai 11f −1 (ai )
(3.2)
i=1
mit a1 , . . . , an die verschiedenen Werte von f .
Beweis: Eine Treppe a1 11A1 ist meßbar und die endliche Summe meßbarer Funktionen ist
meßbar. Damit nimmt jede Treppenfunktion nur endlich viele Werte an und ist meßbar.
Die Darstellung (3.2) ist eindeutig für eine meßbare Funktion mit endlichem Bildraum.
Dies ist die Standarddarstellung einer Treppenfunktion.
q.e.d.
Die Menge T = T (Ω, IR) der Treppenfunktionen ist ein Vektorraum. Wir betrachten den
positiven Kegel T + der positiven Treppenfunktionen. (OEdA sind die Koeffizienten positiv.)
Definiere auf T + die Abbildung I
I(f ) :=
n
X
ai µ(f −1 (ai ))
i=1
mit Hilfe der Standarddarstellung von f.
Proposition 31 Die Funktion I : T + → IR ist eine additive, skalare, isotone und erweiterte
Funktion.
Beweis: I ist wohldefiniert, da die Standarddarstellung eindeutig ist. Mit entsprechender Notation zeigen wir die Additivität.
I(f + g) =
X
ci µ((f + g)−1 (ci )) =
XX
j
=
k
XX
j
(aj + bk )µ(f
k
−1
X
ci
i
i
=
X
(aj ) ∩ g
{j,k|aj +bk =ci }
−1
(bk ))
aj µ(f −1 (aj ) ∩ g −1 (bk )) +
= I(f ) + I(g)
µ(f −1 (aj ) ∩ g −1 (bk ))
XX
j
k
bk µ(f −1 (aj ) ∩ g −1 (bk ))
Die Skalarität und die Isotonie (die Differenz von Treppenfunktion ist eine Treppenfunktion)
sind einfach.
q.e.d.
Bemerkung: Für einen additiven Operator auf einem Vektorraum ist Isotonie und Positivität dasselbe.
P
Folgerung: Für jede Darstellung m
i=1 bi 11Bi einer Treppenfunktion f gilt (nachrechnen)
I(f ) :=
m
X
i=1
26
bi µ(Bi )
(3.3)
WS10/11
U. Rösler
Hintergrund Ordnungsstruktur
Sei A eine Menge. Eine Relation ist eine Teilmenge R von A × A. Die Komposition oder
Verknüpfung zweier Relationen R, Q ist gegeben durch
R ◦ Q =: {(a, c) | ∃b ∈ A : (a, b) ∈ R, (b, c) ∈ Q}.
Das Inverse einer Relation ist R−1 := {(b, a) | (a, b) ∈ R}. Eine Relation heißt reflexiv, falls
die Relation die Diagonale {(a, a) | a ∈ A} enthält. Eine Relation heißt symmetrisch, falls die
Relation gleich ihrer Inversen ist. Eine Relation heißt antisymmetrisch, falls der Durchschnitt
der Relation mit der Inversen genau die Diagonale ist. Eine Relation heißt transitiv, falls die
Relation unter Komposition abgeschlossen ist (R ◦ R ⊂ R).
Eine Teilordnung oder partielle Ordnung oder Ordnung auf einer Menge A ist eine reflexive, antisymmetrische und transitive Relation. Wir schreiben a b für (a, b) ∈ R und
sprechen von b dominiert oder majorisiert a oder auch b ist größer als a. Analog benutzen
wir Minorante und kleiner. Ein Tupel (A, ) heißt geordnete Menge .
Sei (A, ) eine partielle Ordnung. Ein Element a ∈ A heißt obere Schranke von B ⊂ A
falls b ≤ a für alle b ∈ B gilt. Eine Menge B ⊂ A heißt nach oben (unten) beschränkt, falls es
eine obere (untere) Schranke von A gibt. Wir sprechen von einer kleinsten oberen Schranke a
von B falls a eine obere Schranke ist und für alle anderen oberen Schranken x gilt a ≤ x.
W
Notation: a = supb∈B b = b∈B b.
Eine kleinste obere Schranke a heißt Maximum von B, falls zusätzlich a ∈ B gilt.
Notation: x = maxb∈B b.
V
Analog verwenden wir das Infimum inf b∈B = b∈B b und Minimum.
Notation: a ∨ b := sup{a, b}
a ∧ b := inf{a, b}.
Ein Verband ist eine geordnete Menge abgeschlossen bzgl. endlichem Supremum und endlichem Infimum. Wir schreiben (A, ≺, ∧, ∨) in der Notation wie oben. Ein Verband heißt von
oben (unten) vollständig falls jede nach oben (unten) beschränkte Teilmenge ein Supremum
(Infimum) besitzt. Er heißt vollständig, falls er von unten und oben vollständig ist. Analog verwenden wir σ-vollständig falls jede beschränkte abzählbare Menge ein Supremum und
Infimum besitzt.
Eine isotone Funktion ist eine ordnungserhaltende Funktion. Eine isotone Funktion f heißt
von unten σ-stetig, falls für jede aufsteigende abzählbare Folge an ∈ M mit supn an ∈ M gilt
∨n f (an ) = f (∨n an ). Analog verwenden wir von oben σ-stetig und σ-stetig für beides.
Bemerkung: Jeder Verband läßt sich σ-vervollständigen, (von unten, von oben, vervollständigen). Darunter verstehen wir eine kleinste, ordnungserhaltende und injektive Einbettung des Verbandes in einen σ-vollständigen (von unten, von oben, vollständigen) Verband. Bis auf Isomorphie (ordnungserhaltende Bijektion) ist diese eindeutig. (Keine Übung:
Dies ist eine mathematische Standardkonstruktion. Z.B. lassen sich so die reellen Zahlen aus
den rationalen Zahlen konstruieren.) Weiterhin: jede isotone, von unten σ-stetige Abbildung
I : V 7→ IR∪{∞} läßt sich eindeutig von unten σ-stetig fortsetzen auf die σ-Vervollständigung
des Verbandes durch
˜ = lim I(vn ).
I(v)
n
Hierbei ist vn ∈ M, n ∈ IN, eine Folge mit vn րn v. Dies bildet den abstrakten Hintergrund
unserer folgenden Argumentation.
Bemerkung: Eine σ-Algebra ist ein Verband mit der Ordnung induziert durch die Enthaltensrelations, A ≺ B ⇔ A ⊂ B, A∨B = A∪B, A∧B = A∩B. Dieser Verband ist vollständig.
27
WS10/11
Maßtheorie
Ein Maß ist von unten σ-stetig, eine endliches Maß sogar σ-stetig. Der Satz von Caratheodory
ist die σ-stetige Erweiterung einer σ-stetigen, additiven und isotonen Abbildung auf einem
Verband. Der Ring (=Verband) wird erweitert zur σ-Algebra (Verbandsvervollständigung)
und das Prämaß zum Maß.
Das Integral
Der Raum der reellwertigen, positiven, erweiterten Treppenfunktionen T + = T (IR+ ) versehen mit der punktweisen Ordnung ist ein Verband. Die Vervollständigung von T + bzgl. σ+
Stetigkeit von unten ist der Raum F der erweiterten reellwertigen, meßbaren und positiven
+
Funktionen. Zu gegebener Funktion f ∈ F konvergieren zum Beispiel die Treppenfunktionen
fn
n
n2
X i
fn (x) :=
11 i
i+1
2n 2n ≤f (x)< 2n
i=0
aufsteigend gegen f.
Die Erweiterung von I kann nur funktionieren, falls I auf T + bereits σ-stetig von unten
ist. Dies liefert die nächste Proposition.
Proposition 32 Die Funktion I (3.3) ist eine additive, skalare, isotone, von unten σ-stetige
erweiterte Funktion. Die Abbildung I eingeschränkt auf I −1 (IR) ist σ-stetig.
Beweis: Die Wohldefiniertheit, Linearität, Skalarität und Isotonie wurde in Proposition 31
gezeigt.
Für die σ-Stetigkeit von unten betrachte eine aufsteigende Folge fn ր f aus T + . Seien
0 ≤ a1 < a2 < ... < aN die Werte von f und Ai = f −1 (ai ).
• I(fn 11Ai ) ր I(f 11Ai ) für alle i = 1..N.
Dies folgt aus der σ-Stetigkeit des Maßes,
ai µ(Ai ) = I(ai 11Ai ) ≥ I(fn 11Ai ) ≥ (ai − ǫ)µ(Ai ∩ {fn ≥ ai − ǫ}) →n (ai − ǫ)µ(Ai ).
Mit ǫ → 0 erhalten wir die Teilbehauptung.
• σ-Stetigkeit von unten.
I(fn ) =
X
i
I(fn 11Ai ) ր
X
I(f 11Ai ) = I(f ).
i
• I eingeschränkt auf I −1 (IR) ist σ-stetig.
Für eine Folge fn ց f ∈ T + betrachte f1 − fn ր f1 − f und argumentiere wie oben. q.e.d.
+
Definiere die Abbildung I˜ von F in die erweiterten reellen Zahlen via
˜ ) = lim I(fn ).
I(f
nր∞
für irgendeine Folge fn von positiven Treppenfunktionen punktweise aufsteigend gegen f.
+
Satz 33 Die Abbildung I˜ : F → IR ist wohldefiniert. Sie ist als additive und σ-stetige
Fortsetzung des Maßes µ eindeutig und ist additiv, skalar, isoton und σ-stetig von unten. Die
Fortsetzung I˜ eingeschränkt auf I˜−1 (IR) ist σ-stetig.
28
WS10/11
U. Rösler
Beweis: • I˜ ist wohldefiniert.
Seien fn und gm zwei monoton gegen f aufsteigende Folgen von Treppenfunktionen. Dann
gilt
lim I(fn ) ≥ lim I(fn ∧ gm ) = I(gm ).
n
n
Dies ergibt limn I(fn ) ≥ limm I(gm ). Aus Symmetriegründen gilt auch die andere Ungleichung.
• I˜ ist additiv, skalar und isoton.
Einfach.
• I˜ ist σ-stetig.
+
Sei F ∋ fn ր f. Seien T + ∋ fi,n րi fn . Dann konvergieren die Treppenfunktionen
W
gn := i,m≤n fi,m ≤ fn isoton gegen f. Aus der Sandwichposition
˜ ) = lim I(gn ) ≤ lim I(f
˜ n ) ≤ I(f
˜ )
I(f
n
ergibt sich die Behauptung.
• Die Fortsetzung I˜ eingeschränkt auf I˜−1 (IR) ist σ-stetig.
Verwende σ-Stetigkeit von unten und fn ց f ⇔ f1 − fn ր f1 − f.
Es verbleibt die Eindeutigkeit der Fortsetzung zu zeigen. Dies ist einfach.
q.e.d.
+
Bem: F ist die σ-Vervollständigung von unten bzgl. der (punktweisen) Ordnung von
T + . I˜ ist die einzig mögliche σ-stetige Fortsetzung von I.
Jede Funktion f : Ω 7→ IR hat eine eindeutige Zerlegung f = f + − f − mit f + := f ∨
˜ + ) oder
0, f − = (−f )+ . Sei Fe der Raum alle meßbaren erweiterten Funktionen f mit I(f
−
˜
˜
I(f ) endlich. Erweitere I auf Fe durch
˜ ˜ ) := I(f
˜ + ) − I(f
˜ − ).
I(f
Dies Objekt nennen wir Integral bzw. genauer Lebesgueintegral.
Dies ist (fast) der allgemeinste Integralbegriff.
Gebräuchliche Notationen für das Integral I˜˜ sind
˜˜ ) =: µ(f ) =:
I(f
Z
f (ω)dµ(ω) =:
Z
f (ω)µ(dω) =:
Ω
Z
f dµ =:
Z
Für eine meßbare Menge A verwenden wir
Z
Speziell auf IR verwenden wir
f dµ :=
Z
f dµ :=
Z
A
Z
b
a
f 11A dµ.
f dµ.
(a,b]
Hat µ keine Punktmaße (∀x ∈ IR : µ(x) = 0), so benutzen wir auch
Z
b
f dµ :=
a
Z
[a,b]
f dµ =: −
29
Z
a
f dµ.
b
f = µ(f ) = µf.
WS10/11
Maßtheorie
Ist µ das Lebesguemaß λ auf IR so schreiben wir
Z
Für W-mas̈e P ist
R
f (x)λ(dx) =
Z
f (x)dx.
f dP =: E(f ) =: Ef der Erwartungswert von f.
Eine integrierbare Funktion f ist eine meßbare Funktion mit endlichem Wert
Der Raum L1 der integrierbaren Funktionen ist ein Vektorraum.
R
|f |dµ < ∞.
R
Korollar 34 Das Integral
auf den integrierbaren Funktionen ist eine additive, skalare,
isotone und σ-stetige Abbildung.
Üblicherweise wird nicht der Raum der integrierbaren Funktionen verwendet, sondern der
Raum L1 der Äquivalenzklassen [f ] bzgl. der Äquivalenzrelation
f ∼g⇔
Z
|f − g|dµ = 0.
Aus der Äquivalenzklasse werden dann Repräsentanten benutzt. (Der Integralwert ist unbeeinflußt von der Auswahl des Repräsentanten.) Der Sprachgebrauch unterscheidet nicht
zwischen Funktionen und Äquivalenzklassen.
Korollar 35 Es gibt eine Bijektion zwischen erweiterten, additiven, skalaren, positiven und
von unten σ-stetigen Abbildungen I auf den positiven mes̈baren Funktionen und Mas̈en µ.
Diese Bijektion kann gegeben werden durch I(11A ) = µ(A).
Bew: Die so definierte Abbildung ist ein Mas̈ und I die eindeutige Erweiterung im obigen
Sinne.
q.e.d.
Bemerkung: Sei A ein linearer Operator auf eine Vektorraum von Funktionen mit Werten
in den reellen Zahlen. Dann ist A positiv genau dann wenn A isoton ist.
Bsp: Dichte: Sei µ ein Maß und f ≥ 0 eine meßbare Funktion. Dann ist die Mengenfunktion ν : A 7→ IR, definiert durch
ν(A) :=
Z
f dµ,
A
ein Maß.
Notation dν = f dµ oder auch ν = f µ.
dν
.
Die Funktion f heißt Radon-Nikodym Dichte von ν bzgl. µ. Geschrieben g = dµ
Bsp: Radon-Nikodym Dichte bzgl. dem Lesbesguemaß: Wir betrachten ein W-Maß
µ auf (IR, B). Die zugehörige Verteilungsfunktion F sei stetig differenzierbar. Die Behauptung
ist
Z
Z
g(x)dµ(x) = g(x)F ′ (x)dx
für alle integrierbarenR Funktionen g. Die Behauptung ist richtig für eine Treppe g = 11A mit
A = (a, b]. (µ(A) = A F ′ (x)dx = F (b) −RF (a).) Damit ist sie richtig für jede A-meßbare
Menge. (Die Menge M = {A ∈ A | µ(A) = A F ′ (x)dx} ist eine σ-Algebra,die einen Erzeuger
enthält.) Da beide Seiten additiv und σ-stetig sind, gilt Gleichheit für alle positiven meßbaren
Funktionen. Dann aber auch für alle integrierbaren Funktionen.
Die Funktion F ′ ist die Radon-Nikodym Dichte aus obigem Beispiel.
30
WS10/11
U. Rösler
Bsp: Diskrete Räume: Sei Ω endlich oder abzählbar versehen mit der Potenzmenge und
P
sei µ ein Maß. Dann ist µ = ω∈Ω f (ω)δω mit f (ω) = µ({ω}). Das Integral ist die Summe,
Z
gdµ =
X
g(ω)f (ω).
ω∈Ω
Die Abbildung ω 7→ f (ω) läßt sich als Radon-Nikodym Dichte von µ bzgl. dem Zählmaß
auffassen.
3.0.4
Konvergenzsätze
R
Sei
das oben definierte Integral für einen beliebigen Maßraum (Ω, A, µ). Wir benutzen
R
R
f = f dµ.
Satz 36 (Monotone Konvergenz)R Sei fn , n ∈R IN, eine steigende (fallende) Folge erweiterter meßbarer Funktionen und sei f1 > −∞ ( f1 < ∞.) Dann gilt
Z
lim fn = lim
n
n
Z
fn .
Beweis: Dies ist die σ-Stetigkeit des Integrals.
q.e.d.
Lemma 37 (Lemma von Fatou) Sei fn , n ∈ IN, eine Folge erweiterter, meßbarer Funktionen. Sind die fn gleichmäßig nach unten beschränkt durch eine integrierbare Funktion, so
gilt
Z
Z
fn ≥
lim inf
lim inf fn .
Sind die fn gleichmäßig nach oben beschränkt durch eine integrierbare Funktion, so gilt
lim sup
Z
fn ≤
Z
lim sup fn .
V
Beweis: Definiere gm := m≤n fn . Die Folge gm , m ∈ IN, konvergiert aufsteigend gegen
lim inf n fn . Mit dem Satz von der monotonen Konvergenz erhalten wir
Z
fm ≥
Z
gm րm
Z
lim inf fn .
n
Für die zweite Aussage betrachte die Folge −fn und beachte lim inf(−fn ) = − lim sup fn .
q.e.d.
Satz 38 (Dominierte Konvergenz) Sei fn , n ∈ IN, eine punktweise konvergente Folge erweiterter, meßbarer Funktionen. Weiterhin sei |fn |, n ∈ IN, gleichmäßig durch eine integrierbare Funktion beschränkt. Dann gilt
lim
n
Z
fn =
Z
lim fn .
Beweis: Folgerung aus dem Lemma von Fatou.
lim sup
Z
fn ≤
Z
lim sup fn =
Z
lim inf fn ≤ lim inf
31
Z
fn ≤ lim sup
Z
fn .
WS10/11
Maßtheorie
q.e.d.
Die Forderung einer Schranke ist essentiell. Als Beispiel betrachten wir: Ω = (0, 1] versehen
mit der Borel σ-Algebra und dem Lebesguemaß λ. Sei fn := n11(0,1/n] . Es gilt limn fn ≡ 0,
lim
Z
fn dλ = 1 > 0 =
Z
lim fn dλ.
n
Der Satz über dominierte Konvergenz ist nicht anwendbar. Das Lemma von Fatou ist anwendbar und die Ungleichung strikt.
3.0.5
Transformationssatz
Satz 39 (Transformationssatz) Sei (Ω, A, µ) ein Maßraum und (Ω′ , A′ ) ein meßbarer Raum.
Sei T : Ω 7→ Ω′ eine meßbare Abbildung. Dann gilt für meßbare (erweiterte) Funktionen
f : Ω′ 7→ IR, sofern eine Seite wohldefiniert ist,
Z
f ◦ T dµ =
Z
f d(µT )
Beweis: Die Aussage ist leicht nachzurechnen für f = 11A′ , A′ ∈ A′ . (Übung). Beide Seiten
sind lineare, σ-stetige Fortsetzungen (einer Mengenfunktion). Diese sind eindeutig.
q.e.d.
Beispiel: Sei T eine stetig differenzierbare Funktion auf den reellen Zahlen mit strikt
positiver Ableitung T ′ und sei µ das Lebesguemaß. Es gilt die Transformationsformel mit
y = T (x), f integrierbar,
Z
Z
f (y)
dy = f (T (x))dx.
T ′ (T −1 (y))
Hierbei ist das Maß T µ gegeben durch
T
(µ )((a, b]) =
Z
1
[a,b]
T ′ (T −1 (y))
Z.B. f (x) = ex , T (x) = x2 = y, µ(dx) = dx, x2 = y, dx =
Z
ey
√ dy =
2 y
Z
dy.
dy
√
2 y,
2
ex dx.
Für weitere und genauere Rechenregeln siehe Lehrbücher über Differential und Integralrechnung.
Fubini
Der wesentliche Satz dieses Abschnittes ist der Satz von Fubini.
Seien (Ω, A, µ) und (Ω′ , A′ , µ′ ) meßbare Räume. Ein Maß ν auf dem Produktraum Ω × Ω′
N
versehen mit der Produkt σ-Algebra A A′ = σ(E), E = {A × A′ | A ∈ A, A′ ∈ A′ } heißt
Produktmaß zu µ, µ′ falls ν(A × A′ ) = µ(A)µ′ (A′ ) gilt für alle A × A′ ∈ E.
32
WS10/11
U. Rösler
Der Schnitt Bω einer Menge B ⊂ Ω×Ω′ bzgl. ω ist die Menge {ω ′ ∈ Ω′ | (ω, ω ′ ) ∈ A
✬
N
A′ }.
✩
B
Bω
ω
✫
✪
Satz 40 Zu zwei Mas̈en gibt es ein Produktmas̈. Sind die Mas̈e σ-endlich, so ist das Produktmas̈ eindeutig.
Beweis: Wir definieren ν durch
ν(B) =
Z Z
11Bω (ω ′ )µ′ (dω ′ )µ(dω).
(
Die Menge D aller B für die obiges wohldefiniert ist, ist ein Dynkinsystem. Dies System
enthält den durchschnittstabilen Erzeuger E der Produkt σ-Algebra. Damit ist D die Produkt
σ-Algebra.
Die Eindeutigkeit folgt aus Satz 14.
q.e.d.
N
Notation: µ µ′ ist das Produktmaß, falls eindeutig definiert.
N
Bem: Sind µ, µ′ σ-endlich, so auch das Proktmaß µ µ′ .
Satz 41 (Fubini) Seien µ, µ′ σ-endliche Maße. Dann gilt
Z Z
(
′
′
′
f (ω, ω )dµ(ω))dµ (ω ) =
Z
′
′
′
f (ω, ω )d(µ × µ )(ω, ω ) =
Z Z
(
f (ω, ω ′ )dµ′ (ω ′ ))dµ(ω).
Beweis: Aus Symmetrie und Eindeutigkeitsgründen reicht es nur das zweite Gleichheitszeichen
zu zeigen. Sei OEdA f positiv.
Für f eine Treppe 11B mit B ∈ E gilt die Gleichheit. Da beide Seiten lineare und von
unten σ-stetige Abbildungen auf mes̈baren Funktionen sind, gilt die Gleichheit für Treppenfunktionen und den aufsteigenden Grenzwert von Treppenfunktionen. Das war’s.
q.e.d.
Bemerkung: Die σ-Endlichkeit ist wichtig. Als Beispiel betrachten wir µ das Lebesguemaß
und µ′ das Zählmaß auf dem Einheitsintervall. Die Funktion (x, y) 7→ f (x, y) = 11x=y ist
meßbar. Es gilt
Z Z
(
Z Z
′
f (x, y)dµ(x))dµ (y) = 0
(
f (x, y)dµ′ (y))dµ(x) = 1.
Diese Bemerkung zeigt, das̈ man die Eindeutigkeit des Produktmaßes nicht σ-endliche Maße
und die Vertauschbarkeit der Integrale verliert (vgl. Halmos [7] page 145, Hahn-Rosenthal
SET FUCTIONS 1948 chap IV,§16[6]).
33
WS10/11
34
Maßtheorie
Kapitel 4
Ungleichungen
Für Ungleichungen gibt es im wesentlichen zwei Quellen, über die Monotonie und über konvexe
Funktionen. Ungleichungen mit Hilfe der Monotonie werden Markoffungleichungen genannt.
Wesentliche bessere Ungleichungen ergeben sich durch konvexe Funtionen. Die Jensenungleichung in ihrer Grundform gilt jedoch nur für Wahrscheinlichkeitsmaße.
Röslers Metatheorem:
Alle guten Integralungleichungen beruhen auf Konvexität.
4.1
Markoff Ungleichung
Die Ungleichungen in diesem Abschnitt beruhen auf Monotonie.
Lemma 42 (Markoff Ungleichung) Sei ϕ : IR 7→ IR eine isotone, positive Funktion. Es
gilt für alle a ∈ IR
Z
ϕ(f )dµ ≥ ϕ(a)µ(f ≥ a)
Beweis: Beachte ϕ(a)11ϕ(f )≥ϕ(a) ≤ ϕ(f ) und verwende die Isotonie des Integrals.
Wichtige Spezialfälle sind die Momentabschätzungen für ϕ(x) = xp , x, p ≥ 0
Z
q.e.d.
|f |p dµ ≥ ap µ(|f | ≥ a)
und die exponentiellen (=Chernoff) Abschätzungen, ϕ(x) = exp(λx), λ ≥ 0
Z
exp(λf )dµ ≥ exp(λa)µ(f ≥ a).
Für W-maße ist ein praktischer und wichtiger Spezialfall die Tchebyscheff Ungleichung:
Z
(f − e)2 dµ ≥ a2 µ(|f − e| ≥ a)
R
mit dem Erwartungswert e = f dµ.
Bemerkung: – In der Regel werden die Momentenabschätzungen besser für zentrierte
Momente.
35
WS10/11
Maßtheorie
– Die Momentenabschätzungen sind besser als die Chernoff Abschätzungen, da gilt, (Übung
Reihenentwicklung)
R
R
exp (λf )dµ
|f |p dµ
≤ inf
.
inf
p
p>0
λ>0
a
exp (λa)
Da sich höhere Momente schlecht berechnen lassen, werden gerne exponentiellen Abschätzungen genommen. Diese sind in der Regel gut.
Proposition 43
R
|f |dµ = 0 ⇔ µ(|f | > 0) = 0.
R
Beweis: Die Markoff
Ungleichung aµ(|f | > a) ≤ |f |dµ liefert die Hinrichtung.
Für die
R
R
Rückrichtung sei |f |dµ > 0. Folglich gibt es eine Treppenfunktion 0 ≤ g ≤ |f | mit gdµ > 0.
Für diese gilt 0 < µ(g > 0) ≤ µ(|f | > 0)).
q.e.d.
4.2
Jensen Ungleichung
Die Ungleichungen in diesem Abschnitt beruhen auf Konvexität.
Eine reellwertige Funktion ϕ auf einem Intervall I heißt konvex, falls für alle t ∈ (0, 1)
und x 6= y ∈ I gilt
ϕ(tx + (1 − t)y) ≤ tϕ(x) + (1 − t)ϕ(y).
(4.1)
Sie heis̈t strikt konvex, falls in 4.1 stets echt kleiner gilt.
Satz 44 (Jensen) Sei P ein W-mas̈ und ϕ eine konvexe Funktion. Dann gilt für jede integrierbare Funktion f , sofern alles wohldefiniert ist,
Z
ϕ ◦ X dP ≥ ϕ(
Z
f dP ).
Gleichheit gilt genau dann, wenn die Funktion ϕ eine Gerade ist, P f −1 fast überall.
Beweis: Ohne Beweis sei angeführt, daß es für jedes x0 ∈ IR eine lineare Funktion l, l(x) =
ax + b) (=Tangente) gibt mit l ≤ ϕ und l(x0 ) = ϕ(x0 ). Es gilt mit x0 = inf f dP
Z
ϕ ◦ f dP ≥
Z
l ◦ f dP = l(
Z
f dP ) = l(x0 ) = ϕ(x0 ).
(4.2)
• Gleichheit.
R
Gilt überall Gleichheit in (4.2), so folgt (ϕ − l) d(P f −1 ) = 0 und daraus nach (43) die
| {z }
≥0
Bedingung. Umgekehrt, die Bedingung impliziert die Gleichheit in (4.2).
q.e.d.
Merkregel Meine Eselsbrücke ist Falscher Effee für Eϕ ≥ ϕE.
Bemerkung: – Für strikt konvexe Funktionen gilt Gleichheit genau dann, wenn f fast
sicher konstant ist.
– Die Jensen-Ungleichung gilt auch, sofern EX wohldefiniert ist. (Der Positivteil oder der
Negativteil von X ist integrierbar.)
– Die Jensen-Ungleichung gilt auch für konvexe Funktionen ϕ : I → IR auf einem Intervall
I.
Warnung: Die Jensenungleichung gilt nur für Wahrscheinlichkeitsmaße.
36
WS10/11
U. Rösler
Beispiel: p-te Momente Für 1 ≤ p < ∞ gilt für W-maße
P
Z
P
|f |p dP ≥ (
Z
|f |dP )p .
Aber es gilt n∈IN |xn |p ≤ ( n |xn |)p für das Zählmas̈.
Mehrere interessante Ungleichungen folgen aus der Jensen Ungleichung in folgender verallgemeinerter Form:
Korollar 45 (Jensen) Sei ϕ eine konvexe Funktion und µ ein Maß auf den reellen Zahlen.
Seien f, g meßbare Funktionen und sei g integrierbar und überall strikt positiv. Dann gilt,
Wohldefiniertheit vorausgesetzt,
R
R
f
gϕ(f /g)
R
ϕ( R ) ≤
.
g
g
Beweis: Das W-maß ν, gegeben durch ν(A) :=
W-maß. Die Jensenungleichung ergibt
linke Seite = ϕ
Z
f
dν ≤
g
Z
1R
a A gdµ,
A ∈ A, und a :=
R
gdµ ist ein
f
ϕ( )dν = rechte Seite.
g
Lp -Ungleichungen: Definiere für 1 ≤ p < ∞ die Abbildung k.kp auf meßbaren Funktionen
durch
Z
kf kp := ( |f |p dµ)1/p .
(4.3)
Die Abbildung ist wohldefiniert.
Satz 46 (Hölder Ungleichung) Sei 1 < p < ∞ und q definiert durch 1/p + 1/q = 1. Für
meßbare Funktionen f, g gilt
kf gk1 ≤ kf kp kgkq .
(4.4)
Sind obige Ausdrücke endlich und ungleich 0, so gilt Gleichheit genau für |f |p und |g|q sind
echte Vielfache voneinander fast sicher.
Beweis: Sei die rechte Seite endlich. Nehme in Korollar 45 die konvexe Funktion ϕ(x) = −x1/p
und die Funktionen |f |p , |g|q . Es ergibt sich die Hölderungleichung. Da ϕ strikt konvex ist,
gilt Gleichheit genau im Fall |f |p /|g|q eine Konstante.
q.e.d.
Corollary 47 (Cauchy-Schwarz Ungleichung)
Z
|f g|dµ ≤
sZ
f 2 dµ
Z
g 2 dµ.
Beweis: Spezialfall der Hölderungleichung für p = 2.
Corollary 48 Für 1 < p, q, r und 1/p + 1/q = 1/r gilt
kf gkr ≤ kf kp kgkq .
Satz 49 (Minkowski) Für 1 ≤ p < ∞ gilt
kf + gkp ≤ kf kp + kgkp .
Gleichheit gilt genau für f und g sind fast sicher positive Vielfache voneinander f.s..
37
q.e.d.
WS10/11
Maßtheorie
Beweis: Für die Minkowskiungleichung verwende IR+ ∋ x 7→ ϕ(x) = −(1 + x1/p )p und die
Funktionen |f |p und |g|p . Die Gleichheit ergibt sich genau für |f | und |g| Vielfache voneinander
und |f + g| = |f | + |g| fast sicher.
q.e.d.
Die letzten 4 Aussagen gelten auch für 1 ≤ p, q, r ≤ ∞, wenn wir
kf k∞ := inf{a > 0 | µ(|f | > a) = 0}
setzen. kf k∞ heißt essentielles Supremum esssupf von |f | oder L∞ -Norm.
38
Kapitel 5
Orlicz und Lp-Räume
Besonders schöne Räume von meßbaren Funktionen sind Lp -Räume, eine Unterklasse der
Orlicz Räume. Hiervon wiederum sind die L2 -Räume als Hilberträume besonders interessant.
Jeder Hilbertraum ist isomorph zu einem L2 -Raum.
5.1
Orlicz-Räume
Eine Orliczfunktion ist eine unterhalbstetige positive konvexe Funktion ϕ : IR+ 7→ IR+ mit
ϕ(0) = 0 ungleich der 0-Funktion. Eine erweiterte Orliczfunktion ist eine unterhalb stetige,
+
positive, konvexe, erweiterte Funktion ϕ : IR+ 7→ IR mit ϕ(0) = 0 und die Endlichkeitsmenge
D = ϕ−1 (IR) hat ein nichtleeres Inneres.
Orlicz Funktionen sind monoton steigend, links stetig und stetig bis auf eventuell in
dem rechten Randpunkt dr > 0 von D. Sie besitzen eine rechtsseitige Ableitung D+ ϕ(x) =
limy↓x ϕ(y)−ϕ(x)
und eine linksseitige Ableitung D− ϕ(x) = limy↑x ϕ(y)−ϕ(x)
im Inneren von D.
y−x
y−x
Erweitere die rechtsseitige (links-) Ableitung rechtsstetig (links-) zu einer erweiterten Funktion via dem Wert ∞ auf (dr , ∞). Die Ableitungen sind jeweils monoton wachsend und rechtsbzw. linksstetig. Die linksseitige Ableitung ist stets kleiner gleich der rechtsseitigen und sie
stimmen überein bis auf eventuell abzählbar viele Punkte.
Jede erweiterte Orliczfunktion ϕ hat die Darstellung
ϕ(x) =
Z
Dϕ(dy) =
[0,x[
Z
(x − y)+ µ(dy)
mit µ ist ein Radonmaß auf D (zu DDϕ mit µ({0}) = 0). (Es ergibt sich dasselbe Maß für
die links- bzw. rechtseitige Ableitung.)
Sei (Ω, A, µ) ein Maßraum und ϕ eine erweiterte Orlicz Funktion. Definiere die Abbildung
d = dϕ : F × F → IR auf meßbaren Funktionen f, g via
dϕ (f, g) := inf{c > 0 |
R
Z
|f − g|
dµ ≤ 1}.
ϕ
c
−g|
Proposition 50 Es gilt ϕ d|f
dµ ≤ 1.
ϕ (f,g)
dϕ ist symmetrisch, erfüllt die Dreiecksungleichung
dϕ (f, g) ≤ dϕ (f, h) + dϕ (h, g)
und ist ideal, d.h. dϕ (f + h, g + h) = dϕ (f, g) und dϕ (af, ag) = adϕ (f, g), a > 0.
39
WS10/11
Maßtheorie
Bew: Die erste Aussage folgt aus monotoner Konvergenz.
Wir rechnen nur die Dreiecksungleichung nach. OEdA sei die rechte Seite endlich. Sei
a > dϕ (f, h) und b > dϕ (g, h). Dann gilt
Z
|f − g|
ϕ
dµ ≤
a+b
Z
b |g − h|
a |f − h|
+
ϕ
dµ
a+b a
a+b b
Z
Z
b
a
|f − h|
|g − h|
ϕ
ϕ
≤
dµ +
dµ
a+b
a
a+b
b
a
b
≤
+
= 1.
a+b a+b
q.e.d.
Die letzte Eigenschaft führt auf Vektorräume. Sei k · kϕ : F → IR definiert durch kf kϕ =
dϕ (f, 0). Definiere Lϕ als die Menge aller f mit kf kϕ endlich. (Dies ist die Menge aller f mit
R
ϕ( |fc | )dµ < ∞ für ein c > 0.)
Lϕ ist ein Vektorraum. Sei Lϕ der Raum der Äquivalenzklassen bzgl. der Äquivalenzrelation ∼ϕ ,
f ∼ϕ g ↔ dϕ (f, g) = 0
Diese stimmt überein mit f ∼ g ⇔ µ(f 6= g) = 0. In Lϕ benutzen wir die übliche Addition +
+([f ], [g]) := [f ] + [g] := [f + g]
die Skalarmultiplikation · : IR × Lϕ → Lϕ
·(c, [f ]) := c[f ] := [cf ]
und die Abbildung dϕ ([f ], [g]) = dϕ (f, g) und k · kϕ : Lϕ 7→ IR
k[f ]kϕ := dϕ (f, 0).
Lϕ heißt Orlicz Raum und k.kϕ die Orlicz Norm.
Warnung: Wir unterscheiden in der Regel notationsmäßig nicht zwischen Funktionen und
ihren Äquivalenzklassen. Ebenso interessiert in der Regel nicht, wie groß die Äquivalenzklassen
wirklich sind.
Bem: Das Verhalten der konvexen Funktion am rechten Endpunkt dr spielt keine Rolle
in der Definition des Orliczraumes. Wir könnten daher auch die Forderung unterhalbstetig
weglassen.
Satz 51 Für jede erweiterte Orlicz Funktion ϕ ist (Lϕ , k.kϕ ) ein Banachraum.
Beweis: Alle genannten Objekte sind wohldefiniert. Lϕ ist ein Vektorraum und k.kϕ ist eine
Norm (wird nachgerechnet). Beachte hierbei
1
1
ϕ(|f − g|) ≤ ϕ(|f |) + ϕ(|g|).
2
2
Wir kommen jetzt zur Vollständigkeit. Sei [fn ] ∈ Lϕ eine Cauchyfolge. Wir können eine
Teilfolge ni →i ∞ wählen mit k[fni+1 ] − [fni ]kϕ = bi < 2−i . Es reicht den Satz für die
Teilfolge zu zeigen. Also können wir oEdA annehmen, die Teilfolge ist die Originalfolge. Nehme
P
Funktionen fn als Representanten der Äquivalenzklasse [fn ]. Sei g = n∈IN |fn+1 − fn |
40
WS10/11
U. Rösler
• kgkϕ ≤ 1.
P
Für vorgegebenes ǫ = i ǫi < ∞ mit ǫi > 0 argumentiere
Z
|g|
ϕ
dµ ≤
1+ǫ
≤
Z
ϕ
X bn + ǫn |fn+1 − fn |
1+ǫ
n
X bn + ǫ n Z
ϕ
1+ǫ
n
≤ 1
bn + ǫn
!
dµ
|fn+1 − fn |
dµ
bn + ǫ n
Mit ǫ → 0 folgt die Teilbehauptung.
• g is f.s. endlich.
Wende die Markoffungleichung an auf die konvexe Funktion x 7→ ϕ( xc ) mit c = kf kϕ
µ(g > a) ≤
R
≤
ϕ
P
ϕ
ϕ
1
a
c
|g|
c
a
c
dµ
→a→∞ 0.
• fn →n f = f1 + i∈IN (fi+1 − fi ) in Orlicznorm.
P
f ist wohldefiniert und endlich fast sicher. Aus der Teleskopdarstellung f = fn + i≥n (fi+1 −
fi ) folgt
X
X
kf − fn kϕ ≤ k
(fi+1 − fi )kϕ ≤
kfi+1 − fi kϕ →n 0.
i≥n
i≥n
Es verbleibt zu zeigen, dass die Äquivalenzklasse von [f ] unabhängig ist von der Auswahl
der Repräsentanten. (Wir überschlagen dies.)
q.e.d.
Eine Orliczfunktion erfüllt die ∇−Bedingung falls es ein a > 1 und b < ∞ gibt mit
ϕ(ax) ≤ bϕ(x)
für alle x ≥ 0.
Satz 52 Sei ϕ eine Orlicz Funktion mit der ∇−Bedingung. Dann ist (Lϕ , k.kϕ ) separabel für
jedes Radon Maß auf Ω = IR.
Beweis: Sei zuerst µ ein endliches Maß. Die Menge T aller Treppenfunktionen
N
X
qn 11(rn ,sn )
n=1
mit rationalen Zahlen qn , rn , sn ∈ Ql, N ∈ IN tut’s.
• T ist abzählbar.
• 1A , A ∈ A liegt in dem Abschluß T von T bezüglich k.kϕ .
Wegen der Regularität des Maßes können wir A durch eine offene Menge U von oben
dem Maße nach approximieren. Jede offenen Menge können wir als abzählbare Vereinigung
disjunkter offener Intervalle Un , n ∈ IN, schreiben. Jedes Un approximieren wir von oben
41
WS10/11
Maßtheorie
durch offene Intervalle Vn mit rationalen Koeffizienten. Sei V := ∪N
n=1 Vn . Damit ist für jedes
vorgegebene c > 0
Z
ϕ
|11A − 11V |
dµ =
c
Z
1
|11A − 11V |dµ
c
1
≤ ≤ϕ
(µ(U \A) + µ(V \U ))
c
ϕ
beliebig klein durch Wahl geeigneter Approximationen.
• Alle Treppenfunktionen liegen in T .
• Alle positiven f ∈ Lϕ liegen in T und dann auch ganz Lϕ .
Hier muss man aufpasssen. Approximiere f von unten durch Treppenfunktionen fn . Dies
kann geschehen mit f − fn ≤ {f rac1n auf einer Menge An mit µ(Acn ) klein. Wir erhalten
Z
ϕ(
f − fn
1
) ≤ ϕ( )µ(An ) +
c
nc
Z
f
ϕ( )
c
An
Der erste Term ist klein in n für festes c. Der zweite wird abgeschätzt mit Hilfe der ∇−Bedingung
durch µ(An )bm mit m so gewählt, dass cam ≥ kf kϕ gilt. Dies wird beliebig klein für n hinreichend gross.
• Lϕ liegt in T .
Zerlegung in Positiv und Negativteil.
• T tut’s auch für nicht endliche Maße.
Zerlege den Raum Ω geeignet durch eine Partition und ’klebe’ aneinander. Puh.
q.e.d.
Bem: Ohne die ∇−Bedingung gibt es Gegenbeispiele zur Separabilität.
Lp -Räume Das Standardbeispiel ist die Orlicz Funktion ϕp (x) = xp für ein 1 ≤ p < ∞.
Die Orlicznorm wird
Z
kf kϕp = ( |f |p dµ)1/p .
Der Orlicz-Raum Lϕp heißt Lp -Raum und die zugehörige Orlicz-Norm k.kp := k.kϕp heißt
Lp -norm.
Bemerkung: Die L∞ -Norm wird definiert durch
kf k∞ := esssup|f | := inf{α ∈ IR | µ(|f | > α) = 0}
(5.1)
und L∞ analog dazu. Die L∞ -Norm und der L∞ -Raum ist die Orlicz Norm und der Orlicz
Raum zur erweiterten Orlicz Funktion ϕ = ∞11(1,∞) . Der Raum L∞ ist vollständig, aber im
allgemeinen nicht separabel.
Proposition 53 Sei µ ein W-maß und 1 ≤ p ≤ q ≤ ∞. Dann gilt kf kp ≤ kf kq und Lp ⊃ Lq .
Beweis: Jensen angewandt auf die konkave Funktion x 7→ xp/q , x ≥ 0 ergibt
kf kp =
Z
|f |
p
1/p
Z
≤
|f |
pq/p
p/qp
= kf kq .
Die erste Aussage impliziert die zweite Aussage.
q.e.d.
Bemerkung Sei 1 ≤ p < ∞. Sei L∗p der Dualraum, d.h. der Raum der linearen und
stetigen Funktionale auf Lp . Der Satz von Fischer-Riesz besagt L∗p = Lq mit 1/p
+ 1/q = 1.
R
Für jedes lineare stetige Funktional B : Lp → IR gibt es ein g ∈ Lq mit B(f ) = f gdµ.
⊃
Warnung: Im allgemeinen gilt L∗∞ 6= L1 .
Hilberträume Besonders wichtig sind die L2 -Räume, da sie Hilberträume sind.
42
WS10/11
U. Rösler
Lemma 54 L2 versehen mit der Bilinearform
< f, g >:=
und der Norm
√
Z
f g dµ
< f, f > = kf k2 ist ein Hilbertraum.
Hilberträume sind selbstdual. Jeder Hilbertraum hat eine Orthonormalbasis. Hilberträume
mit gleicher Kardinalität der Orthonormalbasis sind isomorph. Hilberträume mit vorgegebener Basiskardinalität lassen sich über Zählmaße konstruieren. (D eine Menge, µ(A) = |D ∩ A|
11d , d ∈ D bildet Orthonormalbasis mit der gleichen Kardinalität wie D. ) Die Separabilität
eines Hilbertraumes ist äquivalent zur Existenz einer höchstens abzählbaren Basis.
Die Hilberträume sind genau die L2 -Räume.
⊃
Warnung: Im allgemeinen gilt L∗∞ 6= L1 .
Die Hilberträume sind genau die L2 -Räume.
43
WS10/11
44
Maßtheorie
Kapitel 6
Konvergenz und Topologie
Wir betrachten verschiedene Konvergenzarten auf dem Raum der Maße und auf dem Raum
der Zufallsgrößen.
Beachte, daß fast jede Konvergenzart eine Konvergenz im topologischen Sinne ist und
umgekehrt, (Pedersen [9]). (Ein topologischer Raum ist ein Tupel (E, τ ), wobei E eine Menge
ist und τ eine Teilmenge der Potenzmenge ist, die E enthält und abgeschlossen ist bezüglich
endlichem Durchschnitt und beliebiger Vereinigung. Eine Folge en ∈ E, n ∈ IN, konvergiert
gegen e ∈ E, falls für alle U ∈ τ mit e ∈ U es ein n0 gibt, sodaß für alle n ≥ n0 gilt en ∈ U.)
Die fast sichere Konvergenz ist eine Aussnahme, dies ist keine topologische Konvergenzart.
6.1
Konvergenz von W-maßen
R
Für ein Maß µ und eine Funktion f benutzen wir µ(f ) := f dµ, falls dies wohldefiniert ist.
Eine Folge µn von Maßen konvergiert bzgl. einer Klasse F von Funktionen, falls für alle
f ∈ F gilt
µn (f ) →n µ(f ).
K
Notation: µn →n µ.
Die zugehörige Topologie wird erzeugt von den Mengen
Z
Z
Uǫ,f (µ) := {ν | f dν − f dµ < ǫ},
ǫ > 0, f ∈ F.
Für F bestehend aus den Treppen 11A , A ∈ A, erhalten wir die punktweise Konvergenz
von Maßen.
Ab jetzt sei (Ω, τ ) ein topologischer Raum. Wir sprechen von schwacher Konvergenz
für die Konvergenz bezüglich aller stetigen beschränkten Funktionen.
C
w
d
Notation: µn →n µ oder µn →n µ oder µn →bn µ. Hierbei steht w für weak , d für distribution und Cb für die Funktionenklasse. (Die W-theoretische schwache Konvergenz ist die
funktionalytische schwach* Konvergenz.)
Wir sprechen von vager Konvergenz für die Konvergenz bzgl. allen stetigen Funktionen
mit kompaktem Träger. (Der Träger supp(f ) einer Funktion ist die kleinste abgeschlossene
Menge f 6= 0 enthaltend.)
v
Notation: µn →n µ.
45
WS10/11
Maßtheorie
Eine Familie M von Maßen heißt straff, falls es für alle ǫ > 0 eine kompakte Menge K
gibt mit µ(K c ) ≤ ǫ für alle µ ∈ M.
Lemma 55 Eine Folge von W-maßen konvergiert schwach genau dann, wenn sie vage konvergiert und die Familie straff ist.
d
v
µn →n µ ⇔ µn →n µ und {µn , n ∈ IN } straff.
Beweis: ⇒‘ Sei K ein kompaktes Intervall und Kǫ := {x ∈ IR | ∃y ∈ K : |x − y| ≤ ǫ}. Es
’
gibt eine stetige Funktion f, die auf dem Kompaktum K stets 1 ist, außerhalb von Kǫ stets
0 und ansonsten von unten durch 0, von oben durch 1 beschränkt ist (Lemma von Urysohn,
[3]). Es gilt
µn (Kǫc ) ≤ µn (1 − f ) →n µ(1 − f ) ≤ µ(K c ).
Wählen wir K mit µ(K) ≥ 1 − ǫ so gilt µn (Kǫc ) < ǫ bis auf endlich viele n. Wir vergrößern
K entsprechend, um die restlichen n’s mit einzuschließen.
⇐‘ Sei g stetig, beschränkt, und f, K wie oben. Argumentiere g = f g + (1 − f )g,
’
|µn (g) − µ(g)| = |µn (f g) − µn (f g)| + |µn ((1 − f )g) − µ((1 − f )g)|.
Der erste Term wird klein für n hinreichend groß. Der zweite Term wird abgeschätzt durch
≤ kgk∞ (µn (K c ) + µ(K c )) und klein für K hinreichend groß.
q.e.d.
Beispiel: µn = δn auf den reellen Zahlen konvergiert vage (gegen Null), aber nicht
schwach.
Für eine Verteilungsfunktion F sei F −1 die linksstetige Inverse
F −1 (u) := inf{x | F (x) ≥ u}.
Lemma 56 Seien µ, µn , n ∈ IN, W-maße auf den reellen Zahlen. Äquivalent sind die Aussagen
i) Die Folge µn konvergiert schwach gegen µ.
ii) Die Folge konvergiert bezüglich einer der Klassen Cc , Cb∞ , Cc∞ .
iii) Die zugehörigen Verteilungsfunktionen Fn konvergieren gegen F für alle Stetigkeitspunkte
von F.
iv) Die Inversen Fn−1 konvergieren gegen F −1 für alle Stetigkeitspunkte von F −1 .
Beweis: i) ⇔ ii). Konvergenz bzgl. Cb ist hier gleichbedeutend, Lemma 55, mit Konvergenz
bzgl. Cc . Jede Funktion aus Cc läßt sich in Supremumsnorm beliebig gut durch eine Cc∞
Funktion approximieren. Dies reicht.
i)⇒ iii) Sei fa diejenige stetige Funktion,die 1 auf (−∞, a], 0 auf [a + ǫ, ∞) und sonst
linear ist. Es gilt
F (a − ǫ) ≤ µ(fa−ǫ ) ←n µn (fa−ǫ ) ≤ Fn (a) ≤ µn (fa ) →n µ(fa ) ≤ F (a + ǫ).
Anders geschrieben,
F (a − ǫ) ≤ lim inf Fn (a) ≤ lim sup Fn (a) ≤ F (a + ǫ).
n
n
Dies gilt für alle ǫ > 0.
46
WS10/11
U. Rösler
iii) ⇐ i) Die Menge S der Stetigkeitspunkte von F ist dicht. (Eine monoton steigende
Funktion hat höchstens abzählbar viele Unstetigkeitspunkte und ides sind Sprungstellen.)
Betrachte die Menge aller meßbarer beschränkter Funktionen f mit µn (f ) →n µ(f ). Diese
Menge ist abgeschlossen bzgl. Addition und gleichmäßiger Konvergenz. Sie enthält alle Treppen 11(−∞,s] mit s ∈ S ein Stetigkeitspunkt. Die Menge enthält alle stetigen Funktion mit
kompaktem Träger, da diese sich gleichmäßig durch Treppenfunktionen obiger Treppen approximieren lassen. Folglich konvergiert µn vage. Zusammen mit Straffheit der Folge, siehe
gleich, folgt schwache Konvergenz.
• µn , n ∈ IN, ist straff.
Wähle Stetigkeitspunkte s1 , s2 mit F (s1 ) < ǫ, F (s2 ) > 1 − ǫ. Für K = [s1 , s2 ] gilt
µn (K c ) ≤ Fn (s1 ) + 1 − Fn (s2 ) →n F (s1 ) + 1 − F (s2 ) < 2ǫ.
Daher gilt µn (K c ) < 2ǫ bis auf endlich viele n. Wir vergrößern jetzt K entsprechend, um
diese n mit einzuschließen.
iii) ⇔ iv) Dies ist einfach für F stetig und strikt steigend. Der allgemeine Fall ist eine
unschöne Übung.
q.e.d.
Eine Familie F von Funktionen heißt separabel oder trennend bzgl. einer Familie M
von Maßen, falls je zwei Maße aus der Familie sich für mindestens eine Funktion f aus der
Funktionenfamilie unterscheiden. (∀µ 6= ν ∈ M∃f ∈ F : µ(f ) 6= ν(f ).)
Cc ist W-maß trennend, Lemma 56 und Eindeutigkeit der Verteilungsfunktion.
6.1.1
Gleichgradige Integrierbarkeit
Gleichgradige Integrierbarkeit ist eine Eigenschaft von Maßen. Wir werden die w-theoretische
Sprache mit Zgn verwenden.
Eine Familie F von Zgn heißt gleichmäßig integrierbar oder gleichgradig integrierbar, falls
gilt
Z
g(c) := sup
X∈F
{|X|>c}
|X|dP −→c→∞ 0.
Für eine Funktion f heißt die Familie F gleichmäßig f -integrierbar oder gleichgradig f integrierbar, falls die Familie f (X), X ∈ F gleichmäßig integrierbar ist. Eine Familie F von
Zgn heißt p-gleichmäßig integrierbar 1 ≤ p < ∞, oder gleichmäßig p-integrierbar , falls
sie gleichgradig f -integrierbar ist für die Funktion f (x) = |x|p .
Bem: Gleichgradige Integrierbarkeit ist eine Eigenschaft der Verteilungen der Zgn und
hängt nicht von der Realisation der Zgn ab.
Bem: Eine Familie gleichgradig integrierbarer Zgn erfüllt stets supX E|X| ≤ c+g(c) < ∞.
Für eine Zg X definiere H = HX : [0, 1] 7→ IR
Z
HX (t) := sup{
A
|X|dP | P (A) ≤ t}.
Für eine Familie F von Zgn benutzen wir
HF (t) := sup HX (t).
X∈F
Falls der W-raum reichhaltig genug ist und eine gleichförmig verteilte Zg besitzt, (was wir
stets annehmen,) so gilt
HX (t) =
Z
1
1−t
47
F −1 (u)du,
WS10/11
Maßtheorie
mit F die Verteilungsfunktion zu |X|. (Übung)
Satz 57 Für eine Familie F von Zgn sind die folgenden beiden Aussagen äquivalent:
(i) F ist gleichgradig integrierbar.
(ii) Für alle ǫ > 0 gibt es eine integrierbare Zg Y mit supX∈F
(iii) HF : [0, 1] → IR ist stetig in 0.
R
|X|>Y
|X|dP < ǫ.
(iv) Es gibt eine aufsteigende Funktion ϕ : IR+ → IR+ mit limx→∞
gleichgradig ϕ| · |-integrierbar.
ϕ(x)
x
= ∞ und F ist
Beweis: i)⇒ ii) Wähle Y als eine Konstante.
ii) ⇒ iii) In der Zerlegung
Z
A
|X| =
Z
A∩{|X|>Y }
|X| +
Z
A∩{|X|≤Y }
|X| ≤
Z
|X|>Y
|X| +
Z
A
|Y |
ist der erste Term klein durch Wahl des Y glm. in X. Der zweite Term ist klein in P (A) klein
glm. in X.
iii) ⇒ i) Zu vorgegebenem ǫ > 0 wähle ein p > 0 mit HF (p) < ǫ. Wähle eine Partition
1
(Ai )N
i=1 von Ω in N ≤ p + 1 Mengen vom Maß ≤ p. Dann gilt gleichmäßig in X ∈ F
Z
|X| ≤
Z
∪i A i
|X| ≤
XZ
i
Ai
|X| ≤ HF (p)N < ∞.
Die Markoffungleichung liefert
sup P (|X| > c) ≤ sup
X
X
R
ǫN
|X|
≤
→c→∞ 0
c
c
Es folgt
sup
X
Z
|X|>c
|X| ≤ sup HX (P (|X| > c) ≤ sup HF (P (|X| > c) ≤ HF (sup(P (|X| > c)) →c→∞ 0
X
iv) ⇒ i)
Z
|X|>c
X
|X| =
Z
|X|>c
X
|x|
|X|
ϕ(|X|) ≤ sup
Eϕ(|X|).
ϕ(|X|)
x≥c ϕ(|x|)
Der erste Faktor konvergiert mit c → ∞ gegen 0 glm. in X ∈ F und der zweite ist endlich
gleichmäßig für X ∈ F.
i) ⇒ iv) Wähle aufsteigende Folge 0 = e0 < en →n ∞ mit g(en ) ≤ 2−n . Definiere die
P
Funktion ϕ durch ϕ(x) = n∈IN0 (|x| − en )+ . ϕ ist symmetrisch und auf IR+ strikt monoton
steigend gegen unendlich. Es gilt
X
X (x − en )+
ϕ(x)
(x − en )+
lim inf
= lim
≥
= n0 →n0 ∞
x→∞ x
x
x
x
x
n
n≤n
lim
0
48
WS10/11
U. Rösler
Zu vorgegebenem n0 sei c gross mit ϕ(en0 ) < c
Z
XZ
ϕ(|X|) =
ϕ|X|>c
n
ϕ(|X|)>c
X Z
≤
(|X| − en )+
+
n≥n0 |X|>en0
X Z
≤
n≥n0 |X|≥en
X
≤
2−n +
(|X| − en ) +
|Xn | +
X
n<n0
n≥n0
X
X Z
n<n0 ϕ(|X|)>c
|X|
g(ϕ−1 (c))
n<n0
g(ϕ−1 (c)) →c→∞ 0
gleichmäßig für X ∈ F.
q.e.d.
Bemerkung: Die hier konstruierte Funktion ϕ ist eine Orlicz Funktion (ϕ ist positiv, konvex und ϕ(0) = 0). Zusätzlich ließe sich ϕ glatt wählen, eventuell unendlich oft differenzierbar
und ϕ(x) > 0 für x > 0.
Der wesentliche Einsatz gleichgradiger Integrierbarkeit besteht in folgendem Lemma.
Lemma 58 Die Folge (Xn )n konvergiere in Verteilung
gegen X∞
. . Dann ist gleichgradige
R
R
Integrierbarkeit der Familie Xn , n ∈ IN äquivalent zu |Xn | →n |X| < ∞.
Bew: Hinrichtung: Sei stets c ∈ IR.
R
R
• |X| ≤ lim inf n |Xn | < ∞
Z
|X| ∨ c = lim
n
Z
|Xn | ∨ c ≤ lim inf
n
Mit dem Grenzwert c → ∞ folgt die Teilbehauptung.
R
R
• lim supn |Xn | ≤ |X|
Z
|X| ≥
Z
|X| ∨ c = lim
n
Z
|Xn | ∨ c = lim(
n
≥ lim sup
n
Z
Z
|Xn | −
|Xn | − lim sup
n
R
Z
R
Z
Z
|Xn |
(|Xn | − c)+
(6.1)
(|Xn | − c)+ ) ≥ lim sup
n
Z
|Xn | − g(c)
(6.2)
R
Mit c → ∞ erhalten wir lim sup |Xn | ≤ |X| ≤ lim inf |Xn | und damit die Hinrichtung.
Für die Rückrichtung verwenden wir die Funktion gc mit gc (x) = 11x≥c +(x−c+1)11c−1≤x<c .
Z
|Xn |>c
|Xn |
=
Z
≤
|
Z
+|
|Xn | −
Z
|Xn | −
Z
|Xn |≤c
Z
|Xn |
|X|| + |
gc (|Xn |) −
Z
Z
|X| −
gc (|X|)| +
=: I + II + III + IV + V
Z
Z
|X| ∨ c| + (
Z
|Xn |≤c
|Xn | −
Z
gc (|Xn |))
gc (|X|)
Zu vorgegebenem ǫ gibt es ein c0 und ein n0 so, dass für alle n ≥ n0 jeder der Terme kleiner
als ǫ/5 wird. Zu jedem festen n < n0 gibt es ein cn so, dass die linke Seite kleiner als ǫ wird.
Dann folgt mit c = sup0≤i<n0 die gewünschte Aussage g(c) < ǫ.
49
WS10/11
Maßtheorie
Korollar 59 Sei Xn , n ∈ IN eine gegen X in Verteilung konvergierende Folge von Zgn. Ist
die Familie (Xn )n gleichgradig integrierbar, so vertauschen für jede stetige Funktion f mit
lim sup
|x|→∞
das Integral und der Limes,
lim
n
Z
|f (x)|
<∞
|x|
f (Xn ) =
Z
(6.3)
f (X).
Bew: Die Familie f (Xn ), n ∈ IN ist gleichgradig integrierbar und konvergiert in Verteilung.
q.e.d.
Das folgende Korollar ist eine W-theoretische Aussage.
Korollar 60 Die L1 -Konvergenz einer Folge (Xn )n von Zgn ist äquivalent zur stochastischen Konvergenz und gleichgradiger Integrierbarkeit. Beide Grenzwerte stimmen fast sicher
überein.
Bew: Hinrichtung: Die L1 -Konvergenz impliziert stochastische Konvergenz und diese Konvergenz in Verteilung. Das obige Lemma liefert wegen kXn k → kXk1 die gleichgradige Integrierbarkeit.
Für die Rückrichtung argumentiere
Z
|Xn − X| ≤
Z
|X−Xn |<ǫ
... +
Z
ǫ≤|X−Xn |<c
≤ ǫ + cP (|X − Xn | ≥ ǫ) + 2
Z
... +
Z
|Xn |<c/2
c≤|X−Xn |
|Xn | + 2
...
Z
|X|>c/2
|X|
alle drei Terme werden beliebig klein für kleine ǫ, große c und n hinreichend groß.
q.e.d.
Korollar 61 Seien Xn , n ∈ IN , p-integrierbare Zgn, 1 ≤ p < ∞. Dann sind äquivalent
• Xn konvergiert in Lp .
• Xn → X stochastisch und kXn kp → kXkp < ∞.
• Xn konvergiert stochstisch und die Familie Xn , n ∈ IN ist gleichgradig p-integrierbar.
Im Konvergenzfalle sind der stochastische und der Lp -Limes gleich.
Der Beweis ist einfach aus Obigem.
..........................................................................
6.1.2
Weitere Metriken
Metriken für Verteilungsfunktionen: Weitere Metriken lassen sich aus den Verteilungsfunktionen konstruieren. Hintergrund ist die eineindeutige Zuordnung von Maßen und Verteilungsfunktionen. Beispiele auf dem Raum der Verteilungsfunktionen sind
d(F, G) := kF − Gk∞
d(F, G) = inf {ǫ | ∀x ∈ IR : |F (x) − G(x + ǫ)| < ǫ und |F (x) − G(x − ǫ)| < ǫ}
50
WS10/11
d(F, G) =
Z
U. Rösler
|F (x) − G(x)|dx.
Diese Metriken auf den Verteilungsfunktionen sind auch Metriken auf W-maßen, durch Identifizierung von Verteilungsfunktion und W-maß. (d(µ, ν) = d(Fµ , Fν ).)
Wasserstein Metrik: Sei d eine Metrik auf dem Werteraum E und µ, ν W-maße auf
(E, B(E)). Definiere
D(µ, ν) := inf Ed(X, Y ).
Hierbei wird das Infimum über alle X mit Verteilung µ und alle Y mit Verteilung ν auf einem
beliebigen W-raum genommen. Dies ist eine Metrik auf dem Raum der W-maße.
Mallows Metrik: Ein Abstandsbegriff für Maße impliziert in natürlicher Weise einen
Abstandsbegriff für Zgn via der Verteilung. Umgekehrt, haben wir einen Abstandsbegriff d
für Zufallsgrößen gegeben, so definieren wir einen (potentiellen) Abstandsbegriff d auf Maßen
durch
d(µ, ν) := inf d(X, Y ).
Hierbei wird das Infimum über alle X mit Verteilung µ und alle Y mit Verteilung ν auf einem
beliebigen W-raum genommen.
Ein Beispiel ist die Mallows Metrik lp : Mp × Mp 7→ IR, 1 ≤ p ≤ ∞,
lp (µ, ν) = inf kX − Y kp
R
auf dem Raum Mp := {µ | |x|p µ(dx) < ∞} der p-fach integrierbaren Maße auf IR. Ohne
Beweis sei angeführt, das Infimum wird angenommen mit
lp (µ, ν) = kFµ−1 (U ) − Fν−1 (U )kp ,
U eine gleichförmig verteilte Zg (siehe [2]).
Satz 62 Der Raum (Mp , lp ), 1 ≤ p ≤ ∞, ist ein vollständiger, metrischer Raum. Er ist
separabel für 1 ≤ p < ∞.
Beweis: • Separabilität.
Sei D eine dichte abzählbare Teilmenge in Lp . Dann ist die Menge aller Verteilungen dazu
dicht in Mp .
• Vollständigkeit.
(U ), U
Für die Vollständigkeit sei µn eine Cauchyfolge in lp -Mallow Metrik. Dann ist Fµ−1
n
−1
gleichförmig verteilt, eine Lp -Cauchyfolge. Diese konvergiert punktweise gegen ein F (U ).
Das zugehörige W-maß µ tut’s.
q.e.d.
Eine Folge Xn ist lp konvergent, falls die Verteilungen in Mallows lp Metrik konvergieren.
lp
Notation: Xn →n X.
Proposition 63 lp Konvergenz ist äquivalent zur schwachen Konvergenz plus Konvergenz
des p-ten absoluten Momentes. (=p-gleichmäßige Integrierbarkeit.)
Beweis: Wir benutzen die Version Fn−1 (U ) = Xn und d(Fn , Fm ) = kFµ−1 (U ) − Fν−1 (U )kp .
Dann verwende den Satz 65.
Bemerkung: Beachte auch die gleichmäßige Integrierbarkeit, Korollar ??.
51
WS10/11
6.2
Maßtheorie
Konvergenz von Zufallsgrößen
Konvergenzen der Verteilungen: Viele Eigenschaften übertragen sich von den Verteilungen nach folgendem allgemeinen Prinzip: Eine Folge, bzw. Familie von Zgn Xn hat die
Eigenschaft ∗, falls die zugehörigen Verteilungen die Eigenschaft ∗ besitzt. In diesem Sinne
sprechen wir von schwacher und vager Konvergenz oder von einer straffen Familie von
Zgn. Wir verwenden dieselben Symbole, z.B.
d
d
Notation: Xn → X ⇔ P Xn → P X .
Konvergenzen der Zgn: Nun zu Konvergenzarten der Zgn selbst. Eine Folge Xn , n ∈ IN,
von Zgn konvergiert stochastisch oder in Wahrscheinlichkeit gegen eine Zg X, falls
lim P (|Xn − X| > ǫ) = 0
n
s
P
für alle ǫ > 0 gilt. Wir schreiben Xn →n X oder Xn →n X. s steht für stochastic und P für
probability.
Diese Konvergenz entspricht Konvergenz bzgl. der Topologie auf den Zgn erzeugt durch
die Metrik
d1 (X, Y ) := inf{ǫ ∈ IR | P (|X − Y | > ǫ) < ǫ}
oder der Metrik
d2 (X, Y ) := E(
|X − Y |
).
1 + |X − Y |
Eine Folge Xn von Zgn konvergiert fast sicher, falls
P (lim Xn = X) = 1
n
gilt.
f.s.
Notation: Xn →n X.
Eine Folge Xn ist Lp konvergent bzw. konvergiert im p-ten Mittel, 1 ≤ p ≤ ∞, gegen X,
Lp
falls kXn − Xkp →n 0. Wir schreiben Xn →n X und sprechen auch von Konvergenz im p-ten
Mittel.
Hier eine Übersicht. p-te Moment steht für Konvergenz des p-ten absoluten Moments.
52
WS10/11
U. Rösler
L∞
❅
❅
❅
❅
❘
❅
Lp , 1 ≤ p < ∞
✻
+ p-te Moment
✠
+ 1-te Moment
fast sicher
■
❅
❅
✲
❄
L1
✛
❅
❅
Version
❅
❅
❅
✒
Version
❅
❅
❅
+ 1-te Moment
❅
❘
❅
✠
stochastisch
✻
✻W-theorie
❄Maßtheorie
Version
❄
schwach
✻
straff
❄
vage
Satz 64
Der Beweis erfogt in einer Reihe von Aussagen.
• Stochastische Konvergenz impliziert schwache Konvergenz.
v
Wir zeigen zuerst Xn → X. Sei f ∈ Cc .
|Ef (Xn ) − Ef (X)| ≤ E(|f (Xn ) − f (X)|(11|Xn −X|≥ǫ + 11|Xn −X|<ǫ ))
≤ 2kf k∞ P (|Xn − X| ≥ ǫ) + sup |f (x) − f (y)|.
|x−y|<ǫ
Der erste Term ist klein für n groß, der zweite ist klein in ǫ, da eine stetige Funktion auf
einem Kompaktum gleichmäßig stetig ist.
Als nächstes zeigen wir Straffheit.
P (|Xn | > c) ≤ P (|Xn | > c, |Xn − X| < ǫ) + P (|Xn | > c, |Xn − X| ≥ ǫ)
≤ P (|X| > c − ǫ) + P (|Xn − X| ≥ ǫ).
Beide Terme sind klein für ǫ, c, n geeignet.
• Fast sichere Konvergenz impliziert stochastische Konvergenz.
P (|Xn − X| > ǫ) ≤ P ({∃N ≥ n : |XN − X| > ǫ}) →n 0.
53
WS10/11
Maßtheorie
• L1 -Konvergenz impliziert stochastische Konvergenz.
Dies folgt aus der Markoff Ungleichung
E|Xn − X|
→n 0.
ǫ
• Lq -Konvergenz impliziert Lp -Konvergenz für 1 ≤ p ≤ q ≤ ∞.
Die Jensen Ungleichung ergibt kY kp ≤ kY kq .
• L∞ -Konvergenz impliziert fast sichere Konvergenz. Einfach.
Gegenbeispiele: Alle Beispiele sind auf dem W-raum ([0, 1], B, λ).
• Schwache Konvergenz impliziert nicht stochastische Konvergenz.
Seien Xn , n ∈ IN, uiv Zgn und keine Konstante. Diese Folge konvergiert schwach. Würde sie
auch stochastisch konvergieren, so würde gelten,
P (|Xn − X| > ǫ) ≤
P (|Xn − Xm | > ǫ) ≤ P (|Xn − X| > ǫ/2) + P (|Xm − X| > ǫ/2) →n,m 0.
Andererseits P (|Xn − Xm | > ǫ) = P (|X1 − X2 | > ǫ) > 0 ist eine strikt positive Konstante für
n 6= m und ǫ hinreichend klein. Widerspruch.
• Stochastische Konvergenz impliziert nicht fast sichere Konvergenz.
X1 = 11[0,1] , X2 = 11[0,1/2] , X3 = 11[1/2,1] , X4 = 11[0,1/4] , X5 = 11[1/4,1/2] , ..., X8 = 1[0,1/8] , ... usw.
Formaler Xn := 11[i/2m ,(i+1)/2m ] mit n = 2m + i, 0 ≤ i < 2m . (Zeichnung machen!). Diese
tut’s.
• Lp -Konvergenz, 1 ≤ p < ∞ impliziert nicht fast sichere Konvergenz.
Siehe oben.
• Fast sichere Konvergenz impliziert nicht Lp -Konvergenz.
Die Folge Xn := an 11[0,1/n] konvergiert fast sicher gegen 0, aber nicht in Lp für geeignet
gewählte an .
• Lp -Konvergenz impliziert nicht Lq -Konvergenz, 1 ≤ p < q ≤ ∞.
P
Wähle eine Folge Xn = ni=1 11( 1 , 1 ] ai mit ai geeignet. Übung.
i+1 i
Nun zu den verbleibenden positive Aussagen mit Zusatzbedingungen.
Version: Eine Version einer Zg ist eine Zg mit derselben Verteilung. Beliebt ist folgende
Konstruktion. Sei U eine Zg mit gleichmäßiger Verteilung auf [0, 1]. Dann ist F −1 (U ) eine
Version von X. Übung.
• Sei Xn schwach konvergent gegen X. Dann existiert eine Version Yn der Xn mit Yn ist
fast sicher konvergent gegen eine Version von X.
Seien Fn , F die zugehörigen Verteilungsfunktionen und U eine gleichmäßig verteilte Zg. Dann
tut’s die Folge Yn = Fn−1 (U ). Die Aussage beruht auf Lemma 56. (F bzw F −1 hat höchstens
abzählbar viele Unstetigkeitspunkte.)
q.e.d.
Bemerkung: Schwache und stochastische Konvergenz stimmen überein für Zgn Xn , die
gegen eine Konstante konvergieren. Auf diskreten W-räumen stimmen stochastische Konvergenz und fast sichere überein.
Teilfolgenprinzip: Jede stochastisch konvergente Folge hat eine fast sicher konvergente
Teilfolge. Der Grenzwert ist derselbe. (Übung)
Den folgenden Satz vergleiche mit dem Korollar ??.
Satz 65 Seien Xn , n ∈ IN , p-integrierbare Zgn, 1 ≤ p < ∞. Xn konvergiert in Lp gegen X
genau dann, wenn Xn stochastisch gegen X konvergiert und kXn kp → kXkp < ∞ gilt.
Lp
s
Xn → X ⇔ Xn → X und kXn kp →n kXkp < ∞.
54
WS10/11
U. Rösler
Beweis: ⇒‘ Lp Konvergenz impliziert stochastische Konvergenz. Die umgekehrte Dreiecksun’
gleichung liefert
|kXn kp − kXkp | ≤ kXn − Xkp →n 0.
⇐‘ Sei A die Menge |Xn − X| > ǫ konvergiert mit n dem Maße nach gegen 0.
’
kXn − Xk ≤ k(Xn − X)11A k + kXn − X11Ac k
≤ kXn 11A k + kX11A k + ǫ
≤ kXn k − kXn 11Ac k + kX11A k + ǫ
≤ kXn k − kX11Ac k + kX11A k + 2ǫ
≤ kXn k − kXk + 2kX11A k + 2ǫ →n 2ǫ →ǫ→0 0
55
WS10/11
56
Maßtheorie
Kapitel 7
Radon-Nikodym Dichte
Ein Maß ν heißt absolut stetig bezüglich µ, falls die µ-Nullmengen auch ν-Nullmengen sind.
Wir sprechen auch von µ dominiert ν dominiert.
Notation: µ << ν.
Für ein Maß µ und eine positive meßbare Funktion f definiere das Maß ν durch
A ∋ A 7→ ν(A) =
Z
f dµ.
A
dν
. Die Funktion f heißt Radon-Nikodym
Wir schreiben ν = f µ oder dν = f dµ oder auch f = dµ
Ableitung oder Radon-Nikodym Dichte von ν bzgl. µ. Das Maß ν ist absolut stetig bzgl. µ.
Quasi die Umkehrung obigen Beispiels ist der Satz von Radon-Nikodym.
Satz 66 (Radon-Nikodym) Seien µ, ν σ-endliche Maße. Dann ist ν absolut stetig bzgl. µ
dν
. Diese ist µ f.s. eindeutig.
äquivalent zur Existenz einer Radon-Nikodym Ableitung f = dµ
Die σ-Endlichkeit ist wichtig, wie das Beispiel ν das Lebesguemaß und µ das Zählmaß zeigt.
Zwei Maße µ, ν heißen singulär zueinander oder orthogonal, falls es eine meßbare Menge
A gibt mit µ(A) = 0 und ν(Ac ) = 0. Notation: µ⊥ν.
Die Orthogonalität ist symmetrisch, die absolute Stetigkeit jedoch nicht.
Satz 67 (Lebesgue) Seien µ, ν σ-endliche Maße. Dann ist ν eindeutig darstellbar als die
Summe eines zu µ absolut stetigen Maßes νc und eines zu µ orthogonalen Maßes ν⊥ .
Die obigen Sätze werden wir für endliche Maße beweisen und dann mit Hilfe der σ-Endlichkeit
standardmäßig ausdehnen. (Dies überschlagen wir.) Zur Wiederholung, ein Maß heißt σendlich, falls es eine gegen Ω aufsteigende Folge (An )n von Mengen endlichen Maßes gibt.
Verwendet wird gerne die äquivalente Bedingung, es gibt eine Partition Bn , n ∈ IN, von Ω in
Mengen endlichen Maßes. Die Äquivalenz ersieht man aus ∪ni=1 Bn = An (bzw. Bn = An \An−1
mit A0 = ∅). Viele Sätze über endliche Maße lassen sich auch für σ-endliche Maße zeigen,
P
indem man µ(·) = n µ(Bn ∩ ·) benutzt oder einen Grenzwert µ(·) = limn µ(An ∩ ·) benutzt.
7.1
Hahn-Jordan Zerlegung∗
Lemma 68 Sei λ die Differenz µ − ν zweier endlicher Maße. Dann gibt es zueinander orthogonale endliche Maße λ+ , λ− mit λ = λ+ − λ− . Die Zerlegung ist eindeutig.
57
WS10/11
Maßtheorie
S
S
Ferner gibt es eine µ + ν eindeutige Partition A+ ◦ A0 ◦ A− = Ω so dass für alle A,die
keine (µ + ν)-Nullmengen sind, gilt
λ(A) =


 >0
falls
=0

 <0
A ∈ A+
A ∈ A0
A ∈ A−
Beweis: Das Supremum α aller Werte λ(A), A ∈ A, ist endlich. Sei An ∈ A eine Folge
P
meßbarer Ereignisse mit λ(An ) ≥ α − ǫn und n ǫn < ∞. Setze A := lim inf n An = ∪m ∩n≥m
An . Dann tun’s λ+ , λ− als Einschränkungen von λ auf A bzw. Ac .
M := T
Die Folge Bm
m≤n≤M An , m ≤ M ∈ IN, ist monoton fallend in M bei festem m
∞ und diese ist monoton steigend in m gegen A.
gegen eine Menge Bm
M ) ≥ α − PM
• λ(Bm
n=m ǫn für alle m, M ∈ IN.
Dies ergibt sich durch Induktion nach M für festes m. Der Induktionsanfang ist trivial.
Der wesentliche Induktionsschritt folgt aus
λ(B ∩ C) = λ(B) + λ(C) − λ(B ∪ C) ≥ λ(B) + λ(C) − α.
Der Rest ist standard.
∞) ≥ α − P
• λ(Bm
n≥m ǫn .
Verwende den Satz über monotone Konvergenz.
• λ(A) = α
Verwende erneut monotone Konvergenz.
• λ(B) ≤ 0 für alle B ⊂ Ac und λ(C) ≥ 0 für alle C ⊂ A.
S
Ansonsten wäre λ(A ◦ B) > α oder λ(A\C) > α
• λ+ ≤ µ, λ− ≤ ν.
Einfach.
• Eindeutigkeit. Einfach, wird überschlagen.
Sei M = {A ∈ A | λ(A) = α} und β = supA∈M (µ + ν)(A).
• M ist abgeschlossen bzgl. Infimum und Supremum.
Folgt aus
λ(B ∩ C) + λ(B ∪ C) = λ(B) + λ(C)
und der Definition von α.
• β wird angenommen durch ein µ + ν eindeutiges bestimmtes Ω+ ∈ M.
Nehme Folge An ∈ M mit absteigendem µ+ν-Maß. OEdA können wir An selbst absteigend
wählen. Der Grenzwert Ω+ tut es.
• Für A ⊂ Ω+ keine (µ + ν)-Nullmenge gilt λ(A) > 0.
Leicht.
Definiere Ω− entsprechend für ν − µ und Ω0 := Ωc+ ∩ Ωc− . Ω+ , Ω0 , Ω− ist eine meßbare
Partition und es gelten die obigen Aussagen. Die Zerlegung ist eindeutig.
q.e.d.
Def: Die obige Zerlegung des signierten Maßes λ bzw. des Grundraumes heißt HahnJordan Zerlegung .
Lemma 69 Seien µ, ν σ-endliche Maße. Dann gibt es eine µ-fast sicher größte, positive,
meßbare Funktion f mit f µ ≤ ν punktweise. Diese ist µ-fast sicher eindeutig.
58
WS10/11
U. Rösler
Beweis: Wir zeigen das Lemma für µ, ν endliche Maße. Betrachte
F := {f : Ω → IR+ | meßbar, f µ ≤ ν}
R
und α := supf ∈F f dµ. F versehen mit der punktweisen Ordnung und dem punktweisen
Infimum, Supremum ist ein Verband. Der wichtige Punkt ist: f, g ∈ F impliziert f ∨ g ∈ F.
Dies folgt aus, B = {f < g}, A ∈ A
Z
A
f ∨ g dµ =
Z
gdµ +
A∩B
Z
A∩B c
f dµ ≤ ν(A ∩ B) + ν(A ∩ B c ) = ν(A)
• α wird für ein f ∈ F angenommen.
R
Die Menge F ist nicht leer. Sei fn ∈ F eine Folge mit fn dν → α. OEdA sei fn aufsteigend.
(Gehe über zur Folge ∨i≤n fi ∈ F .) Der aufsteigende Grenzwert f der Folge tut’s. Er ist aus
F (Satz von der monotonen Konvergenz)
R
R
Z
f dµ = lim
A
n
Z
A
fn dµ ≤ ν(A)
und A f dµ = limn A fn dµ = α.
R
R
• f ist größte. Waere g ∈ F. So folgt α ≥ f ∨ gdµ ≥ f d mu = α und damit 0 ≤
g ∨ f − f ≤ 0 f.s.
Die Eindeutigkeit folgt aus demselben Grunde.
q.e.d.
Beweis des Lebesgue Satzes: Seien µ, ν endlich und f die maximale Funktion mit
f µ ≤ ν. Dann tun’s νc = f µ und ν⊥ = ν − νc .
Beides sind Maße und νc ist absolut stetig bzgl. µ. Zu zeigen verbleibt ν⊥ ⊥µ.
Betrachte λt := ν⊥ − tµ, Ql ∋ t > 0, und sei Ωt der strikte Positivteil aus der Hahn-Jordan
Zerlegung von λt .
• Die Abbildung Ql> ∋ t 7→ Ωt ist (µ + ν⊥ )-f.s. antiton.
Es reicht zu zeigen s < t ⇒ Ωs ⊃ Ωt µ + ν⊥ f.s.
Die Menge A = Ωt \Ωs erfüllt λs (A) ≥ λt (A). Wäre A keine (µ + ν⊥ )-Nullmenge, so gilt
λt (A) > 0. Dies wäre ein ist ein Widerspruch zur λs -Maximalität von Ωs .
• µ(Ωt ) = 0 für t > 0.
Auf Ωt gilt ν⊥ ≥ tµ und damit ν⊥ ≥ gµ mit g = t11Ωt . Wäre µ(Ωt ) > 0 so wäre ν ≥ (f +g)µ
im Widerspruch zur Maximalität von f.
• ν⊥ (Ωc0 ) = 0
ν⊥ (Ω0 ) = limt→0 ν⊥ (Ωt ) = limt λt (Ω) = λ(Ω) = ν⊥ (Ω)
• Eindeutigkeit
Sei ν = ν1 + ν2 eine weitere Zerlegung, ν1 << µ, ν2 ⊥µ. Auf der µ-Nullmenge Ω0 wie oben
stimmen die beiden Maße ν⊥ und ν2 überein. Auf der Menge Ωc0 gilt ν1 + ν2 = ν = νc << µ.
Folglich ν2 orthogonal und absolut stetig bzgl. µ auf dieser Menge und damit identisch 0.
Damit sind auch νc und ν1 gleich.
Die Ausdehnung von endlichen Maßen auf σ-endliche ist Standard.
q.e.d.
Beweis Radon-Nikodym: Benutze die Lebesgue Zerlegung νc = f µ wie oben. ν⊥ ist
gleichzeitig orthogonal und absolut stetig bzgl. µ. Dies bedeutet ν⊥ ist identisch 0.
Die Umkehrung ist offensichtlich. Anwendung: Mit Hilfe der Radon-Nikodym Dichte
dµ
dν
läßt sich unsere Beweisführung besser verstehen. Seien f = dm
, g = dm
die Radon-Nikodym
Ableitungen zum Referenzmaß m = µ + ν. Dann hat λ = µ − ν die Darstellung λ = f m − gm.
f − g heißt auch Radon-Nikodym Dichte von λ zum Referenzmaß m. Dann sind Ω+ , Ω0 , Ω−
die Mengen f − g strikt größer 0, gleich 0 und strikt kleiner 0.
59
WS10/11
Maßtheorie
Korollar 70 (Radon-Nikodym Bijektion) Sei µ ein σ-endliches Maß. Es gibt eine Bijektion zwischen den endlichen, absolut stetigen Maßen ν bezüglich µ und den Äquivalenzklassen
µ-integrierbarer positiver Funktionen f . Diese Bijektion kann gegeben werden durch die Zuordnung eines Maßes zu der Äquivalenzklasse der Radon-Nikodym Dichte,
[f ] 7→ f µ
Dies ist eine direkte Folgerung aus dem Satz von Radon-Nikodym.
Ein Vektorraumverband ist ein Objekt (V, +, ·, ≤) mit (V, +, ·) ein reeller Vektorraum,
(V, ≤) ein Verband und die algebraische und die Ordnungsstruktur sind verträglich (d.h.
(ax − z) ∨ (ay − z) = a(x ∨ y) und (ax − z) ∧ (ay − z) = a(x ∧ y) für alle x, y, z ∈ V, a ∈ IR+ ).
Folgerung: Sei m ein Maß und V der Raum der m-integrierbaren Funktionen. Dies ist ein
Vektorraumverband. Sei L(m) der Raum der Ladungsverteilungen µ − ν mit µ + ν << m. Die
Abbildung V ∋ f → f m ∈ L(m) ist ein Vektorraumverbandsisomorphismus. Das Supremum
auf M (m) ist definiert durch
λ ∧ ρ = (f ∧ g)m
λ ∨ ρ = (f ∨ g)µ
mit den Radon-Nikodym Ableitungen f, g von λ, ρ bzgl. m.
Ladungsverteilung: Sei M die Menge aller endlichen Maße auf einem meßbaren Raum
(Ω, A). Die Menge
L = M − M = {µ − ν | µ, ν ∈ M }
der Differenzen endlicher Maße heißt Vektorraum der signierten Maße bzw. der Ladungsverteilungen.. Elemente daraus heißen signiertes Maß oder Ladungsverteilung. L ist ein Vektorraumverband. Die Ordnung ist die punktweise Ordnung und das Infimum, Supremum wird
gegeben durch
(ρ ∧ λ)(A) = inf (ρ(B) + λ(A\B))
(ρ ∨ λ)(A) = sup (ρ(B) + λ(A\B))
B⊂A
B⊂A
(Direktes Nachrechnnen oder leichter mit Hilfe der Radon-Nikodym Ableitung.)
Auf dem Raum der Ladungsverteilungen ist die Abbildung k · ktot : V → IR
kλktot := sup (λ(A) − λ(B)).
(7.1)
A,B∈A
eine Norm, ganannt die Totalvariationsnorm. Für ein signiertes Mass λ = µ − µ berechnet
sich diese zu
Z
kλktot =
|f − g|d(µ + µ) = kλ+ ktot + kλ− ktot
mit f, g die Radon-Nikodym Ableitungen von µ, ν bzgl. m = µ + ν. Die Ladungsverteilung λ
eingeschränkt auf Ω+ ist das Maß λ+ = µ − µ ∧ ν bzw. (f − g)+ m.
Bem: Ladungsverteilungen werden manchmal auch eingeführt als Abbildungen λ von
einer σ-Algebra A in die erweiterten reellen Zahlen, die σ-stetig ist. (D.h. für jede aufsteigende
(absteigende) Folge An ∈ A gilt λ(An ) → λ(A).) Hat λ endliche Totalvariationsnorm (7.1) so
ist λ eine Differenz endlicher Maße.
60
WS10/11
7.1.1
U. Rösler
Satz von Fischer-Riesz∗
Sei L∗p (µ) der Raum der stetigen und linearen Abbildungen von Lp in die reellen Zahlen.
Satz 71 (Fischer-Riesz) Sei µ ein σ-endliches Maß. Dann ist L∗p (µ) isometrisch zu Lq (µ)
mit p1 + 1q = 1, 1 < p, q < ∞. Genauer, für jede Abbildung B ∈ L∗p (µ) gibt es ein g ∈ Lq (µ)
R
mit B(f ) = f gdµ und kBk = kgkq .
Beweis: Sei zuerst µ endlich. Die Abbildung λ : A → IR definiert durch λ(A) = B(11A ) hat
eine endliche Totalvariationsnorm,
kλktot := sup (λ(A) − λ(Ac )) ≤ sup(kBkk11A kp + kBkk11Ac kp ) ≤ kBk2µ(Ω) < ∞.
A∈A
A
Die Operatornorm kBk von B ist endlich wegen der Stetigkeit des Operators. Damit ist λ ein
signiertes Maß. Sei λ = λ+ − λ− die Hahn-Jordan Zerlegung. λ+ und λ− sind absolut stetig
relativ zu µ. (Nachrechnen.) Die Funktion
g=
dλ+ dλ−
−
dµ
dµ
tut’s. R
• gf dµ = B(f ) für alle beschränkten f ∈ Lp
Zeige dies erst für eine Treppe, dann für eine positive Treppenfunktion (Linearität), dann
durch Approximation für positive beschränkte f ∈ Lp (σ-Stetigkeit von unten) und schließlich
für beschränkte f ∈ Lp .
• Die Lq -Norm von g ist beschränkt durch die Operatornorm kBk von B.
q
Sei fN := |g|g 11|g|≤N . Dies ist eine beschränkte Funktion, daher in Lp , und es gilt
|kfN kpp | =
Z
|B(fN )| = |
∞ > kBk ≤
Z
|g|q 11|g|≤N dµ
fN gdµ| =
Z
|g|q 11|g|≤N dµ = kg11|g|≤N kqq
|B(fN )|
= kg11|g|≤N kqq−q/p → kgkq
kfN kp
R
• gf dµ = B(f ) für alle f ∈ Lp .
R
R
Die Ausdehnung erfolgt (durch σ-Stetigkeit) auf alle f ∈ Lp da | f gdµ| ≤ |f g|dµ ≤
kf kp kgkq endlich ist.
• kBk ≤ |gkq .
kBk = sup
L∗p
f 6≡0
kf gk1
|B(f )|
≤ sup
≤ kgkq .
kf kp
kf kp
f
• Die Abbildung
∋ B 7→ g ∈ Lq ist wohldefiniert, injektiv und surjektiv.
Leicht.
• OEdA sei µ ein endliches Maß.
Sei An ∈ A, n ∈ IN, eine disjunkte Zerlegung mit µ(An ) < ∞. Sei B ∈ L∗p und fn ∈ Lq
P
die zugehörige Darstellung, eingeschränkt auf die Menge An . Dann tut es f := ∞
n=1 fn 11An .
q.e.d.
61
WS10/11
Maßtheorie
Spezialisierung auf IR : Jedem Radonmaß µ (µ(K) < ∞ für Kompakta K) hatten
wir bijektiv eine aufsteigende und rechtsstetige Funktion F mit F (0) = 0 zugeordnet via
µ((a, b]) = F (b) − F (a). Wir behandeln das Äquivalent für Ladungsverteilungen.
P
Eine Funktion F : IR 7→ IR heißt absolut stetig, falls sup i |F (ti+1 − F (ti )| < ∞ gilt.
Hierbei ist das Supremum über alle Zerlegungen t0 < t1 < . . . < tn genommen.
Proposition 72 Es gibt eine Bijektion zwischen Ladungsverteilungen λ und rechtsstetigen,
absolut stetigen Funktionen F mit F (0) = 0. Diese Bijektion kann durch
λ((a, b]) = F (b) − F (a)
(7.2)
gegeben werden.
Beweis: ⇒ Seien F + , F − die entsprechenden Funktionen für λ+ , λ− . Dann ist die Zuordnung
λ = λ+ − λ− 7→ F + − F − = F
eindeutig.
⇐ Umgekehrt für gegebenes F definiere F via
F (b) := sup
X
i
|F (ti+1 − F (ti )|
Das Supremum ist über alle Zerlegungen 0 = t0 < t< . . . < tn = b bzw. b = t0 < t1 < . . . <
tn = 0. Die Funktion F ist rechtstetig und aufsteigend. Die Funktionen F + := F +F
und
2
F − := F −F
sind aufsteigend und rechtsstetig und erfüllen F = F + − F − . Seien λ+ , λ− die
2
zugehörigen Maße. Wir erhalten die Zuordnung
F = F + − F − → λ+ − λ− =: λ
von Funktionen in Ladungsverteilungen.
7.1.2
q.e.d.
Totalstetig ∗
Ein Maß ν heißt totalstetig bzgl. µ, falls
∀ǫ > 0 ∃δ > 0
∀A ∈ A
µ(A) < δ ⇒ ν(A) < ǫ.
Proposition 73 Ist ν totalstetig bzgl. µ, so ist ν absolut stetig bzgl. µ. Die Umkehrung gilt
für endliche Maße ν.
Beweis: Nur die Umkehrung ist zu zeigen. Sei ν nicht totalstetig bzgl. µ. Dann gibt es ein
P
ǫ > 0 und eine Folge An ∈ A mit ν(An ) > ǫ und µ(An ) →n 0. Wir können n µ(An ) < ∞
annehmen. Die Eigenschaften der Menge A := lim supn An ergeben nun einen Widerspruch.
• ν(A) ≥ ǫ.
S
T
Beachte A = m Bm und Bm := i≥m Ai fällt monoton gegen A. Mit Fatou ν(A) =
ν(limm Bm ) ≥ limm ν(Bm ) ≥ limm ǫ = ǫ.
• µ(A) = 0.
P
q.e.d.
µ(A) = limm µ(Bm ) ≤ limm n≥m µ(An ) = 0.
62
WS10/11
7.2
U. Rösler
Bedingte Erwartungen
Die bedingte W-keit einer Menge A unter B ist P (A | B) = P P(A∩B)
(B) für P (B) > 0. Wie groß
ist die W-keit von A, gegeben die Information ω ∈ B oder nicht. Dies wird beschrieben durch
die Funktion
f = 11B P (A | B) + 11B c P (A | B c )
von Ω → IR. Nehmen wir eine meßbare Partition (Bn )n des Grundraumes, so ergibt sich eine
meßbare Funktion
X
f=
11Bn P (A | Bn )
n
Diese erfüllt
Z
f dP =
B
Z
B
11A dP
für alle B ∈ σ(Bn , n ∈ IN ). Die Interpretation von f ist als die W-keit von A gegeben die
Information der σ-Algebra σ(Bn , n ∈ IN ).
Jetzt die Verallgemeinerung auf allgemeine σ-Algebren. Sei (Ω, A, µ) ein Maßraum und
A0 ⊂ A eine Unter-σ-Algebra. Eine A0 − B meßbare Funktion g : Ω 7→ IR heißt bedingte
Erwartung von f unter A0 , falls gilt
Z
f dµ =
A0
Z
g dµ
(7.3)
A0
für alle A0 ∈ A0 und beide Seiten sind wohldefiniert im Lebesgueschen Sinne.
Notation: E(f | A0 ) oder E A0 (f ).
Satz 74 (Existenz der bedingten Erwartung) Sei A0 ⊂ A eine Unter-σ-Algebra von
A0 und µ ein σ-endliches Maß. Dann existiert die bedingte Erwartung für positive, erweiterte
und meßbare Funktionen f : Ω → IR+ . Sie ist µ fast sicher eindeutig.
Beweis: OEdA sei µ ein endliches Maß. Betrachte für positives und integrierbares f das
endliche Maß ν := f · µ. Seien ν0 , µ0 die Einschränkungen der Maße ν, µ auf (Ω, A0 ). Es gilt
dν0
. Sei erfüllt die definierende
ν0 << µ0 . Dann tut’s die Radon-Nikodym Dichte 70 g = dµ
0
Eigenschaft der bedingten Erwartung
Z
g dµ =
A0
Z
A0
g dµ0 =
Z
A0
dν0 =
Z
dν =
A0
Z
f dµ
A0
Sei jetzt f positiv, erweitert und meßbar. Dann gibt es eine Folge von positiven integrierbaren Funktionen fn , n ∈ IN , die monoton aufsteigend sind gegen f. Dann tut’
E(f | A0 ) = lim E(fn | A0 ).
n→∞
• Wohldefiniertheit.
Da die fn punktweise aufsteigend in n sind, können wir Funktionen E(fn | A0 ) punktweise
aufsteigend in n wählen. (Z.B. wähle erst bedingte Erwartungen E(fn | A0 ) und verwende
dann ∨i≤n E(fi | A0 ) als bedingte Erwartung von fn .)
Der Rest ist nachrechnen.
Z
A0
E(f | A0 )dµ = lim
n
Z
A0
E(fn | A0 )dµ = lim
n
63
Z
fn dµ =
Z
f dµ
WS10/11
Maßtheorie
• Eindeutigkeit
R
Seien g, h bedingte Erwartungen von f und A0 die Menge g > h. Es gilt A0 (g − h)dµ =
R
q.e.d.
A0 (f − f )dµ = 0 und damit µ(A0 ) = 0. Mit Symmetrie foglt g = h.
Die Definition für positive Funktionen erweitern wir zu allgemeinen meßbaren Funktionen.
f hat eine eindeutige Darstellung f = f+ − f− als Differenz des Positivteils f+ = f ∨ 0 und
des Negativteils f− = (−f ) ∨ 0. Setze
E(f | A0 ) = E(f+ | A0 ) − E(f− | A0 )
sofern die rechte Seite f.s. wohldefiniert ist. (Wir muessen ∞ − ∞ vermeiden.)
Satz 75 (Existenz der bedingten Erwartung 2) Sei A0 ⊂ A eine Unter-σ-Algebra von
A und µ ein σ-endliches Maß. Dann existiert die bedingte Erwartung auf L1 (A) und ist eine
positive, additive, skalare, σ-stetige Abbildung von L1 (A) nach L1 (A0 ).
Beweis: Die Aussagen sind leicht bis auf die letzte, die aus dem nächsten Satz folgt. q.e.d.
Mit der bedingten Erwartung können wir umgehen wie mit dem Lebesgueintegral. Insbesonders gelten die Konvergenzsätze und die Standardungleichungen.
Satz 76 Es gelten die drei Konvergenzsätze und die Jensen Ungleichung jeweils µ fast sicher:
• MonotoneR Konvergenz:
fn րn f, R f1 dµ > −∞ ⇒ E(fn | A0 ) րn E(f | A0 )
fn ցn f, f1 dµ < ∞ ⇒ E(fn | A0 ) ցn E(f | A0 )
• Fatou:
R
inf n fn > −∞ ⇒ lim inf n E(fn | A0 ) ≥ E(lim inf n fn | A0 )
R
supn fn < ∞ ⇒ lim supn E(fn | A0 ) ≤ E(lim supn fn | A0 )
• Dominierte Konvergenz:
fn →n f, supn |fn | ∈ L1 ⇒ E(fn | A0 ) →n E(f | A0 )
• Jensen Ungleichung: Für eine konvexe Funktion ϕ und ein W-maß µ gilt, sofern
wohldefiniert,
E(ϕ(f ) | A0 ) ≥ ϕ(E(f | A0 ))
Wir überschlagen den Beweis, der analog zum Lebesgueintegral verläuft.
Hier noch einige häufig benutzte Eigenschaften.
Lemma 77 Sei alles wohldefiniert. Die folgenden Aussagen gelten alle µ-fast sicher.
• |E(f | A0 )| ≤ E(|f | | A0 )
• E(f h | A0 ) = hE(f | A0 ) für A0 -meßbare Funktionen h.
• Towerproperty: Für A0 ⊂ A1 ⊂ A Unter-σ-Algebren gilt
E(E(f | A0 ) | A1 ) = E(f | A0 ) = E(E(f | A1 ) | A0 )
• supn E(fn | A0 ) ≤ E(supn fn | A0 )
64
WS10/11
U. Rösler
Beweis: Standard.
Beachte, die bedingten Erwartungen sind nur µ-fast sicher definiert und sind, mathematisch gesehen, eher Äquivalenzklassen bzgl. µ-Nullmengen. Wir rechnen damit allerdings wie
mit Funktionen, die nichts anderes als Repräsentanten der Äquivalenzklasse sind. Im Folgenden unterscheiden wir (einfachheitshalber) nicht zwischen Funktionen und Äquivalenzklassen
(falls nicht notwendig).
Korollar 78 (Eigenschaften der bedingten Erwartung) Unter den Voraussetzungen des
obigen Satzes ist die bedingte Erwartung ein linearer, positiver, projektiver, stetiger und σstetiger Vektorraumhomomorphismus, der die 1 auf die 1 abgebildet.
Beweis: Nach dem obigen Satz ist die bedingte Erwartung wohldefiniert. Die Eigenschaften
werden nachgerechnet. (Eine Projektion ist eine idempotente, lineare Abbildung auf einem
Vektorraum in sich selbst.)
q.e.d.
R
Bsp: Sei A0 die triviale σ-Algebra {∅, Ω}. Dann gilt E(f | A0 ) = f dµ.
Bsp: Sei A0 eine Unter-σ-Algebra erzeugt von einer abzählbaren, meßbaren Partition
Bn , n ∈ IN, mit 0 < µ(Bn ) < ∞. Dann ist die bedingte Erwartung
E(f | A0 ) =
X
11Bn
n
R
f dµ
µ(Bn )
Bn
Bsp: Gruppenmittelwert Sei G eine endliche Gruppe von meßbaren, maßerhaltenden
Abbildungen g : Ω 7→ Ω, d.h. µg −1 = µ. Sei A0 die σ-Algebra aller G-invarianter Ereignisse,
A0 = {B ∈ A | ∀g ∈ G : g −1 (B) = B}. Dann gilt für f ≥ 0
E(f | A0 ) =
1 X
f ◦ g.
|G| g∈G
Beweis: Benutze eine Variablentransformation um
ist leicht.
R
B
f dµ =
R
B
f ◦ gdµ zu zeigen. Der Rest
q.e.d.
Korollar 79 Sei µ ein W-maß. Die bedingte Erwartung E(· | A0 ) : Lp (A) → Lp (A0 ), 1 ≤
p ≤ ∞ ist ein linearer, positiver, σ-stetiger Operator mit Operatornorm 1. Die Fixpunkte der
bedingten Erwartung sind die A0 -meßbaren und p-integrierbaren Funktionen.
Beweis: Für 1 ≤ p < ∞ verwende die Jensen-Ungleichung für IR+ ∋ x 7→ xp ,
Z
p
|E(f | A0 )| dµ ≤
Z
|E(|f |p | A0 )dµ = kf kpp .
Analog für p = ∞,
esssup |E(f | A0 )| ≤ esssup E(|f | | A0 )| ≤ esssup |f |.
Der Rest ist Übung.
Folgerung: Die bedingte Erwartung ist eine stetige Funktion auf Lp .
65
WS10/11
Lemma 80 Seien 1 ≤ p, q ≤ ∞ dual,
1
p
+
1
q
Maßtheorie
= 1. Dann definiert
Lp (A) × Lq (A) ∋ (f, g) 7→ E(f g | A0 ) ∈ L1 (A0 )
eine Bilinearform. Es gilt die bedingte Hölder Ungleichung
E(|f g| | A0 ) ≤ (E(|f |p | A0 ))1/p (E(|g|q | A0 ))1/q .
Beweis: Der bedingte Erwartungswert als Operator ist wohldefiniert, da
Z
Z
|E(f g | A0 )| ≤
E(|f g| | A0 ) = kf gk1 ≤ kf kp kgkq < ∞.
Der Operator ist bilinear.
Sei zur Abkürzung X = (E(|f |p | A0 ))1/p und Y = (E(|g|q | A0 ))1/q . Es reicht zu zeigen
f g
E(| X
Y | | A0 ) ≤ 1 auf jeder Menge A0 ∈ A0 .
Z
f g
| | A0 ) dµ ≤
E(|
XY
A0
≤
Z
|f | |g|
11A0
dµ ≤
X Y
Z
A0
Z
E(|f |p | A0 )
dµ
Xp
= µ(A0 )
1/p+1/q
11A0 |f |p
dµ
Xp
1/p Z
A0
1/p Z
11A0 |g|q
dµ
Yq
E(|g|q | A0 )
dµ
Yq
1/q
1/q
= µ(A0 )
Alternative Einführung der bedingten Erwartung über Hilberträume.
Eine Projektion auf einem Hilbertraum H ist eine lineare Abbildung A : H 7→ H mit A ◦ A =
A. Eine orthogonale Projektion ist eine selbstadjungierte (A = A∗ ) Projektion. Orthogonale
N
Projektionen gestatten die Hilbertraumorthogonalzerlegung H = H0 H0⊥ mit H0 = AH
und H0⊥ der Orthogonalraum. Dieses setzen wir als bekannt voraus.
Lemma 81 Es gibt genau eine surjektive orthogonale Projektion H 7→ H0 .
Beweis: Für f ∈ H betrachte die Abbildung Tf : H0 → IR definiert durch Tf (h) =< f, h > .
Die Abbildung Tf eingeschränkt auf H0 ist aus dem stetigen Dualraum H0∗ von H0 . Da H0
selbstdual ist, siehe Satz von Riesz, gibt es genau eine Funktion g ∈ H0 mit < f, h >=< g, h >
für alle h ∈ H0 . Definiere die Abbildung A : H → H0 durch A(f ) = g. A tut’s.
A ist wohldefiniert. Der Bildraum ist H0 , da A auf H0 die Identität ist. Hieraus folgt die
Surjektivität und dann die Projektionseigenschaft. Die Orthogonalität rechnen wir nach,
< A∗ f, f >=< f, Af >=< Af, Af >=< Af, f >
für alle f, f ∈ H.
q.e.d.
In
unserem
Fall
sei
der
Hilbert
Raum
H
=
L
(A)
versehen
mit
der
Bilinearform
<
f,
g >=
2
R
f gdµ. Für eine Unter-σ-Algebra A0 ist H0 := L2 (A0 ) ⊂ H ein Unterhilbertraum. Dann ist
die orthogonale Projektion A auf H0 die bedingte Erwartung. Es verbleibt nachzurechnen in
Hilbertraumnotation
< A(f ), 11A0 >=< f, 11A0 >
für alle A0 ∈ A0 . Dies ist erfüllt.
Der Definitionsbereich von A kann dann auf positive Funktionen und auf Lp Funktionen
ausgedehnt werden.
66
WS10/11
U. Rösler
Umgekehrt, die bedingte Erwartung wie vormals definiert, liefert auf dem Hilbertraum
die eindeutige surjektive orthogonale Projektion nach H0 . Die Surjektivität und Projektionseigenschaft ergibt sich durch E(f | A0 ) = f für f ∈ H0 . Die Orthogonalität folgt aus
Z
E(f | A0 )gdµ =
Z
f gdµ =
Z
f E(g | A0 )dµ
erst für eine Treppe g = 11A , dann eine Treppenfunktion und mit σ-Stetigkeit für g aus dem
Hilbertraum H.
7.2.1
Faktorisierung
Seien f : Ω → Ω′ und g : Ω → Ω′′ meßbare Funktionen. f heißt g-meßbar, falls f meßbar ist
bezüglich der von g erzeugten σ-Algebra über Ω. In Formeln, falls f −1 (A′ ) ⊂ g −1 (A′′ ).
Hintergrund ist das
Lemma 82 (Faktorisierungslemma) Seien f : Ω → Ω′ und g : Ω → Ω′′ meßbare Funktionen. Die σ-Algebren A′ , A′′ seien abzählbar erzeugt. Dann gilt
f ist g meßbar ⇔ ∃h : Ω′′ 7→ Ω′ meßbar mit f = h ◦ g.
Beweis: Die Rueckrichtung folgt aus f −1 (A′ ) = g −1 (h−1 (A′ )) ⊂ g −1 (A′′ ).
Für die Hinrichtung betrachte zuerst einen Grundraum Ω′ ⊂ IR in den reellen Zahlen. Für
eine g-meßbare Treppenfunktion f gilt der Satz. Ein allgemeines g-meßbares f approximiere
von unten durch Treppenfunktionen fn . Das zugehörige hn ist monoton steigend gegen ein h.
Dies tut’s.
Die Ausdehnung auf allgemeinere W-Räume ergibt sich aus folgendem Lemma.
q.e.d.
Lemma 83 Jede abzählbar erzeugte σ-Algebra A besitzt einen abzählbaren, isotonen Erzeuger.
Ist A abzählbar erzeugt so gibt es eine Menge C in den rellen Zahlen versehen mit der
induzierten Borel σ−Algebra B ∩ C, so dass A isomorph (bijektiv und strukturerhaltend) ist
zu B ∩ C. Ist A punktetrennend (∀ω1 6= ω2 ∈ Ω∃A ∈ A : ω1 ∈ A, ω2 6∈ A) so gibt es eine
Bijektion ϕ : Ω → C die bimeßbar (ϕ and ϕ−1 sind meßbar) ist.
Bew: Nehme zuerst an, A sei punktetrennend.
Sei En ∈ A, n ∈ IN ein abzählbares Erzeugendensystem der σ-Algebra A. Definiere die
Abbildung ϕ1 : Ω → {0, 1}IN ,
ϕ1 (ω)(i) := 11Ei (ω)
und definiere ϕ2 : {0, 1}IN 7→ [0, 1] via
ϕ2 ((x1 , x2 , . . .)) =
∞
X
2xi 3−i .
i=1
Sei ϕ := ϕ2 ◦ ϕ1 . Die Mengen Aq := ϕ−1 (Bq ), Bq = (−∞, q]), q ∈ Ql tun’s.
Die Abbildung ϕ ist injektiv, da ϕ1 , ϕ2 injektiv sind. Sei C das Bild von ϕ und definiere
die σ-Algebra C auf C durch C = ϕ(A). Da ϕ : Ω → C eine bijektive Abbildung ist, liefert ϕ
auch eine Bijektion der σ-Algebren.
• Jeder Erzeuger von A wird unter ϕ auf einen Erzeuger von C abgebildet und umgekehrt.
67
WS10/11
Maßtheorie
Sei E ′ ein Erzeuger von A und A′ stets σ-Algebren. Dann gilt
ϕ(A) = ϕ(∩E ′ ⊂A′ A′ ) = ∩ϕ(E ′ )⊂ϕ(A′ ) ϕ(A′ ) = σ(E ′ ) = C
• C = B ∩ C mit B die Borel σ-Algebra.
C wird erzeugt durch die ϕ(En ) = Fn ∩C, n ∈ IN, mit Fn = {y ∈ IR | yn = 2 in der Trialdarstellung y =
P
−i
i∈IN yi 3 }. Die Borelsche σ-Algebra wird von allen Fn , n ∈ IN erzeugt. Damit gilt C =
σ(Fn ∩ C, n ∈ IN ) = σ(Fn , n ∈ IN ) ∩ C = B ∩ C.
Die Mengen Bq , q ∈ Ql bilden einen Erzeuger der Borelschen σ-Algebra und Bq ∩ C, q ∈ Ql
einen Erzeuger von C. Daher sind die Urbilder Aq , q ∈ Ql ein Erzeuger von A.
Ist A nicht punktetrennend, so betrachte die Äquivalenzrelation ∼ auf Ω
ω ∼ ω ′ ⇔6 ∃A ∈ A : ω ∈ A, ω ′ 6∈ A.
Gehe über zu dem Raum Ω∼ der Äquivalenzklassen [ω], nehme hierauf die σ-Algebra A∼
der Mengen [A], A ∈ A. Diese ist isomorph zu A. Mit entsprechender Notation ist ϕ∼ eine
Bijektion von Ω∼ auf ein C ⊂ IR. Diese ist eine Isomorphie der σ-Algebren.
q.e.d.
Bem: Die obige Menge C ⊂ IR kann auch nicht meßbar sein! Wichtig bei dieser Betrachtung ist die Isomorphie der σ-Algebren.
Bem: Zwei meßbare Räume (Ωi , Ai ), i ∈ {1, 2}, heißen isomorph zueinander, falls es eine
bijektive, meßbare Abbildung ϕ : Ω1 → Ω2 gibt, deren Inverse meßbar ist. Ein meßbarer
Raum heißt Standard-Borel, falls er isomorph ist zu einer Borelmenge in IR versehen mit
der induzierten Borel σ-Algebra. Zwei Maßräume (Ωi , Ai , µi ), i ∈ {1, 2}, heißen isomorph
zueinander, falls es eine bijektive, meßbare Abbildung ϕ : Ω1 → Ω2 gibt, die das Maß erhält
(µ2 = µ1 ϕ−1 ) und deren Inverse meßbar ist. In der W-theorie spielen Standard-Borelw-räume
eine besondere Rolle, siehe z.B. bedingte W-keiten. Dies umfaßt z.B. alle polnischen Räume.
Sei jetzt (Ω, A, µ) ein Maßraum. In der bedingten Erwartung notieren wir die Teil-σAlgebra A0 durch deren Charakterisierung wie z.B. durch ein Erzeugendensystem oder auch
Funktionen.
Notation: E(f | E) oder E(f | X) für E(f | A0 ) wobei A0 = σ(E) oder σ(X) gesetzt ist.
(σ(X) ist die kleinste σ-Algebra, bezüglich der die Funktion X meßbar ist.)
Sei X : Ω → IR, f ∈ F + meßbar und E(f | X) eine Version (Repräsentant) der bedingten
Erwartung und damit eine feste σ(X) − B-meßbare Funktion Ω → R. Nach dem Faktorisierungslemma gibt es eine reelle Funktion h mit E(f | X) = h ◦ X. Wir benutzen E(f | X = x)
für die Abbildung h(x) = E(f | X) ◦ X −1 (x).
Sprache: E(f | X = x) heißt bedingte Erwartung von f (bedingt) unter X = x.
Beachte, in der Regel ist {X = x} eine Nullmenge. Die obige Funktion h ist µX fast sicher
wohldefiniert. Mit der bedingten Erwartung bedingt nach X = x läßt sich rechnen wie mit
bedingten Erwartungen.
Sei jetzt (Ω, A, µ) ein Maßraum. Das Faktorisierungslemma gilt auch für Äquivalenzklassen
(bzgl f.s. Gleichheit), mit den entsprechenden Modifikationen. Die Äquivalenzklasse [f ] ist
meßbar bzgl. der Äquivalenzklasse [g] falls für alle f ∈ [f ], g ∈ [g], A′ ∈ A′′ es ein A′′ ∈ A′′
gibt mit der symmetrischen Differenz f −1 (A′ )△g −1 (A′′ ) als Nullmenge. Wir überschlagen die
technischen Details.
7.2.2
Weitere Beziehungen *
Wir zeigen einige Beispiele aus der Wahrscheinlichkeitstheorie. (Wir setzen den Begriff der
Unabhängigkeit voraus. Ein W-maß bezeichnen wir stets mit P.)
68
WS10/11
U. Rösler
Proposition 84 Für unabhängige Zgn X, Y gilt P X fast sicher
E(f (X, Y ) | X = x) = E(f (x, Y ))
Beweis: Sei M die Menge aller Funktionen mit obiger Eigenschaft. M enthält alle Funktionen
der Form f (x, y) = 11x∈A 11y∈B
Z
X
C
E(f (X, Y ) | X = x)P (dx) =
=
Z
X
E(f (x, Y ))P (dx) =
C
=
Z
11X∈C E(f (X, Y ) | X)dP
Z
11X∈C f (X, Y )dP =
Z
ZC
11x∈A (
Z
Z Z
11x∈C f (x, y)P X (dx)P Y (dy)
11Y ∈B dP )P X (dx)
f (x, y)P Y (dy)P X (dx)
C
für alle Borelmengen C.
Weiterhin ist M abgeschlossen bezüglich Treppenfunktionen und monotoner Grenzwerte.
Dies reicht.
q.e.d.
Beispiel: Ebene Seien X, Y : Ω → IR Zufallsgrößen
mit der gemeinsamen Verteilung
R
gemäß der Dichte f : IRR2 7→ IR, d.h. P ((X, Y ) ∈ ·) = · f (x, y)dxdy.
Dann ist g, g(x) := f (x, y)dy, die Dichte von X. g ist meßbar und
P (X ∈ A) =
Z Z
11x∈A f (x, y)dxdy =
Z
g(x)dx.
A
Ferner gilt
E(h(Y ) | X) =
R
h(y)f (X, y)dy
,
g(X)
E(h(Y ) | X = x) =
R
h(y)f (x, y)dy
g(x)
für jede integrierbare oder positive meßbare Funktion h.
Sei dazu h = 11B und A, B borelsch.
Z
X −1 (A)
E(h(Y ) | X)dP
= E(11X∈A 11Y ∈B ) = P ((X, Y ) ∈ (A, B))
=
Z Z
f (x, y)dydx =
A B
=
Z
Z R
B
A
X −1 (A)
R
f (x, y)dy
g(x)dx
g(x)
h(y)f (X, y)dy
dP.
g(X)
Hieraus folgt die erste Behauptung wegen der fast sicheren Eindeutigkeit der bedingten Erwartung.
Alle meßbaren Treppenfunktionen h erfüllen die Behauptung und alle monotonen Grenzwerte hiervon wegen der σ-Stetigkeit.
q.e.d..
Lemma 85 Seien A0 und A1 Unter-σ-Algebren und f integrierbar oder positiv und meßbar.
Falls σ(A0 , f ) unabhängig von A1 ist, gilt P -f.s.
E(f | A0 , A1 ) = E(f | A0 ).
69
WS10/11
Beweis:
D := {D ∈ σ(A0 , A1 ) |
Z
D
E(f | A0 , A1 )dP =
Maßtheorie
Z
D
E(f | A0 )dP }.
Man rechnet leicht nach, daß D ein Dynkin-System ist. E := {A0 ∩ A1 |A0 ∈ A0 , A1 ∈ A1 } ist
ein Erzeuger von σ(A0 , A1 ). Für A0 ∈ A0 , A1 ∈ A1 ist
Z
A0 ∩A1
E(f | σ(A0 , A1 ))dP = P ((11A0 f )11A1 ) = P (11A0 f )P (11A1 )
= P (11A0 E(f | A0 ))P (11A1 ) = P (11A0 E(f | A0 )11A1 ) =
Z
A0 ∩A1
E(f | A0 )dµ.
Daher gilt E ⊂ D.
q.e.d.
Man beachte hier den Spezialfall A0 trivial: Aus σ(f ) unabhängig von A0 folgt E(f |
A1 ) = E(f ).
7.3
Bedingte Wahrscheinlichkeiten∗
Mit der bedingten Erwartung E(. | A0 )(ω) oder auch E(. | X = x) läßt sich rechnen wie
mit Erwartungen oder bedingten Wahrscheinlichkeiten. Wann ist für festes ω die bedingte
Erwartung E(. | A0 )(ω) als eine Abbildung auf Funktionen darstellbar als ein Integral?
Das Problem besteht darin eine Festlegung K(ω, A) von E(11A | A0 )(ω) als Funktion zu
finden, die es bis auf eine Nullmenge simultan für alle meßbaren Mengen A tut. Und diese
Festlegung soll all die guten Eigenschaften der bedingten Erwartung haben, wie linear, scalar,
σ-stetig. Mathematisch ist dies ein Lifting von Äquivalenzklassen zu Funktionen.
7.3.1
Kerne aus bedingten Erwartungen
Seien (Ω, A) und (Ω′ , A′ ) meßbare Räume. Ein Kern ist eine Abbildung K : Ω × A′ 7→ IR
mit den Eigenschaften
(i) für alle ω ist K(ω, ·) : A′ 7→ IR ein Maß,
(ii) für alle A′ ∈ A′ ist K(·, A′ ) : Ω 7→ IR meßbar.
Ein Wahrscheinlichkeitskern ist ein Kern mit K(ω, ·) ein W-maß für jedes ω. Ein Subwahrscheinlichkeitskern ist ein Kern mit K(ω, Ω′ ) ≤ 1 für jedes ω.
Sprache: Wir sprechen von einem Kern von (Ω, A) nach (Ω′ , A′ ).
R
Wir benutzen die Notation K(ω, f ) := f (x)K(ω, dx) falls das Integral wohldefiniert ist.
Satz 86 Sei (Ω, A, P ) ein Standard Borelw-raum. Sei A0 eine Unter-σ-Algebra von A. Dann
gibt es einen W-kern K : Ω × A → IR, so daß für alle positiven meßbaren Funktionen f die
Funktion K(., f ) : Ω → R fast sicher gleich der bedingten Erwartung E(f | A0 ) ist.
Beweis: Der Standard Borelw-raum ist isomorph zu einer Borelmenge versehen mit der Borel
σ-Algebra (siehe Lemma (83). Wir führen den Beweis auf den reellen Zahlen.
Betrachte den abzählbaren Erzeuger Aq := (−∞, q], q ∈ Ql der Borel σ-Algebra. Wähle für
jedes q ∈ Q eine Funktion F (., q) : Ω → IR aus, die fast sicher gleich der bedingten Erwartung
E(Aq | A0 ) ist.
• Die Funktionen F (., p) sind punktweise aufsteigend in p bis auf ω in einer Nullmenge
N1 .
70
WS10/11
U. Rösler
Für festes p < q gilt F (., p) ≤ F (., q) bis auf ein Nullmenge. Es gibt nur abzählbar viele
rationale Paare p ≤ q und die Vereinigung abzählbar vieler Nullmengen ist eine Nullmenge.
• lim inf Ql∋q→−∞ F (ω, q) = 0 bis auf eine Nullmenge N2 .
Leicht.
• lim inf Ql∋q→∞ F (ω, q) = 1 bis auf eine Nullmenge N3 .
Leicht.
Sei N = N1 ∪ N2 ∪ N3 . Definiere G : Ω × IR 7→ IR durch
G(ω, x) = inf F (ω, q).
Q
l∋q≥x
• G(ω, .) ist eine Verteilungsfunktion für alle ω 6∈ N.
Nachrechnen. Übung.
Sei µω , ω ∈ N c , das W-maß zur Verteilungsfunktion G(ω, ·) via
µω (Bq ) = G(ω, q),
q ∈ Ql. Dies W-maß ist eindeutig. Sei µω das Punktmaß in 0 für ω ∈ N. Dann tut’s K(ω, A) :=
µω (A).
• K ist ein Kern.
Für festes ω ist K(ω, .) ein Maß. Es verbleibt zu zeigen:
D := {A ∈ A | K(., A) : Ω 7→ IR ist meßbar }
ist gleich A. Zeige hierzu D ist ein Dynkinsystem. (Ω ∈ D, D ist abgeschlossen bzgl. dem
Komplement und disjunkter abzählbarer Vereinigung.) D enthält das durchschnittsstabile
Erzeugendensystem Aq , q ∈ Q von A.
.
Notation: µω (·) heißt bedingte Wahrscheinlichkeit.
Folgerung 87 Bis auf eineR gemeinsame Nullmenge gilt µω (A) = E(1A | A0 )(ω) für alle
A ∈ A und E(f | A0 )(ω) = f dµω .
Beweis: Dies gilt für f eine Treppe, f eine Treppenfunktion, per σ-Stetigkeit für positive f
und per Zerlegung f = f + − f − für alle f , sofern die Ausdrücke wohldefiniert sind.
q.e.d.
Bemerkung: Es existieren nicht immer bedingte Maße, sogar für Teilmengen der reellen
Zahlen versehen mit der Borel σ-Algebra. (Wenn der Grundraum zu ’perforiert’ ist. ) Für
jede Zg mit Werten in (IR, B) existiert die bedingte W-keit.
Bsp: Für ein meßbares B sei 0 < P (B) < 1 und A0 := {∅, B, B c , Ω}. Die bedingte
Wahrscheinlichkeit, bedingt auf B, ist das W-maß P (· | B) := PP(·∩B)
(B) wohldefiniert. Es gilt
P (A | A0 ) = 11B P (A | B) + 11B c P (A | B c ).
Sei nun (Bn )n∈IN eine meßbare Partition von Ω, stets 0 < P (Bn ) < 1. Sei A0 die kleinste
σ-Algebra erzeugt von der Partition. Die bedingte Erwartung wird durch bedingte W-maße
gegeben,
X
P (A | A0 ) :=
P (A | Bn )11Bn : Ω → IR
n
E(f | A0 ) =
Z
f dP (· | A0 ) =
XZ
n
f dP (· | Bn )11Bn
fast sicher.
Bedingte W-keit unter X = x sind die Verallgemeinerungen von bedingten W-keiten
bedingt auf Ereignisse vom Maß 0.
71
WS10/11
72
Maßtheorie
Kapitel 8
Produkträume *
Ziel dieses Paragraphen sind Maße auf allgemeinen Produkträumen und der Existenzsatz
von Kolmogoroff für Produkträume. Diese werden für die Existenz stochastischer Prozesse
benötigt, z.B. für die Existenz einer Folge von unabhängigen Zufallsgrößen.
8.1
Produkträume
Wir starten mit dem mengentheoretischen Produktraum. Seien Ωi , i ∈ I, beliebige Mengen,
I ein beliebiges Indexsystem. Das kartesische Produkt
ΩI :=
Y
Ωi
i∈I
dieser Mengen ist die Menge aller Funktionen ω : I 7→ ∪i∈I Ωi mit ω(i) ∈ Ωi für alle i ∈ I.
Sind alle Ωi , i ∈ I, gleich, etwa E, so benutzen wir die gebräuchliche Notation ΩI = E I .
Q
Ebenso benutzen wir ΩJ = j∈J Ωj für J ⊂ I. Dies entspricht allen Funktionen ω|J , ω ∈ ΩI
eingeschränkt auf J.
Projektion: Für K ⊂ J ⊂ I sei
ΦJ,K : ΩJ → ΩK
die Projektion auf die K-Koordinaten. Formal ist dies die Einschränkung der Funktionen aus
ΩJ auf K. Wir benutzen die Notation ΦK := ΦI,K wenn möglich. Die Abbildung Φi := Φ{i}
heißt i-te Koordinatenabbildung .
Die Menge der Projektionsabbildungen ist transitiv, d.h. sie erfüllen
ΦK,L ◦ ΦJ,K = ΦJ,L
(8.1)
für L ⊂ K ⊂ J.
Bsp. Endliche Tupel: Für endliche Mengen I und eine fest vorgegebene Numerierung
i1 , i2 , . . . , in der Elemente von I identifizieren wir den Produktraum ΩI mit
Ωi1 × Ωi2 × . . . × Ωin .
Ein Element ist ein Tupel (ω1 , ..., ωn ). In dieser Darstellung als Tupel ist stets die Reihenfolge
der Aufzählung implizit enthalten.
Definiere die Abbildung πJ := Φ−1
J ΦJ : ΩI → ΩI .
73
WS10/11
Maßtheorie
Proposition 88 Es gilt
– die Abbildung J → πJ ist antiton (bzgl. der Enthaltensordung f ’ür Mengen und der
punktweisen für Funktionen)
– πJ ◦ πK = πJ∩K = πK ◦ πJ für alle K, J ⊂ I.
– die Projektionseigenschaft πJ ◦ πJ = πJ für alle J,
Beweis: Übung mit Wertebereichen von Funktionen.
Zylindermengen: Eine Zylindermenge in ΩI ist eine Menge der Form Φ−1
J (AJ ) mit
AJ ⊂ ΩJ , J ⊂ I. Die Koordinatenmenge J heißt Basis des Zylinders.
Jede Menge A ⊂ ΩI ist eine Zylindermenge wegen A = Φ−1
I (A) mit Basis I. Interessant sind kleinere Basen, im Sinne der Enthaltenrelations. Dies Beispiel zeigt die Basis eines
Zylinders ist nicht eindeutig. (Übung).
Proposition 89 Sind J und K zwei Basen einer Zylindermenge, so auch J ∩ K.
−1
Beweis: Die Zylindermenge Z habe zwei Darstellungen Φ−1
J (AJ ) = ΦK (AK ) mit J 6= K.
Dann gilt πJ (Z) = Z und πK (Z) = Z. Hieraus folgt πJ∩K (Z) = Z und damit Z = Φ−1
J∩K (A)
für A ∈ ΩJ∩B . (Ohne Beweis A = ΦJ,J∩K (AJ ) = ΦK,J∩K (AK ).)
Rechteckmengen: Eine Rechteckmenge oder auch Rechteckzylinder ist eine Menge der
Form
\
Φ−1
j (Aj )
j∈J
mit Aj ⊂ Ωj , j ∈ J ⊂ I. Ist I endlich, etwa I = {1, 2, . . . , n}, so schreiben wir die
Rechteckmengen in der prägnanteren Form A1 × A2 × . . . × An . Beachte die Reihenfolge des
Index.
Schnitt: Der Schnitt einer Menge A ∈ ΩI in Richtung x ∈ ΩJ c ist
x
SI,J
(A) := ΦJ (A ∩ Φ−1
J c (x)).
Eine alternative Beschreibung ist {ω|J | ω ∈ A, ω|J c = x} durch Einschränkung der Funktionen bestimmtes Verhalten auf J c .
✬
✩
B
Bω
ω
✫
8.1.1
✪
Produkt σ-Algebra
Wir kommen jetzt zu Produkträumen mit meßbarer Struktur. Seien (Ωi , Ai ), i ∈ I, beliebige
meßbare Räume. Die Produkt σ-Algebra AI ist die kleinste σ-Algebra auf ΩI , bezüglich der
alle Koordinatenabbildungen Φi , i ∈ I, meßbar sind. Wir benutzen die Notation
AI =:
O
i∈I
74
Ai
WS10/11
U. Rösler
N
Wir benutzen , da AI nicht das mengentheoretische Produkt ist, sondern eine Struktur
enthält. Das Tupel (ΩI , AI ) heißt Produktraum (der meßbaren Räume (Ωi , Ai ), i ∈ I.) Analog
verwenden wir AJ für J ⊂ I.
Proposition 90 Die Abbildungen ΦI,J , J ⊂ I, sind AI − AJ meßbar.
−1
Beweis: i) Die Urbilder ΦJ,{j}
(Aj ), Aj ∈ Aj , j ∈ J, bilden ein Erzeugersystem E für die
Produkt σ-Algebra AJ . Das Urbild Φ−1
I,J (E) des Erzeugersystems ist in AI wegen der Projek−1
−1
tionseigenschaft (8.1) ΦI,{j} (E) = ΦI,J (Φ−1
J,{j} (E)). Dies reicht im Hinblick auf Proposition 6.
q.e.d.
Proposition 91 Die Produkt σ-Algebra AI ist gleich der Menge aller meßbarer Zylindermengen mit abzählbarer Basis. Jede meßbare Zylindermenge hat eine Darstellung Φ−1
J (AJ )
mit abzählbarem J und meßbarem AJ ∈ AJ .
Beweis: • M ist eine σ-Algebra.
c
−1
c
M ist nicht leer und komplementabgeschlossen, (Φ−1
· (A)) = Φ· (A ). Sie ist abgeschlossen bzgl. der abzählbaren Vereinigung. Dies folgt aus Jn ⊂ I (höchstens) abzählbar,
J := ∪n Jn , (höchstens) abzählbar,
(
[
n
c
Φ−1
=
Jn (AJn ))
=
\
n
\
n
c
Φ−1
Jn (AJn )
−1
−1
c
Φ−1
J (ΦJ,Jn (AJn )) = ΦJ (
\
n
c
Φ−1
J,Jn (AJn )) ∈ M
• AI ⊂ M
M enthält alle Mengen Φ−1
i (Ai ), die wiederum einen Erzeuger E der Produkt σ-Algebra
bilden. Aus E ⊂ M folgt AI = σ(E) ⊂ σ(M) = M
• M ⊂ AI
Einfach, da ΦJ meßbar ist.
Daraus folgt M = AI .
q.e.d.
Die meßbaren Rechteckmengen sind (genau diejenigen) von der Form
\
Φ−1
j (Aj )
j∈J
mit
Aj ∈ Aj , j ∈ J ⊂ I höchstens abzählbar.
x (A), x ∈ Ω c , meßbar
Proposition 92 Sei J ⊂ I endlich. Für A ∈ AI ist jeder Schnitt SI,J
J
bzgl. der Produkt σ-Algebra AJ .
Beweis: Betrachte die Menge M aller Mengen A ∈ AI mit obiger Eigenschaft. Die Menge
M ist eine σ-Algebra. (Nachrechnen, der wesentliche Punkt ist ΦJ (Ac ∩ Φ−1
J c (x)) = ΦJ (A ∩
c .) M enthält einen Erzeuger, da die erzeugenden Abbildungen Φ meßbar sind bezüglich
Φ−1
(x))
c
i
J
M − Ai . Damit folgt M = AI .
q.e.d.
Proposition 93 Rechteckmengen mit höchstens abzählbarer Basis sind genau dann meßbar,
wenn in der Darstellung jedes Aj meßbar ist Aj ∈ Aj ist.
75
WS10/11
Maßtheorie
I\j,x
Beweis: Die Rückrichtung ist einfach. Für die Hinrichtung zeige SI
x ∈ ΩI\j und vorgegebenes j ∈ J. Aj muß meßbar sein.
= Aj für ein geeignetes
q.e.d.
Lemma 94 Die Menge R′ der meßbaren Rechteckzylinder mit endlicher Basis bilden einen
Semiring.
Beweis: Die Eigenschaften eines Semiringes sind nachzuprüfen. ∅ ∈ R0 ist offensichtlich. Die
endliche Durchschnittsabgeschlossenheit folgt aus
−1
−1
∩n≤N ∩j∈Jn Φ−1
j (Aj,n ) = ∩j∈I ∩{n|j∈Jn } Φj (Aj,n ) = ∩j∈I Φj (∩{n|j∈Jn } Aj,n ).
Daß die Differenz als disjunkte endliche Summe von Semiringmengen darstellbar ist, ist eine
unangenehme Schreibarbeit. Wir begnügen uns mit einem Bild im IR2 .
B
A
Dies reicht.
8.2
q.e.d.
Maße auf Produkträumen.
Wir kommen jetzt zu maßtheoretischen Produkträumen.
Ein Produktmaß auf dem Produktraum (ΩI , AI ) ist ein Maß µ darauf mit
µ(
\
Φ−1
j (Aj )) =
j∈J
Y
µ(Φ−1
j (Aj ))
(8.2)
j∈J
für alle meßbaren Rechteckmengen.
Das Produktmaß induziert ein Maß µi auf (Ωi , Ai ), i ∈ I, via µi (Ai ) = µ(Φ−1
i Ai ), Ai ∈ Ai .
Umgekehrt, zumindest für Wahrscheinlichkeitsmaße, wie wir gleich zeigen werden, gibt es zu
vorgegebenen µi genau ein Produktmaß µ. Daher verwenden wir die Notation µ = µI =:
N
i∈I µi .
Das Tripel (ΩI , AI , µI ) heißt Produktmaßraum oder auch nur Produktraum (bezüglich der
Maßräume (Ωi , Ai , µi )i ).
Wir kommen jetzt zur Existenz des Produktmaßes.
Satz 95 Seien (Ωi , Ai , µi ), i ∈ I, W-Räume. Es gibt genau ein Produktwahrscheinlichkeitsmaß auf dem Produktraum.
76
WS10/11
U. Rösler
Beweis: Fall: I bestehe aus den zwei Elementen 1 und 2. Setze für Rechteckmengen
µ(A1 × A2 ) = µ1 (A1 )µ2 (A2 ).
In Funktionenschreibweise mit Funktionen f = 11A1 ×A2 .
Z
f (x, y)µ(d(x, y)) =
Z Z
f (x, y)µ1 (dx)µ2 (dy).
Die rechte Seite hängt nicht von der Reihenfolge der Integration ab Satz 41. Dehne die rechte
Seiten linear aus auf Treppenfunktionen und dann
σ-stetig auf meßbare positive Funktionen.
R
(Übung.) Dann tut’s µ definiert durch µ(A) = 11A µ1 (dx)µ2 (dy).
Fall: I endlich. Argumentiere induktiv über n = |I|.
Fall: I abzählbar, oEdA I = IN. Der Beweis folgt obiger Konstruktion mit einem zusätzlichen Kompaktheitsargment. Sei R0 der Semiring aller Rechteckmengen mit endlicher Basis.
Definiere µ : R0 7→ IR wie in (8.2)
µ(∩j∈J Φ−1
j (Aj ) =
Y
µj (Aj )
j∈J
• Die Mengenfunktion µ ist wohldefiniert und ein Inhalt.
Übung. Dies ist keine Trivialität und benötigt die Projektionseigenschaft.
Setze diese Mengenfunktion auf den von R0 erzeugten Ring R additiv fort.
• µ : R 7→ IR ist ein Prämaß.
Wir zeigen die σ-Stetigkeit bei der leeren Menge, welches hinreichend ist. Annahme: An ∈ R0
ist fallend gegen die leere Menge und limn µ(An ) > 0.
Nach Fubini gilt
Z
x1
µ2 (SI\1
(An ))µ1 (dx1 )
µ(An ) =
Q
x1
(An ) ist der Schnitt von An in
mit µ2 der analoge entsprechende Inhalt auf i≥2 Ωi . SI\1
2
Richtung erster Koordinate an der Stelle x1 . (Beachte µ (B2 ×B3 ×. . .) = µ(Ω1 ×B2 ×B3 ×. . .)
wie für endliches I.)
Der Satzes von der monotonen Konvergenz impliziert
lim µ(An ) =
n
Z
x1
(An ))µ1 (dx1 ).
lim µ2 (SI\1
n
x∗
1
(An )) > 0. (Wir integrieren über eine echte
Folglich gibt es ein x∗1 ∈ Ω1 mit limn µ2 (SI\1
Funktion, keine Äquivalenzklasse.)
Ebenfalls nach Fubini und monotoner Konvergenz
lim µ
n
2
x∗1
(SI\1
(An ))
mit µ3 der analoge Inhalt auf
Q
i≥3 Ωi .
=
Z
(x∗ ,x )
1 2
lim µ3 (SI\{1,2}
(An ))µ2 (dx2 )
n
Es gibt ein x∗2 ∈ Ω2 mit limn µ3 (SI\{1,2}(x∗1 ,x∗2 ) (An )) > 0.
Analog wähle x∗3 , x∗4 , . . . usw. Dann liegt x∗ := (x∗1 , x∗2 , ...) in dem Durchschnitt aller An .
(Übung.) Widerspruch.
• Für höchstens abzählbare J ⊂ K gilt µK Φ−1
K,J = µJ .
Die Aussage gilt für alle Rechteckmengen in AJ mit endlichem Träger. Die bilden einen
Erzeuger der Produkt σ-Algebra AJ .
77
WS10/11
Maßtheorie
• Die eindeutige Caratheodory Erweiterung liefert das gewünschte Produktwahrscheinlichkeitsmaß µ = µI .
Fall: I beliebig. Definiere µI : AI 7→ IR durch
µI (A) = µJ (AJ )
Für Zylindermengen A = Φ−1 (AJ ), AJ ∈ AJ mit höchstens abzählbarer Basis J ⊂ I. µI tut’s.
• Wohldefiniertheit.
−1
A habe die beiden Darstellungen A = Φ−1
J (AJ ) = ΦK (AK ) mit höchstens abzählba−1
rer Basis J, K. Dann gilt ΦJ∪K (A) = Φ−1
J∪K,J (AJ ) = ΦJ∪K,K (AK ) und damit µJ (AJ ) =
−1
µJ∪K (Φ−1
J∪K,J (AJ )) = µJ∪K (ΦJ∪K,K (AK )) = µK (AK ).
• µI ist ein W-maß. Nachrechnen.
q.e.d.
Korollar 96 Voraussetzungen wie im obigen Satz. Es gilt für J ⊂ K ⊂ I µK Φ−1
K,J = µJ
Nachrechnen.
Bsp. Lebesguemaß: Sei Ωi = {0, 1} und µi (1) = 1/2 für alle i ∈ I = IN. Betrachte die
Abbildung ϕ : ΩI → [0, 1] mit
ϕ(ω) =
∞
X
ωi 2−1
i=1
Die Abbildung ϕ ist surjektiv und, wenn wir eine µI Nullmenge herausnehmen, injektiv. (Die
Dualdarstellung ist eindeutig.) Dann ist ϕ(AI ) die Borel σ-Algebra auf [0, 1] und µI ϕ−1 ist
das Borelmaß darauf.
Projektiver Limes*
Wir betrachten eine Klasse O von Objekten derselben mathematischen Struktur, wie Vektorräume, meßbare Räume, Gruppen, oder anderes. Weiterhin gebe es gewisse strukturerhaltende Abildungen zwischen den Objekten, z.B. lineare Abbildungen, meßbare Abbildungen,
Gruppenhomomorphismen, usw.. Diese Abbildungen heißen Morphismen.
Ein projektives System ist ein Tupel (O, M) einer Menge O von mathematischen Objekten
und einer transitiven Menge M von Morphismen. (Transitiv bedeutet, falls ϕα,β : α → β und
ϕβ,γ : β → γ Morphismen aus M sind, so auch ϕα,γ = ϕβ,γ ◦ ϕα,β .) Anders formuliert, das
folgende Diagramm kommutiert:
✉
△
✲✉
α
✧
ϕα,β
✲✉
β
ϕβ,γ
ϕα,γ
✲✉
✻
✦
γ
✲✉
✲
Auf O ist eine transitive Relation durch die Morphismen vorgegeben via,
α β ⇔ ∃ϕ ∈ M ϕ : α → β.
Der projektive Limes eines projektiven Systems (O, M) ist ein weiteres Objekt △ mit
dieser mathematischen Struktur und folgenden Eigenschaften.
78
WS10/11
U. Rösler
(i) Es gibt Morphismen ϕ△,α : γ → α für alle α ∈ O, so daß
(O ∪ {△}, M ∪ {ϕ△,α | α ∈ O})
ein projektives System derselben mathematischen Struktur bildet.
(ii) △ ist das kleinste derartige Objekt. Sei δ ein weiteres Objekt mit Morphismen ϕδ,. wie
in (i). Dann gibt es einen Morphismus ϕ : δ → △ mit
ϕδ,α = ϕ△,α ◦ ϕδ,△ .
Die erste Bedingung fordert die Verträglichkeit der Morphismen ϕ△,α mit der Projektionsstruktur. Sehr einprägsam ist die graphische Darstellung als links abgeschlosser Graph (der
nicht linear sein muß):
✉
δ′
ϕδ,△
✧
✲✉
δ
ϕδ,α
ϕδ,α
✲✉
✻
✦
α
✲✉
✲
Beispiel: Produktmaß Der Produktraum von W-räumen ist der projektive Limes eines
projektiven Systems. Betrachte die Objekte (ΩJ , AJ , µJ ), für J ⊂ I abzählbar. Dies sind
Wahrscheinlichkeitsräume. Die Morphismen sind die Projektionsabbildungen ΦK,J für J ⊂ K.
Diese erfüllen die Verträglichkeitsbedingung (8.1),
ΦK,L ◦ ΦJ,K = ΦJ,L
ΦJ,K µJ = µK
J ⊂ K ⊂ L. Das Objekt (ΩI , AI , µI ) mit den Morphismen ΦJ für höchstens abzählbare
Teilmengen J ⊂ I ist der projektive Grenzwert.
Dies ist das kleinste Objekt mit Morphismen, welches das projektive System projektiv
abschließt. Wäre δ = (Ω, A, µ) ein weiterer W-Raum mit den Morphismen Φδ,J , der das
projektive System projektiv abschließt. Dann tut es die Abbildung
Ω ∋ ω 7→ ϕδ,I (ω) =
Y
i
Φi (ω) ∈ ΩI .
Kompakte Klassen *
Dieser Abschnitt ist nur der Vollständigkeit halber gegeben und kann beim ersten Lesen
überschlagen werden.
Eine Teilmenge K ⊂ P(Ω) der Potenzmenge heißt kompakte Klasse, bzw. hat die endliche
T
Durchschnittseigenschaft, falls für jede abzählbare Folge Kn ∈ K mit N
n=1 Kn 6= ∅ für jedes
T
N ∈ IN auch n∈IN Kn 6= ∅ gilt.
T
T
Äquivalent ist die Forderung n Kn = ∅ für eine Folge impliziert N
n=1 Kn = ∅ für ein
N ∈ IN.
In topologischen Räumen ist die Menge der kompakten Mengen eine kompakte Klasse. (Dies
ist das Hauptbeispiel und vielleicht das einzig relevante.)
Lemma 97 Ist K eine kompakte Klasse, so auch die Menge der abzählbaren Durchschnitte
und die Menge der endlichen Vereinigungen von Mengen aus K.
79
WS10/11
Beweis: Für Durchschnitte ist die Behauptung einfach. Sei nun Dn :=
T
und N
n=1 Dn 6= ∅ für alle N ∈ IN. Definiere den Produktraum
L :=
∞
Y
Maßtheorie
Sin
n
i=1 Ki
mit Kin ∈ K
{1, 2, . . . , in } = {1, 2, . . . , i1 } × {1, 2, . . . , i2 } × . . .
n=1
n
LN := {(l1 , l2 , . . .) ∈ L | ∩N
n=1 Kln 6= ∅}.
• LN , N ∈ IN, sind nicht leer und die Folge LN ist fallend.
• ∩N LN ist nicht leer.
Wähle aus jedem LN ein lN aus. Nach dem Schubfachprinzip gibt es ein 1 ≤ l1∗ ≤ i1 mit
#{N ∈ IN | l1∗ = l1N } = ∞. Ebenso findet man ein l2∗ mit #{N ∈ IN | l1∗ = l1N , l2∗ = l2N } = ∞
usw. Damit gilt (l1∗ , l2∗ , l3∗ , . . .) ∈ ∩N LN .
Damit gilt ∩n≤N Klnn∗ 6= ∅ für alle N ∈ IN. K ist eine kompakte Klasse, also ∩n Klnn∗ 6= ∅.
Hieraus folgt ∩n Dn 6= ∅.
q.e.d.
Lemma 98 Sei I eine beliebige Indexmenge, Ki ⊂ P(Ωi ), i ∈ I, kompakte Klassen. Dann ist
K := {Φ−1
i (Ki ) | i ∈ I, Ki ∈ Ki }
eine kompakte Klasse.
−1
n
n
n
Beweis: Sei K n eine Folge aus K mit ∩N
n=1 K 6= ∅ für alle N ∈ IN. Für K = Φin (Kin ) ∈
K, n ∈ IN, in ∈ I, Kinn ∈ Kin . gilt
−1
−1
n
n
n
∩N
n=1 K = ∩i ∩{n≤N |in =i} Φi (Ki ) = ∩i Φi (∩{n≤N |in =i} Ki ).
Der Durchschnitt wird über alle i ∈ I genommen, mit {n ≤ N | in = i} nicht leer.
Für jedes solche i sind die endlichen Durchschnitte ∩{n≤N |in =i} Kin nicht leer (wegen
n 6= ∅.) Da K eine kompakte Klasse ist, ist der abzählbare Durchschnitt A :=
∩N
i
i
n=1 K
n = ∩ Φ−1 (A ) nicht.
K
q.e.d.
∩{n|in =i} Kin nicht leer. Folglich auch ∩∞
i
i
n=1
i
8.2.1
Die Kolmogoroffschen Erweiterungssätze
Seien (Ωi , Ai ), i ∈ I, meßbare Räume und (ΩJ , AJ ), J ⊂ I endlich, der Produktraum versehen
mit der Produkt σ-Algebra.
Eine maßerhaltende Abbildung ist eine Abbildung zwischen Maßräumen, die die Maße
erhält.
Satz 99 (Daniell-Kolmogoroff ) Seien (Ωi , Ai , µi ), i ∈ I W-räume mit beliebiger Indexmenge I. Für jedes i ∈ I gebe es ein kompaktes System Ki derart, daß
∀ǫ > 0 ∀Bi ∈ Ai ∃Ki ∈ Ki ∃Ai ∈ Ai : Ai ⊂ Ki ⊂ Bi und µi (Bi \Ai ) < ǫ.
Seien (ΩJ , AJ ) die Produkträume für endliches J ⊂ I. Seien µJ W-maße auf (ΩJ , AJ ) so
dass (ΩJ , AJ , µJ ), J ⊂ I endlich mit den Projektionen Φ.,. ein projektives System bilden bzgl.
W-räumen und maßerhaltenden Abbildungen.
Dann gibt es einen projektiven Grenzwert und dieser ist (ΩI , AI , µI ) zusammen mit den
Projektionsabbildungen als Morphismen.
80
WS10/11
U. Rösler
Dieser Satz wird häufig in folgender Form verwendet.
Satz 100 (Kolmogoroff ) Sei E ein polnischer Raum mit der Borelschen σ-Algebra B. Seien
(E J , B J , µJ ), J ⊂ I endlich, W-räume und die Projektionsabbildungen seien maßerhaltend.
Dann ist der projektive Limes (ΩI , B I , µI ) mit einem W-maß µI .
Beweis erste Version: Sei R0 die Menge aller meßbarer Rechteckzylinder mit endlicher Basis.
R0 ist ein Semiring, Proposition 94. Auf R0 betrachten wir die additive Mengenfunktion
µ : R0 7→ IR definiert durch
µ(Φ−1
J (AJ )) := µJ (AJ )
für meßbare Rechteckzylinder AJ . (Die Wohldefiniertheit von µ verwendet die Verträglichkeitsbedingung und ist keine Trivialität.) Erweitere µ (eindeutig) zur additiven Mengenfunktion auf dem von R0 erzeugten Ring R, Lemma 16.
Die additive Mengenfunktion µ auf R ist ein Prämaß, d. h. σ-stetig bei der leeren Menge.
Dazu zeigen wir:
K := {∩j∈J Φ−1
j (Kj ) | |J| < ∞, Kj ∈ Kj , j ∈ J}
ist ein kompaktes System, siehe vorhergenden Abschnitt.
• Für alle ǫ > 0 und alle meßbaren Rechteckzylinder B mit endlichen Zylinder J gibt es
eine Menge K ∈ K mit Basis J und einen meßbaren Rechteckzylinder A mit A ⊂ K ⊂ B und
µ(B\A) < ǫ.
Sei B = ∩j∈J Φ−1
j (Bj ) ∈ R0 . Wähle zu vorgegebenen ǫj , Bj Mengen Kj ∈ Kj und Aj ∈ Aj
−1
mit Aj ⊂ Kj ⊂ Bj und µj (Bj \Aj ) < ǫj . Setze K = ∩j∈J Φ−1
j (Kj ) ∈ K, A = ∩j∈J Φj (Aj ) und
P
P
schließe und schließe µ(B\A) ≤ j µj (Bj \Aj ) ≤ j ǫj kann beliebig klein gewählt werden.
Sei oEdA J = {1, 2, . . . , n}. (Ansonsten wähle eine Indizierung j1 , j2 , . . . , jn der Elemente von
−1
J.) Betrachte C0 = B, Cl = (∩0<i≤l Φ−1
1 (Ai )) ∩n>i>l Φi (Bi ) für l ∈ IN≤n . Dann gilt
[n
B\A = ◦
i=1
[n
Ci \Ci−1 ⊂ ◦
i=1
Φ−1
i (Bi \Ai )
(Mache ein Bild für eine zweielementige Menge J.)
Unter Anwendung von Caratheodory erhalten wir eine Fortsetzung von µ zu einem Maß
auf der σ-Algebra σ(R0 ) = AI .
Die Eindeutigkeit ist einfach. Ebenso, daß dies das kleinste projektive Objekt ist. q.e.d.
Beweis zweite Version: Nehme als kompakte Klasse Ki die Menge aller kompakten Mengen
in E. Diese tun’s.
q.e.d.
Bemerkung: Der Satz von Kolmogoroff gibt nicht nur die Existenz des projektiven Limes,
sondern auch die Produktgestalt des meßbaren Raumes (ΩI , AI ).
Beispiel von Jessen*: Ohne Kompaktheitsbedingung können wir für den projektiven
Limes nicht den Produktraum nehmen.
Betrachte Ω = [0, 1) mit der Borel σ-Algebra B und dem Lebesguemaß λ. Für eine Menge
A betrachten wir den eingeschränkten Raum ΩA := Ω ∩ A versehen mit der eingeschränkten σ-Algebra B|A := {B ∩ A | B ∈ B} und dem eingeschränkten Maß λ|A auf B|A mit
λ|A (C) = inf{λ(B) | B ∈ B, C ⊂ B} (Nachrechnen, dies ist ein Maß. Es ist das äußere Maß
λ∗ eingeschränkt auf B|A .)
Betrachte die Reellen Zahlen als Vektorraum über den rationalen Zahlen. Definiere die
Äquivalenzrelation x ∼ y ⇔ x − y ∈ Ql auf [0, 1). Sei A ⊂ [0, 1) ein Representantensystem der
Äquivalenzklassen. Die Mengen Aq = A + q modulo 1 für q ∈ Ql ∩ [0, 1) bilden eine paarweise
disjunkte Zerlegung von [0, 1). Für jedes q ∈ Ql ist Aq nicht Lebesguemeßbar, Abschnitt 2.1.3.
81
WS10/11
Maßtheorie
Das innere Lebesguemaß von jedem Aq ist 0. (B ∋ B ⊂ Aq ⇒ λ(B) = 0.) Das innere
Lebesguemaß von jeder endlichen Vereinigung von Aq ist 0. (Übung).
Sei Ωq := Acq versehen mit der σ-Algebra Aq := B|Ωq und dem W-maß µq := λ|Ωq . Auf
dem Produktraum (ΩJ , AJ ), J ⊂ Ql endlich, definiere die W-Maße µJ durch
µJ (C) = λ∗ ({x ∈ [0, 1] | ∩j∈J Φ−1
j (x) ∈ C}).
(Nachrechen, dies ist ein wohldefiniertes W-maß.) Die W-räume (ΩJ , AJ , µJ ), J ⊂ Ql endlich,
bilden eine projektive Familie (bezüglich den Objekten der W-räume und den Projektionsabbildungen als maßerhaltende Morphismen.) (Übung).
Angenommen, der projektive Limes wäre (ΩQl, AQl, µ). Sei q1 , q2 , . . . eine Abzählung der
rationalen Zahlen. Die Mengen
Dn := {ω ∈ ΩQl | ω(qi ) = ω(qj ) für 1 ≤ i, j ≤ n}
konvergieren fallend gegen die Diagonale {ω ∈ ΩQl | ω(q) = ω(r) ∈ [0, 1) für alle q, r ∈ Ql in
ΩQl}. Dies ist die leere Menge, da es für jedes x ∈ [0, 1) ein q ∈ Q gibt mit x 6∈ Ωq . Dies ergibt
den Widerspruch, Jn := {q1 , . . . , qn },
lim µ(Dn ) = lim µJn (ΦJn (Dn )) = 1 6= 0 = µ(lim Dn ) = lim µ(Dn )
n
n
n
im Widerspruch zur σ-Stetigkeit von µ.
8.3
n
q.e.d.
Maße aus Kernen
Bedingte W-keiten lassen sich als Kerne interpretieren und umgekehrt, zu vorgegebenen Kernen lassen sich W-Maße mit zugehörigen bedingten W-verteilungen konstruieren.
8.3.1
Kerne
Seien (Ω, A), (Ω′ , A′ ) meßbare Räume. Ein Kern ist eine Abbildung K : Ω × A′ → IR mit
i) K(x, .) : A′ → IR ist ein Maß für alle x ∈ E,
ii) K(., A′ ) : Ω → IR ist eine meßbare Funktion für alle A′ ∈ A′ .
Wir sprechen von einem endlichen Kern, falls alle Maße K(e, .) endlich sind. Ein Kern
heißt Wahrscheinlichkeitskern oder auch Markoff Kern oder Übergangskern, falls alle Maße
in i) W-Maße sind. Ebenso sprechen wir von σ-endlichen Kernen usw.
Ein Kern K induziert eine lineare, σ-stetige Abbildung F(Ω′ , IR+ ) → F(Ω, IR+ ) auf positiven, erweiterten und meßbaren Funktionen via
f 7→
Z
f (y)K(., dy).
Wir benutzen die Notation K(., f ). Diese Abbildung läst sich via K(x, f ) = K(x, f + ) −
K(x, f − ) ausdehnen.
Ebenso induziert ein Kern eine isotone, lineare Abbildung von Maßen auf A nach Maßen
auf A′ via
Z
µ 7→
K(x, .)µ(dx).
E
Wir benutzen die Notation K(µ, .) und K(µ, f ) analog.
82
WS10/11
U. Rösler
Die Komposition von Kernen K : Ω × A′ 7→ IR und L : Ω′ × A′′ 7→ IR ist gegeben durch
KL = K ◦ L : Ω × A′′ → IR
′′
KL(e, A ) :=
Z
L(e′ , A′′ )K(e, de′ ).
E′
Lemma 101 Die Komposition von Kernen ist ein Kern. Die Komposition ist assoziativ.
Beweis: • KL ist ein wohldefinierter Kern.
KL ist wohldefiniert. Für festes x ist KL(x, .) ein Maß. Für die zweite Eigenschaft eines Kerns approximiere L(x′ , A′′ ) von unten durch Treppenfunktionen, für die wiederum die
Aussage gilt.
• Assoziativitäet.
Zu zeigen ist (K ◦ L) ◦ M = K ◦ (L ◦ M ). Dies folgt aus Fubini KLM (x, A′′′ ) :=
R R
( M (x′′ , A′′′ )L(x′ , dx′′ ))K(x, dx′ ) durch vertauschen der Integrationsreihenfolge.
q.e.d.
Hier sind einige Beispiele von Kernen K.
Maß: Sei µ′ ein Maß auf A′ . Definiere
K(x, A′ ) := µ′ (A′ ).
Der Kern K ist unabhängig von der ersten Koordinate.
Faltungskern: Wir betrachten die reellen Zahlen und ein Maß µ auf der Borelschen
σ-Algebra B. Definiere für x ∈ IR, B ∈ B
K(x, B) := µ(B − x).
Matrizen: Sei M eine positive n × n Matrix, M : ⌊1, n⌋ × ⌊1, n⌋ 7→ IR. Definiere
K(i, A) :=
X
M (i, j).
j∈A
M ist eine stochastische Matrix genau dann wenn K ein W-kern ist.
Bedingte Erwartung: Sei (Ω, A) = (Ω′ , A′ ) und An ∈ A, n ∈ IN, eine disjunkte meßbare
Zerlegung von E. Alle Ereignisse haben strikt positives endliches Maß µ(An ) > 0. Definiere
K(ω, A) :=
X
n
11ω∈An µ(A | An )
mittels der bedingten Maße µ(A | B) := µ(A ∩ B)/µ(B). K ist gleichzeitig die bedingte
Erwartung
K(ω, A) = E(11A | σ(An , n ∈ IN ))(ω)
bezüglich der von (An )n aufgespannten σ-Algebra.
Integralkern: Sei k : Ω × Ω′ 7→ IR+ eine positive meßbare Funktion bzgl. der Produkt
σ-Algebra A ⊗ A′ . Sei µ′ ein σ-endliches Maß auf A′ . Dann ist K
K(x, A′ ) :=
Z
A′
ein Kern.
83
k(x, y)µ′ (dy)
WS10/11
Maßtheorie
W-Maße aus Kernen
Zur weiteren Orientierung zeigen wir beispielhaft die Konstruktion von W-Maßen durch
Kerne. Dies entspricht der Vorstellung eines Wahrscheinlichkeitsbaums mit bedingten Wahrscheinlichkeiten in elementarer Notation.
Proposition 102 Seien (Ω1 , A1 , µ) ein W-raum, (Ω2 , A2 ) ein meßbarer Raum und K : Ω1 ×
A2 → IR ein W-kern. Dann ist P, definiert durch
Z
f dP =
Z Z
f (x, y)K(x, dy)µ(dx)
für positive meßbare Funktionen f ein W-maß auf dem Produktraum (Ω = Ω1 × Ω2 , A =
A1 ⊗ A2 ).
Die bedingte Erwartung unter der σ-Algebra Φ−1
1 (A1 ) =: A0 ⊂ A ist E(11A | A0 )(ω) =
Φ1 (ω)
K(Φ1 (ω), S2
(A)) f.s. und die bedingte W-keit
P (A | Φ1 = x)(x) = K(x, S2x (A))
für A ∈ A.
Beweis: • P ist wohldefiniert.
Ist f eine meßbare Funktion, so ist f (x, .) : Ω2 → IR meßbar. (Dies entspricht dem Schnitt
x
S{1,2},2
(A) einer meßbaren Menge A.)
• P ist ein W-maß. Einfach.
• P Φ−1
1 =µ
Für die bedingte Erwartung berechne durch Variablenwechsel, A0 ∋ B = Φ−1 (C), C ∈
A1 ,
Z
B
Φ (ω)
K(Φ1 (ω), S2 1 (A))P (dω)
= =
Z
C
K(x, S2x (A))µ(dx)
= P (B ∩ A) =
Z
B
=
Z
11C (x)11A (x, y)K(x, dy)µ(dx)
E(11A | A0 )dP
Die fast sichere Eindeutigkeit der bedingten Erwartung liefert die Behauptung.
q.e.d.
Dies Beispiel läßt sich erweitern auf endliche Produkte durch die Hintereinanderschaltung
mehrerer Kerne. Das Maß P wird sinngemäß definiert durch
Z
f dµ =
Z
...
Z
f (x1 , . . . , xn )K n−1 ((x1 , . . . , xn−1 ), dxn ) . . . K 1 (x1 , dx2 )µ1 (dx1 ).
(8.3)
Der Kern hat wieder die Interpretation als bedingte W-keit. (Genaue Formulierung als Übung.)
Beispiel: Polyas Urnenmodell Aus einer Urne mit S schwarzen und W weißen Kugeln
wird zufällig mit Gleichverteilung eine Kugel gezogen, die Farbe angesehen und anschließend
werden insgesamt c + 1 ∈ IN Kugeln derselben Farbe zurückgelegt. Wie groß ist die Wahrscheinlichkeit, daß im dritten Ziehen eine schwarze Kugel gezogen wird, gegeben die erste
Kugel war weiß und die zweite schwarz? Oder wie groß ist die Wahrscheinlichkeit als dritte
Kugel eine schwarze zu ziehen gegeben die erste war weiß.
Als meßbare Räume wählen wir Ω1 = Ω2 = Ω3 = {0, 1} jeweils versehen mit der Potenzmenge als σ-Algebra. 0 entspricht einer weißen Kugel und 1 einer schwarzen. Das WS
Maß µ1 auf (Ω1 , P(Ω1 )) ist gegeben durch µ1 (1) = S+W
= 1 − µ(0). Die Übergangskerne
1
2
K : Ω1 × P(Ω2 ) 7→ IR und K : Ω1 × Ω2 × P(Ω3 ) 7→ IR sind gegeben durch
K 1 (1, {1}) =
S+c
= 1 − K 1 (1, {0})
W +S+c
84
WS10/11
K 1 (0, {1}) =
U. Rösler
S
= 1 − K 1 (0, {0})
W +S+c
und für das dritte Ziehen
K 2 ((1, 1), {1}) =
S + 2c
W + S + 2c
S+c
= K 2 ((0, 1), {1})
W + S + 2c
S
K 2 ((0, 0), {1}) =
W + S + 2c
K 2 ((1, 0), {1}) =
Q
Q
usw. Das W-Maß P auf dem Produktraum ( i Ωi , P( i Ωi ) i ∈ I = {1, 2, 3} sei das Kernmaß
µ aus (8.3). Die Projektionsabbildungen Φi geben die Farbe der i-ten gezogenen Kugel an.
Damit ist die erste gesuchte Wahrscheinlichkeit
P (Φ3 = 1 | Φ1 = 0, Φ2 = 1) =
=
P (Φ1 = 0, Φ2 = 1, Φ3 = 1)
P (Φ1 = 0, Φ2 = 1)
S+c
µ1 (0)K 1 (0, {1})K 2 ((0, 1), {1})
= K 2 ((0, 1), {1}) =
1
µ1 (0)K (0, {1})
S + W + 2c
und die zweite
P (Φ3 = 1 | Φ1 = 0) =
P
i P (Φ1
= 0, Φ2 = i, Φ3 = 1)
P (Φ1 = 0)
= K 1 (0, {0})K 2 ((0, 0), {1}) + K 1 (0, {1})K 2 ((0, 1), {1}) =
S
.
S+W +c
Halbgruppen
Seien (Ωt , At ), t ∈ T meßbare Räume nd (T, ≤) sei eine halbgeordente Menge. Eine Halbgruppe
von Kernen ist eine transitive Familie K s,t : Ωs ×At 7→ IR von Übergangskernen für s < t ∈ T.
Transitiv bedeutet
K s,t ◦ K t,u = K s,u
für alle s < t < u ∈ T . Sind alle meßbaren Räume (Ωt , At ) = (E, {E}) gleich, so sprechen wir
von einer Halbgruppe von Kernen über E.
Jede solche Familie läßt sich stets erweitern um K t,t , t ∈ T durch K t,t (x, A) = 11A (x).
Wir betrachten nur erweiterte Familien und nehmen dies mit in die Definition hinein.
Im folgenden betrachten wir nur Halbgruppen über E. Sei (T, +) selbst eine Halbgruppe
(+ : T × T → T ist assoziativ). Eine Halbgruppe von Kernen über E heißt zeitlich homogen
oder zeittranslationsinvariant (bezüglich (T, +)) falls mit s, t, u, s + u, s + t ∈ T gilt
K s,t = K s+u,t+u
Wir schreiben, falls möglich, dann K t für K s,s+t .
Analog sei (E, +) eine Halbgruppe mit einer meßbaren Verknüpfung + : E × E → E. Eine
Halbgruppe von Kernen über E heißt räumlich homogen oder raumtranslationsinvariant falls
für alle x, y ∈ E, A ∈ E
K .,. (x, A) = K .,. (x + y, A + y)
gilt.
85
WS10/11
Maßtheorie
T hat in den meisten Fällen die Interpretation als Zeit und heißt daher Zeitparameterraum.
Insbesondere ist für T ⊂ IR dies eine gängige Interpretation. Wir können auch andere Objekte
zulassen, z.B. Bäume. E hat die Bedeutung eines Raumes und heißt Zustandsraum.
Kompositionshalbgruppe: Sei K ein Kern auf E. Definiere induktiv K n , n ∈ IN, durch
K n+1 := KK n = K n K.
Die Familie K m,n := K n−m , m ≤ n ∈ IN, ist eine Halbgruppe von Kernen. Diese heißt
Kompositionshalbgruppe von K. Diese ist zeittranslationsinvariant. K wird gerne als eine
Matrix M geschrieben mit Einträgen K(i, {j}). Dann ist K n die Matrixmultiplikation M n .
Faltungshalbgruppen: Sei E eine additive Gruppe (E, +) mit meßbaren Gruppenoperationen + und −. Eine Faltungshalbgruppe von Maßen ist eine Familie µs,t , s < t ∈ T ⊂ IR+
von Wahrscheinlichkeitsmaßen mit
µs,t ⋆ µt,u = µs,u ,
⋆ bezeichne die Faltung
Z
f (x + y)µ(dx)ν(dy) = inf f (z)(µ ∗ ν)(dz)(dz)
Mit K s,t (x, A) = µs,t (A − x) ergibt dies eine räumlich homogene Faltungshalbgruppe von
Kernen. (Übung).
Gauß Halbgruppe: Sei E = IR, E = B, T = IR+ . Die Gaußsche Halbgruppe wird gegeben
durch
Z
K s,t (x, B) :=
ϕx,t−s (y)dy
B
für s < t. Hierbei ist ϕm,σ2 die Dichte der Normalverteilung mit Erwartung m ∈ R und
Varianz 0 < σ 2 < ∞,
1
(y − m)2
.
ϕm,σ2 (y) := √
exp −
2σ 2
2πσ 2
(Hier ist einiges nachzurechnen.) Sie ist eine räumlich und zeitlich invariante Faltungshalbgruppe. K s,t ist ein Integralkern mit der Dichte k s,t (x, y) = ϕx,t−s (y − x) bzgl. dem Lebesguemaß.
Poisson Halbgruppe: Sei E = ZZ + , E = P(E), T = IR+ . Definiere für s < t
K s,t (x, A) :=
∞
X
n=0
exp(−(t − s))
(t − s)n
11x+n∈A = P ois(t − s)(A − x).
n!
Diese Markoffsche Halbgruppe heißt Poisson Halbgruppe. Sie ist eine räumlich und zeitlich
invariante Faltungshalbgruppe.
8.4
Maße aus Kernen
Seien (Ei , Ei ), i ∈ I = IN0 meßbare Räume und K n,n+1 : En × En+1 → IR Übergangskerne.
Durch Komposition erhalten wir hieraus eine Halbgruppe K s,t , s ≤ t. Für i < j1 < j2 <
. . . < jl , J := {j1 , . . . , jl } sei der Übergangskern K i,J : Ei × EJ → IR gegeben durch
K i,J (e, f ) :=
Z
...
Z
f (x1 , . . . , xl )K jl−1 ,jl (xl−1 , dxl )K jl−2 ,jl−1 (xl−2 , dxl−1 ) . . . K jl ,j2 (x1 , dx2 )K i,j1 (e, x1 )
analog wie das Kernmaß für positive meßbare Funktionen f .
86
WS10/11
U. Rösler
Satz 103 (Ionescu-Tulcea) In obigem Set-up gibt es einen W-Kern K : E0 × EIN → IR mit
0,J
K(e0 , Φ−1
(e0 , AJ )
J (AJ )) = K
(8.4)
für alle J = {1, 2, . . . , n}, AJ ∈ EJ .
Beweis: • Die Objekte der Übergangskerne K 0,⌊1,n⌋ ⌊1, n⌋ := {1, . . . , n} mit den Projektionen
Φ : E⌊1,n⌋ → E⌊1,m⌋ bilden ein projektives System.
Das wesentliche hierbei benötigte Argument ist
K 0,⌊1,n+1⌋ (e0 , A1 × . . . × An × En+1 ) = K 0,⌊1,n⌋ (e0 , A1 × . . . × An )
für alle n ∈ IN.
Sei R0 die Menge aller Rechteckmengen in EIN . Definiere die Abbildung K : E0 ×R0 7→ IR
wie in (8.4)
• K ist wohldefiniert.
Dies ist die projektive Eigenschaft des Systems.
Die Menge R0 der Rechteckmengen ist ein Semiring. Erweitere für jedes feste e0 ∈ E0 die
Abbildung K zu einer additiven Mengenfunktion auf dem von R0 erzeugten Ring R, Lemma
(18).
• Für jedes A ∈ R gibt es ein n ∈ IN mit K(e, A) = K 0,⌊1,n⌋ (e0 , Φn (A)) für alle e0 ∈ E0 .
Die Behauptung gilt für jede Rechteckmengen A. Da jede Menge A ∈ R eine disjunkte
endliche Vereinigung von Rechteckmengen ist und beide Seiten additiv sind, folgt die Behauptung.
• Der Inhalt K(e0 , .) ist für jedes e0 ∈ E0 ein Prämaß.
Wir zeigen die σ-Stetigkeit in der leeren Menge. Dazu sei An ∈ R, n ∈ IN, eine Folge von
Ringmengen aus R monoton fallend gegen die leere Menge. Wir haben limn K(e0 , An ) = 0 zu
zeigen.
Nehmen wir an limn K(e0 , An ) > 0 wäre strikt positiv. OEdA durch Umnummerierung
sei An = (Φn )−1 Φn An und damit K(., An ) = K 0,⌊1,n⌋ (., Φn (An )) an. Wir benutzen hier fn für
11Φn (An ) .
K(e0 , An ) =
Z
E1
Z
fn (e1 , . . . , en )K 1,⌊2,n⌋ (e1 , d(e2 , . . . , en ))K 0,1 (e0 , de1 )
Wegen monotoner Konvergenz
n
0 < lim K(e0 , A ) =
n
Z
lim
n
Z
fn (e1 , . . . , en )K 1,⌊2,n⌋ (e1 , d(e2 , . . . , en ))K 0,1 (e, de1 )
können wir ein e∗1 ∈ E1 finden mit strikt positivem Integranden an der Stelle (e0 , e∗1 ). Analog
können wir wegen
0 < lim
n
=
Z
Z
fn (e1 , . . . , en )K 1,⌊2,n⌋ (e1 , d(e2 , . . . , en ))
lim fn (e∗1 , . . . , en )K 2,⌊3,n⌋ (e2 ), d(e3 , . . . , en ))K 1,2 (e∗1 , de2 )
E2 n
ein e∗2 ∈ E2 finden mit strikt positivem Integranden an der Stelle (e0 , e∗1 , e∗2 ).
87
WS10/11
Maßtheorie
Fahren wir so fort, so finden wir induktiv ein e∗ := (e0 , e∗1 , e∗2 , e∗3 , ...). Dies e∗ ist Element
von jedem An . (Konstruktion). Dies ist ein Widerspruch.
Wir erweitern K(e0 , .) mit Caratheodory eindeutig zu einem W-Maß auf EIN .
Es verbleibt zu zeigen, daß die Abbildung K(., A) meßbar ist für jedes A ∈ EIN . Die Menge
der A’s mit dieser Eigenschaft bildet ein Dynkin-System. Dieses Dynkin-System enthält den
durchschnittstabilen Erzeuger der Rechteckmengen R0 . Damit ist dies die Produkt σ-Algebra
selber.
q.e.d.
Wir erweitern dies zu überabzählbar vielen vorgegebenen Kernen. Wir beschränken uns
der Einfachheit halber auf den Zeitparameter T ⊂ IR+ .
Satz 104 Sei K s,t , 0 ≤ s ≤ t ∈ T = IR+ , eine Markoff Halbgruppe auf einem polnischen
Raum E versehen mit der Borel σ-Algebra. Dann existiert ein Markoff Kern K : E × EIR+ 7→
IR mit
0,t
K(e, Φ−1
t (At )) = K (e, At )
s ≤ t, At ∈ E, e ∈ E.
Beweis: Sei e fest. Betrachte die W-Maße K 0,J (e, .) für J ⊂ T auf den meßbaren Räumen
(EJ , EJ ). Mit den Projektionen bilden diese ein projektives System. Das wesentliche Argument
ist wieder von der Bauart
K 0,{j1 ,j2 ,j3 } (e, Aj1 × Ej2 × Aj3 ) = K 0,{j1 ,j3 } (e, Aj1 × Aj3 )
(Bachte, das neue Element j2 wurde zwischen die anderen eingefügt, nicht notwendigerweise
am Schluss.) Nach dem Satz von Kolmogoroff 100 existiert das projektive Maß K(e, .) auf
+ N
(E IR , t∈T E) mit den Koordinatenabbildungen als Morphismen.
Dieses konstruierte Maß K(e, .) tut‘s. Die Kerneigenschaft wird standardmäßig nachgerechnet ({A ∈ . | K(., A) ist meßbar} = ...)
q.e.d.
Bem: Wir haben hier die kompakten Mengen des polnischen Raumes als kompakte Klasse
benutzt. Sollte auch ohne gehen(?).
Brownsche Maß und Brownsche Bewegung: Das Brownsche Maß ist das Maß (auf
+
dem Produktraum IRIR versehen mit der Produkt σ-Algebra zu der Gaußschen Halbgruppe
K s,t (x, B) :=
Z
B
ϕx,t−s (y)dy.
Eine Zufallsvariablen mit dieser Verteilung und (zusätzlich) stetigen Pfaden heißt Brownsche
Bewegung.
Poisson Prozess: Zu der Poissson Halbgruppe
K s,t (x, A) :=
∞
X
exp(−t + s)
n=0
+
(t − s)n
11x+n∈A = P ois(t − s)(A − x)
n!
+
gibt es ein Maß auf ZZ IR bzw. IRIR . Eine Zufallsgröße mit diesem (Markoff) Maß als Verteilung und (zusätzlich) rechtsstetigen Pfaden heißt Poisson Prozess.
Beide Prozesse haben räumlich und zeitlich invariante Übergangskerne. Mehr über die
inhaltliche Bedeutung dazu in der Sektion über Prozesse.
Bemerkung: Die Existenz von stetigen bzw. rechtsstetigen Versionen muß bewiesen werden und ist keine Trivialität.
88
WS10/11
U. Rösler
Beispiel: Produktmaße Produktmaße auf endlichen Produkträumen lassen sich als Spezialfall der Konstruktion durch Kerne sehen. Der Kern hängt nicht von der ersten Koordinate
ab. In der Sprache der Wahrscheinlichkeitstheorie liefert dies die Existenz einer Folge von
unabhängigen Zufallsgrößen Xi , i ∈ IN, mit den µi als Verteilung der Xi . Die Projektionsabbildung Φi auf dem Produktraum spielt die Rolle von Xi .
Markoffketten: Der Satz von Ionescu-Tulcea hat Anwendung in der Konstruktion von
Markoff Ketten auf einem endlichen (oder abzählbaren) Zustandsraum E. Gegeben sei eine
stochastische Matrix (positive Einträge und Zeilensumme stets 1) und eine Startwahrscheinlichkeit π auf (E, E). Die Kompositionen P n , n ∈ ZZ + bilden eine Halbgruppe. Die Zufallsgrößen Φi = Xi , i ∈ IN, auf dem Produktraum E IN mit der Produkt σ-Algebra ist eine Markoff
Kette mit den Übergangswahrscheinlichkeiten
P (Xn+1 = j | Xn = i) = P (i, j).
n
Bsp. Baumindex: Sei V = ∪∞
n=0 IN die Menge endlicher Folgen einschließlich der leeren
Folge. Diese Menge ist ein gerichteter Graph mit den Kanten (v, vi), v ∈ V, i ∈ IN. Jedem
N
Knoten v ∈ V ordnen wir einen meßbaren Raum (Ev , Av ) zu. Sei K v,(vi)i : Ev × i∈IN Avi →
IR ein Übergangskern für alle (v, (vi)i ). Solche Kerne können wir hintereinanderschalten im
Sinne
K
v,(vi)i
(L
vi,(vij)j
)i (x, A) =
Z
11A ((yi,j )i,j )
Y
Lvi,(vij)j (yi , d(yij )j )K v,(vi)i (x, d(yi )i )
i∈IN
Wir erhalten W-Kerne auf K v,(vVn ) : Ev × AvVn → IR mit Vn die Menge der Folgen der Länge
n. Dann ist für jedes x ∈ E∅ das Tupel (ΩVn , AVn , K ∅,Vn (x, .)), n ∈ IN, versehen mit den
Projektionen ΦVn ,Vm , m ≤ n ein projektives maßerhaltendes System. Dieses hat, analog zu
Ionescu-Tulcea, einen projektiven Grenzwert (ΩV , AV , K(x, .)).
89
WS10/11
8.5
Maßtheorie
Prozesse
Durchgehend benutzen wir denselben W-raum (Ω, A, P ). Alle Prozesse sind auf diesem Wraum definiert.
Ein stochastischer Prozess ist eine Familie von Zufallsgrößen Xt : Ω 7→ Et , t ∈ T. Die
Indexmenge T ist in der Regel eine geordnete Menge. Sehr häufig ist die Indexmenge eine
Teilmenge der reellen Zahlen und erhält dann die Interpretation als Zeitparameterraum. In
vielen Fällen ist (Et , Et ) = (E, E) für alle t ∈ T. Wir sprechen dann von einem Prozess mit
Zustandsraum E.
In diesem Sinne ist jede deterministische Funktion f : T 7→ E ein (degenerierter) stochastischer Prozeß. Allgemein ist die Abbildung T ∋ t 7→ Xt (ω) ein Pfad des Prozesses (zu
ω).
Q
Sei ET = t∈T Et der Produktraum. Jeder stochastische Prozeß X = (Xt )t∈T ist eine Zufallsgröße X : Ω 7→ ET , meßbar bzgl. der Produkt-σ-Algebra ET definiert durch Φt (X(ω)) =
(X(ω))(t) = Xt (ω). Die Verteilung eines Prozesses X ist das Maß P X = P (X −1 (·)) auf dem
Produktraum (ET , ET ). Eine Marginalverteilung zur Basis S ⊂ T ist das W-Maß P ΦS X =
P (XS ∈ ·) auf ES . Wir sprechen von eindimensionanlen, endlich dimensionalen (usw. ) Marginalverteilungen für S einelementig, mit endlich vielen Elementen usw.. Die endlich dimensionalen Verteilungen bestimmen im Regelfall (Kolmogoroff oder Ionescu-Tulcea) die Verteilung
des Prozesses.
Zwei Zgn X und Y, nicht unbedingt auf demselben W-raum definiert, heißen Kopien
voneinander, falls deren Verteilung übereinstimmt, P X = P Y . Durch Vergrößern, (=Produktbildung) des zugrunde liegenden W-raumes könnten wir X, Y auf demselben W-raum
betrachten. Dies ist der Regelfall. Zwei Zgn X und Y auf demselben W-Raum heißen Version voneinander, falls sie fast sicher ununterscheidbar sind auf dem Bildraum. In Formeln,
P ({X ∈ A}△{Y ∈ A}) = 0 für alle meßbaren Mengen A. Sie heißen fast sicher gleich oder
ununterscheidbar, falls P (X 6= Y ) = 0 gilt.
Der Begriff Kopie betrifft die Verteilung einer Zg, Version und Gleichheit die Ausprägung
der Zgn, einmal bzgl. dem Bildraum und einmal auf dem Definitionsraum. Gleichheit impliziert Version und Version impliziert Kopie, aber im allgemeinen nicht umgekehrt.
Betrachten wir jetzt Prozesse X, Y : Ω → ET . Diese sind Kopien voneinander, falls alle
endlich dimensionalen Marginalverteilungen übereinstimmen. Sie sind Versionen voneinander,
falls P (Xt 6= Yt ) = 0 für alle t ∈ T gilt. (Argumentiere über das Erzeugendensystem Φ−1
t (.)
der Produkt-σ-Algebra. Die Produkt-σ-Algebra ist die Menge aller meßbaren Zylindermengen
mit abzählbarer Basis.) Für die Ununterscheidbarkeit sei angemerkt, dass die Menge X 6= Y
eventuell garnicht ET meßbar ist.
Standardbeispiel: Sei Ω das Einheitsintervall, B die Borel σ-Algebra darauf, λ das Lebesgue Maß. Definiere die Prozesse Xt (ω) = 11t=ω und Yt ≡ 0, t ∈ T = [0, 1]. Diese Prozesse
sind Versionen voneinander, da P ({ω | Xt (ω) 6= Yt (ω)}) = 0 für alle t ∈ T gilt. Sie sind nicht
fast sicher gleich, die Menge X 6= Y ist der gesamte Raum Ω.
Warnung: Die Menge {X 6= Y } = {ω ∈ Ω | ∀t ∈ T | Xt (ω) 6= Yt (ω)} ist im allgemeinen nicht meßbar. Dazu sei, (Ω, B, λ, T ) wie im obigen Beispiel und A ⊂ [0, 1] eine nicht
Lebesgue meßbare Menge. Die Prozesse Xt (ω) := 11A (t)11t (ω), Yt ≡ 0, t ∈ T sind Versionen
voneinander, aber X 6= Y ist die nicht meßbare Menge A.
90
WS10/11
8.5.1
U. Rösler
Pfadmengen
Sei X : Ω → E T , Xt (ω) = X(ω)(t) ein stochastischer Prozesss mit Zeitparametermenge T in
den reellen Zahlen. Die Funktion ω 7→ supt∈T Xt (ω) ist eventuell nicht meßbar. Das Problem
taucht nur für überabzählbare T auf. Für T abzählbar ist das obige Supremum und auch
Y : Ω × T → E mit Y (ω, t) := Xt (ω) meßbar bzgl. A ⊗ ET − E, jedoch im allgemeinen
nicht für überabzählbere T. Das Meßbarkeitsproblem ließe sich umgehen, wenn jeder Pfad
ω
T ∋ t 7→ Xt (ω) durch abzählbar viele Werte Xt (ω) mit t aus einer abzählbaren Menge
bestimmt wäre. Eine derartige Theorie separabler Prozesse wurde von Doob ausgeführt (siehe
Meyer [8]).
Wir sind nicht ganz so anspruchsvoll. Unser Ziel sind zwei wichtige Prozesse, die Brownsche
Bewegung und der Poissonsche Zählprozess.
Die Brownsche Bewegung
Ein Prozess Xt , t ∈ T ⊂ IR, mit unabhängigen Zuwächsen ist ein Prozess mit Xti − Xti−1 , i =
1, ..., n, unabhängig für alle t0 < t1 < ... < tn ∈ T.
Eine Brownsche Bewegung zu σ 2 > 0 ist ein stochastischer Prozeß Xt : Ω 7→ IR, t ∈ T =
IR+ , mit den Eigenschaften
i) Die Zuwächse sind unabhängig.
ii) Xt − Xs hat eine N (0, σ(t − s)) Normalverteilung für alle s < t.
iii) X0 ≡ 0.
iv) Die Pfade T ∋ t 7→ Xt (ω) sind stetig.
Die Standard Brownsche Bewegung ist eine Brownsche Bewegung (BB) mit σ 2 = 1. Die
Standardnotation ist Bt oder Wt . (Norbert Wiener hat als erster die BB mathematisch exakt
definiert, Brown war Physiker.)
Satz 105 Die Brownsche Bewegung existiert.
Beweis: Sei µs,t die Normalverteilung N (0, (t − s)σ 2 ) für s < t. Sei K s,t , s < t ∈ IR+ , die
Gaußsche Halbgruppe,
K s,t (x, A) = µs,t (A − x).
Nach Kolmogoroff existiert zu dieser Halbgruppe ein W-Kern K T : IR × B T → IR als projektiver Limes. Nehme als Xt die Projektionen Φt auf die t-te Koordinate zu dem Maß K T (0, ·)
auf RT . Es gilt X0 = 0.
Die ersten zwei Eigenschaften werden nachgerechnet, die dritte ist einfach. Die Idee zum
Nachweis der vierten und letzten Eigenschaft besteht in der Einschränkung dieses Maßes
auf stetige Funktionen. Beachte, die Menge C der stetigen Funktionen ist nicht Produkt-σAlgebra meßbar (da sie keine Zylindermenge mit abzählbarer Basis ist). Eine entsprechende
Theorie entwickeln wir jetzt allgemein.
Sei (Ω, A, P ) ein W-raum. Das äußere Maß zu P ist die Abbildung P ∗ von der Potenzmenge über Ω in die erweiterten reellen Zahlen definiert durch
P ∗ (Q) = inf{P (A) | Q ⊂ A ∈ A}.
Das äußere Maß ist wohldefiniert, isoton und ist eine Erweiterung des Maßes (=stimmt mit
µ auf der σ-Algebra A überein).
91
WS10/11
Maßtheorie
Proposition 106 Sei (Ω, A, P ) ein W-Raum und Q ⊂ Ω eine Menge von P -äußeren Maß
1. Dann ist die Einschränkung P|Q von P auf Q, definiert durch P|Q (A ∩ Q) = P (A) für alle
A ∈ A, ein W-maß auf (Q, A|Q = {A ∩ Q | A ∈ A}).
Beweis: • P|Q ist wohldefiniert.
Sei A ∩ Q = B ∩ Q mit A, B ∈ A. Es folgt A△B ⊂ Qc . Dies impliziert Q ⊂ (A△B)c . Aus
der Istonie des äußeren Maßes folgt 1 = P ∗ (Q) ≤ P ∗ ((A△B)c ) = P ((A△B)c ) ≤ 1 und damit
P (A△B) = 0 und P (A) = P (B).
Der Rest ist einfach.
q.e.d.
Für Produktw-räume (IRT , B T , P ) ist Q eine Menge von P -äußerem Maß 1 genau dann,
wenn P (A) = 1 gilt für alle Zylindermengen A mit abzählbarer Basis, die Q ⊂ A erfüllen.
(Die Produkt-σ-Algebra ist die Menge aller Zylindermengen mit abzählbarer Basis.)
Wir werden diese Aussage anwenden auf hölderstetige Funktionen. Für 0 ≤ γ ≤ 1, d > 0
sei Hγ,d (S) die Menge der Funktionen f : S → IR mit
|f (x) − f (y)| ≤ d|x − y|γ
für alle x, y ∈ S ⊂ T. Wir verwenden zur Abkürzung Φ−1
T,S (H. (S)) = H. (S, T ).
Die Abbildung
d 7→ Hγ,d (S, T )
ist isoton (für festes γ, S) und die Abbildung
S 7→ Hγ,d (S, T )
ist antiton (für festes γ, d) und σ-stetig von unten (=für aufsteigende Mengen Sn , n ∈ IN,
gegen S gilt Hγ,d (Sn ) →n Hγ,d (S, T )).
Ein Element aus Hγ (S) := ∪d>0 Hγ,d (S) heißt (gleichmäßig) γ-hölderstetig auf S. Beachte,
Hγ (S) ist der aufsteigende Grenzwert der Mengen Hγ,dn (S), n ∈ IN, einer gegen ∞ aufsteigenden, abzählbaren Folge (dn )n . Hölderstetige Funktionen sind stetig. Die 1-Hölderstetigkeit
wird auch Lipschitzstetigkeit genannt.
Warnung, die Abbildung
S 7→ Hγ (S, T )
ist antiton, aber im allgemeinen nicht mehr σ-stetig von unten.
Proposition 107 Sei S eine Teilmenge der reellen Zahlen und sei f : S → IR (γ, d)-hölderstetig. Dann gibt es eine (γ, d)-hölderstetige Fortsetzung von f auf den reellen Zahlen. Ist S
dicht in den reellen Zahlen, so ist die Erweiterung eindeutig.
Bew: Definiere eine Fortsetzung g : S → IR von f auf dem Abschluss S von S durch g(t) =
limS∈s→t f (s). g ist wohldefiniert als Funktion, ist (γ, d)-hölderstetig und die einzige mögliche
Fortsetzung in Hγ,c (S). (Nachrechnen.)
c
c
Für x ∈ S gibt es ein größtes offenes Intervall in der offenen Menge S mit x als innerem
Punkt. Sei (a, b) dies Intervall und a, b ∈ S. Setze g linear fort auf dem Intervall [a, b] mit den
x−a
Stützwerten g(a) auf a und g(b) auf b, formal h(x) := b−x
b−a g(a) + b−a g(b). Ist a = −∞ oder
b = ∞ so wähle h(x) = g(b) bzw. = g(a). Die Fortsetzung h : IR → IR tut’s.
q.e.d.
Lemma 108 Sei P ein W-Maß auf (IRT , B T ), T ⊂ IR. Dann hat die Menge Hγ (T, T ) der γhölderstetigen Funktionen auf T äußeres Maß 1 genau dann, wenn für jede abzählbare Menge
S ⊂ T gilt P (Hγ (S, T )) = 1.
92
WS10/11
U. Rösler
S
Beweis: • Hγ (S, T ) ∈ Φ−1
S (B ) für höchstens abzählbare S.
Sei S abzählbar und ϕ : S → IN eine Abzählung von S (=ϕ ist bijektiv) und Sn =
Sn
ϕ−1 ({1, 2, . . . , n}). Die Menge Hγ,d (Sn , T ) ist in Φ−1
Sn (B ) und konvergiert gegen Hγ,d (S, T ) ∈
S
Φ−1
S (B ),
−1 −1
−1
Sn
S
Sn
Hγ,d (Sn , T ) ∈ Φ−1
Sn (B ) = ΦS ΦS,Sn (B ) ∈ ΦS (B ).
Mit einer abzählbaren Folge 0 < di րi ∞ folgt die Behauptung.
• ’Hinrichtung’:
Die ’Hinrichtung’ folgt aus der Isotonie des äußeren Maßes,
1 ≤ P ∗ (Hγ (T, T )) ≤ P ∗ (Hγ (S, T )) = P (Hγ (S, T )) ≤ 1
für S wie oben.
• ’Rückrichtung’: Sei Hγ (T, T ) ⊂ A ∈ B T . Dann ist A = Φ−1
S (Z) eine Zylindermenge
mit (höchstens) abzählbarer Basis S, Z ∈ B S . Es reicht zu zeigen Hγ (S, T ) ⊂ A, denn dies
impliziert P (A) = 1.
Sei f ∈ Hγ (S, T ). Dann existiert eine Funktion g ∈ Hγ (T, T ) mit f|S = g|S , Proposition
108. Damit
−1
−1
−1
−1
−1
−1
f ∈ Φ−1
S (f|S ) = ΦS (g|S ) = ΦS ΦS (g) ⊂ ΦS ΦS (A) = ΦS ΦS ΦS (Z) = ΦS (Z) = A.
q.e.d.
Theorem 109 Sei P ein W-maß auf dem Produktraum (IRT , B T ) mit T = [0, 1]. Falls es
Konstanten 0 < α, 1 < β und a gibt mit
Z
|f (t) − f (s)|α P (df ) ≤ a|t − s|β
für alle s < t ∈ T , so hat Hγ (T ) äußeres P -maß 1 für alle γ <
β−1
α .
Beweis: Sei Dn die Menge der reellen Zahlen 2in , 0 ≤ i ≤ 2n , und D der Grenzwert der
n
i
aufsteigenden Folge Dn . Definiere Bd = ∩n∈IN ∩2i=1 Hγ,d ({ i−1
2n , 2n }, T ) und B = ∪d>0 Bd .
• P (B) = 1.
Die Markoffungleichung liefert, δ := β − 1 − γα > 0,
c
P (Hγ,d
({s, t}, T ))
P (Bdc )
≤
R
≤
2
X X
≤
≤
=
a
|f (t) − f (s)|α P (df )
≤ αγ |t − s|β−αγ
α
α
γ
(d |t − s| )
d
n
c
P (Hγ,d
({
n∈IN i=1
i−1 i
, }, T ))
2n 2n
n
2
a X X
2−n(β−αγ)
dαγ n∈IN i=1
a X −nδ
2
dαγ n∈IN
1
a2−δ
→d→∞ 0
dαγ 1 − 2−δ
Die Abbildung d → Bd ist aufsteigend, die Bd sind meßbar und damit auch der Grenzwert B.
93
WS10/11
Maßtheorie
• ∀d > 0 ∃d′ ≥ d ∀S ⊂ T, D ⊂ S : Bd ∩ C(S, T ) ⊂ Hγ,d′ (S, T ) mit C(S, T ) = {f : T →
IR | f|S stetig }.
P
Sei f ∈ Bd , s < t ∈ S. Wir benutzen die Dualdarstellung x = i∈IN xi 2−i , xi ∈ {0, 1}
P
und nicht alle Koordinaten sind 1 ab einer gewissen Stelle. Für t = i ti 2−i und entsprechend
s sei i0 das kleinste i ∈ IN mit si 6= ti . Aktuell gilt si0 = 0 < 1 = ti0 . Sei i1 das kleinste
i > i0 mit ti = 1 und ∞, falls keine solches i existiert. Definiere die aufsteigende Folge tn =
Pn
−i ∈ D , n ∈ IN reeller Zahlen. Es gilt tn ↑ t, ti −ti−1 = t 2−i , t−u = P∞ (ti+1 −ti )
n
i
i=i0
i=1 ti 2
P
für u = ti0 und f (t) − f (u) = i=i0 (f (ti+1 ) − f (ti )) wegen der Stetigkeit. Es folgt
|f (t) − f (u)| ≤
∞
X
|f (ti+1 ) − f (ti )|
i=i0
∞
X
≤ d
≤ d
i=i0
∞
X
|ti+1 − ti |γ = d
2−iγ = d2−i1 γ
∞
X
ti+1 2−(i+1)γ
i=i0
∞
X
2−iγ
i=0
i=i1
1
d
≤
|t − u|γ
1 − 2−γ
1 − 2−γ
≤ c1 |t − u|γ
= d2−i1 γ
P
mit einer Konstanten c1 . Mit einem symmetrischen Argument, schreibe u − s = i xi 2−i in
P
der Dualdarstellung und mit der Folge xn = ni=0 xi 2−i →n u − s erhalten wir |f (u) − f (s)| ≤
c2 |u − s|γ mit eventuell einer anderen Konstanten c2 . Dies ergibt
|f (t) − f (s)| ≤ |f (t) − f (u)| + |f (u) − f (s)| ≤ c1 |t − u|γ + c2 |u − s|γ ≤ c3 |t − s|γ
mit einer Konstanten c3 ≥ d.
Die oben angeführten Abschätzungen gelten gleichmäßig in S ⊃ D.
• Bd ⊂ C(D, T )
Hölderstetigkeit impliziert Stetigkeit.
• Hγ (D, T ) = B
Aus Hγ,d (D, T ) ⊂ Bd ∩ C(D, T ) ⊂ Hγ,d′ (D, T ) folgt die Teilaussage mit d → ∞.
• ∀S ⊂ T, D ⊂ S : Hγ (S, T ) = B ∩ C(S, T )
Die Aussage folgt aus Hγ,d (S, T ) ⊂ Bd ∩ C(S, T ) ⊂ Hγ,d′ (S, T ) mit d → ∞ für eine Folge.
• P (B ∩ C(S, T )) = 1 für höchstens abzählbare S.
OEdA gilt D ⊂ S. Für jedes s ∈ S\D sei dn ∈ D eine Folge mit |dn − s| → 0 schnell
genug. Sei As,m = ∩n≥m Hγ,d ({dn , s}) und As der Grenzwert der aufsteigenden Folge As,m in
m. Wegen
X
|dn − s|β−γα < ∞
P (Acs,m ) ≤ c3
n≥m
mit c3 eine Konstante und Wahl der dn , konvergiert P (Acs,m ) in m gegen 0. Damit gilt
P (As,m ) →m P (As ) = 1. Damit ist A := ∩s∈S\D As meßbar und hat Maß 1. Aus B ∩ A ⊂
B ∩ C(S, T ) folgt die Behauptung.
• P (Hγ (S, T )) = 1 für höchstens abzählbare S.
OEdA sei D ⊂ S. Aus Hγ,d (S, T ) ⊂ Bd ∩ C(S, T ) ⊂ Hγ,d′ (S, T ) folgt B ∩ C(S, T ) =
Hγ (S, T ) und damit die Teilaussage.
Mit der Proposition 107 ergibt sich der Satz.
q.e.d.
Jetzt in stochastischer Schreibweise die stochastische Formulierung:
94
WS10/11
U. Rösler
Korollar 110 Sei X = (Xt )t∈T =[0,1] ein reellwertiger Prozeß. Falls es Konstanten 0 < α, 1 <
β und a gibt mit E|Xt − Xs |α ≤ a|t − s|β für alle s < t ∈ T , so gibt es eine γ-hölderstetige
Kopie von X für alle γ < β−1
α .
Beweis: Die ω’s ersetzen die Funktionen. Nehme die Einschränkung von P auf die Menge
{ω ∈ Ω | ∃d > 0 ∀s, t ∈ T : |Xt (ω) − Xs (ω)| ≤ d|t − s|γ }.
Diese tut’s, Proposition 106 und Satz 109.
q.e.d.
Der obige Satz und das Korollar lassen sich schnell ausdehnen auf kompakte T, nicht
jedoch auf ganz IR+ .
Bsp: Brownsche Bewegung Die Pfade der Brownschen Bewegung √
auf [0, 1] sind fast
sicher γ-hölderstetig für jedes γ < 1/2. Es gilt Xt − Xs ∼ N (0, t − s) ∼ t − sN (0, 1) und
damit
E|Xt − Xs |α ≤ aα |t − s|α/2
1
für α > 2. γ < α/2−1
= α−2
α
α →α→∞ ↑ 2 .
Insbesondere ist die Menge C der stetigen Funktionen eine 1-Menge für das äußere Maß.
Die Menge Hγ (T ) ist nicht B T meßbar, hat äußeres Maß 1 und ist in C enthalten. Standardmäßig nimmt man in die Definition der BB bereits die Stetigkeit der Pfade mit hinein,
nicht die Hölderstetigkeit.
Fortsetzung des Existenzbeweises der BB: Zu n ∈ IN sei Wtn : Ωn → IR eine BB auf dem
Intervall t ∈ Tn = [n − 1, n] mit stetigen Pfaden. Sei Pn das W-maß dazu. Durch Übergang
auf den Produktraum Ω = ΩIN versehen mit der Produkt-σ-Algebra und dem Produktmaß
können wir von unabhängigen Zgn (Wtn )t∈Tn : Ω → IRTn , n ∈, IN definiert auf demselben
W-raum ausgehen. Definiere für t ∈ IR+ , n = ⌊t⌋, die untere Gaussklammer
n+1
Wt = Wt−n
+
n
X
W1i
i=1
Dies ist eine standard Brownsche Bewegung. (Hier ist einiges Nachzurechnen.)
q.e.d.
Alternative Konstruktion: Für die Konstruktion des Prozesses ergeben sich gute Alternativen durch stetige (oder hölderstetige) Funktionen. Wir könnten einen Prozess konstruieren bzgl. der vorgegebenen Halbgruppe K s,t , s ≤ t ∈ D auf einer dichten und abzählbaren
Teilmenge D von T, wie zum Beispiel das oben verwendete D. Zeige dann µD (C(D)) = 1
oder µD (Hγ (D)) = 1 und erweitere das Maß µD von (IRD , B D ) auf (IRT , B T ). (Hintergrund
ist, jede stetige (hölderstetige) Funktion auf S kann zu genau einer auf T erweitert werden.)
Noch einmal abstrakt die (gemachte) Konstruktion. Sei (IRT , B T , µ) ein W-raum und die
Menge C(T ) der stetigen Funktionen auf T habe äußeres Maß 1. Dann ist die Abbildung
T
T
T
ϕ1 : (C(T ), B|C(T
) , µ|C(T ) ) → (R , B , µ)
definiert als Einbettung ein Maßraummorphismus, d.h. meßbar und maßerhaltend (µϕ−1 =
µ|C(T ) ). Sei D eine dichte, abzählbare Teilmenge von T. Die Abbildung
D
T
ϕ2 : (C(D), B|C(D)
, µ|C(D) ) → (C(T ), B|C(T
) , µ|C(T ) )
definiert durch die Einbettung ist ein Maßraumisomorphismus, d.h. ϕ2 ist bijektiv ϕ2 , ϕ−1
2
sind Maßraummorphismen.
95
WS10/11
Maßtheorie
Proposition 111 Sei Xt , t ∈ T = IR+ ein stochastischer Prozess auf (Ω, A, P ) mit stetigen
Pfaden. Dann ist X ′ : Ω × T → IR definiert durch X ′ (ω, t) = Xt (ω) meßbar bzgl. der ProduktN
σ-Algebra A B und der Borelschen.
Bew: OEdA sei T = [0, 1). Sei S eine dichte, abzählbare Teilmenge von T. Wie oben dargelegt
(allerdings für Ω = IRT ), ist XT : Ω → IRT A − B T -meßbar äquivalent zu XS : Ω → (IRS , B S )
meßbar wegen der Pfadstetigkeit. Die letztgenannte Zg ist genau dann meßbar, wenn X̃ :
Ω × S → IR, definiert durch X̃(ω, s) = Xs (ω), meßbar ist bzgl. der Produkt-σ-Algebra. (Die
Hinrichtung ist offensichtlich. Für die Rückrichtung verwende, für A ∈ A × Pot(S) ist jeder
Schnitt {ω ∈ Ω | (ω, s) ∈ A} in Richtung s ∈ S meßbar in A.)
Eigenschaften
Proposition 112 Sei Wt , t ∈ IR+ , eine Brownsche Bewegung zu σ 2 = VarW1 .
• Für a > 0 ist Wat , t ∈ IR+ , eine Brownsche Bewegung zum Parameter aσ 2 .
• Für a > 0 ist aWt , t ∈ IR+ , eine Brownsche Bewegung zum Parameter a2 σ 2 .
• Für s > 0 ist Xt+s − Xs , t ∈ IR+ , eine Brownsche Bewegungvzu σ 2 .
• Yt := tX1/t für t > 0 und Y0 := 0 ist f.s. eine Brownsche Bewegung zu σ 2 .
Beweis: Die ersten drei Aussagen sind einfach. Nur die vierte Aussage benötigt eine Argumentation.
Die Unabhängigheit der Zuwächse von Yt = tX1/t ist etwas Schreibarbeit, läßt sich jedoch
auf die Unabhängigkeit der Zuwächse des X-Prozesses zurückführen.
Der Zuwachs Yt − Ys = tX1/t − sX1/s = −s(X1/s − X1/t ) + (t − s)(X1/t − 0) ist eine
Summe von zwei unabhängigen Zgn mit Gaussverteilung zu den Parametern (0, s2 σ 2 ( 1s − 1t ))
2
und (0, (t − s)2 σt ). Diese ist Gaussverteilt mit Parameter die Summe der Einzelparameter
(=(0, σ 2 (t − s))).
Es verbliebe zu zeigen limt→0 tX1/t = 0 = limt→∞ Wt t . Verwende für n2 ≤ t < (n + 1)2
Wt = Wn2 + (Wt − Wn2 ) und
Borel-Cantelli gilt
W
limn→∞ nn22
X
P(
n
n
≤
|Wn2 |
n2
+
An
n2
= 0 f.s. wegen
mit An := supn2 ≤s≤(n+1)2 |Ws − Wn2 |. Mit
X EW 22
X 1
Wn2
n
≥
a)
≤
=
<∞
2
4
2
2 2
n
n n a
n n a
Borel-Cantelli liefert ebenfalls
X
|Wt |
t
An
n2
P(
D
D
→ 0 wegen An = sup0≤t≤2n+1 |Wt | =
X
An
>
a)
≤
n2
n
√
√
2n + 1A0 und
2n + 1
EA0 < ∞.
n2
q.e.d.
96
WS10/11
8.5.2
U. Rösler
Der Poissonsche Zählprozess
Ein Poissonprozess oder auch Poisson Zählprozess λ > 0 ist ein stochastischer Prozeß Xt :
Ω 7→ IR, t ∈ T = [0, ∞), mit den Eigenschaften
• Die Zuwächse sind unabhängig.
• Xt − Xs hat eine P oi(λ(t − s)) Poissonverteilung für alle s < t.
• Die Pfade t 7→ Xt (ω) sind rechtsstetig, isoton und haben nur Sprünge der Größe 1.
• X0 = 0.
Der Standard Poissonprozess ist ein Poissonprozess mit λ = 1.
Lemma 113 Der Poissonprozess existiert.
Beweis: Sei µs,t die Poissonverteilung P oi(λ(t−s)) für s < t. Sei K s,t , s < t ∈ IR+ , die Poisson
Halbgruppe,
K s,t (x, A) = µs,t (A − x).
+
Nach Kolmogoroff existiert zu dieser Halbgruppe ein W-Maß P = K T (0, ·) auf IRIR als
projektiver Limes. Nehme als Xt die Projektionen auf die t-te Koordinate. Es gilt X0 = 0.
Ersten beiden Eigenschaften: Für 0 = t0 < t1 < ... < tn , Ai ∈ B, ist zu zeigen
P (Xti − Xti−1 ∈ Ai , i = 1, ..., n) =
n
Y
µti ,ti−1 (Ai ).
i=1
Dies folgt durch die Konstruktion via den Kernen.
Zum Nachweis der dritten und letzten Eigenschaft werden wir den Prozess Xs : Ω 7→
+
ZZ , s ∈ S abzählbar mit obigen Eigenschaften betrachten und dann fortsetzen mittels X̃t =
limS∋sցt Xs punktweise. X̃t tut’s.
Sei S die Menge der dyadischen Zahlen { 2in | i ∈ IN, n ∈ IN.}. Dies ist eine dichte und
abzählbare Menge in T .
• Fast alle Pfade s 7→ Xs (ω), s ∈ S, sind stückweise konstant und haben nur Sprünge
aufwärts der Größe 1.
n
i
i−1
Eine Funktion f : IR+ 7→ IR mit f ∈ limn ∪n2
i=1 {g | g( 2n ) − g( 2n ) 6∈ {0, 1}} ist stückweise
konstant und hat nur Sprüngen aufwärts der Größe 1. (Übung). Wir schätzen ab
n
P (∪n2
i=1 {X
i
2n
6∈ {0, 1}} ≤
− X i−1
n
2
≤
≤
≤
n
n2
X
i=1
n
n2
X
i=1
n
n2
X
i=1
n
n2
X
i=1
Dies zeigt die Behauptung.
97
P (X
i
2n
6∈ {0, 1})
− X i−1
n
2
−n
exp(−λ2
)
∞
X
(λ2−n )j
j=2
j!
exp(−λ2−n )(λ2−n )2
∞
X
(λ2−n )j
j=0
j!
(λ2−n )2 ≤ nλ2 2−n →n→∞ 0.
WS10/11
Maßtheorie
• X̃t ist wohldefiniert wegen der Isotonie der Pfade.
• X̃t hat die richtige Verteilung.
Die Verteilung P oi(λs) konvergiert mit s → t gegen P oi(λt). Wegen Xs →S∋sցt X̃t hat
X̃t eine P oi(λt) Verteilung. Analog erhält man
D
(Xt1 , ..., Xtn ) = (X̃t1 , ..., X̃tn ).
q.e.d.
Beachte, wir benötigen hier nicht T = [0, 1) und die Aneinandersetzung des Prozesses.
Wir können die schöne“Version auch sofort einfacher angeben.
”
Sei Sn eine Summe von uiv Zgn zu einer Exponentialverteilung mit Parameter λ. Definiere
Nt als das größte n ∈ IN0 mit Sn ≤ t.
Lemma 114 Der Prozess (Nt )t∈IR+ ist eine Version des PP zum Parameter
Pfadeigenschaften.
1
λ
mit obigen
(Für die Gleichheit der endlich dimensionalen Verteilungen zeigt man die Markoffeigenschaft
von N und die bedingte Verteilung von Nt unter Ns ist die von Nt−s . Dies liegt an der altwie-neu-Eigenschaft einer exponentialverteilten Zg: P (X > t | X > s) = P (X < t − s) für
s < t. [?])
Eigenschaften
Proposition 115 Sei Xt : Ω → IN0 , t ∈ IR+ , ein Poissonprozess zum Parameter λ. Es gilt
• Für a > 0 ist Xat , t ∈ IR+ , ein Poissonprozess zum Parameter aλ.
• Für s > 0 ist Xt+s − Xs , t ∈ IR+ , ein Poissonprozess zu λ.
• Die Abbildung T ∋ t 7→ Xt (ω) ist fast sicher stetig in jedem t ∈ T.
• Fast alle Pfade haben unendlich viele Sprünge.
Beweis: Die ersten beiden Eigenschaften sind einfach. Für die dritte verwende die Abschätzung
P(
sup
t−ǫ≤s≤t+ǫ
|Xt − Xs | > 0) ≤ P (|Xt+ǫ − Xt−ǫ | > 0) ≤ 1 − Poi(2λǫ)(0) = 1 − e−2λǫ →ǫ 0.
Für die vierte Eigenschaft verwende
lim P (Xt ≤ n) = Poi(λt)({0, ..., n}) =
t
n
X
j=0
exp(−λ)
(λt)j
→t→∞ 0.
j!
q.e.d.
98
WS10/11
8.5.3
U. Rösler
Punktprozesse
Ein Punktprozess auf den reellen Zahlen versehen mit der Borel σ-Algebra B zum Radon Maß
µ auf den reellen Zahlen als Parameter ist ein stochastischer Prozeß Xt : Ω 7→ IN0 , t ∈ T = B,
mit den Eigenschaften
• Für paarweise disjunkte Mengen Bi ∈ B, i = 1, . . . n sind die XBi , ı = 1, . . . n unabhängig.
• XB hat eine Poi(µ(B))-Verteilung für B ∈ B.
• X∅ = 0.
• Die Pfade t 7→ Xt (ω) sind isoton bzgl. der Enthaltensordnung auf T.
Hierbei benutzen wir die Konvention, die Poissonverteilung zum Paramter ∞ ist das
Punktmaß auf unendlich.
Das Maß µ heißt Intensitätsmas̈. Das Intensitätsmaß eines Punktprozesses ist festgelegt
durch die Erwartungswerte XI von Intervallen. Der standard Punktprozess hat das Lebesmaß
als Intensitätsmaß. Damit ist X[0,t] , t ∈ IR+ ein Poisson Prozess zu λ = 1.
Existenz: Sei µ ein endliches Mas̈. Seien Zn , n ∈ IN uiv Zgn mit Verteilung µ(IµR) und N
P
sei Poi(µ(IR)) verteilt. Sei ν = N
i=1 δZi ein zufälliges Maß. Dann tut es XA := ν(A).
Die Ausdehnung auf σ-endliche Maße ist standard.
Wir können jetzt noch einen Schritt weitergehen. Seien Yn , n ∈ IN weitere uiv Zgn unP
abhängig von allem anderen. Setze ν = i∈IN δ(Zi ,Yi ) . Dann ist ν ein zufälliges Maß auf IR2
mit besonderen, schönen Eigenschaften. Wir gehen nicht in die Einzelheiten.
Bild
99
WS10/11
100
Maßtheorie
Literaturverzeichnis
[1] H. Bauer Wahrscheinlichkeitstheorie und Grundzüge der Maßtheorie De Gruyter, Berlin
1968
[2] P.J. Bickel and D.A. Freedman Some asymptotic theory for the bootstrap. Annals of
Probability 9 1196-1217, 1981.
[3] N. Dunford und J. Schwartz Linear Operators, Part I to III Wiley Interscience 1988.
[4] K.J. Falconer The Geometry of Fractal Sets. Cambridge University Press 1985
[5] P. Gaenssler und W. Stute, Seminar on empirical processes. DMV Seminar, Bd. 9, Birkhuser Verlag.
[6] Hahn-Rosenthal Set Functions Albuquerque, New Mexico 1948.
[7] P. R. Halmos Measure Theory Springer-Verlag 1974.
[8] P. A. Meyer Probability and Potentials Waltham-Toronto-London 1966
[9] Pedersen Analysis Now Springer-Verlag 1988,
101
WS10/11
102
Maßtheorie

Download Report