Skript - Universität Hamburg

Maßtheoretische Konzepte der Stochastik
Sommersemester 2016
Mathias Trabs∗
Universität Hamburg
13. Mai 2016
Modulbeschreibung: Allgemeine Dichten, Satz von Radon-Nikodym, Bedingte Erwartungswerte
und Übergangskerne, Martingale in diskreter Zeit, Konvergenz von Wahrscheinlichkeitsmaßen,
Integraltransformationen (z.B. erzeugende Funktionen, Fourier- und Laplace-Transformation)
Inhaltsverzeichnis
1 Wozu brauchen wir Maßtheorie? Ein Beispiel.
2
2 σ-Algebren und Maße
2.1 Definitionen und Eigenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.2 Konstruktion von Maßen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3 Dynkinsysteme* . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4
4
7
11
3 Integrationstheorie
3.1 Messbare Abbildungen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.2 Integralkonstruktion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
13
16
4 Lp -Räume und Radon-Nikodym-Dichten
4.1 Räume integrierbarer Funktionen . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.2 Satz von Radon-Nikodym und Lebesguescher Zerlegungssatz . . . . . . . . . . . . .
23
23
26
Literatur
• Bauer, H. (1992). Maß-und Integrationstheorie. de Gruyter.
• Elstrodt, J. (2007). Maß- und Integrationstheorie. Springer, Berlin Heidelberg.
• Georgii, H.-O. (2007). Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik.
de Gruyter, Berlin.
• Klenke, A. (2006). Wahrscheinlichkeitstheorie. Springer, Heidelberg.
• Küchler, U. (2015). Maßtheorie für Statistiker: Grundlagen der Stochastik. Springer, Berlin.
∗ Email:
[email protected]
1
1
Wozu brauchen wir Maßtheorie? Ein Beispiel.1
Betrachten wir n ∈ N unabhängige Würfe einer fairen Münze, also den endlichen Wahrscheinlichkeitsraum Ωn := {0, 1}n (mit der Interpretation, dass 0 “Kopf” entspricht und 1 “Zahl”) versehen
mit der Gleichverteilung Pn ({ω}) = 2−n für jedes ω ∈ Ωn . Der Anteil der Würfe mit dem Ergebnis
“Zahl”, ist dann gegeben durch
n
Sn (ω) :=
1X
ωi
n i=1
für alle
ω = (ωi )i=1,...,n ∈ Ωn .
Ist die Münze fair, so sollte Sn (ω) etwa 21 sein. Gleichheit tritt allerdings nur mit verschwindender
√
Wahrscheinlichkeit auf, da für große n Stirlings Approximation (n! ≈ 2πn( ne )n für n → ∞)
ergibt, dass
P2n S2n =
1
=2−2n # ω ∈ Ω2n : ω enthält genau n Einsen
2
1
−2n 2n
=2
≈√ .
n
πn
Tatsächlich liefert uns das schwache Gesetz der großen Zahlen
1
lim Pn Sn − < ε = 1
2
für alle ε > 0.
n→∞
Intuitiv würde man sogar folgende stärkere Form dieses Konvergenzresultates erwarten: Bezeichne
Ω := {0, 1}N := {ω = (ωi )i∈N : ωi ∈ {0, 1}, i ∈ N}
den Ergebnisraum eines unendlich langen Münzwurfes.
Bemerkung 1.1. Ω = {0, 1}N ist überabzählbar (Übung 2
).
Pn
1
Mit der Notation Sn (ω) := n i=1 ωi , ω ∈ Ω, entspricht das Gesetz der großen Zahlen
lim Sn (ω) =
n→∞
1
.
2
Für alle ω ∈ Ω gilt dies offensichtlich nicht (z.B. ω = (0, 0, 0 . . . )). Wir können also höchstens
fragen, ob dieser Grenzwert für fast alle Wurffolgen ω ∈ Ω gilt. Untersuchen wir also das Ereignis
1
ω ∈ Ω : lim Sn (ω) =
.
n→∞
2
Problem: Der Grenzwert hängt von dem asymptotischen Verhalten der Folge ω ab. Bisher
können wir aber nur die Wahrscheinlichkeiten von Ereignissen, die von endlichen vielen Münzwürfen abhängen, berechnen, genauer
P ({ω : (ω1 , . . . , ωn ) ∈ A}) = 2−n #A
für alle A ⊆ Ωn , n ∈ N.
Die Frage ist also, wie wir Wahrscheinlichkeiten P (A), A ∈ F, für zumindest ein Mengensystem
F ⊆ P(Ω) von Ereignissen auf Ω definieren. Als Mindestanforderung sollte gelten
A1. F enthält alle Ereignisse, die nur von endlichen vielen Münzwürfen abhängen, d.h. für alle
n ∈ N und A ⊆ Ωn gilt {ω : (ω1 , . . . , ωn ) ∈ A} ∈ F. Auf diesen Mengen ist P definiert durch
P ({ω : (ω1 , . . . , ωn ) ∈ A}) = Pn (A),
A ⊆ Ωn .
1 Dieser Abschnitt folgt Kapitel 1 aus Breiman, L. (1992). Probability. Classics in Applied Mathematics. Siam,
Philadelphia.
2
Versuchen wir die Wahrscheinlichkeit von A := {limn→∞ Sn (ω) − 12 > 0} abzuschätzen.
Bemerke
lim Sn (ω) = lim Sm2 (ω).
n→∞
m→∞
Für ε > 0 und 1 < m0 < m1 definieren wir
1
Aε := ω : limm→∞ Sm2 (ω) − > ε ,
2
m1
[
1
Am0 ,m1 :=
ω : Sm2 (ω) − > ε .
2
m=m
0
Da Am0 ,m1 nur von den ersten
Pm21
m21
Würfen abhängt, folgt aus (A1) und der Subadditivität von
P (Am0 ,m1 ) 6
m1
X
m=m0
1
Pm2 |Sm2 − | > ε .
2
Aus der Chebyshev-Ungleichung folgt
Var(Sm2 )
1
1
= 2 2
Pm2 Sm2 − > ε 6
2
2
ε
4ε m
Pm1
1
1
und damit P (Am0 ,m1 ) 6 4ε2 m=m0 m2 . Für festes m0 ist (Am0 ,m1 )m1 >m0 eine monoton wachsende Folge mit dem Grenzwert
[
[ 1
Am0 :=
Am0 ,m1 =
ω : Sm2 (ω) − > ε .
2
m1 >m0
m>m0
Wir benötigen folgende Monotonieannahme.
A2. Ist (An )n>1 ⊆ F eine monotone Folge, d.h. An ⊆ An+1 , dann gilt
[
lim P (An ) = P
An .
n→∞
S
n>1
An ∈ F und
n>1
Aus (A2) folgt
P (Am0 ) = lim P (Am0 ,m1 ) 6
m1 →∞
∞
1
1 X 1
6 2
.
4ε2 m=m m2
4ε (m0 − 1)
0
Sm2 (ω) − 1 > ε genau dann, wenn für alle m0 ein m > m0 existiert, so dass
2
Da limm→∞
Sm2 (ω) − 1 > ε, folgt Aε = T
m0 >1 Am0 . Da (Am0 )m0 >2 eine fallende Folge von Mengen ist, folgt
2
wieder aus (A2), dass
P (Aε ) = lim P (Am0 ) 6 lim
1
m0 →∞ 4ε2 m0
m0 →∞
= 0.
S
Schließlich stellen wir fest, dass A = ω : limm→∞ Sm2 (ω) − 12 > 0 = k>1 A1/k mit wachsender
Folge (A1/k )k , so dass erneut (A2) ergibt
P (A) = lim P (A1/k ) = 0.
k→∞
Wir haben somit folgendes starkes Gesetz der großen Zahlen für unser Münzwurfexperiment bewiesen:
Satz 1.2. Erfüllen F und P die Annahmen (A1) und (A2), so gilt P (ω : limn→∞ Sn (ω) = 12 ) = 1.
Es bleibt die Frage, ob eine Wahrscheinlichkeitsverteilung P existiert, welche die Annahmen
(A1) und (A2) erfüllt und ob P durch (A1) und (A2) eindeutig beschrieben wird (was man
intuitiv erwarten würde). Die Antwort auf diese Frage liefert Caratheodorys Fortsetzungssatz,
dem zentralen Satz der Maßtheorie.
3
σ-Algebren und Maße
2
2.1
Definitionen und Eigenschaften
Wie bereits bekannt, modellieren wir die Gesamtheit aller möglichen Ausgänge eines Zufallsexperimentes durch eine nichtleere Menge E. Die Potenzmenge P(E) ist definiert als die Menge aller
Teilmengen von E. Alle uns interessierenden Ereignisse fassen wir durch ein Mengensystem A aus
E zusammen.
Definition 2.1. Ein nichtleeres Mengensystem A ⊆ P(E) heißt
(i) Ring, falls für alle A, B ∈ A gilt auch A ∪ B ∈ A und A \ B ∈ A.
(ii) Algebra, falls für alle A, B ∈ A gilt A ∪ B ∈ A und E \ A ∈ A.
(iii) σ-Algebra, falls A eine Algebra ist und für alle (An )n>1 ⊆ A gilt
S
n>1
An ∈ A.
Satz 2.2. Sei A ⊆ P(E).
(i) Ist A ein Ring mit E ∈ A, so ist A auch eine Algebra.
(ii) Ist A eine Algebra, dann gilt für alle A, B ∈ A:
∅, E ∈ A,
A ∩ B ∈ A,
A \ B ∈ A.
Für A1 , . . . , An ∈ A gilt stets
n
[
Ak ∈ A
und
n
\
Ak ∈ A.
k=1
k=1
(iii) Ist A eine σ-Algebra und (An )n>1 ⊆ A, so gilt
∞
\
An ∈ A.
n=1
(iv) Der Durchschnitt
T
i∈I
Ai beliebig vieler σ-Algebren Ai , i ∈ I, ist wieder eine σ-Algebra.
Beweis. Übung 2
.
Beispiel 2.3. Sei E eine beliebige nichtleere Menge.
(i) {∅, E} und P(E) sind σ-Algebren.
(ii) Sei E ⊆ P(E) ein beliebiges Mengensystem. Dann ist
\
σ(E) :=
A : A ist σ-Algebra aus E mit E ⊆ A
(2.1)
die kleinste σ-Algebra, die E umfasst. σ(E) heißt die von E erzeugte σ-Algebra. Es gilt (Übung
2
):
(a) Ist A eine σ-Algebra aus E, so ist A = σ(A).
(b) Sind E, E 0 Mengensysteme aus E, so folgt aus E ⊆ E 0 , dass σ(E) ⊆ σ(E 0 ) gilt.
(iii) Sei Ωn = {0, 1}n bzw. Ω = {0, 1}N der Ergebnisraum des (unendlichen) Münzwurfexperiments. Das Mengensystem
F : = A ⊆ Ω : ∃n ∈ N, B ⊆ Ωn , so dass A = {ω ∈ Ω : (ω1 , . . . , ωn ) ∈ B}
= {πn−1 (B) : n ∈ N, B ⊆ Ωn }
mit der Projektion auf die ersten n Koordinaten πn : Ω → Ωn ist eine Algebra, aber keine
σ-Algebra.
4
(iv) Sei f : X → Y eine Abbildung und A ⊆ P(Y ). Dann definieren wir
f −1 (A) := {f −1 (A) : A ∈ A}.
Ist A eine σ-Algebra auf Y , so ist f −1 (A) eine σ-Algebra auf X, welche die durch f induzierte
σ-Algebra genannt wird. Für jedes Mengensystem E ⊆ P(Y ) gilt (Übung 2
)
σ(f −1 (E)) = f −1 (σ(E)).
(v) Für n > 1 bildet das folgende Mengensystem eine Algebra auf Rn :
Qn :=
K
n[
(ak , bk ] :(ak , bk ] :=
k=1
n
Y
(ak,l , bk,l ] mit − ∞ 6 ak,l 6 bk,l 6 ∞, k = 1, . . . , K, l = 1, . . . , n
l=1
o
und (ak , bk ] sind paarweise disjunkt, K ∈ N ,
wobei wir hier (a, ∞] = (a, ∞) für a ∈ R setzen. Es ist aber keine σ-Algebra, denn (n = 1)
[
/ A.
(0, 1 − k1 ] = (0, 1) ∈
k>1
(vi) Sei (E, d) ein metrischer (oder topologischer) Raum und bezeichne O(E) die Familie der
offenen Teilmengen und C(E) die Familie der abgeschlossenen Teilmengen. Die von O(E)
erzeugte σ-Algebra BE := σ(O(E)) heißt Borelsche σ-Algebra auf E. Eine Teilmenge A ∈
BE wird Borelmenge des metrischen Raumes (E, d) genannt. Es gilt (Übung 2
)
(a) BE = σ(C(E)),
(b) BRn = σ(Qn ).
Definition 2.4. Ein Paar (E, A), wobei E eine nichtleere Menge und A ⊆ P(E) eine σ-Algebra
ist, heißt messbarer Raum. Die Elemente von A heißen messbare Mengen.
Maße sind Abbildungen von einer σ-Algebra nach [0, ∞], die intuitiv jeder Menge aus der
σ-Algebra eine “Größe” zuordnen, bspw. Flächen oder Volumina. Es ist intuitiv, dass diese Abbildungen nichtnegativ und additiv sein sollten. In der Stochastik dienen Maße dazu, den Ereignissen
Wahrscheinlichkeiten zuzuordnen, was den Wertebereich von Wahrscheinlichkeitsmaßen auf natürliche Weise auf [0, 1] beschränkt.
Definition 2.5. Es sei A eine Algebra auf E 6= ∅. Eine Abbildung µ : A → [0, ∞] := [0, ∞) ∪ {∞}
heißt Inhalt, falls µ(∅) = 0 und falls µ additiv ist, d.h. für disjunkte Mengen A, B ∈ A gilt
µ(A ∪ B) = µ(A) + µ(B).
µ heißt σ-additiv oder σ-Inhalt, falls
S zusätzlich für jede abzählbare Folge (Ak )k>1 ⊆ A paarweise disjunkter Mengen aus A mit k>1 Ak ∈ A gilt
∞
∞
[
X
µ
Ak =
µ(Ak ).
k=1
k=1
Ein σ-additiver Inhalt µ : A → [0, ∞] auf einer σ-Algebra A heißt Maß auf A.
Ein Tripel (E, A, µ) aus einer nichtleeren Menge E, einer σ-Algebra A und einem Maß µ auf
A heißt Maßraum. Die Mengen A ∈ A mit µ(A) = 0 heißen µ-Nullmengen.
Satz 2.6 (Eigenschaften von Inhalten und Maßen). Für jeden Inhalt µ : A → [0, ∞] auf einer
Algebra A ⊆ P(E) gelten folgende Aussagen:
(i) Für alle A, B ∈ A mit A ⊆ B und µ(A) < ∞ gilt µ(B \ A) = µ(B) − µ(A), insbesondere
µ(A) 6 µ(B) (Monotonie).
5
(ii) Für alle A, B ∈ A mit µ(A ∩ B) < ∞ gilt µ(A ∪ B) = µ(A) + µ(B) − µ(A ∩ B).
(iii) Die beiden folgenden Eigenschaften sind äquivalent:
(a) Die additive Mengenfunktion µ ist σ-additiv.
(b) Für jede Folge (An )n>1 ⊆ A mit An ⊆ An+1 , µ(An ) < ∞ für n > 1 und
gilt
[
lim µ(An ) = µ
An
(Stetigkeit von unten).
n→∞
S
n>1
An ∈ A,
n>1
An ∈ A,
n>1
(iv) Die beiden folgenden Eigenschaften sind äquivalent:
(a) Für jede Folge (An )n>1 ⊆ A mit An ⊇ An+1 , n > 1, und µ(A1 ) < ∞ und
gilt
\
lim µ(An ) = µ
An
(Stetigkeit von oben).
n→∞
T
n>1
(b) Für jede Folge (An )n>1 ⊆ A mit An ⊇ An+1 , n > 1, und µ(A1 ) < ∞ und
gilt limn→∞ µ(An ) = 0 (Stetigkeit in der leeren Menge).
T
n>1
An = ∅
(v) Die Eigenschaften in (iii) implizieren (iv). Im Fall µ(E) < ∞ sind die Eigenschaften in (iii)
und (iv) äquivalent.
S
(vi) Ist µ σ-additiv, so gilt für jede Folge (An ) ⊆ A mit n>1 An ∈ A die Ungleichung
∞
[
X
An 6
µ
µ(An )
(Subadditivität).
n=1
n>1
Beweis. (i) Wegen B = A ∪ (B \ A) gilt µ(B) = µ(A) + µ(B \ A).
(ii) Folgt aus A ∪ B = (A \ B) ∪ (B \ A) ∪ (A ∩ B).
Sn
(iii) (a)⇒(b) Definiere B1 := A1 und Bn := An \ An−1 für n > 1. Dann gilt k=1 Bk = An
und
n
∞
[
[
[
X
Bk = µ
Ak .
lim µ(An ) = lim µ
Bk =
µ(Bk ) = µ
n→∞
n→∞
k=1
k>1
k=1
k>1
(b) ⇒ S(a) Für paarweise disjunkte (Bn )n>1 ⊆ A folgt die σ-Additivität aus obiger Zeile mit
n
An := k=1 Bk .
(iv) Übung 2
.
T
(v) Wir zeigen (iii)(a) ⇒ (iv)(b): Sei (An )n>1 ⊆ A fallend mit µ(A1 ) < ∞ und n>1 An = ∅.
S∞
P
Definiere die disjunkten Mengen Bn := An \ An+1 . Es gilt An = k=n Bk und k>1 µ(Bk ) =
P∞
µ(A1 ) < ∞. Aus µ(An ) = k=n µ(Bk ) folgt die Behauptung.
S Falls µ(E) < ∞, so gilt (iv)(b)
S∞ ⇒ (iii)(a): Sei (An ) ⊆ A eine Folge
T disjunkter Mengen mit
A
∈
A.
Die
Folge
B
:=
A
∈
A
ist
monoton
fallend
mit
n
n
k
n>1
k=n
n>1 Bn = ∅. Dann gilt
µ(
[
k>1
Ak ) = lim µ(
n→∞
n
[
n
X
Ak ) + µ(Bn+1 ) = lim
µ(Ak ) + lim µ(Bn+1 ).
n→∞
k=1
n→∞
k=1
Da letzterer Grenzwert gegen 0 konvergiert, folgt die σ-Additivität.
Sn−1
S
S (vi) Für die Folge disjunkter Mengen B1 := A1 und Bn := An \ k=1 Ak gilt n>1 An =
n>1 Bn und es folgt aus der σ-Additivität und (i)
µ
[
n>1
[
X
X
An = µ
Bn =
µ(Bn ) 6
µ(An ).
n>1
n>1
6
n>1
Definition 2.7. Ein Inhalt µ : A S
→ [0, ∞] auf einer Algebra A über E heißt σ-endlich, falls eine
Folge (En )n>1 ⊆ A existiert mit n>1 En = E und µ(En ) < ∞ für alle n > 1. Gilt µ(E) < ∞,
dann heißt µ endlich. Gilt µ(E) = 1 für ein Maß µ auf einer σ-Algebra A, so nennt man µ
Wahrscheinlichkeitsmaß und (E, A, µ) Wahrscheinlichkeitsraum.
Definition 2.8. Sei (E, A, µ) ein Maßraum. Das Maß µ : A → [0, ∞] heißt vollständig, falls jede
Teilmenge einer Nullmenge selbst messbar ist, d.h. ist A ∈ A eine Menge vom Maß µ(A) = 0 und
B ⊆ A, so gilt B ∈ A.
Beispiel 2.9.
(i) Das Zählmaß zählt die Anzahl der Elemente einer Menge. Wir definieren µ : P(E) → [0, ∞]
durch
(
#A,
falls A endlich,
µ(A) :=
+∞,
sonst.
µ ist genau dann σ-endlich, wenn E abzählbar ist. µ ist vollständig (da A = P(E)). Ist
#A
, A ⊆ E, ein Wahrscheinlichkeitsmaß, die Gleichverteilung
E endlich, dann ist P (A) := #E
(insbesondere ist Pn auf Ωn aus Kaptiel 1 ein Wahrscheinlichkeitsmaß).
(ii) Sei x ∈ E ein fixierter Punkt. Das Dirac-Maß entscheidet, ob x in einer Menge liegt oder
nicht. Wir definieren δx : P(E) → [0, ∞] durch
(
1,
falls x ∈ A,
δx (A) =
0,
falls x ∈
/ A.
δx ist ein vollständiges Wahrscheinlichkeitsmaß.
d
(iii) Sei (xn )∞
n=1 ⊆ R eine Folge ohne Häufungspunkte und f : N → [0, ∞) eine Gewichtsfunktion. Wir definieren µf : P(Rd ) → [0, ∞] durch
X
µf (A) :=
f (n).
xn ∈A
µf ist ein vollständiges, σ-endliches Maß. Die σ-Endlichkeit folgt, da man Rd durch kompakte
Kugeln ausschöpfen kann, die jeweils nur endlich viele Folgeglieder xn enthalten können, da
(xn )n keinen Häufungspunkt hat.
2.2
Konstruktion von Maßen
Da man im Allgemeinen nicht einmal alle Elemente der σ-Algebra eines messbaren Raumes (E, A)
kennt (z.B. Borelmengen), erscheint es hoffnungslos µ(A) für alle A ∈ A angeben zu können. Wie
gelangt man dann aber zum konkreten Maß? Wir verwenden die Konstruktion von Caratheodory.
Einen σ-Inhalt µ auf einem Ring R über E nennen wir Prämaß. Unser Ziel ist nun, den
zugehörigen Prämaßraum (E, R, µ) zu einem (vollständigen) Maßraum fortzusetzen. Zunächst ein
Reduktionsschritt.
Definition 2.10. Eine Abbildung µ∗ : P(E) → [0, ∞] heißt äußeres Maß auf E, falls
(i) µ∗ (∅) = 0,
(ii) aus A ⊆ B für A, B ⊆ E folgt µ∗ (A) 6 µ∗ (B) (Monotonie),
S∞
P∞
(iii) für An ⊆ E, n > 1, gilt µ∗ ( n=1 An ) 6 n=1 µ∗ (An ) (σ-Subadditivität).
Definition 2.11. Sei µ∗ ein äußeres Maß auf P(E). Eine Teilmenge A ⊆ E heißt µ∗ -messbar,
falls für alle Teilmengen B ⊆ E gilt
µ∗ (B) = µ∗ (A ∩ B) + µ∗ (Ac ∩ B).
Die Menge aller µ∗ -messbaren Teilmengen von E bezeichnen wir mit Aµ∗ .
7
(2.2)
µ∗ -messbare Mengen A zerlegen also jedes B ∈ P(E) in zwei disjunkte Teilmengen, auf denen
µ additiv ist. Aufgrund der Subadditivität von µ∗ ist nur > für die Messbarkeit zu zeigen.
∗
Satz 2.12 (Caratheodory, 1914). Sei µ∗ : P(E) → [0, ∞] ein äußeres Maß, dann ist
(E, Aµ∗ , µ∗ |Aµ∗ ) ein vollständiger Maßraum.
Beweis. Schritt 1: Aµ∗ ist eine Algebra.
Offenbar ist E ∈ Aµ∗ und da (2.2) symmetrisch in A und Ac ist, folgt aus A ∈ Aµ∗ auch
c
A ∈ Aµ∗ . Sind A, B ∈ Aµ∗ , so gilt für alle Q ⊆ E:
µ∗ (Q) >µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac )
>µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac ∩ B) + µ∗ (Q ∩ Ac ∩ B c )
>µ∗ (Q ∩ A) ∪ (Q ∩ Ac ∩ B) + µ∗ (Q ∩ (A ∪ B)c )
=µ∗ (Q ∩ (A ∪ B)) + µ∗ (Q ∩ (A ∪ B)c ).
Somit ist A ∪ B ∈ Aµ∗ .
S
Schritt 2: Ist (An )n>1 eine Folge disjunkter Mengen aus Aµ∗ , so ist A := n>1 An ∈ Aµ∗ und
µ∗ (A) =
X
µ∗ (An ).
(2.3)
n>1
Für disjunkte Mengen M, N ∈ Aµ∗ folgt aus (2.2) mit B = Q∩(M ∪N ), dass µ∗ (Q∩(M ∪N )) =
µ (Q ∩ M ) + µ∗ (Q ∩ N ). Induktiv folgt für jedes n ∈ N
∗
∗
µ (Q ∩
n
[
Aj ) =
j=1
Nach Schritt 1 ist
Sn
j=1
n
X
µ∗ (Q ∩ Aj ).
j=1
Aj ∈ Aµ∗ und wir erhalten für alle Q ⊆ E und alle n ∈ N:
n
n
n
[
c X
[
µ∗ (Q) = µ∗ Q ∩
Aj + µ∗ Q ∩
Aj
>
µ∗ (Q ∩ Aj ) + µ∗ (Q ∩ Ac ).
j=1
j=1
j=1
Also liefert die σ-Subadditivität
µ∗ (Q) >
∞
X
µ∗ (Q ∩ Aj ) + µ∗ (Q ∩ Ac ) > µ∗ (Q ∩ A) + µ∗ (Q ∩ Ac ) > µ∗ (Q).
j=1
Diese Ungleichungskette zeigt A ∈ Aµ∗ sowie (2.3) im Fall Q = A.
Schritt 3: µ∗ ist vollständig.
Ist N ∈ Aµ∗ eine µ∗ -Nullmenge und M ⊆ N , dann gilt µ∗ (M ) = 0 und für jedes Q ⊆ E
impliziert die Monotonie:
µ∗ (Q) > µ∗ (Q ∩ M ) + µ∗ (Q ∩ M c ) > µ∗ (Q ∩ N ) + µ∗ (Q ∩ N c ) = µ∗ (Q).
Satz 2.13 (Fortsetzungssatz). Sei µ : R → [0, ∞] ein Inhalt auf einem Ring R über E. Wir
definieren µ∗ : P(E) → [0, ∞] durch
o
( n P∞
S∞
inf
n=1 µ(An ) : B ⊆
n=1 An mit An ∈ R für alle n > 1
∗
µ (B) :=
+∞, falls Bnicht in einer abzählbaren Vereinigung von Mengen aus Rliegt.
Dann gilt:
(i) µ∗ ist ein äußeres Maß auf E (das von µ erzeugte äußere Maß).
(ii) R ⊆ Aµ∗ .
8
(iii) Ist µ ein σ-Inhalt, so gilt µ = µ∗ |R .
Beweis. (i) Da ∅ ∈ R und µ > 0, gilt µ∗ (∅) = 0. Ist B1 ⊆ B2 , so ist jede Überdeckung von B2
auch eine Überdeckung von B1 , woraus die Montonie µ∗ (B1 ) 6 µ∗ (B2 ) folgt.
Sei nun (An )n>1 ⊆ P(E). Ist µ∗ (An ) = ∞ für ein n, so ist die Ungleichung
µ∗ (
∞
[
An ) 6
n=1
∞
X
µ∗ (An )
n=1
trivial. Es sei nun µ∗ (An ) < ∞
S für alle n > 1 und sei ε > 0. Für jedes n ∈ N gibt es eine Folge
(Bnk )k>1 ⊆ R, so dass An ⊆ k>1 Bnk und
X
µ(Bnk ) 6 µ∗ (An ) + ε · 2−n .
k>1
S
S
S
Nun ist (Bnk )(n,k)∈N2 eine abzählbare Familie von Mengen aus R mit n>1 An ⊆ n>1 k>1 Bnk
und es folgt
[
XX
X
X ∗
µ∗
An 6
µ∗ (Bnk ) 6
µ∗ (An ) + ε · 2−n =
µ (An ) + ε.
n>1
n>1 k>1
n>1
n>1
Da ε beliebig war, folgt die σ-Subadditivität und µ∗ ist ein äußeres Maß.
S
(ii) Seien nun A ∈ R und B ⊆ E mit µ∗ (B) < ∞. Wir wählen (An ) ⊆ R mit B ⊆ n>1 An
(existiert da µ∗ (B) < ∞). Da µ ein Inhalt auf R ist und µ∗ |R 6 µ, folgt
X
X
X
µ(An ) =
µ(An ∩ A) +
µ(An ∩ Ac )
n>1
n>1
>
X
n>1
∗
µ (An ∩ A) +
n>1
∗
>µ
A∩
X
µ∗ (An ∩ Ac )
n>1
[
An + µ∗ Ac ∩
An
[
n>1
∗
n>1
∗
c
>µ (A ∩ B) + µ (A ∩ B).
Bilden wir das Infimum über alle Überdeckungen (An )n>1 von B, erhalten wir µ∗ (B) > µ∗ (A ∩
B) + µ∗ (Ac ∩ B).
(iii) Sei nun µ ein σ-Inhalt und B ∈SR. Nach Definition gilt µ∗ (B) 6 µ(B). Für jede Überdeckung (An )n>1 ⊆ R von B gilt B = n>1 Bn mit der Folge (Bk )k>1 ⊆ R disjunkter Mengen
Sn−1 B1 := B ∩ A1 und Bn := B ∩ An \ k=1 Ak , n > 2. Dann folgt
[
X
X
µ(B) = µ
Bn =
µ(Bn ) 6
µ(An ).
n>1
n>1
n>1
Bilden wir das Infimum über alle Überdeckungen, folgt µ(B) 6 µ∗ (B).
Diese beiden Sätze zeigen, dass jeder Prämaßraum (E, R, µ) zu einem vollständigen Maßraum
(E, Aµ∗ , µ∗ |Aµ∗ ) fortgesetzt werden kann. Beachte, dass die kleinste Fortsetzung zu einem Maßraum gegeben ist durch (E, σ(R), µ
e) mit µ
e = µ∗ |σ(R) .
Bemerkung 2.14. Man kann zeigen, dass Aµ∗ die Vervollständigung von σ(R) ist, d.h.
Aµ∗ = A ∪ N : A ∈ σ(R), N ⊆ N0 für ein N0 ∈ σ(R) mit µ
e(N0 ) = 0 .
Satz 2.15 (Eindeutigkeitssatz). Es seien µ und ν zwei Maße auf einer σ-Algebra A = σ(R) über
E erzeugt von einem Ring R mit
(i) µ|R = ν|R und
9
(ii) es
S existiert eine wachsende Folge (En )n>1 ⊆ R mit µ(En ) = ν(En ) < ∞ für alle n ∈ N und
n En = E,
dann gilt µ = ν.
Beweis.
Für jedes A ∈ A = σ(R) haben wir eine monotone wachsende Ausschöpfung A =
S
A
∩
En . Aufgrund der Stetigkeit von unten gilt
n>1
µ(A) = lim µ(A ∩ En )
n→∞
und ν(A) = lim ν(A ∩ En ).
n→∞
Es genügt also folgendes zu zeigen: Sei A ∈ R und B ∈ A eine Teilmenge von A, dann gilt
µ(B) = µ∗ (B) = ν(B) mit
µ∗ (B) = inf
∞
nX
µ(Cn ) : B ⊆
n=1
[
o
Cn , Cn ∈ R .
n>1
Für jede Überdeckung (Cn ) ⊆ R von B gilt:
[
X
X
ν(B) 6 ν
Cn 6
ν(Cn ) =
µ(Cn ).
n>1
n>1
n>1
Bilden wir das Infimum über alle Überdeckungen, erhalten wir ν(B) 6 µ∗ (B). Analog ergibt sich
ν(A \ B) 6 µ∗ (A \ B). Es folgt
µ∗ (A) = ν(A) = ν(B) + ν(A \ B) 6 µ∗ (B) + µ∗ (A \ B) 6 µ∗ (A),
so dass überall Gleichheit gilt. Insbesondere folgt ν(B) = µ∗ (B).
Bemerkung 2.16. Diesen Satz kann man auf einen durchschnittsstabilen Erzeuger der σ-Algebra
statt eines Ringes abschwächen.
Korollar 2.17. Sei µ ein σ-endlicher σ-Inhalt auf einem Ring R. Dann existiert genau ein Maß
µ
e auf σ(R), welches µ fortsetzt, d.h. für das µ
e|R = µ gilt. Dieses Maß ist σ-endlich.
Beispiel 2.18.
(i) Im unendlichen Münzwurfexperiment Ω = {0, 1}N haben wir bereits gesehen, dass F =
{πn−1 (B) : n ∈ N, B ⊆ Ωn } mit Ωn = {0, 1}n und den Projektionen πn : Ω → Ωn eine Algebra
ist. Auf F hatten wir P (πn−1 (B)) := Pn (B) := 2−n #B für alle n ∈ N, B ⊆ Ωn definiert.
Da Pn Wahrscheinlichkeitsmaße sind, ist P ein σ-Inhalt auf F und wegen Ω = π1−1 ({0, 1})
mit P (π1−1 ({0, 1})) = P1 ({0, 1}) = 1 ist P auch normiert (insbesondere σ-endlich). Folglich
können wir P zu einem eindeutigen Wahrscheinlichkeitsmaß P auf σ(F) fortsetzen.
(ii) Ein Radon-Maß auf (R, BR ) ist ein Maß µ mit µ(B) < ∞ für alle beschränkten Mengen
B ∈ BR . Da der Ring
Q1 :=
n
n[
o
(ak , bk ] : −∞ 6 a1 < b1 < a2 < b2 < · · · < an < bn 6 ∞, n ∈ N ∪ {∅}
k=1
auf R die Borel-σ-Algebra BR erzeugt, wird jedes Radon-Maß durch die Werte
µ((a, b]), −∞ < a 6 b < ∞ eindeutig festgelegt.
Das Maß λ auf (R, BR ) mit λ((a, b]) = b − a für alle −∞ < a 6 b < ∞ heißt LebesgueMaß auf (R, BR ). Die Existenz kann man S
mit Hilfe von Satz
angewendet auf den Ring
P2.13
n
n
Q1 und das darauf definierte Prämaß µ( k=1 (ak , bk ]) =
(b
k=1 k − ak ) nachweisen. Die
Vervollständigung von (R, BR ) bzgl. λ wird mit (R, LR ) bezeichnet mit der σ-Algebra der
Lebesguemessbaren Mengen LR := Aµ∗ .
10
(iii) Aus der mathematischen Stochastik ist bekannt, dass sich jedes Wahrscheinlichkeitsmaß
auf (R, BR ) eindeutig durch seine Verteilungsfunktion F : R → [0, 1], F (x) = P((−∞, x]) beschreiben lässt. Dies folgt auch aus (ii), da P((a, b]) = F (b)−F (a). Umgekehrt kann man ähnlich wie beim Lebesgue-Maß zeigen, dass zu jeder rechtsseitig stetigen, monoton steigenden
Funktion F : R → [0, 1] mit F (−∞) := limx↓−∞ F (x) = 0 und F (∞) := limx↑∞ F (x) = 1
ein Wahrscheinlichkeitsmaß existiert, das F als Verteilungsfunktion hat.
In Verallgemeinerung des letzten Beispiels lässt sich zeigen
Satz 2.19. Zu jeder rechtsseitig stetigen, monoton steigenden Funktion G : R → R existiert genau ein Radon-Maß (oder Lebesgue-Stieltjes-Maß) µG , so dass µG ((a, b]) = G(b) − G(a) für alle
−∞ < a 6 b < ∞. G heißt maßdefinierende Funktion zu µG . Für jedes Radonmaß µ auf (R, BR )
ist die maßdefinierende Funktion bis auf eine additive Konstante eindeutig bestimmt. Eine maßdefinierende Funktion ist gegeben durch G(a) := µ((0, a]) für a > 0 und G(a) = −µ((a, 0]) für
a < 0.
Beweis. Übung 2
.
2.3
Dynkinsysteme*
Definition 2.20. Sei E 6= ∅. Ein Mengensystem D ⊆ P(E) heißt Dynkinsystem über E, falls:
(i) E ∈ D,
(ii) für alle A, B ∈ D mit A ⊆ B gilt B \ A ∈ D,
(iii) Für jede Folge diskjunkter Mengen (An )n∈N ⊆ D gilt
S
n∈N
An ∈ D.
Offensichtlich ist jede σ-Algebra ein Dynkinsystem. Umgekehrt gilt
Lemma 2.21. Ist D ein ∩-stabiles Dynkinsystem, so ist D auch eine σ-Algebra.
Beweis. Wir weisen die Eigenschaften einer σ-Algebra nach. Es gilt E ∈ D und E \ A ∈ D für
jedes A ∈ D nach Definition. Sind A, B ∈ D, so ist auch A \ B = A \ (A ∩ B) ∈ D und daher
auch A ∪ B = A ∪ (B \ A) ∈ D. Für (An )n>1 ⊆ D definieren wir B1 := A1 ∈ D und Bn :=
Sn−1
S
S
An \ k=1 Ak ∈ D, so dass (Bn )n>1 paarweise disjunkt sind mit n>1 An = n>1 Bn ∈ D.
Sei E 6= ∅ und E ⊆ P(E). Ganz analog zur erzeugten σ-Algebra ist das kleinste DynkinSystem, welches E umfasst, gegeben durch
\
δ(E) := {D : D ist Dynkinsystem über E mit E ⊆ D}.
δ(E) heißt das von E erzeugte Dynkinsystem.
Satz 2.22. Ist E ⊆ P(E) ∩-stabil, so ist auch δ(E) ∩-stabil. Insbesondere gilt in diesem Fall
δ(E) = σ(E).
Beweis. Für jedes C ∈ δ(E) werden wir zeigen, dass
δ(E) ⊆ DC := {A ∈ δ(E) : A ∩ C ∈ δ(E)}.
Daraus folgt DC = δ(E) für jedes C ∈ δ(E), also ist δ(E) ∩-stabil und nach Lemma 2.21 eine
σ-Algebra, d.h. σ(E) ⊆ δ(E). Anderseits ist jede σ-Algebra ein Dynkinsystem, so dass δ(E) ⊆ σ(E)
und damit σ(E) = δ(E) folgt.
Zunächst weisen wir nach, dass DC ein Dynkinsystem ist:
(i) E ∈ DC , da E ∩ C = C ∈ δ(E).
(ii) Sind A, B ∈ DC mit A ⊆ B, dann ist (B \ A) ∩ C = (B ∩ C) \ (A ∩ C) ∈ δ(E).
11
(iii) Sind (An )n>1 ⊆ DC paarweise disjunkt, so ist (
S
n>1
An ) ∩ C =
S
n>1 (An
∩ C) ∈ δ(E).
Für C ∈ E gilt E ⊆ DC nach Annahme, damit auch δ(E) ⊆ DC . Für jedes A ∈ δ(E) und C ∈ E gilt
also A ∩ C ∈ δ(E) also C ∈ DA . Es folgt E ⊆ DA , was δ(E) ⊆ DA für jedes A ∈ δ(E) impliziert.
Damit lässt sich der Eindeutigkeitssatz wie folgt verschärfen.
Satz 2.23 (Eindeutigkeitssatz II). Es seien µ und ν zwei Maße auf einer σ-Algebra A = σ(E)
über E erzeugt von einem ∩-stabilen Erzeuger E mit
(i) µ|E = ν|E und
(ii) S
es existiert eine wachsende Folge (En )n>1 ⊆ E mit µ(En ) = ν(En ) < ∞ für alle n ∈ N und
n En = E,
dann gilt µ = ν.
Beweis. Für jedes A ∈ A = σ(E) haben wir eine monotone wachsende Ausschöpfung A =
En . Aufgrund der Stetigkeit von unten gilt
µ(A) = lim µ(A ∩ En )
n→∞
S
n>1
A∩
und ν(A) = lim ν(A ∩ En ).
n→∞
Es genügt also µ(A ∩ C) = ν(A ∩ C) für jedes A ∈ A und C ∈ E mit µ(C) < ∞ zu zeigen. Wir
definieren
DC := {A ∈ A : µ(A ∩ C) = ν(A ∩ C)}.
Dann ist DC für ein beliebiges C ∈ E mit µ(C) < ∞ ein Dynkinsystem:
(i) E ∈ DC , denn E ∩ C = C ∈ E.
(ii) Sind A, B ∈ DC mit A ⊆ B, dann gilt
µ (B \ A) ∩ C = µ (B ∩ C) \ (A ∩ C) = µ(B ∩ C) − µ(A ∩ C)
= ν(B ∩ C) − ν(A ∩ C) = ν((B \ A) ∩ C).
(iii) Sind (An )n>1 ⊆ Dc disjunkt, dann folgt
[
X
[
(An ∩ C) =
µ(An ∩ C)
An ∩ C = µ
µ
n>1
n>1
n>1
=
X
n>1
ν(An ∩ C) = ν
[
An ∩ C .
n>1
Da E ∩-stabil, ist E ⊆ Dc und damit δ(E) ⊆ DC ⊆ A = σ(E). Anderseits folgt δ(E) = σ(E) aus
Satz 2.22, also DC = A für jedes C ∈ E.
3
Integrationstheorie
Um Erwartungswerte, Varianzen, Kovarianzen, etc. von Zufallsgrößen zu berechnen, benötigen
wir einen Integralbegriff auf Wahrscheinlichkeitsräumen (E, A, µ). Diesen einzuführen und dessen
Eigenschaften kennen zu lernen ist Ziel dieses Kapitels. Als Integranden werden wir Funktionen
f : E → R := [−∞, ∞] betrachten, d.h. die Funktionswerte ±∞ sind zugelassen. Bevor wir das
(Lebesgue-)Integral konstruieren können, lernen wir im ersten Abschnitt die Klasse von Abbildungen kennen, die wir anschließend integrieren wollen.
12
3.1
Messbare Abbildungen
Es seien (E, A) und (F, B) zwei messbare Räume und f : E → F eine Abbildung.
Definition 3.1. Die Abbildung f heißt (A, B)-messbar (wenn keine Verwechslungen möglich sind,
auch kürzer A-messbar, oder einfach messbar), falls f −1 (B) ⊆ A, d.h.
f −1 (B) ∈ A für alle B ∈ B.
(3.1)
Ist (F, d) ein metrischer Raum, so betrachtet man die Borel-σ-Algebra BF und jede (A, BF )messbare Abbildung f : E → F heißt auch Borel-messbar. Im Allgemeinen ist Messbarkeit schwer
nachzuprüfen. Oft hilft folgendes Kriterium:
Lemma 3.2. Es sei E ein Erzeuger von B, d.h. B = σ(E). Dann ist f (A, B)-messbar genau dann,
wenn
f −1 (E) ⊆ A.
(3.2)
Beweis. Aus der Messbarkeit von f folgt offensichtlich (3.2). Andererseits folgt aus Beispiel 2.3(iv),
dass
f −1 (B) = f −1 (σ(E)) = σ(f −1 (E)) ⊆ σ(A) = A.
Beispiel 3.3. Gegeben sei der messbare Raum (E, A).
(i) Gilt A1 , . . . , An ∈ A und a1 , . . . , an ∈ R \ {0}, so ist
f (y) =
n
X
ak 1Ak (y),
y ∈ E,
(3.3)
k=1
A-messbar. Funktionen von der Gestalt (3.3) nennen wir einfache Funktionen. Man prüft
leicht nach, dass für einfache Funktionen f und g auch αf + βg eine einfache Funktion ist
für alle α, β ∈ R (siehe unten).
(ii) Jede stetige Funktion f : R → R ist Borel-messbar. Die umgekehrte Implikation gilt nicht,
da die Dirichletsche Funktion f (y) = 1Q (y), y ∈ R, messbar, aber nirgendwo stetig ist.
(iii) Es seien E eine Menge, (F, B) ein messbarer Raum und f : E → F eine Abbildung. Dann ist
σ(f ) := f −1 (B) die kleinste σ-Algebra A aus E, so dass f eine (A, B)-messbare Abbildung
ist. Wir nennen σ(f ) die von f erzeugte σ-Algebra.
(iv) Es seien f : (E, A) → (F, B) und g : (F, B) → (G, C) messbare Abbildungen. Dann ist die
zusammengesetzte Abbildung
h : E → G,
y 7→ g ◦ f (y) := g(f (y))
eine (A, C)-messbare Abbildung.
Der folgende Satz liefert Eigenschaften messbarer Funktionen
Satz 3.4. Es sei (E, A) ein messbarer Raum.
d
d
(i) f : E → R ist genau dann Borel-messbar, wenn für alle x ∈ R gilt
{y ∈ E : f (y) 6 x} ∈ A.
(ii) Sind f1 , f2 , . . . , fn : E → R reellwertige (A, BR )-messbare Funktionen und ist h : Rn → Rd
Borel-messbar, so ist h(f1 , . . . , fn ) eine A-messbare Funktion.
(iii) Sind f, g : E → R Borel-messbar, so sind es auch f + g, f · g, max(f, g), min(f, g) und, falls
g 6= 0, fg .
13
(iv) Sind fn : E → R, n > 1, Borel-messbar, so sind es auch
sup fn ,
n>1
inf fn ,
lim sup fn ,
n>1
n→∞
lim inf fn
n→∞
(hierbei folgt die Bildung von sup fn , inf fn etc. punktweise, d.h. (supn fn )(y) := supn fn (y)).
(v) Sind fn : E → R Borel-messbar und konvergiert fn punktweise gegen f , dann ist f Borelmessbar.
d
Beweis. (i) folgt direkt aus BRd = σ({(−∞, x], x ∈ R }) und Lemma 3.2.
(ii) Wegen Q
Beispiel 3.3(iv), betrachten wir o.B.d.A. die Identitätsabbildung h(x) = x, x ∈ Rn .
n
Da σ({(a, b] = k=1 (ak , bk ] : a, b ∈ Rn }) = BRn , genügt es
(f1−1 , . . . , fn−1 )((a, b])
=
n
\
fk−1 ((ak , bk ]) ∈ A
k=1
für jeden Quader (a, b] zu zeigen. Da f1 , . . . , fn messbar sind folgt dies aus der Durchschnittsstabilität von A.
(iii) folgt aus (ii) und Beispiel 3.3(ii).
(iv) folgt aus
\
sup fn 6 x = {fn 6 x}
n
und
n
\
1
1 \[
=
fn < x +
inf fn 6 x =
inf fn < x +
n
n
m
m
m n
m
sowie den Darstellungen lim supn→∞ fn
= inf n>1 supk>n fk und lim inf n→∞ fn
supn∈N inf k>n fn .
(v) Es gilt f = lim supn→∞ fn = lim inf n→∞ fn , so dass die Behauptung aus (iv) folgt.
=
Die letzte Eigenschaft lässt sich auf vollständigen Maßräumen etwas abschwächen.
Definition 3.5. Sei (E, A, µ) ein Maßraum. Man sagt: Eine Eigenschaft gilt auf E “µ-fast überall”,
falls sie auf E \ N gilt, wobei N ∈ A eine µ-Nullmenge ist.
Lemma 3.6. Es seien (E, A, µ) ein vollständiger Maßraum, (fn : E → R) eine Folge A-messbarer
Funktionen und f : E → R. Die Folge (fn ) konvergiere µ-fast überall gegen f , d.h.
lim fn (x) = f (x)
n→∞
für alle x ∈ E \ N für ein N ∈ A, µ(N ) = 0.
Dann ist die Grenzfunktion f ebenfalls A-messbar.
Beweis. Übung 2
.
Der folgende Satz zeigt, dass man jede messbare Funktion (zerlegbar in zwei nichtnegative
Funktionen f = f+ − f− ) durch einfache Funktionen beliebig genau approximiert werden kann.
Dieses Resultat wird zentral für die Konstruktion von Integralen sein.
Satz 3.7 (Approximationssatz). Für jede nichtnegative Borel-messbare Funktion f : (E, A) →
([0, ∞], B[0,∞] ) gibt es eine nichtfallende Folge (fn )n>1 einfacher nichtnegativer Borel-messbarer
Funktionen, die punktweise von unten gegen f konvergiert:
0 6 fn (y) 6 fn+1 (y) 6 f (y),
n > 1, y ∈ E
und
lim fn (y) = f (y),
n→∞
y ∈ E.
Beweis. Sei f : E → R messbar mit f > 0. Für n ∈ N definieren wir
(
k · 2−n ,
falls f (y) ∈ [k2−n , (k + 1)2−n ) und k = 0, . . . , n2n − 1,
fn (y) :=
n,
falls f (y) > n.
14
(3.4)
Schritt 1: (fn )n>1 ist eine Folge einfacher Funktionen mit fn 6 f .
Setzen wir
An,k :=f −1 ([k2−n , (k + 1)2−n )) ∈ A,
für k = 0, . . . , n2n − 1,
An :=f −1 ([n, ∞]) ∈ A,
dann ist E die disjunkte Vereinigung von An und An,k , k = 0, . . . , n2n − 1. Weiter können wir fn
darstellen als
n
n2
−1
X
k
1A + n1An ,
fn =
2n n,k
k=0
so dass fn einfache Funktionen sind.
Schritt 2: (fn )n>1 ist monoton wachsend.
Wegen
k k + 1 2k 2k + 1 2k + 1 2(k + 1) ,
,
= n+1 , n+1 ∪
2n 2n
2
2
2n+1
2n
˙ n+1,2k+1 . Aus der Definition von fn und fn+1 ergibt sich
gilt An,k = An+1,2k ∪A
2k
k
= n = fn |An,k ,
2n+1
2
k
2k + 1
= n+1 > n = fn |An,k .
2
2
fn+1 |An+1,2k =
fn+1 |An+1,2k+1
Für die Mengen An = An+1 ∪ f −1 ([n, n + 1)) gilt
fn+1 |An+1 = n + 1 > n = fn |An
und fn+1 |f −1 ([n,n+1)) > n = fn |An .
Schritt 3: (fn )n>1 konvergiert gegen f .
Ist f (x) = +∞, so ist fn (x) = n für alle n ∈ N und die Behauptung klar. Ist f (x) < ∞, so
Sn2n −1
gilt für n ∈ N mit f (x) < n, dass x ∈
/ An also x ∈ k=0 An,k . Deshalb gibt es ein k0 , so dass
x ∈ An,k0 und somit
k0 + 1
k0
0 6 f (x) − fn (x) <
− n = 2−n .
2n
2
Nun noch eine Eigenschaft, die es Stochastikern erlaubt, sich auf Wahrscheinlichkeitsmaße auf
dem Ergebnisraum eines Zufallexperiments zu beschränken, statt den gesamten zugrundeliegenden
Wirkmechanismus beschreiben zu müssen.
Satz 3.8. Es seien (E, A, µ) ein Maßraum, (F, B) ein messbarer Raum und f : (E, A) → (F, B)
eine messbare Abbildung. Durch
µf (B) := µ(f −1 (B)),
B ∈ B,
ist auf B ein Maß µf definiert, das als von f induzierte Maß oder als Bildmaß von f bezeichnet
wird. Ist µ endlich, so ist auch µf endlich.
Beweis. Es gilt µf (∅) = 0 und für jede Folge (Bk )k>1 ⊆ F paarweiser diskjunkter Mengen
[
[
X
[
X
µf
Bk = µ f −1
Bk = µ
f −1 (Bk ) =
µ(f −1 (Bk )) =
µf (Bk ).
k>1
k>1
k>1
k>1
k>1
Damit f −1 (B) ∈ A und somit obiger Ausdruck für alle B ∈ B wohldefiniert ist, benötigen wir
also genau die Messbarkeit von f . Messbare Abbildung X : Ω → F auf Wahrscheinlichkeitsräumen
(Ω, F, P ) heißen auch Zufallsvariablen und das Bildmaß P X wird auch Wahrscheinlichkeitsverteilung der Zufallsvariable X genannt.
15
3.2
Integralkonstruktion
In diesem Abschnitt definieren wir das Integral über messbare Funktionen auf einem Maßraum
(E, A, µ) und studieren die Eigenschaften dieses Integrals. Um das Integral zu konstruieren, gehen
wir in 3 Schritten vor:
(i) Integral für einfache Funktionen
(ii) Integral für nichtnegative Funktionen
(iii) Integral für beliebige messbare Funktionen
Definition 3.9. Sei f : E → R eine einfache Funktion mit f =
R und A1 , . . . , Am ∈ A. Die Zahl
ˆ
ˆ
f dµ :=
f (y)µ(dy) :=
E
E
m
X
Pm
i=1
ai 1Ai für m ∈ N, a1 , . . . , am ∈
ai µ(Ai )
i=1
heißt Integral von f über E bezüglich des Maßes µ.
Man prüft leicht nach, dass diese Definition korrekt ist, d.h. nicht von der Wahl der Darstellung
von f als einfache Funktion abhängt (Übung 2
).
Satz 3.10. Seien f, g : E → R einfache Funktionen. Dann gilt:
(i) Ist f 6 g, so gilt
ˆ
ˆ
f dµ 6
gdµ
E
(Montonie des Integrals).
E
(ii) Die Funktion αf + βg für α, β ∈ R ist einfach und es gilt
ˆ
ˆ
ˆ
(αf + βg)dµ = α
f dµ + β
gdµ (Linearität des Integrals).
E
E
E
Beweis. Wir stellen f und g als einfache Funktionen für eine gemeinsame disjunkte Zerlegung dar.
O.B.d.A sind f und g gegeben durch Normaldarstellungen
f=
m
X
ai 1Ai
und g =
i=1
n
X
bj 1Bj ,
j=1
mit a1 , . . . , an , b1 , . . . , bm > 0 und (Ai )i=1,...,m und (Bj )j=1,...,n sind disjunkte Zerlegungen von E
(Übung 2
). Dann gilt
f=
m X
n
X
ai 1Ai ∩Bj
und g =
i=1 j=1
m X
n
X
bj 1Ai ∩Bj .
i=1 j=1
Aus letzterer Darstellung folgen die Behauptungen aus der Definition.
Definition 3.11. Sei (E, A, µ) ein Maßraum. M+ bezeichne die Menge aller nichtnegativen, Amessbaren Funktionen f : E → [0, ∞]. Für f ∈ M+ heißt die Zahl
ˆ
nˆ
o
f dµ := sup
ϕdµϕ : E → R einfach,ϕ 6 f ∈ [0, ∞]
E
E
Integral von f über E bzgl. des Maßes µ. Ist A ∈ A, so definiert man das Integral von f über A
(bzgl. µ) durch
ˆ
ˆ
f dµ :=
f 1A dµ.
A
E
16
Satz 3.12. Sei (E, A, µ) ein Maßraum und seien f, g ∈ M+ . Dann gilt
´
´
(i) f 6 g auf A ∈ A impliziert A f dµ 6 A gdµ.
´
´
(ii) Sind A, B ∈ A mit A ⊆ B, so gilt A f dµ 6 B f dµ.
(iii) Sind A, B ∈ A disjunkt, dann gilt
ˆ
ˆ
f dµ =
A∪B
(iv) Es gilt
´
E
ˆ
f dµ +
A
f dµ.
B
f dµ = 0 genau dann, wenn µ({x ∈ E : f (x) > 0}) = 0 (d.h. f = 0 µ-fast überall).
Beweis. (i)-(iii) Übung 2
.
(iv) ⇒: Wir setzen An := {x ∈ E : f (x) >
1
n}
für n ∈ N. Dann gilt An ⊆ An+1 und
A := {x ∈ E : f (x) > 0} =
[
An .
n>1
Da f messbar ist, gilt An ∈ A und damit auch A ∈ A. Aus den Monotonieeigenschaften (i) und
(ii) folgt
ˆ
ˆ
ˆ
µ(An )
1
dµ =
für alle n ∈ N.
0=
f dµ >
f dµ >
n
n
E
An
An
Also gilt µ(An ) = 0 für alle n ∈ N. Aus der Stetigkeit des Maßes von unten folgt µ(A) =
limn→∞ µ(An ) = 0.
⇐: Sei A := {x ∈ E : f (x) > 0} und µ(A) = 0. Für jede einfache, nichtnegative
Funktion
´
ϕ 6 f gilt dann Aϕ := {x ∈ E´ : ϕ(x) > 0} ⊆ A, also µ(Aϕ ) = 0 und folglich E ϕdµ = 0. Aus der
Integraldefinition erhält man E f dµ = 0.
Als nächstes beweisen wir grundlegende Konvergenzeigenschaften für das Integral von Funktionenfolgen. Im Allgemeinen können wir nicht erwarten, dass das Integral der Grenzfunktion gleich
dem Grenzwert der Integrale über die Funktionenfolge ist.
Beispiel 3.13. Auf dem Maßraum ([0, 1], B[0,1] , λ) mit Lebesguemaß λ, betrachten wir die Folge
einfacher Funktionen
fn : R → R+ , fn (y) = n1[0,1/n] (y), y ∈ R,
mit
Grenzwert
´ dem punktweisen
´ f : R → R+ mit f (x) = 0 für x 6= 0 und f (0) = ∞. Es gilt
f dλ = n · n1 = 1, jedoch [0,1] f dλ = 0 nach Satz 3.12(iv).
[0,1] n
Satz 3.14 (Satz von Beppo Levi über monotone Konvergenz, 1906). Sei (E, A, µ) ein Maßraum,
(fn )n>1 ∈ M+ eine monoton wachsende Folge und f : E → [0, ∞] die Grenzfunktion f (x) :=
limn→∞ fn (x), x ∈ E. Dann gilt
ˆ
ˆ
lim
fn dµ =
f dµ.
n→∞
E
E
Beweis.
Nach Satz 3.4 ist f messbar. Da fn 6 fn+1 6 f folgt aus Satz 3.12
´
f
dµ
und
somit
E
ˆ
ˆ
lim
fn dµ 6
f dµ.
n→∞
E
´
E
fn dµ 6
´
E
fn+1 dµ 6
E
Es bleibt die UngleichungPin der anderen Richtung zu zeigen. Sei ϕ 6 f eine einfache Funktion
m
mit der Darstellung ϕ = k=1 αk 1Ak . Sei λ ∈ (0, 1) fixiert und
Bn := {x ∈ E : λϕ(x) 6 fn (x)} ∈ A.
17
S
Da fn S↑ f und λϕ < f , gilt E = n>1 Bn und Bn ⊆ Bn+1 . Die Mengen Ak ∈ A erfüllen
Ak = n>1 (Ak ∩ Bn ). Aus der Stetigkeit von µ von unten folgt µ(Ak ) = limn→∞ µ(Ak ∩ Bn ).
Nach Definition ist
ˆ
m
n
X
X
λ
ϕdµ = λ
αk µ(Ak ) = lim λ
αk µ(Ak ∩ Bn )
E
k=1
= lim
n→∞
ˆ X
n
n→∞
E
k=1
1Ak ∩Bn dµ
λαk
| {z }
=1Ak ·1Bn
k=1
ˆ
λϕdµ.
= lim
n→∞
Bn
Nach Definition gilt λϕ 6 fn auf Bn . Somit folgt
ˆ
ˆ
ˆ
λ
ϕdµ 6 lim
fn dµ 6 lim
fn dµ.
n→∞
E
n→∞
Bn
E
Bilden wir den Grenzwert λ → 1 und das Supremum über alle einfachen Funktionen ϕ 6 f , so
erhalten wir
ˆ
ˆ
fn dµ.
f dµ 6 lim
E
n→∞
E
Der Approximationssatz 3.7 liefert unmittelbar:
Korollar 3.15. Sei f ∈ M+ . Dann existiert eine monoton wachsende Folge nichtnegativer, einfacher Funktionen (ϕn ) mit ϕn ↑ f und es gilt
ˆ
ˆ
ϕn dµ.
f dµ = lim
E
n→∞
E
Diese äquivalente Darstellung des Integrals messbarer, nichtnegative Funktionen (als Grenzwert der ´Integrale über eine approximierende Folge einfacher Funktionen) wird häufig als Definition von E f dµ verwendet. Die Charakterisierung über das Supremum hat den Vorteil, dass die
Unabhängigkeit des Integrals von der Auswahl der approximierenden Folge sofort ersichtlich ist.
Korollar 3.16. Sind f, g ∈ M+ und α, β ∈ [0, ∞), so gilt
ˆ
ˆ
ˆ
αf + βg dµ = α
f dµ + β
gdµ.
E
E
E
Beweis. Seien (ϕn )n>1 und (ψn )n>1 monoton wachsende Folgen nichtnegativer, einfacher Funktionen mit ϕn ↑ f und ψn ↑ g. Dann ist auch (αϕn + βψn )n>1 eine wachsende Folge einfacher
Funktionen mit limn→∞ αϕn + βψn = αf + βg. Somit liefert die Linearität des Integrals von
einfachen Funktionen (Satz 3.10)
ˆ
ˆ
(αf + βg)dµ = lim
(αϕn + βψn )dµ
n→∞ E
E
ˆ
ˆ
ˆ
ˆ
= lim α
ϕn dµ + lim β
ψn dµ = α
f dµ + β
gdµ.
n→∞
E
n→∞
E
E
Korollar 3.17. Für jede Folge (fn )n>1 ⊆ M+ gilt
∞ ˆ
X
n=1
E
fn dµ =
ˆ X
∞
E
Beispiel 3.18.
18
n=1
fn dµ.
E
(i) Betrachten wir den Maßraum (N, P(N), µ) mit dem Zählmaß µ. Dann gilt für jede Funktion
f : N → [0, ∞], dass
ˆ
X
f dµ =
f (n).
N
n∈N
Dies sieht man wie folgt: Jede Funktion ist messbar,
P da wir als σ-Algebra die Potenzmenge
gewählt haben. Mit gn := f (n)1{n} > 0 gilt f = n>1 gn . Dann folgt aus den vorangegangen
zwei Korollaren
ˆ
ˆ
Xˆ
X
X
X
f dµ =
gn dµ =
f (n) 1{n} dµ =
f (n)µ({n}) =
f (n).
N
n>1
N
n>1
N
n>1
n>1
(ii) Sei (E, A, µ) ein Maßraum und f ∈ M+ . Wir definieren die Abbildung ν : A → [0, ∞] durch
ˆ
ν(A) :=
f · 1A dµ, für alle A ∈ A.
E
Dann gilt (Übung 2
):
(a) ν ist ein Maß auf (E, A), das sogenannte Maß mit der Dichte f bezüglich µ.
(b) ν ist stetig bezüglich µ im dem Sinn, dass für alle A ∈ A mit µ(A) = 0 auch ν(A) = 0
gilt.
´
´
(c) Ist g ∈ M+ , so gilt E gdν = E (f · g)dµ.
Für eine beliebige Folge messbarer, nichtnegativer Funktionen gilt der folgenden Konvergenzsatz:
Satz 3.19 (Lemma von Fatou, 1906). Sei (E, A, µ) ein Maßraum, (fn : E → [0, ∞]) eine Folge
A-messbarer Funktionen. Dann gilt
ˆ
ˆ
lim inf fn dµ 6 lim inf
fn dµ.
E n→∞
n→∞
E
Beweis. Für den Limes Inferior einer Folge gilt
lim inf fn = sup inf fk .
n→∞
n k>n
Sei nun gn := inf k>n fk . Nach Satz 3.4 ist die Funktion gn A-messbar. Weiterhin gilt gn 6 gn+1
und gn 6 fk für alle k > n. Daraus folgt
ˆ
ˆ
ˆ
ˆ
gn dµ 6
fk dµ und damit
gn dµ 6 inf
fk dµ, n ∈ N.
E
E
k>n
E
E
Wir wenden nun den Satz über monotone Konvergenz auf die Folge (gn ) an und erhalten
ˆ
ˆ
ˆ
ˆ
lim inf fn dµ =
sup gn dµ =
lim gn dµ = lim
gn dµ
n→∞ E
E n→∞
E n
E n→∞
ˆ
ˆ
ˆ
= sup
gn dµ 6 sup inf
fk dµ = lim inf
fn dµ.
n
E
n k>n
E
n→∞
E
Nun werden wir das Integral für eine beliebige A-messbare Funktion f : E → R definieren. Wir
verwenden die Zerlegung
f = f+ − f− ,
f+ = max{0, f }, f− (y) = max{0, −f },
wobei f+ , f− ∈ M+ . Es gilt außerdem |f | = f+ + f− .
19
Definition 3.20. ´Sei (E, A, µ) ein Maßraum.
Eine A-messbare Funktion f : E → R heißt µ´
integrierbar, wenn E f+ dµ < ∞ oder E f− dµ < ∞ gilt (oder beides endlich ist). In diesem Fall
ist das Integral von f über E bezüglich µ definiert als
´
´
´
´

ˆ
ˆ
 E f+ dµ − E f− dµ, falls ´E f+ dµ < ∞ und ´E f− dµ < ∞,
f (x)µ(dx) :=
f dµ := +∞,
falls E f+ dµ = ∞ und E f− dµ < ∞,

´
´
E
E

−∞,
falls E f+ dµ < ∞ und E f− dµ = ∞.
1
1
Wir bezeichnen mit
´ L (µ) = L (E, A, µ) die Menge aller µ-integrierbaren A-messbaren Funktionen
f : E → R mit | f dµ| < ∞.
´
´
Ist µ = λ das Lebesguemaß auf (R, LR ), so heißt R f (x)dx := R f dλ Lebesgueintegral von
f . Sei (Ω, A, P ) ein´Wahrscheinlichkeitsraum, also ein Maßraum mit Wahrscheinlichkeitsmaß P ,
dann heißt E[f ] := Ω f dP Erwartungswert von f unter P .
Bemerkung 3.21. Das Lebesgueintegral beruht auf der Annäherung von messbaren Abbildungen
mittels einfacher Funktionen. Diese Approximation durch einfache Funktionen beruht auf einer
Zerlegung des Wertebereichs, vgl. Satz 3.7. Im Gegensatz dazu wird das in der Schule gelehrte
Riemannintegral von Funktionen f : R → R durch eine Zerlegung des Definitionsbereiches konstruiert.
Man kann zeigen, dass jede Riemannintegrierbare (z.B. stetige) Funktion auf einem Intervall
[a, b] auch Lebesgueintegrierbar bzgl. des Lebesguemaßes λ ist und beide Integrale übereinstimmen.
Da das Lebesgueintegral auch die Integration bezüglich sehr beliebiger σ-endlicher Maße zulässt,
ist es sehr viel allgemeiner als das Riemannintegral.
Abbildung. Dann
Lemma 3.22. Es seien (E, A, µ) ein Maßraum und f : E → R eine A-messbare
´
gilt f ∈ L1 (µ) genau dann, wenn ein g ∈ M+ existiert mit |f | 6 g und E gdµ < ∞. g heißt
Majorante von f .
´
Beweis. ⇒: Ist f ∈ L1 (µ), so gilt E f± dµ < ∞, so dass |f | = f+ + f− eine Majorante mit
endlichem Integral ist.
´
⇐: Sei nun g ∈ M+ mit |f | 6 g und E gdµ < ∞, so liefert die Monotonie des Integral über
nichtnegative, messbare Funktionen (Satz 3.12), dass
ˆ
ˆ
ˆ
f± dµ 6
|f |dµ 6
gdµ < ∞.
E
E
E
Damit gilt f ∈ L1 (µ).
Wir werden nun Rechenregeln für das Integral formulieren und beweisen.
Satz 3.23. Für f, g ∈ L1 (µ) gelten folgende Aussagen:
(i) Für alle α, β ∈ R ist αf + βg ∈ L1 (µ) und es gilt
ˆ
ˆ
ˆ
(αf + βg)dµ = α
f dµ + β
gdµ.
E
(ii) Wenn f 6 g, so ist
(iii) Es gilt
´
E
f dµ 6
E
´
E
E
gdµ.
ˆ
ˆ
f
dµ
|f |dµ < ∞.
6
E
E
(iv) Wenn f = g µ-fast überall, d.h. µ({x ∈ E : f (x) 6= g(x)}) = 0, so ist
(v) f ist µ-fast überall endlich, d.h. µ({x ∈ E : |f (x)| = ∞}) = 0.
20
´
E
f dµ =
´
E
gdµ.
Beweis. (i) Schritt 1: Ist f = p − q mit Funktionen p, q ∈ M+ mit endlichen Integralen, so gilt
ˆ
ˆ
ˆ
f dµ =
pdµ −
qdµ.
E
E
E
Aus f = f+ − f− = p − q folgt q + f+ = p + f− und die Additivität des Integrals über M+
liefert
ˆ
ˆ
ˆ
ˆ
qdµ +
f+ dµ =
pdµ +
f− dµ.
E
E
E
E
Da alle Terme endlich sind, folgt hieraus
ˆ
ˆ
ˆ
ˆ
ˆ
f dµ =
f+ dµ −
f− dµ =
pdµ −
qdµ.
E
E
E
E
E
1
Schritt 2: f + g ∈ L (µ) und es gilt
ˆ
ˆ
ˆ
(f + g)dµ =
f dµ +
gdµ.
E
E
E
Die Funktionen p := f+ + g+ und q := f− + g− aus M+ haben ein endliches Integral und es gilt
f + g = p − q. Da |f + g| 6 p + q, folgt aus Lemma 3.22, dass f + g ∈ L1 (E, A, µ). Aus Schritt 1
und der Linearität des Integrals über M+ folgt
ˆ
ˆ
ˆ
(f + g)dµ =
pdµ −
qdµ
E
E
ˆE
ˆ
ˆ
ˆ
=
f+ dµ +
g+ dµ −
f− dµ −
g− dµ
E
E
ˆE
ˆ E
=
f dµ +
gdµ.
E
E
´
´
Schritt 3: αf ∈ L (E, A, µ) und E αf dµ = α E f dµ.
Ist α > 0 ist (αf )+ = αf+ und (αf )− = αf− und die Behauptung folgt aus der Linearität des
Integrals auf M+ . Ist α < 0, gilt (αf )+ = |α|f− und (αf )− = |α|f+ . Es folgt
ˆ
ˆ
ˆ
ˆ
αf dµ = |α|
f− dµ −
f+ dµ = α
f dµ.
1
E
E
E
´
E
(ii) Aufgrund der Linearität des Integrals genügt es E hdµ > 0 für h := g − f > 0 zu zeigen.
Letzteres folgt aus Satz 3.12.
(iii) Es gilt
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
ˆ
f dµ = f+ dµ −
f− dµ 6
f+ dµ +
f− dµ =
(f+ + f− )dµ =
|f |dµ.
E
E
E
´
E
E
E
E
(iv) Es genügt f dµ = 0 für jedes messbare f mit f = 0 µ-fast überall
zu zeigen.
Für ein
´
´
solches f sind auch f+ und f− µ-fast überall 0. Nach Satz 3.12 gilt dann E f+ dµ = E f− dµ = 0
und somit folgt die Behauptung.
(v) Da |f | = f+ + f− , gilt
{x ∈ E : |f (x)| = ∞} = {x ∈ E : f+ (x) = ∞} ∪ {x ∈ E : f− (x) = ∞}.
Wir können also o.B.d.A f > 0 annehmen. Sei M = {x ∈ E : f (x) = ∞}. Für n ∈ N gilt
f > f · 1M > n · 1M . Folglich ist
ˆ
ˆ
+∞ >
f dµ > n
1M dµ = n · µ(M ) für alle n ∈ N.
E
E
Dann muss aber µ(M ) = 0 gelten.
21
Als nächstes beweisen wir einen weiteren wichtigen Konvergenzsatz für das Integral von Funktionenfolgen.
Satz 3.24 (Satz von Lebesgue über die majorisierte Konvergenz, 1910). Sei (E, A, µ) ein Maßraum, f : E → R A-messbar und (fn : E → R)n>1 eine Folge A-messbarer Funktionen mit
(i) limn→∞ fn (x) = f (x) für µ-fast alle x ∈ E.
(ii) Es existiert eine Funktion F ∈ L1 (µ) mit
|fn (x)| 6 F (x)
Dann ist f ∈ L1 (µ) und es gilt
für µ-fast alle x ∈ E.
ˆ
ˆ
f dµ = lim
n→∞
E
fn dµ.
E
Beweis. Nach Satz 3.23 können wir, evtl. durch Abändern der Funktionen f, fn bzw. F auf einer
µ-Nullmenge, folgendes annehmen: fn , f sind messbare Funktionen mit
(i) Für alle n ∈ N ist fn über E integrierbar und endlich.
(ii) Die Folge (fn ) konvergiert auf dem ganzen Raum E punktweise gegen f .
(iii) |fn (x)| 6 F (x) für alle x ∈ E.
Da |f | = limn→∞ |fn | 6 F ∈ L1 (µ) folgt f ∈ L1 (µ) aus Lemma 3.22. Wegen (iii) ist 0 6 fn + F
und 0 6 F − fn . Aus limn→∞ fn = f und dem Lemma von Fatou folgt
ˆ
ˆ
ˆ
06
(f + F )dµ =
lim inf (fn + F )dµ 6 lim inf (fn + F )dµ
n→∞
E
E
E n→∞
ˆ
ˆ
=
F dµ + lim inf
fn dµ,
n→∞
ˆ
ˆ
ˆE
ˆE
06
(F − f )dµ =
lim inf (F − fn )dµ 6
F dµ − lim sup
fn dµ.
E n→∞
E
Aus
´
E
E
n→∞
E
F dµ < ∞ schließen wir
ˆ
ˆ
ˆ
ˆ
f dµ 6 lim inf
fn dµ 6 lim sup
fn dµ 6
f dµ.
E
n→∞
Somit existiert der Grenzwert limn→∞
E
n→∞
´
´
E
fn dµ =
E
E
E
f dµ.
Bemerkung 3.25. Für das Riemann-Integral benötigt man die gleichmäßige Konvergenz der Funktionenfolge (fn ) gegen f , um Integral und Grenzwert zu vertauschen. Das Lebesgue-Integral hat
also bessere Konvergenzeigenschaften.
´
Die folgende wichtige Eigenschaft besagt, dass man zur Berechnung von (h ◦ f )dµ nur das
Bildmaß µf kennen muss, nicht die Abbildung f noch das Maß µ selbst. Dies ist in der Statistik von fundamentaler Bedeutung, da wir häufig den zugrundeliegenden Wahrscheinlichkeitsraum (Ω, F, P ) nicht kennen, sondern nur abgeleitete Größen, die so genannten Zufallsvariablen,
X : Ω → F beobachten und daher (unter Verwendung von Stichproben) nur die Wahrscheinlichkeitsverteilung P X zugänglich ist.
Satz 3.26 (Substitutionsregel). Es seien f : E → F eine (A, B)-messbare Abbildung in einen
messbaren Raum (F, B), g : F → R eine Borel-messbare Funktion und µf das Bildmaß von µ
vermittels der Abbildung f . Es gilt:
(i) g ◦ f = g(f ) ∈ L1 (E, A, µ) genau dann, wenn g ∈ L1 (F, B, µf ) und
22
(ii) falls g > 0 oder g ∈ L1 (F, B, µf ), dann
ˆ
ˆ
g(f (y))µ(dy) =
g(x)µf (dx).
E
(3.5)
F
Beweis. Schritt 1: Die Gleichung (3.5) gilt für g = 1B , B ∈ B, nach Definition des Bildmaßes µf :
ˆ
g(x)µf (dx) = µf (B) = µ(f −1 (B))
E
ˆ
ˆ
ˆ
=
1f −1 (B) (y)µ(dy) = 1B (f (y))µ(dy) = g(f (y))µ(dy).
E
E
E
Schritt 2: Aufgrund der Linearität des Integrals gilt (3.5) für alle einfachen Funktionen.
Schritt 3: Ist (ϕn )n>0 eine wachsende Folge nichtnegativer, einfacher Funktionen mit g =
limn→∞ ϕn , und dank Schritt 2
ˆ
ˆ
ˆ
lim
(ϕn ◦ f )dµ = lim
ϕn dµf =
gdµf .
n→∞
n→∞
E
E
E
Auch ϕn ◦f ist eine wachsende Folge einfacher Funktionen und es folgt aus dem Satz über monotone
Konvergenz
ˆ
ˆ
ˆ
ˆ
(ϕn ◦ f )dµ =
lim (ϕn ◦ f )dµ =
(g ◦ f )dµ.
gdµf = lim
n→∞
E
E n→∞
E
E
Schritt 4: (i) und (ii) für den allgemeinen Fall folgen aus der Zerlegung g = g+ − g− und
Schritt 3.
Die hier verwendete Beweistechnik kommt häufig zum Einsatz und wird mitunter “LiftingMethode” oder “maßtheoretische Induktion” genannt.
Lp -Räume und Radon-Nikodym-Dichten
4
4.1
Räume integrierbarer Funktionen
Im Folgenden werden wir dem Maßraum (E, A, µ) eine Serie von normierten Vektorräumen integrierbarer Funktionen studieren.
Definition 4.1. Für p > 1 bezeichnen wir mit Lp (µ) = Lp (E, A, µ) die Menge aller reellwertigen
Borel-messbaren Funktionen f : E → R mit
ˆ
|f (y)|p µ(dy) < ∞.
E
p
Für jedes f ∈ L (µ) definieren wir
kf kp :=
ˆ
1/p
|f |p dµ
.
E
∞
∞
Ferner definieren wir L (µ) := L (E, A, µ) als Menge aller Borel-messbaren Funktionen f : E →
R mit
kf k∞ := sup |f (y)| < ∞.
y∈E
Die Lp (µ)-Räume erfüllen zwei wesentliche Ungleichungen.
23
Satz 4.2 (Hölder-Ungleichung). Es seien p, q > 1 mit p1 + 1q = 1 oder p = 1, q = ∞. Dann gilt für
f ∈ Lp (E, A, µ) und g ∈ Lq (E, A, µ), dass f · g ∈ L1 (E, A, µ) und
ˆ
ˆ
|f · g|dµ 6
|f · g|dµ 6 kf kp · kgkq .
E
E
Beweis. Der Fall p = 1, q = ∞ ist trivial. Sei nun p, q > 1.
Wir zeigen zunächst die Ungleichung (“gewichtete Ungleichung von geometrischen und arithmetischen Mittel”)
aρ b1−ρ 6 ρa + (1 − ρ)b ∀a, b > 0, ρ ∈ (0, 1).
(4.1)
Die Ungleichung ist klar für a = 0 oder b = 0. Sind a, b > 0, ist (4.1) aufgrund der Monotonie des
Logarithmus äquivalent zu
ρ log a + (1 − ρ) log b = log aρ b1−ρ 6 log ρa + (1 − ρ)b ,
was wiederum äquivalent zur Konkavität der Logarithmusfunktion ist. Eine C 2 -Funktion f ist
aber genau dann konkav, wenn f 00 6 0 gilt. Für f = log ist dies erfüllt, da f 00 (x) = −x−2 , x > 0.
Somit gilt (4.1).
Falls kf kp = 0 oder kgkp = 0, so ist f bzw. g µ-f.ü. 0 und die Behauptung gilt. Seien nun
kf kp , kgkq > 0. Für beliebiges x ∈ E wenden wir (4.1) auf
ρ=
an. Also
1
,
p
a=
|f (x)|p
,
kf kpp
b=
|g(x)|q
kgkqq
1 |g(x)|p
|f (x)| |g(x)|
1 |f (x)|p
.
·
6
p +
kf kp kgkq
p kf kp
q kgkqq
Integrieren wir über E, folgt
ˆ
ˆ
ˆ
1
1
1
p
|f (x)| dµ +
|g(x)|q dµ
|f (x)g(x)|dµ 6
kf kp kgkq E
pkf kpp
qkgkqq
1 1
= + =1
p q
und somit kf · gk1 6 kf kp · kgkq .
Daraus ergeben sich zwei wichtige Spezialfälle:
Korollar 4.3.
(i) Für f, g ∈ L2 (E, A, µ) gilt kf · gk1 6 kf k2 kgk2 ( Cauchy-Schwarz-Ungleichung).
(ii) Ist µ ein endliches Maß, so existiert für jedes 1 6 p0 6 p eine Konstante Cp,p0 > 0, so dass
0
kf kp0 6 Cp,p0 kf kp ( stetige Einbettung von Lp (µ) in Lp (µ)).
Die zweite Ungleichung ist die Dreiecksungleichung für Lp (µ)-Räume.
Satz 4.4 (Minkowski-Ungleichung). Falls p ∈ [1, ∞] und f, g ∈ Lp (E, A, µ), so gilt f + g ∈
Lp (E, A, µ) und
kf + gkp 6 kf kp + kgkp .
Beweis. Für p = 1 und p = ∞ ist die Behauptung trivial. Sei p ∈ (1, ∞). Für beliebige a, b ∈ R
gilt
p
|a + b|p 6 (|a| + |b|)p 6 2 · max{|a|, |b|}
=2p · max{|a|p , |b|p } 6 2p (|a|p + |b|p ).
24
Setzen wir nun a = f (x) und b = g(x) und integrieren beide Seiten über x ∈ E, erhalten wir
ˆ
ˆ
ˆ
|f (x) + g(x)|p dµ 6 2p
|f (x)|p dµ +
|g(x)|p dµ < ∞.
E
E
E
Somit ist f + g ∈ Lp (µ) gezeigt. Um die Dreiecksungleichung zu zeigen, können wir o.B.d.A.
p
:
kf + gkp > 0 annehmen. Wir verwenden die Hölder-Ungleichung mit q = p−1
ˆ
ˆ
|f + g|p dµ =
|f + g||f + g|p−1 dµ
ˆ
E
ˆ
E
p−1
|f | · |f + g| dµ +
|g| · |f + g|p−1 dµ
E
ˆ
1/q
ˆ
1/q
q(p−1)
6 kf kp
|f + g|
dµ
+ kgkp
|f + g|q(p−1) dµ
E
E
ˆ
1/q
p
= kf kp + kgkp
|f + g| dµ
.
6
E
E
Somit
kf + gkp =
ˆ
1−1/q
6 kf kp + kgkp .
|f + g|p dµ
E
Aus der Minkowski-Ungleichung ergibt sich, dass für jedes p ∈ [1, ∞] die Menge Lp (E, A, µ)
einen Vektorraumaum bildet, d.h.
f, g ∈ Lp (µ), α, β ∈ R
αf + βg ∈ Lp (µ),
⇒
und k · kp eine Halbnorm auf Lp (E, A, µ) ist:
kf kp > 0,
kf + gkp 6 kf kp + kgkp ,
kαf kp = |α| · kf kp
∀f, g ∈ Lp (µ), λ ∈ R.
k · kp ist jedoch keine Norm auf Lp (µ), da aus kf kp = 0 lediglich f = 0 µ-f.ü. folgt. Um einen
normierten Vektorraum zu erhalten, betrachtet man die Mengen von Äquivalenzklassen bezüglich
der Äquivalenzrelation
f ∼ g :⇔ f = g µ-fast überall
auf Lp (µ).
Definition 4.5. Sei p ∈ [1, ∞). Der Quotientenraum der Äquivalenzklassen [f ] := {g ∈ Lp (µ) :
f ∼ g} wird bezeichnet mit
Lp (µ) := Lp (E, A, µ) = {[f ] : f ∈ Lp (E, A, µ)} = L
p
(E,A,µ)/{f : E→R|f A-messbar und f =0 µ-f.ü.}
und versehen mit der Norm
k[f ]kp :=
ˆ
1/p
|g|p dµ
für einen beliebigen Repräsentanten g ∈ [f ].
E
Aus Gründen der Vereinfachung und weil Verwechslungen kaum möglich sind, nennt man
Lp (µ), p ∈ [1, ∞), den Raum der p-integrierbaren Funktionen und schreibt dessen Elemente als f
statt [f ], meint aber eigentlich den Raum der entsprechenden Äquivalenzklassen.
Der normierte Vektorraum (Lp (E, A, µ), k · kp ), 1 6 p < ∞, ist sogar vollständig, d.h. jede
Cauchy-Folge konvergiert: Ist (fn )n>1 ⊆ Lp (µ) eine Folge, so dass
∀ε > 0 ∃nε ∈ N : ∀n, m > nε : kfn − fm k 6 ε,
dann existiert ein f ∈ Lp (µ) mit limn→∞ kf − fn kp = 0 (Übung 2
). Wir haben also folgenden
Satz bewiesen:
25
Satz 4.6 (Fischer-Riesz). Für p ∈ [1, ∞) ist (Lp (E, A, µ), k · kp ) ein Banachraum (d.h. ein vollständiger, normierter Vektorraum).
Im Spezialfall p = 2 wird die Norm k · k2 vom Skalarprodukt (also der positiv definiten Bilinearform)
ˆ
hf, gi :=
f · gdµ, f, g ∈ L2 (µ)
E
erzeugt, d.h. kf k22 = hf, f i für alle f ∈ L2 (µ). Damit ist (L2 (E, A, µ), h·, ·i) ein (unendlichdimensionaler) Hilbertraum. Insbesondere gibt es zu jedem abgeschlossenen, linearen Unterraum
M ⊆ L2 (µ) und jedem f ∈ L2 (µ) eine eindeutige Darstellung (Orthogonalzerlegung)
f = g + h mit g ∈ M, h ∈ L2 (µ) mit hh, zi = hf − g, zi = 0 ∀z ∈ M.
Für alle z ∈ M gilt dann der Satz von Pythagoras
kf − zk22 = kf − g + g − zk22
= kf − gk22 + 2hf − g , g − z i + kg − zk22 = kf − gk22 + kg − zk22 .
| {z } | {z }
⊥M
∈M
Folglich kann die Funktion g auch durch kf − gk2 = inf z∈M kf − zk2 charakterisiert werden
und wird Orthogonalprojektion von f auf M genannt. Mit Hilfe der Orthogonalprojektion lässt
sich der folgende Riesz’sche Darstellungssatz beweisen (vgl. Funktionalanalysis): Eine Abbildung
ϕ : L2 (µ) → R ist genau dann stetig und linear, falls ein f ∈ L2 (µ) existiert, so dass ϕ(g) = hf, gi
für alle g ∈ L2 (µ) gilt.
4.2
Satz von Radon-Nikodym und Lebesguescher Zerlegungssatz
In diesem Abschnitt seien µ und ν stets zwei Maße auf dem messbaren Raum (E, A). In Beispiel 3.18 ist uns bereits folgender Begriff untergekommen:
Definition 4.7. Eine messbare Funktion f : E → [0, ∞] heißt Dichte von ν bezüglich µ oder
µ-Dichte von ν, falls
ˆ
ˆ
ν(A) =
f · 1A dµ =
f dµ für jedes A ∈ A.
E
A
Existiert eine Dichte f von ν bzgl. µ, dann schreiben wir auch f =
dν
dµ .
Lemma 4.8. Sei ν σ-endlich. Sind f1 und f2 Dichten von ν bzgl. µ, so gilt f1 = f2 µ-fast überall.
S
Beweis. Sei (En ) eine Ausschöpfung von E, d.h. En ⊆ En+1 , n > 1, mit n>1 En = E, und
ν(En ) < ∞ für alle n > 1. Setzen wir An := En ∩ {f1 > f2 }, n > 1, dann ist ν(An ) < ∞, also
ˆ
0 = ν(An ) − ν(An ) =
(f1 − f2 )dµ.
An
Folglich gilt f1 1An = f2 1An µ-f.ü. (Satz 3.12(iv)). Da f1 > f2 auf An gilt, erhalten wir µ(An ) = 0
und damit
[
µ({x ∈ E : f1 (x) > f2 (x)}) = µ
An = 0.
n>1
Analog folgt µ({x ∈ E : f1 (x) > f2 (x)}) = 0, also f1 = f2 µ-fast überall.
Satz 4.9.
26
(i) Hat das Maß ν auf (E, A) eine µ-Dichte f , so ist eine messbare Funktion h : E → R genau
dann ν-integrierbar, wenn h · f µ-integrierbar ist. In dem Fall gilt
ˆ
ˆ
hdν =
h · f dµ.
E
E
(Dabei setzen wir ∞ · 0 = 0).
(ii) Seien µ, ν, η Maße auf (E, A), wobei ν eine µ-Dichte f besitzt und η eine ν-Dichte g besitzt.
dη
dν dη
· dν = dµ
.
Dann ist f · g eine µ-Dichte von η also dµ
Beweis. Übung (2
).
Definition 4.10. Seien µ und ν zwei Maße auf (E, A). ν heißt absolutstetig bzgl. µ (kurz ν µ),
falls ν(A) = 0 für jede µ-Nullmenge A ∈ A gilt. Die Maße µ und ν heißen äquivalent (kurz µ ∼ ν),
falls ν µ und µ ν gilt. µ heißt singulär zu ν (kurz µ ⊥ ν), falls es ein A ∈ A gibt mit
µ(A) = 0 und ν(Ac ) = 0.
Beispiel 4.11.
(i) Wir haben bereits gesehen, dass ν µ, falls ν eine Dichte bzgl. µ besitzt. Der Satz von
Radon-Nikodym wird sogar die Äquivalenz zeigen.
(ii) Auf (R, BR ) ist das Dirac-Maß δx singulär zum Lebesguemaß λ für jedes x ∈ R, da λ({x}) = 0
und δ(R \ {x}) = 0.
Satz 4.12 (Radon-Nikodym). Seien µ ein σ-endliches und ν ein beliebiges Maß auf (E, A). Dann
sind folgende Aussagen äquivalent
(i) ν hat eine Dichte bzgl. µ.
(ii) ν µ.
In diesem Fall heißt die Dichte Radon-Nikodym-Dichte
dν
dµ
von ν bzgl. µ.
Beweis. Die Hinrichtung ist bereits bekannt. Wir zeigen nun (ii)⇒(i) im Fall, dass µ und ν endliche
Maße sind. Für die Erweiterung auf σ-endliches µ und beliebige ν sei auf Elstrodt (2007, Satz
VII.2.3) verwiesen.
Schritt 1: Gilt ν 6 µ, dann besitzt ν eine µ-Dichte f : E → [0, 1].
Wegen ν(E) 6 µ(E) < ∞ gilt L2 (µ) ⊆ L2 (ν) ⊆ L1 (ν) (stetige Einbettungen, Korollar 4.3).
Damit ist die lineare Abbildung
ˆ
L2 (µ) 3 g 7→
gdν
E
wohldefiniert und stetig. Nach dem Darstellungssatz von Riesz existiert nun ein f ∈ L2 (µ), so dass
ˆ
ˆ
gdν = hg, f i =
g · f dµ für alle g ∈ L2 (µ).
E
E
Wählt man g = 1A für A ∈ A, so folgt, dass nur noch 0 6 f 6 1 µ-f.ü. zu zeigen ist, da wir dann
eine Dichte f : E → [0, 1] wählen können.
´
Angenommen µ(B) > 0 für B := {f > 1}. Dann ist ν(B)
= B f dµ > µ(B): Widerspruch!
´
Analog folgt aus µ(C) > 0 mit C := {f < 0}, dass ν(C) = C f dµ < 0: Widerspruch!
Schritt 2: Seien nun µ, ν beliebige endliche Maße mit ν µ, dann existiert eine µ-Dichte von
ν.
Zum endlichen Maß τ := µ + ν existieren
nach Schritt 1 die τ -Dichten g, h : E → [0, 1] von µ
´
bzw. ν. Für N = {g = 0} gilt µ(N ) = N gdτ = 0 und wegen ν µ auch ν(N ) = 0. Die Funktion
(
h(x)/g(x),
für x ∈ N c ,
f (x) :=
0,
für x ∈ N
27
ist nichtnegativ, A-messbar und für alle A ∈ A gilt
ˆ
ˆ
c
ν(A) = ν(A ∩ N ) =
hdτ =
A∩N c
A∩N c
ˆ
f · gdτ =
ˆ
f dµ =
A∩N c
f dµ.
A
Satz 4.13 (Lebesguescher Zerlungssatz). Sind µ und ν σ-endliche Maße auf (E, A), so gibt es
genau eine Zerlegung
ν =ρ+η
von ν in zwei σ-endliche Maße ρ und η auf A mit ρ µ und η ⊥ µ.
Beweis. Existenz: Das Maß τ := µ + ν ist σ-endlich mit µ τ . Nach dem Satz von RadonNikodym gibt es eine τ -Dichte f ∈ M+ von µ. Wir setzen N := {f = 0} und definieren ρ und η
vermöge
ρ(A) := ν(A ∩ N c ), η(A) := ν(A ∩ N ), A ∈ A.
´
c
Dann sind ρ, η σ-endliche Maße mit ν = ρ + η. Wegen µ(N ) = N f dτ = 0 und
´ η(N ) = 0, gilt
µ ⊥ η. Es bleibt ρ µ zu zeigen. Sei dazu A eine µ-Nullmenge, also 0 = µ(A) = E f 1A dτ . Damit
ist f 1A = 0 τ -f.ü., d.h. τ (A ∩ N c ) = 0. Wegen ρ(A) = ν(A ∩ N c ) 6 τ (A ∩ N c ) = 0 ist also auch
ρ(A) = 0.
Eindeutigkeit: Sei ν = ρ0 + η 0 eine zweite Zerlegung mit ρ0 µ und η 0 ⊥ µ. Dann existieren
µ-Nullmengen N, N 0 ∈ A mit η(N c ) = 0 und η 0 (N 0c ) = 0. Für alle A ∈ A gilt daher
ρ(A) = ρ(A ∩ N c ∩ N 0c ) = ν(A ∩ N c ∩ N 0c ) = ρ0 (A ∩ N c ∩ N 0c ) = ρ0 (A).
Weiter ist
η(A) = η(A ∩ N ) = ν(A ∩ N ) = ν(A ∩ N ∩ N 0 ),
denn ν(A ∩ N ∩ N 0c ) = ρ0 (A ∩ N ∩ N 0c ) + η 0 (A ∩ N ∩ N 0c ) und ρ0 = ρ. Aus Symmetriegründen
erhalten wir η(A) = ν(A ∩ N ∩ N 0 ) = η 0 (A).
Beispiel 4.14. Sei F : R → [0, 1] die Verteilungsfunktion eines Wahrscheinlichkeitsmaßes P auf
(R, BR ). Nach dem Lebesgueschen Zerlegungungssatz können wir P = Pa + Ps in einen bzgl.
dem Lebesguemaß absolut stetigen Teil Pa λ und einen singulären Teil Pa ⊥ λ. zerlegen.
Angenommen F ist stückweise (schwach) differenzierbar mit der Ableitung F 0 und höchstens
abzählbar vielen Sprungstellen (xk )k>1 ⊆ R. Setzen wir F 0 (xk ) = 0, k > 1, so ist F 0 die RadondPa
Nikodym-Dichte
dλ von Pa bzgl. λ. Für den singulären Teil finden wir die Darstellung Ps =
P
(F
(x
)
−
lim
k
ε↓0 F (xk − ε))δxk .
k>1
28