ANALYSIS III OLIVER C. SCHNÜRER Zusammenfassung. Bei diesem Manuskript handelt es sich um Notizen zu einer Vorlesung Analysis III an der Universität Konstanz im Wintersemester 2015/2016. Themen sind gewöhnliche Differentialgleichungen sowie Maß- und Integrationstheorie. Inhaltsverzeichnis Gewöhnliche Differentialgleichungen 8. Existenz und Eindeutigkeit 8.1. Der Existenzsatz von Picard-Lindelöf 8.2. Vergleichssätze 8.3. Parameterabhängige Differentialgleichungen 8.4. Der Satz von Arzelà-Ascoli 8.5. Der Existenzsatz von Peano 8.6. Separation der Variablen ? 8.7. Exakte Differentialgleichungen ? 9. Lineare Differentialgleichungen 9.1. Einführung und Beispiele 9.2. Homogene lineare Systeme 9.3. Inhomogene lineare Systeme 9.4. Die Exponentialfunktion für Matrizen ? 9.5. Systeme mit konstanten Koeffizienten 9.6. Stabilität linearer Systeme 9.7. Der Stabilitätssatz 9.8. Rand- und Eigenwertprobleme ? 9.9. Selbstadjungierte Eigenwertprobleme ? 10. Maßtheorie 10.1. Messbare Räume 10.2. Maße 10.3. Äußere Maße 10.4. Messbare Mengen 10.5. Das Lebesguesche Maß 11. Integrationstheorie 11.1. Messbare Funktionen 11.2. Integrierbare Funktionen 11.3. Konvergenzsätze 11.4. Die Lebesgueschen Räume 11.5. Der Satz von Fubini 11.6. Die Faltung 11.7. Der Transformationssatz 11.8. Zerlegung der Eins 2 2 2 8 10 12 16 18 20 21 21 23 25 25 29 31 33 36 38 40 40 46 50 54 59 70 70 87 97 107 113 119 120 126 Date: 2. März 2016. Vielen Dank an Frau Eva Dutt für das Tippen und Korrekturlesen einiger Abschnitte und an Herrn Andrey Zakharov für Korrekturen. 1 2 OLIVER C. SCHNÜRER 11.9. Der Divergenzsatz Literatur 126 127 Dies ist eine Fortsetzung des Skriptes zur Vorlesung Analysis, siehe [7, 8]. Wir orientieren uns für die gewöhnlichen Differentialgleichungen an [2, 3, 5, 10] und für die Maßtheorie an [1] und benutzen manchmal [11]. Wir empfehlen wiederum wie in den ersten Semestern, Resultate mit Banachräumen zunächst im Fall R oder Rn zu verstehen. Wünschenswert wäre nun ein Verständnis zumindest im Falle von Rn . Gewöhnliche Differentialgleichungen 8. Existenz und Eindeutigkeit 8.1. Der Existenzsatz von Picard-Lindelöf. Definition 8.1. Eine implizite gewöhnliche Differentialgleichung k-ter Ordnung ist eine Gleichung der Form F t, x(t), ẋ(t), x(2) (t), . . . , x(k) (t) = 0. Eine (explizite) gewöhnliche Differentialgleichung k-ter Ordnung ist eine Gleichung der Form x(k) (t) = F t, x(t), ẋ(t), x(2) (t), . . . , x(k−1) (t) . Gesucht ist jeweils eine k-mal differenzierbare Funktion x : I → Rn bzw. x : I → E, E ein Banachraum, für ein offenes Intervall I ⊂ R. Im Folgenden nehmen wir stets an, dass F : I × Rn × Rn × · · · × Rn → Rn bzw. F : I × E × E × · · · × E → E mindestens stetig ist. Bemerkung 8.2. (i) Wir untersuchen gewöhnliche Differentialgleichungen auf • (globale) Lösbarkeit, • Eindeutigkeit (der Lösung), • Abhängigkeit der Lösung von (Anfangs-)daten. (ii) Ist F eine Funktion mit Werten in Rn , so sprechen wir von einem System von gewöhnlichen Differentialgleichungen. (iii) Eine Differentialgleichung k-ter Ordnung lässt sich als System von Differentialgleichungen erster Ordnung darstellen: ẋ(t) x(t) ẋ(t) x(2) (t) d d .. . .. X(t) ≡ = ≡ F̃ (t, X(t)) . . dt dt (k−2) (k−1) x (t) x (t) (k−1) k−1 x (t) F t, x(t), ẋ(t), . . . , x (t) Daher genügt es häufig, gewöhnliche Differentialgleichungen erster Ordnung zu untersuchen. (iv) Sind F und x jeweils k-mal stetig differenzierbare Funktionen und löst x die Differentialgleichung ẋ(t) = F (t, x(t)), so ist x auch k + 1-mal stetig differenzierbar. (v) Wir klassifizieren gewöhnliche Differentialgleichungen ein wenig. 8.1. DER EXISTENZSATZ VON PICARD-LINDELÖF 3 (a) Ein System heißt linear, wenn es sich in der Form ẋ(t) = A(t)x(t) mit einer Matrix A(t) darstellen lässt. Eine inhomogene lineare Differentialgleichung hat die Form ẋ(t) = A(t)x(t) + g(t). (b) Eine gewöhnliche Differentialgleichung heißt autonom, falls sie die Form F x(t), ẋ(t), . . . , x(k) (t) = 0 hat, wenn F also nicht explizit von t abhängt. (c) Explizite und implizite gewöhnliche Differentialgleichungen haben wir bereits unterschieden. (d) Man klassifiziert gewöhnliche Differentialgleichungen nach ihrer Ordnung. (vi) Die nicht autonome gewöhnliche Differentialgleichung α̇(t) = F (t, α(t)) lässt sich äquivalent als autonome Differentialgleichung vermöge d β 1 (t) 1 = F β 1 (t), β 2 (t) dt β 2 (t) umschreiben. Dabei ist β 1 (t) = t und β 2 löst die Differentialgleichung für α. Ein einfaches aber wichtiges Resultat ist: Lemma 8.3. Sei I ⊂ R ein offenes Intervall. Sei Ω ⊂ E eine offene Teilmenge eines Banachraumes. Sei F : I × Ω → E stetig. Seien t0 ∈ I und x0 ∈ Ω. Dann löst x ∈ C 1 (I, E) mit x(t) ∈ Ω für alle t ∈ I genau dann die Gleichung ( ẋ(t) = F (t, x(t)), t ∈ I, x(t0 ) = x0 , wenn es die Integralgleichung Zt x(t) = x0 + F (τ, x(τ )) dτ t0 für alle t ∈ I löst. Beweis. Integriere bzw. Differenziere. Nachfolgend erinnern wir an einige Definitionen und Resultate. Definition 8.4. ? Sei E ein normierter Raum und sei M ⊂ E. Dann heißt eine Abbildung Φ : M → M kontrahierend, falls es ein c mit 0 ≤ c < 1 und kΦ(x) − Φ(y)k ≤ c · kx − yk für alle x, y ∈ M gibt. Theorem 8.5 (Banachscher Fixpunktsatz). ? Sei E ein Banachraum und M ⊂ E abgeschlossen. Sei Φ: M → M eine kontrahierende Abbildung. Dann besitzt Φ genau einen Fixpunkt, d. h. es gibt genau ein x ∈ M mit Φ(x) = x. Definition 8.6. Seien E, F normierte Räume. 4 8. EXISTENZ UND EINDEUTIGKEIT (i) ? Dann heißt f : E → F (global) lipschitzstetig (auch: Lipschitz stetig), falls es ein L > 0 mit kf (x) − f (y)kF ≤ L · kx − ykE für alle x, y ∈ E gibt. Die kleinste solche Zahl L heißt Lipschitzkonstante der Abbildung f . (ii) Sei fj : E → F , j ∈ J, eine Familie von lipschitzstetigen Funktionen mit Lipschitzkonstanten Lj . Dann heißt {fj }j∈J gleichmäßig lipschitzstetig, falls die Lipschitzkonstanten Lj , j ∈ J, gleichmäßig beschränkt sind. (iii) Eine Funktion f : E → F heißt lokal lipschitzstetig, falls es zu jedem Punkt x0 ∈ E eine Umgebung U mit x0 ∈ U und ein L = L(U ) mit kf (x) − f (y)kF ≤ L(U ) · kx − ykE für alle x, y ∈ U gibt. (iv) Eine Familie von Funktionen fj : E → F , j ∈ J, heißt gleichmäßig lokal lipschitzstetig, falls es zu jedem Punkt x0 ∈ E eine Umgebung U mit x0 ∈ U und ein L = L(U ) mit kfj (x) − fj (y)kF ≤ L(U ) · kx − ykE für alle x, y ∈ U und alle j ∈ J gibt. Entsprechende Definitionen verwenden wir für Funktionen f : Ω → F , die auf Teilmengen Ω ⊂ E von E definiert sind. Bemerkung 8.7. ? C 1 -Funktionen sind Lipschitzstetig: Seien E, F ein Banachräume. Ist f ∈ C 1 (E, F ), so erhalten wir 1 Z1 Z d ≤ kDf (tx + (1 − t)y)hx − yik dt f (tx + (1 − t)y) dt kf (x) − f (y)kF = dt 0 0 ≤ sup kDf (tx + (1 − t)y)k · kx − yk. t∈[0,1] Da Df stetig ist, ist f lokal lipschitzstetig. Ist kDf k überall beschränkt, so ist f global lipschitzstetig. Wir beweisen den ersten Existenzsatz für gewöhnliche Differentialgleichungen für Funktionen x : I → E mit einem beliebigen Banachraum E statt Rn oder Cn , da dies keinen Zusatzaufwand bedeutet. Theorem 8.8 (Picard-Lindelöf). Sei E ein Banachraum und x0 ∈ E. Sei Ω ⊂ E offen mit x0 ∈ Ω. Sei I ⊂ R offen mit t0 ∈ I. Sei f : I × Ω → E stetig und sei die Familie (f (t, ·))t∈I lokal gleichmäßig lipschitzstetig. Dann gibt es ε > 0, so dass das Anfangswertproblem (AWP) ( ẋ(t) = f (t, x(t)), t ∈ (t0 − ε, t0 + ε), x(t0 ) = x0 genau eine Lösung x ∈ C 1 ((t0 − ε, t0 + ε), E) besitzt. Diese Lösung ist sogar die eindeutig bestimmte Lösung der äquivalenten Integralgleichung in C 0 ((t0 − ε, t0 + ε), E). Beweis. Wir wollen die äquivalente Integralgleichung lösen. Setze M := 2kf (t0 , x0 )k + 1. 8.1. DER EXISTENZSATZ VON PICARD-LINDELÖF 5 Aufgrund der Stetigkeit von f und der lokalen Lipschitzstetigkeit gibt es ein r > 0 und ein L > 0 mit kf k < M sup (t0 −r,t0 +r)×Br (x0 ) und kf (t, x) − f (t, y)k ≤ L · kx − yk für alle x, y ∈ Br (x0 ) und alle t ∈ (t0 − r, t0 + r). Wähle ε mit 0 < ε < r, ε · M ≤ r und ε · L ≤ 21 . Definiere M := x ∈ C 0 ([t0 − ε, t0 + ε], E) : x(t) ∈ B r (x0 ) ∀ t ∈ [t0 − ε, t0 + ε] . M ist eine bezüglich der C 0 -Norm abgeschlossene Teilmenge von C 0 ([t0 − ε, t0 + ε], E) und daher vollständig. Definiere T : M → C 0 ([t0 − ε, t0 + ε], E) durch Zt (T (x))(t) := x0 + f (τ, x(τ )) dτ. t0 Wir behaupten, dass T (M) ⊂ M gilt. Wir erhalten nämlich für |t0 − t| ≤ ε t Z k(T (x))(t) − x0 k = f (τ, x(τ )) dτ t0 ≤ |t − t0 | · sup kf (τ, x)k (τ,x)∈(t0 −r,t0 +r)×Br (x0 ) ≤ ε · M ≤ r. Wir behaupten weiterhin, dass T sogar eine Kontraktion ist. Es gilt nämlich für x, y ∈ M t Z k(T x)(t) − (T y)(t)k = f (τ, x(τ )) − f (τ, y(τ )) dτ t0 ≤ |t − t0 | · kf (τ, x(τ )) − f (τ, y(τ ))k sup τ ∈[t0 −r,t0 +r] ≤ ε|{z} · L· sup τ ∈[t −ε,t ≤ 21 0 kx(τ ) − y(τ )k ≤ 0 +ε] 1 kx − ykC 0 . 2 Somit ist T eine Kontraktion. Der Banachsche Fixpunktsatz liefert, dass T einen eindeutigen Fixpunkt besitzt, die gesuchte Lösung. Bemerkung 8.9. Unter den Voraussetzungen des Theorems von Picard-Lindelöf wollen wir das maximale Intervall J ⊂ I mit t0 ∈ J finden, in dem das Anfangswertproblem eine Lösung besitzt. (i) Sei x1 in J1 eine Lösung des Anfangswertproblems und sei x2 in J2 ebenfalls eine Lösung des Anfangswertproblems. Betrachte G := {t ∈ J1 ∩ J2 : x1 (t) = x2 (t)}. Diese Menge ist (a) nichtleer, da t0 ∈ J1 ∩ J2 gilt, (b) abgeschlossen in J1 ∩ J2 , da xi stetige Abbildungen sind, (c) offen. Dies folgt aus dem Satz von Picard-Lindelöf, angewandt mit t1 ∈ G und Anfangswert x(t1 ) = x1 (t1 ) = x2 (t1 ). Somit gilt x1 = x2 auf J1 ∩ J2 . 6 8. EXISTENZ UND EINDEUTIGKEIT (ii) Betrachte alle Lösungen (xi , Ji ) des Anfangswertproblems, S wobei Ji mit t0 ∈ Ji die Definitionsbereiche der Lösungen sind. Setze J := Ji und x(t) := xi (t) i für t ∈ Ji . Dann ist x auf dem offenen Intervall J definiert. x ist wohldefiniert, da wir gesehen haben, dass xi = xj auf Ji ∩ Jj gilt. Offenbar löst x das Anfangswertproblem. Wir nennen x die maximale Lösung des Anfangswertproblems. (iii) Es folgt direkt aus dem Satz von Picard-Lindelöf, dass das maximale Existenzintervall offen ist. Bemerkung 8.10 (Maximaler Fluss). (i) Variiert man den Anfangswert x0 , so erhält man zugehörige maximale Existenzintervalle Jx0 und Lösungen α(t, x0 ) ≡ xx0 (t). Wir werden zeigen, dass [ D(f ) := Jx × {x} x∈Ω in I × Ω offen ist. Ist darüber hinaus f im Definitionsgebiet von der Klasse C m , so gilt auch α, α̇ ∈ C m (D(f ), E). Dies werden wir ebenfalls später zeigen. (ii) Wir nennen die Funktion α : I × Ω → Ω, so dass jedes α(·, x) die gewöhnliche Differentialgleichung ( α̇(t, x) = f (t, α(t, x)) in Ω, α(0, x) = x löst, den Fluss des Vektorfeldes (= der vektorwertigen Funktion) f . (iii) Da die Existenzzeit ε im Satz von Picard-Lindelöf nur von den Konstanten r, L und M aus dem dortigen Beweis abhängt, sehen wir, dass wir für eine kompakte Teilmenge K ⊂ Ω und Startwerte x0 ∈ K eine gleichmäßige positive untere Schranke an die Existenzzeit für alle x0 ∈ K finden können. (Details: Übung) Dieses Resultat bezeichnet man als lokalen Existenzsatz für den Fluss. (iv) D(f ) ⊂ I ×Ω ist eine offene Teilmenge, siehe unten. Wir bezeichnen α : D → Ω als maximalen Fluss. Wir zeigen die Offenheit: Falls D(f ) nicht offen wäre, gäbe es (t0 , x0 ) ∈ D(f ) mit Bδ (t0 , x0 ) 6⊂ D(f ) für alle δ > 0. Ohne Einschränkung dürfen wir annehmen, dass t0 minimal mit dieser Eigenschaft ist, sonst betrachten wir das Infimum aller solcher t0 . Aufgrund des lokalen Existenzsatzes für den Fluss gilt t0 > 0. Nach Picard-Lindelöf gibt es eine Umgebung Br (α(t0 , x0 )) ⊂ Ω und Startzeiten [t0 − r, t0 ], so dass jede Lösung mit Startwert in dieser Umgebung zur entsprechenden Startzeit für mindestens das Zeitintervall ε > 0 existiert. Wir betrachten nun die Menge α(t0 − ε/2, Bρ (x0 )) für ρ > 0. Zunächst ist sie für kleine ρ > 0 wohldefiniert, da t0 > 0 minimal mit der Eigenschaft war, dass (t0 , x0 ) keine offene Umgebung im Definitionsbereich D(f ) von α besitzt. Weiterhin gilt α(t0 − ε/2, Bρ (x0 )) ⊂ Br (α(t0 , x0 )), falls wir ρ > 0 ggf. nochmals verkleinern. Dies folgt aus der stetigen Abhängigkeit der Lösung vom Anfangswert; diese haben wir momentan zwar noch nicht gezeigt, sie folgt aber unabhängig von diesem Resultat aus dem Lemma von Gronwall. Aufgrund dieser Inklusion können wir jede der Kurven t 7→ α(t, x) mit x ∈ Bρ (x0 ) in der Zeit noch um mindestens ε als Lösung der Differentialgleichung fortsetzen. (Man überlege sich, wie und warum man zwei Lösungen zusammensetzen kann, als Übung.) Daher ist (t0 , x0 ) ein innerer Punkt von D(f ). Widerspruch. Wir beschreiben nun, was am Rand des maximalen Existenzintervalles passiert. Wir werden in Bemerkung 8.13 sehen, dass eine Lösung nicht für alle t ∈ I definiert zu sein braucht. 8.1. DER EXISTENZSATZ VON PICARD-LINDELÖF 7 Bemerkung 8.11. Sei x ∈ C 1 (J, E) die maximale Lösung des Anfangswertproblems aus dem Satz von Picard-Lindelöf. Dann verlässt x jede kompakte Teilmenge K ⊂ I × Ω: graph x 6⊂ K. Anschaulich bedeutet dies im Falle dim E < ∞, dass (i) x auf ganz I definiert ist oder (ii) x gegen den Rand von Ω konvergiert, d. h. es gibt eine Folge (tn ) ⊂ J mit dist(∂Ω, x(tn )) → 0 für n → ∞, oder (iii) x am Ende (oder Anfang) von J unbeschränkt wird. Beweis. (i) Sei K ⊂ I × Ω kompakt und J ( I. Wir betrachten nur den Fall, dass J die Form [0, t0 ) oder [0, t0 ] mit t0 < ∞ hat, t0 ein innerer Punkt von I ist und graph x ⊂ K gilt. (ii) Aufgrund des lokalen Existenzsatzes gibt es ein ε > 0, so dass die Differentialgleichung für jeden Startwert in K mindestens auf einem Zeitintervall der Länge ε in beide Zeitrichtungen existiert. Dies wenden wir auf den Anfangswert x(t0 − ε/2) und die Startzeit t0 − ε/2 an. Durch Zusammensetzen der Lösung sehen wir, dass das Anfangswertproblem eine Lösung besitzt, die über t0 hinaus existiert. Widerspruch. Bei beschränkten Daten erhalten wir globale Existenz. Korollar 8.12. Sei E ein Banachraum mit x0 ∈ E. Sei f : I × E → E stetig und beschränkt und sei die Familie (f (t, ·))t∈R lokal gleichmäßig lipschitzstetig. Dann besitzt das Anfangswertproblem ( ẋ(t) = f (t, x(t)), t ∈ R, x(t0 ) = x0 genau eine Lösung x ∈ C 1 (R, E). Beweis. Der Satz von Picard-Lindelöf sichert die lokale Existenz einer Lösung. Bemerkung 8.9 impliziert die Eindeutigkeit. Angenommen, I sei das maximale offene Existenzintervall und sei a := sup I < ∞. Ohne Einschränkung nehmen wir dabei an, dass I nach oben beschränkt sei. Für alle r, s ∈ I erhalten wir mit der Dreiecksungleichung für Integrale aus der zur Differentialgleichung äquivalenten Integralgleichung s Z ≤ kf kL∞ · kr − sk. kx(r) − x(s)k = f (τ, x(τ )) dτ r Für jede Folge (ti )i∈N ⊂ I mit ti → a ist x(ti ) also eine Cauchyfolge. Wir setzen x mittels x(a) := lim x(ti ) auf I ∪ {a} fort und bezeichnen die Fortsetzung x : I ∪ i→∞ {a} → E laxerweise wieder mit x. Im Grenzwert s → a sehen wir, dass auch die Fortsetzung x Lipschitzstetig mit Lipschitzkonstante kf kL∞ ist. Weiterhin sehen wir aufgrund der Stetigkeit von x und wegen der Beschänktheit des Integranden, dass auch die Fortsetzung x die äquivalente Integralgleichung löst. Dies widerspricht der angenommenen Maximalität von I. Bemerkung 8.13 (Vergleich von Lösungen). Obwohl ich zum Anfangswertproblem ẋ(t) = t2 + x2 (t), x(0) = 1 keine explizite Lösung kenne, kann man doch Aussagen über das Existenzintervall machen. 8 8. EXISTENZ UND EINDEUTIGKEIT Eine Lösung des Anfangswertproblems ẏ(t) = y 2 (t) mit y(0) = 1 erfüllt y(t) ≤ x(t) für alle t ≥ 0: Sei ε > 0. Eine Lösung yε (t) = 1 1 −t der Differentialgleichung 1−ε für y mit Anfangswert 1 − ε erfüllt nämlich yε (0) < x(0). Daher gilt aufgrund der Stetigkeit von yε und x auch yε (t) < x(t) für kleine Werte von t > 0. Angenommen, es gibt ein minimales t0 > 0 im Definitionsbereich von x und yε mit x(t0 ) = yε (t0 ). Dann folgt aus x(t) ≥ yε (t) für alle 0 ≤ t ≤ t0 , dass ẋ(t0 ) ≤ ẏε (t0 ) gilt. Andererseits folgt jedoch aufgrund der Differentialgleichung ẋ(t0 ) = t20 + x2 (t0 ) > 0 + yε2 (t0 ) = ẏε (t0 ). Widerspruch. Wir erhalten x(t) ≥ yε (t) für alle t ≥ 0 im gemeinsamen Definitions1 kann auch x(t) höchstens bis gebiet. Mit ε & 0 folgt x(t) ≥ y(t). Wegen y(t) = 1−t t = 1 existieren. ? Betrachte also alle 0 ≤ t < T ≤ 1, für die eine Lösung x(t) existiert. Dort gilt ẋ(t) ≤ 1 + x2 (t). Im Falle der Gleichheit löst tan(t − t0 ) diese Differentialgleichung, konkret πx(t) = tan t + π4 . Somit + ε , erhalten wir ähnlich wie oben mit Hilfe von tan t + 4 π ε & 0, tan t + 4 ≥ x(t). Daher existiert die Lösung x(t) in einem Intervall [0, T ) mit 0, 785 < π4 ≤ T ≤ 1. Bemerkung 8.14. Ein Existenzresultat gilt auch für stetige Funktionen f ohne Lipschitzbedingung: Der Existenzsatz von Peano. Wir werden diesen später behandeln. Die Eindeutigkeitsaussage gilt nicht mehr, da ( p ẋ(t) = |x(t)|, t ∈ R, x(0) = 0 für jedes t0 > 0 durch ( 0, t ≤ t0 , x(t) = 1 2 (t − t ) , t > t0 0 4 gelöst wird. Für t < 0 gibt es analoge Nichteindeutigkeiten mit negativen Lösungen. Beschreibt man die Wasserhöhe in einem Eimer mit einem Loch durch eine gewöhnliche Differentialgleichung, so sollte diese nicht eindeutig lösbar sein. Zwar ist die Voraussage möglich, wie das Wasser ausströmt. Ist jedoch bereits alles Wasser herausgeflossen, so ist nicht mehr rekonstruierbar, seit wann der Eimer leer ist. 8.2. Vergleichssätze. Theorem 8.15 (Lemma von Gronwall). Sei I ⊂ R ein Intervall der Form [t0 , t1 ) oder [t0 , t1 ] (t1 = ∞ ist erlaubt), 0 ≤ ϕ, ψ ∈ C 0 (I, R). Sei a ≥ 0. Nehme an, dass Zt ϕ(t) ≤ a + ψ(τ )ϕ(τ ) dτ t0 für alle t ∈ I gilt. Dann folgt Zt ϕ(t) ≤ a · exp ψ(τ ) dτ t0 für alle t ∈ I. Häufig genügt es, dass Lemma im Fall ψ(t) ≡ c > 0 zu benutzen. 8.3. PARAMETERABHÄNGIGE DIFFERENTIALGLEICHUNGEN 9 Beweis. Wir dürfen annehmen, dass a > 0 gilt. Sonst ersetzen wir a durch ε > 0 und lassen am Ende ε & 0. Definiere Zt h(t) := a + ψ(τ )ϕ(τ ) dτ. t0 1 Es folgt h ∈ C und wir erhalten für t ∈ (t0 , t1 ) ḣ(t) = ψ(t)ϕ(t) ≤ ψ(t)h(t) nach Annahme an ϕ. Da h ≥ a > 0 gilt, schließen wir, dass d ḣ(t) log h(t) = ≤ ψ(t) dt h(t) gilt. Somit erhalten wir Zt log h(t) − log h(t0 ) ≤ ψ(τ ) dτ t0 und hieraus, nochmals nach Annahme an ϕ, t t Z Z ϕ(t) ≤ h(t) ≤ h(t0 ) · exp ψ(τ ) dτ = a · exp ψ(τ ) dτ . t0 t0 Das Lemma folgt. Hiermit schließen wir, dass Lösungen gewöhnlicher Differentialgleichungen stetig vom Anfangswert abhängen. Dies bedeutet physikalisch, dass eine Rechnung mit einem kleinen Messfehler auch nur kleine Abweichungen liefert. Theorem 8.16. Sei I ein offenes Intervall. Sei Ω eine offene Teilmenge eines Banachraumes E. Seien x0 , y0 ∈ Ω. Sei f ∈ C 0 (I × Ω, E) und sei (f (t, ·))t gleichmäßig Lipschitz stetig mit Lipschitzkonstante L. Sei J ⊂ I ein offenes Intervall mit t0 ∈ J. Gelte ( ( ẋ(t) = f (t, x(t)) in J, ẏ(t) = f (t, y(t)) in J, und x(t0 ) = x0 y(t0 ) = y0 . Dann gilt kx(t) − y(t)k ≤ kx0 − y0 k · exp(L · |t − t0 |) für alle t ∈ J. Beweis. Setze ϕ(t) := kx(t) − y(t)k. Dann folgt ϕ(t) = kx(t) − y(t)k Zt Zt = x0 + f (τ, x(τ )) dτ − y0 − f (τ, y(τ )) dτ t0 t0 Zt ≤ kx0 − y0 k + kf (τ, x(τ )) − f (τ, y(τ ))k dτ t0 Zt ≤ kx0 − y0 k + t0 L · kx(τ ) − y(τ )k dτ. {z } | =ϕ(τ ) Die Behauptung folgt nun direkt aus dem Lemma von Gronwall. 10 8. EXISTENZ UND EINDEUTIGKEIT 8.3. Parameterabhängige Differentialgleichungen. In diesem Kapitel seien E, F stets Banachräume, I ⊂ R offen mit 0 ∈ I. Sei Ω ⊂ E offen und V ⊂ F . Sei f : I × Ω × V → E zumindest stetig und in Ω × V gleichmäßig Lipschitz stetig, d. h. es gibt C > 0 mit kf (t, x, v) − f (t, y, w)k ≤ C · (kx − yk + kv − wk) für alle t ∈ I, alle x, y ∈ Ω und alle v, w ∈ V . Sei ϕ : V → Ω Lipschitz stetig mit kϕ(v) − ϕ(w)k ≤ C · (kv − wk) für alle v, w ∈ V . Um unnötige technische Komplikationen zu vermeiden, wollen wir stets annehmen, dass f, I, Ω und V beschränkt sind. Sei I ⊂ [−T, T ]. Theorem 8.17. Sei α : I × V → E mit ( α̇(t, v) = f (t, α(t, v), v), α(0, v) = ϕ(v) t ∈ I, für alle (t, v) ∈ I × V gegeben. Dann ist α gleichmäßig Lipschitz stetig. Beweis. (i) Lipschitzstetigkeit in t: Nach Voraussetzung ist α̇(t, v) = f (t, α(t, v), v) gleichmäßig beschränkt. Hieraus folgt die gleichmäßige Lipschitzstetigkeit. (ii) Lipschitzstetigkeit in v: Seien v, w ∈ V . α erfüllt die Integralgleichung Zt α(t, v) = ϕ(v) + f (τ, α(τ, v), v) dτ 0 und eine entsprechende Gleichung für w. Wir erhalten Zt α(t, v) − α(t, w) = ϕ(v) − ϕ(w) + f (τ, α(τ, v), v) − f (τ, α(τ, w), w) dτ 0 und somit Zt kα(t, v) − α(t, w)k ≤ kϕ(v) − ϕ(w)k + kf (τ, α(τ, v), v) − f (τ, α(τ, w), w)k dτ 0 Zt ≤ C · kv − wk + C · kα(τ, v) − α(τ, w)k + C · kv − wk dτ 0 Zt ≤ C · (1 + T ) · kv − wk + C kα(τ, v) − α(τ, w)k dτ. 0 Mit Hilfe des Lemmas von Gronwall erhalten wir daraus kα(t, v) − α(t, w)k ≤ c · kv − wk · eCT . Die Behauptung folgt. Theorem 8.18. Sei V offen und seien f und ϕ von der Klasse C 1 . Seien D2 f und D3 f in Ω × V und Dϕ in V gleichmäßig Lipschitz stetig. Sei α wie in Theorem 8.17. Dann ist α ebenfalls von der Klasse C 1 . Beweis. (i) Die stetige Differenzierbarkeit in t ist aufgrund der Differentialgleichung klar. 8.3. PARAMETERABHÄNGIGE DIFFERENTIALGLEICHUNGEN 11 (ii) Differenzierbarkeit bezüglich v; Vorüberlegungen: Wäre α bezüglich v differenzierbar und die zweiten Ableitungen vertauschbar, so löste Dv α die Differentialgleichung. d d D2 α(t, v) = D2 α(t, v) = Dv f (t, α(t, v), v) dt dt = D2 f (t, α(t, v), v)hDv α(t, v)i + D3 f (t, α(t, v), v) mit Anfangsbedingung D2 α(0, v) = Dϕ(v). Dies ist eine affin lineare Differentialgleichung für D2 α(t, v). Sie besitzt daher lokal eine Lösung. Sei λ = λ(t, v) die Lösung von ( λ̇(t, v) = D2 f (t, α(t, v), v)hλ(t, v)i + D3 f (t, α(t, v), v), λ(0, v) = Dϕ(v). (iii) Wir behaupten, dass D2 α(t, v) = λ(t, v) gilt. Nach Theorem 8.17 ist α in I ×V Lipschitz stetig. Somit sind auch die Terme in der Differentialgleichung für λ Lipschitz stetig und λ ist nach Theorem 8.17 in I × V Lipschitz stetig. Bis auf den Nachweis D2 α(t, v) = λ(t, v) erhalten wir also, dass α ∈ C 1 (I × V, E) gilt. (iv) Behauptung: Es gilt α(t, v + h) − α(t, v) − λ(t, v)hhi ∈ o(khk) für h → 0. Beweis. Wir definieren für kleine h 6= 0 ϑ(t, v) := α(t, v + h) − α(t, v). Es gelten ϑ(0, v) = ϕ(v + h) − ϕ(v) und ϑ̇(t, v) − λ̇(t, v)hhi = f (t, α(t, v + h), v + h) − f (t, α(t, v), v) − (D2 f (t, α(t, v), v)hλ(t, v)hhii + D3 f (t, α(t, v), v)hhi) . Wir integrieren dies und erhalten ϑ(t, v) − λ(t, v)hhi = ϕ(v + h) − ϕ(v) − Dϕ(v)hhi Zt f (τ, α(τ, v + h), v + h) − f (τ, α(τ, v), v) dτ + 0 Zt − D2 f (τ, α(τ, v), v)hλ(τ, v)hhii + D3 f (τ, α(τ, v), v)hhi dτ 0 = ϕ(v + h) − ϕ(v) − Dϕ(v)hhi Zt Z1 + 0 0 d f (τ, sα(τ, v + h) + (1 − s)α(τ, v), v + sh) ds dτ | {z } ds ≡ξs Zt − D2 f (τ, α(τ, v), v)hλ(τ, v)hhii + D3 f (τ, α(τ, v), v)hhi dτ, 0 wobei es wichtig ist, dass wir nicht α(τ, v + sh) schreiben, = ϕ(v + h) − ϕ(v) − Dϕ(v)hhi 12 8. EXISTENZ UND EINDEUTIGKEIT Zt Z1 D2 f (τ, ξs )hα(τ, v + h) − α(τ, v)i − D2 f (τ, α(τ, v), v)hλ(τ, v)hhii ds dτ + 0 0 Zt Z1 D3 f (τ, ξs )hhi − D3 f (τ, α(τ, v), v)hhi ds dτ + 0 0 = ϕ(v + h) − ϕ(v) − Dϕ(v)hhi Zt Z1 D2 f (τ, ξs )hα(τ, v + h) − α(τ, v) − λ(τ, v)hhii ds dτ + 0 0 Zt Z1 (D2 f (τ, ξs ) − D2 f (τ, α(τ, v), v)) hλ(τ, v)hhii ds dτ + 0 0 t 1 Z Z D3 f (τ, ξs ) − D3 f (τ, α(τ, v), v) ds dτ hhi + 0 0 ≡ I1 + I2 + I3 + I4 . Es gilt I1 ∈ o(khk), da ϕ differenzierbar ist. Da h 7→ ξs stetig mit ξs |h=0 = (α(τ, v), v) ist, folgt I3 , I4 ∈ o(khk). Insgesamt erhalten wir also in ε-Notation Zt kϑ(t, v) − λ(t, v)hhik ≤ ε(khk) · khk + c kϑ(τ, v) − λ(τ, v)hhik dτ. 0 Das Lemma von Gronwall impliziert nun kϑ(t, v) − λ(t, v)hhik ≤ ε(khk) · khk · ect . Dies zeigt die Behauptung. Damit folgt auch das Theorem. Bemerkung 8.19. Eine entsprechende Aussage gilt auch für die Klasse C p , 1 ≤ p < ∞. Beweis. Sei ohne Einschränkung p < ∞. Wir benutzen Induktion und dürfen bereits annehmen, dass α ∈ C p−1 gilt. Aus der Gleichung α̇(t, v) = f (t, α(t, v), v) liest man direkt ab, dass Dtp α existiert und stetig ist. Das funktioniert analog, solange mindestens eine Zeitableitung auftritt, also für Dtq Dvp−q α mit 1 ≤ q ≤ p. Dvp α: Es gilt d p−1 D α(t, v) = D2 f (t, α(t, v), v)hDvp−1 α(t, v)i + R(t, v) dt v mit R ∈ C 1 . Somit folgt nach Theorem 8.18 Dvp−1 α ∈ C 1 und daher die Behauptung. 8.4. Der Satz von Arzelà-Ascoli. Als Vorbereitung für einen Existenzsatz bei stetiger rechter Seite benötigen wir den Satz von Arzelà-Ascoli. Definition 8.20. Sei E ein metrischer Raum und sei F ein Banachraum. (i) Dann heißt eine Teilmenge Λ ⊂ C 0 (E, F ) gleichgradig stetig, falls ∀x ∈ E ∀ ε > 0 ∃ δ > 0 ∀ f ∈ Λ ∀ y ∈ E : d(x, y) < δ =⇒ kf (x) − f (y)k < ε, d. h. δ in der Definition von Stetigkeit kann unabhängig von der speziellen Funktion f gewählt werden. (Ohne den Quantor ∀x ∈ E spricht man von gleichgradiger Stetigkeit im Punkt x ∈ E.) 8.4. DER SATZ VON ARZELÀ-ASCOLI 13 (ii) Eine Teilmenge Λ ⊂ C 0 (E, F ) heißt gleichmäßig gleichgradig stetig, falls ∀ε > 0 ∃δ > 0 ∀f ∈ Λ ∀x, y ∈ E : d(x, y) < δ =⇒ kf (x) − f (y)k < ε. (iii) Wir sagen auch, dass die Funktionen f ∈ Λ bzw. eine Folge (gleichmäßig) gleichgradig stetig sind, wenn dies für Λ bzw. die Menge der Folgeglieder gilt. Beispiele 8.21. (i) Sei Λ ⊂ C 0 (R, R) eine Teilmenge von gleichmäßig hölderstetigen Funktionen, d. h. gilt |f (x) − f (y)| ≤ c · |x − y|α für ein c > 0, ein α ∈ (0, 1), alle x, y ∈ R und alle f ∈ Λ, so ist Λ gleichmäßig gleichgradig stetig. (ii) Gleichmäßig Lipschitz stetige Funktionen sind gleichmäßig gleichgradig stetig. (iii) Jede Funktion einer gleichmäßig gleichgradig stetigen Menge ist selbst gleichmäßig stetig. (iv) Eine Menge, die sich aus endlich vielen stetigen Funktionen oder endlich vielen gleichgradig stetigen Mengen zusammensetzt, ist gleichgradig stetig. (v) Eine Menge, die sich aus endlich vielen gleichmäßig stetigen Funktionen oder endlich vielen gleichmäßig gleichgradig stetigen Mengen zusammensetzt, ist selbst wieder gleichmäßig gleichgradig stetig. Genauso wie bei einer einzelnen Funktion ist eine gleichgradig stetige Menge von Funktionen, die auf einer kompakten Menge definiert sind, gleichmäßig gleichgradig stetig. Lemma 8.22. Sei E ein kompakter metrischer Raum und F ein Banachraum. Sei Λ ⊂ C 0 (E, F ) gleichgradig stetig. Dann ist Λ auch gleichmäßig gleichgradig stetig. Beweis. ? Falls nicht, gibt es ε > 0 und zu jedem n > 0 eine Funktion fn ∈ Λ sowie xn , yn ∈ E mit d(xn , yn ) < n1 und kfn (xn ) − fn (yn )k ≥ ε. Da E kompakt ist, konvergiert eine Teilfolge von (xn )n>0 , gelte also ohne Einschränkung xn → x ∈ E für n → ∞. Es folgt yn → x für n → ∞ aufgrund der Dreiecksungleichung. Da Λ gleichgradig stetig ist, gibt es δ > 0, so dass für alle f ∈ Λ und alle y ∈ Bδ (x) auch kf (x) − f (y)k < 3ε folgt. Sei nun n so groß, dass xn , yn ∈ Bδ (x) gilt. Dann erhalten wir ε ε 2 ε ≤ kfn (xn ) − fn (yn )k ≤ kfn (xn ) − fn (x)k + kfn (x) − fn (yn )k < + = ε. 3 3 3 Widerspruch. Die nächsten beiden Lemmata zeigen, wie Eigenschaften dank der Gleichgradigkeit im Limes erhalten bleiben. Lemma 8.23. Sei E ein metrischer Raum und sei F ein Banachraum. Sei die Folge (fn )n∈N ⊂ C 0 (E, F ) gleichmäßig gleichgradig stetig. Konvergiert (fn )n∈N punktweise gegen eine Funktion g : E → F , so ist g gleichmäßig stetig. Beweis. Sei ε > 0. Dann existiert δ > 0, so dass ∀ n ∈ N ∀ x, y ∈ E d(x, y) < δ =⇒ kfn (x) − fn (y)k < ε gilt. Für feste x, y ∈ E mit d(x, y) < δ erhalten wir also im Limes n → ∞ kg(x) − g(y)k ≤ ε Da ε > 0 beliebig war, folgt die gleichmäßige Stetigkeit. Lemma 8.24. Sei E ein metrischer Raum und sei F ein Banachraum. Sei die Folge (fn )n∈N ⊂ C 0 (E, F ) gleichgradig stetig. Konvergiert (fn )n∈N punktweise gegen eine Funktion g : E → F , so ist g stetig. 14 8. EXISTENZ UND EINDEUTIGKEIT Beweis. Sei x ∈ E. Sei ε > 0. Dann gibt es δ > 0, so dass y ∈ Bδ (x) =⇒ kfn (y) − fn (x)k < ε für alle n ∈ N gilt. Wir gehen nun für festes y ∈ Bδ (x) zum Limes n → ∞ über und erhalten kg(y) − g(x)k ≤ ε. Da ε > 0 beliebig war, folgt die Stetigkeit von g. Proposition 8.25. Sei E ein metrischer Raum und sei F ein Banachraum. Sei (fn )n∈N ⊂ C 0 (E, F ) eine gleichgradig stetige Folge. Sei D ⊂ E dicht. Konvergiert (fn )n∈N punktweise in D, so konvergiert (fn )n∈N punktweise in ganz E. Beweis. Sei x ∈ E beliebig. Da F vollständig ist, genügt es zu zeigen, dass die Folge (fn (x))n∈N eine Cauchyfolge ist. Sei ε > 0. Dann gibt es aufgrund der gleichgradigen Stetigkeit von (fn )n∈N ein δ > 0, mit kfn (x) − fn (y)k < ε ∀ y ∈ Bδ (x) ∀ n ∈ N. Da D dicht in E liegt, gibt es y ∈ D∩Bδ (x). Fixiere solch ein y. Nach Voraussetzung ist (fn (y))n∈N eine Cauchyfolge in F , d. h. es gibt n0 ∈ N, so dass für alle n, m ≥ n0 kfn (y) − fm (y)k < ε gilt. Zusammengenommen erhalten wir kfn (x) − fm (x)k ≤ kfn (x) − fn (y)k + kfn (y) − fm (y)k + kfm (y) − fm (x)k < 3ε für alle n, m ≥ n0 . Da ε > 0 beliebig war, folgt die Behauptung. Auf kompakten Mengen impliziert punktweise Konvergenz gleichgradig stetiger Funktionen bereits gleichmäßige Konvergenz. Proposition 8.26. Sei E ein kompakter metrischer Raum und F ein Banachraum. Sei (fn )n∈N ⊂ C 0 (E, F ) gleichgradig stetig und sei g : E → F eine Funktion. Dann folgt aus fn → g (punktweise) bereits fn ⇒ g. Beweis. (i) Nach Lemma 8.22 ist (fn )n∈N auch gleichmäßig gleichgradig stetig und nach Lemma 8.23 ist auch g gleichmäßig stetig. Daher ist Λ := {fn : n ∈ N} ∪ {g} gleichmäßig gleichgradig stetig. (ii) Sei ε > 0 beliebig. Dann gibt es aufgrund der gleichmäßigen gleichgradigen Stetigkeit ein δ > 0 so dass für alle x, y ∈ E und alle f ∈ Λ d(x, y) < δ =⇒ kf (x) − f (y)k < ε gilt. (iii) Da E kompakt ist, gibt es endlich viele xi ∈ E, 1 ≤ i ≤ N , so dass die Kugeln Bδ (xi ) die Menge E überdecken. (iv) Aufgrund der punktweisen Konvergenz fn → g gibt es zu jedem i ∈ {1, . . . , N } ein ni ∈ N mit kfn (xi ) − g(xi )k < ε ∀ n ≥ ni . Definiere n0 := max ni . 1≤i≤N (v) Sei nun x ∈ E beliebig. Sei i ∈ {1, . . . , N } mit x ∈ Bδ (xi ) fest gewählt. Dann gilt kfn (x) − g(x)k ≤ kfn (x) − fn (xi )k + kfn (xi ) − g(xi )k + kg(xi ) − g(x)k < 3ε für alle n ≥ n0 aufgrund der obigen Abschätzungen. Da x ∈ E und ε > 0 beliebig waren, folgt die Behauptung. 15 8.4. DER SATZ VON ARZELÀ-ASCOLI Lemma 8.27. Sei E ein metrischer Raum und sei F ein Banachraum. Sei Λ ⊂ C 0 (E, F ) (gleichmäßig) gleichgradig stetig. Dann ist auch der Abschluss Λ bezüglich der C 0 -Norm (gleichmäßig) gleichgradig stetig. Beweis. Gehe in der Definition der (gleichmäßigen) gleichgradigen Stetigkeit zum Grenzwert über. Details: Übung. Theorem 8.28 (Satz von Arzelà-Ascoli). Sei E ein kompakter metrischer Raum und sei F ein Banachraum. Dann ist Λ ⊂ C 0 (E, F ) genau dann relativ kompakt, wenn Λ gleichgradig stetig ist und wenn für jedes x ∈ E die Menge Λ(x) := {f (x) : f ∈ Λ} ⊂ F relativ kompakt ist. In Anwendungen ist insbesondere die Rückrichtung wichtig. Beweis. • ? „=⇒“: Sei Λ relativ kompakt. Λ(x) ist relativ kompakt: Sei x ∈ E beliebig. Wir behaupten, dass Λ(x) relativ kompakt ist, dass also Λ(x) kompakt ist. Da Λ(x) ⊂ F aufgrund der Vollständigkeit von F selbst ebenfalls vollständig ist, ist dies äquivalent dazu, dass Λ(x) oder, äquivalent dazu, Λ(x) präkompakt ist. Aufgrund derselben Argumentation ist Λ ⊂ C 0 (E, F ) genau dann relativ kompakt, wenn Λ präkompakt ist. Sei ε > 0 beliebig. Dann existieren endlich viele fi ∈ Λ, 1 ≤ i ≤ N , so dass zu jedem f ∈ Λ ein i ∈ {1, . . . , N } mit kf − fi kC 0 = sup kf (y) − fi (y)k < ε y∈E existiert. Insbesondere folgt daraus kf (x) − fi (x)k < ε für dieses i. Somit ist Λ(x) präkompakt und daher auch relativ kompakt. Λ ist gleichgradig stetig: Wir benutzen nochmals, dass Λ präkompakt N S ist. Sei ε > 0 beliebig. Seien fi ∈ Λ, 1 ≤ i ≤ N , mit Λ ⊂ Bε (fi ). Jedes fi i=1 ist gleichmäßig stetig, da E kompakt ist. Die Gleichmäßigkeit ist zwar nicht zu zeigen, erleichtert aber die Notation. Da die Menge {fi : 1 ≤ i ≤ N } endlich ist, gibt es δ > 0 mit d(x, y) < δ =⇒ kfi (x) − fi (y)k < ε für alle x, y ∈ E und alle 1 ≤ i ≤ N . Sei nun f ∈ Λ beliebig und i ∈ {1, . . . , N } mit f ∈ Bε (fi ). Dann folgt für x, y ∈ E mit d(x, y) < δ kf (x) − f (y)k ≤ kf (x) − fi (x)k + kfi (x) − fi (y)k + kfi (y) − f (y)k < 3ε. Da ε > 0 beliebig war, folgt die (gleichmäßige) gleichgradige Stetigkeit. • „⇐=“: Wir zeigen die Kompaktheit von Λ, indem wir zeigen, dass jede Folge (fn )n∈N ⊂ Λ eine in C 0 (E, F ) konvergente Teilfolge besitzt. Da E kompakt ist, ist E auch separabel. Daher besitzt E eine höchstens abzählbare dichte Teilmenge D = {xn : n ∈ N}. Sei (fn )n∈N ⊂ Λ beliebig. Wir behaupten, dass (fn )n∈N eine in ganz D punktweise konvergente Teilfolge besitzt. Dann konvergiert die Teilfolge nach Proposition 8.25 in ganz E punktweise und nach Proposition 8.26 sogar gleichmäßig und damit in C 0 (E, F ) wie behauptet. Die in D konvergente Teilfolge erhalten wir als Diagonalfolge: (a) {fn (x0 ) : n ∈ N} ⊂ Λ(x0 ) ist nach Voraussetzung relativ kompakt und besitzt daher eine in F konvergente Teilfolge (f0n (x0 ))n∈N . 16 8. EXISTENZ UND EINDEUTIGKEIT (b) {f0n (x1 ) : n ∈ N} ⊂ Λ(x1 ) besitzt ebenso eine konvergente Teilfolge: (f1n (x1 ))n∈N . (c) Iterativ erhalten wir eine Teilfolge (fin )n∈N von (fi−1n )n∈N , die in {x0 , . . . , xi } punktweise konvergiert. (d) Die Diagonalfolge (fnn )n∈N konvergiert in ganz D: Sei nämlich xi ∈ D beliebig, so ist (fnn )n≥i eine Teilfolge von (fin )n∈N und diese konvergiert in xi . Dies zeigt die noch ausstehende Behauptung. Ist der Bildraum endlichdimensional, so erhalten wir Korollar 8.29. Sei E ein kompakter metrischer Raum und (fn )n∈N ⊂ C 0 E, Rd , d ∈ N>0 , beliebig. Ist (fn )n∈N gleichgradig stetig und punktweise beschränkt, d. h. gilt für alle x ∈ E sup kfn (x)k ≤ c(x) < ∞, n∈N so besitzt (fn )n∈N eine in C 0 E, Rd konvergente Teilfolge. Ein wichtiger Spezialfall davon ist Korollar 8.30. Sei E ein kompakter metrischer Raum. Seien α ∈ (0, 1) und d ∈ N>0 . Sei (fn )n∈N ⊂ C 0,α E, Rd mit sup kfn kC 0,α (E,Rd ) < ∞ n∈N Dann besitzt (fn )n∈N eine Teilfolge, ohne Einschränkung (fn )n∈N selbst, mit fn −→ f in C 0 E, Rd für n → ∞ für ein f ∈ C 0,α E, Rd und es gilt kf kC 0,α (E,Rd ) ≤ sup kfn kC 0,α (E,Rd ) . n∈N Man sieht leicht, dass auch die Abschätzung kf kC 0,α (E,Rd ) ≤ lim kfn kC 0,α (E,Rd ) n→∞ gilt. Beweis. Wir müssen nur die Regularität und die Abschätzung für f nachweisen. Gelte kfn (x) − fn (y)k sup kfn (z)k + sup ≤ c. d(x, y)α z∈E x6=y∈E Insbesondere erhalten wir für feste x 6= y, z ∈ E kfn (z)k · d(x, y)α + kfn (x) − fn (y)k ≤ c · d(x, y)α . Nach Arzelà-Ascoli konvergiert eine Teilfolge, ohne Einschränkung (fn )n∈N selbst, in C 0 E, Rd und damit auch punktweise gegen eine Funktion f ∈ C 0 E, Rd . Mit n → ∞ erhalten wir kf (z)k · d(x, y)α + kf (x) − f (y)k ≤ c · d(x, y)α . Teilen wir durch d(x, y)α und betrachten das Supremum über alle x 6= y, z ∈ E, so folgt die Behauptung. 8.5. Der Existenzsatz von Peano. Theorem 8.31 (Peano). Sei Ω ⊂ R × Rn offen und f : Ω → Rn stetig. Sei (t0 , x0 ) ∈ Ω beliebig. Dann gibt es ein offenes Intervall I ⊂ R mit t0 ∈ I und mindestens eine Lösung des Anfangswertproblems ( α̇(t) = f (t, α(t)), t ∈ I, α(t0 ) = x0 . Jede Lösung α lässt sich fortsetzen, so dass graph α 6⊂ K für jede kompakte Teilmenge K ⊂ Ω gilt. 8.5. DER EXISTENZSATZ VON PEANO 17 Der wichtigste Teil des Beweises ist das folgende Resultat. Theorem 8.32. Sei I = [t0 , t1 ] ⊂ R mit t1 > t0 und sei f : I × Rn → Rn stetig und beschränkt. Sei x0 ∈ Rn . Dann gibt es mindestens eine (stetig) differenzierbare Funktion α : I → Rn mit ( α̇(t) = f (t, α(t)), t ∈ I, α(t0 ) = x0 . Beweis. (i) Wir benutzen die äquivalente Umformulierung als Integralgleichung Zt f (τ, α(τ )) dτ α(t) = x0 + t0 für τ ∈ I und zeigen, dass diese eine Lösung α ∈ C 0 (I, Rn ) besitzt. Für ε > 0 definieren wir eine Funktion αε durch t ≤ t0 , x0 , Rt αε (t) := x0 + f (τ, αε (τ − ε)) dτ, t ∈ I. t0 (ii) Die Funktion αε ∈ C 0 (I, Rn ) ist wohldefiniert: Zunächst können wir das Integral für t ∈ [t0 , t0 + ε] ∩ I bestimmen, da dort αε (τ − ε) definiert ist. Dann ist αε auf t ∈ [t0 , t0 + ε] ∩ I definiert, wir können also mit Hilfe der Integraldarstellung αε auf [t0 , t0 + 2ε] ∩ I bestimmen und erhalten so αε nach endlich vielen Schritten auf ganz I. (iii) (Gleichmäßige) gleichgradige Stetigkeit: Da f beschränkt ist, ist auch α̇ε unabhängig von ε > 0 beschränkt. (iv) Punktweise gleichmäßige Beschränktheit: Gelte |f | ≤ C. Für t ∈ I gilt Zt |αε (t)| = x0 + f (τ, αε (τ − ε)) dτ ≤ |x0 | + |t1 − t0 | · C. t0 Daher gibt es nach dem Satz von Arzelà-Ascoli eine Folge εi → 0, i → ∞, mit in C 0 (I, Rn ). αεi −→ α Auch die Funktionen t 7→ αεi (t − εi ) konvergieren gegen α; es gilt nämlich |αεi (t − εi ) − α(t)| ≤ |αεi (t − εi ) − αεi (t)| + |αεi (t) − α(t)| t Z = f (τ, αεi (τ − εi )) dτ + |αεi (t) − α(t)| t−εi ≤ εi · C + |αεi (t) − α(t)| und der letzte Term konvergiert wegen αεi −→ α in C 0 (I, Rn ) für i → ∞ ebenfalls gegen Null. (v) Da f auf kompakten Teilmengen der Form I × BR (0) gleichmäßig stetig ist, konvergiert f (·, αεi (·−εi )) ⇒ f (·, α(·)) (kleine Übung). Wir können also in der definierenden Integralgleichung für αε zum Grenzwert übergehen und erhalten Zt α(t) = x0 + f (τ, α(τ )) dτ t0 für t ∈ I wie behauptet. 18 8. EXISTENZ UND EINDEUTIGKEIT Eine einfache Normabschätzung für die hier definierten Funktionen αε zeigt, dass f nur auf einem Rechteck definiert zu sein braucht. Theorem 8.33. Seien t0 ∈ R, x0 ∈ Rn , t1 > t0 , r > 0 und f : R ≡ [t0 , t1 ] × Br (x0 ) → Rn stetig. Seien A := max |f |, ohne Einschränkung A > 0, und β := R min t1 − t0 , Ar . Dann besitzt das Anfangswertproblem ( α̇(t) = f (t, α(t)), t0 ≤ t ≤ t0 + β, α(t0 ) = x0 eine für t ∈ [t0 , t0 + β] ≡ I definierte Lösung α ∈ C 1 (I, Rn ). Eine entsprechende Aussage gilt für t1 < t0 . Beweis. Sei f ohne Einschränkung nach R̃ := [t0 , t1 ]×Rn stetig und mit sup |f | = A R̃ fortgesetzt, beispielsweise konstant entlang radialer Strahlen. Wir zeigen, dass für eine Lösung α ∈ C 1 (I, Rn ) stets |α(t)| ≤ r für alle t ∈ [t0 , t0 + β] gilt. Dann verlässt keine Lösung aus Theorem 8.32 den ursprünglichen Definitionsbereich von f , ist also eine gesuchte Lösung. Es gilt t Z |α(t) − α(t0 )| ≤ f (τ, α(τ )) dτ ≤ |t − t0 | · A ≤ β · A ≤ r. t0 Somit folgt die Behauptung. Beweisidee des Satzes von Peano: (i) Sei K b Ω beliebig. Wir zeigen lediglich, dass sich α nach rechts soweit fortsetzen lässt, dass graph α 6⊂ K gilt. Indem wir Ω durch kompakte Mengen ausschöpfen und α jeweils entsprechend fortsetzen, folgt die Behauptung. (ii) Sei I = [t0 , T ] bzw. = [t0 , T ) ein Intervall, auf dem α definiert ist. Indem wir in der äquivalenten Integralrechnung zum Grenzwert übergehen, sehen wir, dass wir α zumindest auf [t0 , T ] fortsetzen können. (iii) Solange (T, α(T )) ∈ K gilt, gibt es stets eine Umgebung mit festem Radius r > 0, auf der |f | ≤ C(K) gilt. Somit können wir die Lösung α nach Theorem 8.33 auf ein Intervall [t0 , T + ε(K)] mit ε(K) > 0 fortsetzen. Nach endlich vielen solchen Schritten verlässt die Lösung damit K. Die Behauptung folgt. 8.6. Separation der Variablen ?. Beispiel 8.34 (Separation der Variablen). Sei x die Geschwindigkeit eines fallenden Körpers, auf den Gravitation und Luftwiderstand wirken. Dabei ist die Geschwindigkeitsänderung (= die Beschleunigung) durch den Luftwiderstand proportional zur Kraft und damit zu x2 . Es gilt ẋ = g − lx2 . In den folgenden Rechnungen kümmern wir uns nicht genauer um mögliche Divisionen durch Null. Man überprüft am Ende, dass es sich tatsächlich um eine Lösung handelt. Wir formen wie folgt um g ẋ(t) = l − x2 (t) , l ẋ(t) l= g , 2 l − x (t) 8.6. SEPARATION DER VARIABLEN ? Zt ẋ(τ ) dτ = − x2 (τ ) 19 Zt ẋ(τ ) pg dτ l − x(τ ) l + x(τ ) 0 0 s Zt s Zt ẋ(τ ) 1 l ẋ(τ ) 1 l pg pg dτ + dτ = 2 g 2 g l − x(τ ) l + x(τ ) 0 0 s s r t r t 1 l g 1 l g = − log − x(τ ) + log + x(τ ) 2 g l 2 g l 0 0 s pg + x(t) 1 l + l · t0 , t0 geeignet, = log p gl 2 g l − x(t) pg r g l + x(t) pg = exp 2l (t − t0 ) , l l − x(t) √ √ ... . . . + x(t) = . . .e − x(t)e... , r 2l√ g (t−t0 ) l ge −1 √g x(t) = . l e2l l (t−t0 ) + 1 l·t= g l pg Es folgt g e... √ e... (e... + 1) − e... (e... − 1) √ 2l . . . = 4l , ẋ(t) = . . . (e... + 1)2 l (e... + 1)2 2 g g g e... − 1 g (e... + 1)2 − (e... − 1)2 g 4e... − x(t)2 = − = = . ... ... 2 ... l l l e +1 l (e + 1) l (e + 1)2 Somit haben wir für jedes t0 eine Lösung gefunden. Als wir den Logarithmus als Stammfunktion verwendet haben, haben wir ein Vorzeichen fixiert. Somit erhalten wir Lösungen für manche Anfangswerte x(0). Weitere Lösungen erhalten wir durch eine andere Vorzeichenwahl. Beispiel 8.35. Ist ẋ(t) = f (at + bx(t) + c), so erfüllt y(t) := at + bx(t) + c die Differentialgleichung ẏ(t) = a + bẋ(t) = a + bf (y(t)). Dies können wir mit Separation der Variablen lösen. Zu einem konkreten Beispiel: ẋ(t) = (t + x(t))2 , y(t) := t + x(t), ẏ(t) = 1 + y 2 (t). Wir rechnen wieder formal und benötigen zunächst eine Stammfunktion. Z Z Z 1 −1 1 1 1 dx = + dx dx = 1 + x2 (x + i)(x − i) 2i x+i x−i 1 1 x−i 1 1 + ix = (− log(x + i) + log(x − i)) = log = log − . 2i 2i x+i 2i 1 − ix √ √ Mit 1 + ix = 1 + x2 · eiϕ , 1 − ix = 1 + x2 · e−iϕ und ϕ = arctan x erhalten wir weiter ... = 1 π log eiπ+2iϕ = + arctan x. 2i 2 20 8. EXISTENZ UND EINDEUTIGKEIT Die Konstante in der Stammfunktion ist natürlich beliebig. Wir erhalten weiter Z Z ẏ(t) dt = 1 dt, 1 + y 2 (t) arctan y(t) = t − t0 , t0 geeignet für Anfangsbedingungen, y(t) = tan(t − t0 ), x(t) = tan(t − t0 ) − t. d tan t = cos12 t (Quotientenregel und sin2 t+cos2 t = 1) und tan2 t+1 = Nun gelten dt 1 cos2 t . Somit erhalten wir ẋ(t) = d 1 (tan(t − t0 ) − t) = − 1 = tan2 (t − t0 ) = (x(t) + t)2 . dt cos2 (t − t0 ) Damit haben wir für jedes t0 eine Lösung gefunden. Beispiel 8.36. Aus einer Differentialgleichung der Form ẋ = f mit u(t) = x(t) t x(t) t erhalten wir für t 6= 0 ẋ(t) = u(t) + tu̇(t) = f (u). Man kann nun f (u(t)) − u(t) t lösen und aus dem Ergebnis x(t) rekonstruieren. Als Beispiel wollen wir das Anfangswertproblem u̇(t) = ẋ(t) = lösen. Mit u(t) = x(t) t t2 x(t) − 2 , t x (t) x(1) = 1 erhalten wir bei unterschiedlicher Differentiation von x(t) ẋ(t) = u(t) − 1 = u(t) + tu̇(t) u2 (t) und somit folgt 1 . tu2 (t) Weiterhin gilt u(1) = 1. Es folgt (vom Umbruch her gelesen) u̇(t) = − 1 1 3 u (t) − u3 (1) = 3 3 | {z } =1 Zt d dτ 1 3 u (τ ) 3 1 Zt = Zt dτ = u2 (τ )u̇(τ ) dτ 1 1 − dτ = − log t + log 1 = − log t, τ 1 p 3 1 − 3 log t, p 3 x(t) = t 1 − 3 log t, u(t) = 0 < t < e1/3 ≈ 1, 396. 8.7. Exakte Differentialgleichungen ?. Bemerkung 8.37. Seien g, h in einer offenen Teilmenge Ω ⊂ R2 stetig differenzierbar. Wir suchen eine Kurve (x(t), y(t)) : I → R2 , die die Differentialgleichung g(x(t), y(t))ẋ(t) + h(x(t), y(t))ẏ(t) = 0 löst. Sei F : Ω → R stetig differenzierbar. Gelte ∂F (x, y) = g(x, y) und ∂x ∂F (x, y) = h(x, y). ∂y 21 9.1. EINFÜHRUNG UND BEISPIELE Die Differentialgleichung heißt dann exakt. Dann ist F (x(t), y(t)) konstant, denn es gilt d ∂F ∂F F (x(t), y(t)) = ẋ(t) + ẏ(t) = g · ẋ + h · ẏ = 0. dt ∂x ∂y Die Differentialgleichung y ẋ + 2xẏ = 0 ist nicht exakt (siehe z. B. nächster Abschnitt). Nach Multiplikation mit y (Eulerscher Multiplikator/integrierender Faktor) erhält man jedoch y 2 ẋ + 2xy ẏ = 0, eine exakte Differentialgleichung mit F (x, y) = xy 2 . ∂2F Die Exaktheit einer Differentialgleichung erfordert im Falle F ∈ C 2 , dass ∂x∂y unabhängig von der Differentiationsreihenfolge ist, also ∂g ∂ ∂F ∂ ∂F ∂h = = = . ∂y ∂y ∂x ∂x ∂y ∂x In einem einfach zusammenhängenden Gebiet ist diese Bedingung auch hinreichend für die Exaktheit. 9. Lineare Differentialgleichungen Die Resultate in diesem Abschnitt gelten auch für Funktionen mit Werten in C oder in einem komplexen Vektorraum. 9.1. Einführung und Beispiele. Definition 9.1. Sei I ⊂ R ein offenes Intervall. Eine lineare Differentialgleichung ist eine Differentialgleichung der Form ẋ(t) + g(t)x(t) = h(t). ? Dieselbe Form haben lineare Systeme gewöhnlicher Differentialgleichungen. Wir wollen annehmen, dass g und h stetig sind. Die Differentialgleichung heißt (i) homogen, falls h(t) ≡ 0 gilt. (ii) inhomogen, wenn h beliebig ist. Ersetzen wir h(t) durch 0, so heißt die resultierende Differentialgleichung die zugehörige homogene Differentialgleichung. Bemerkung 9.2. Lokal sind Lösungen linearer Differentialgleichungen stets eindeutig, da der Term g(t)x(t) bezüglich x(t) linear und damit Lipschitz stetig ist. Hieraus folgt auch die globale Eindeutigkeit. Beispiel 9.3 (Homogene Differentialgleichung, eindimensional). Die homogene Differentialgleichung ẋ(t) = g(t)x(t) können wir durch Separation der Variablen lösen. Wir rechnen formal ẋ(t) d log x(t) = = g(t), dt x(t) Zt log x(t) = g(τ ) dτ + log C, t0 Zt x(t) = C · exp g(τ ) dτ . t0 Man rechnet direkt nach, dass dies eine Lösung ist. Mit C := x(t0 ) kann man beliebige Anfangswerte realisieren. Aufgrund der Lipschitzstetigkeit im zweiten Argument sind diese Lösungen auch eindeutig bestimmt. 22 9. LINEARE DIFFERENTIALGLEICHUNGEN Lemma 9.4. Sei ẋ(t) + g(t)x(t) = h(t) eine lineare Differentialgleichung. Seien x1 , x2 Lösungen der Differentialgleichung und sei x0 eine Lösung der zugehörigen homogenen Differentialgleichung. Dann ist (i) (x1 − x2 )(t) := x1 (t) − x2 (t) eine Lösung der zugehörigen homogenen Differentialgleichung. (ii) x1 + x0 eine Lösung der inhomogenen Differentialgleichung. (iii) Eine beliebige Lösung der inhomogenen Differentialgleichung ist die Summe aus einer fixierten Lösung der inhomogenen Differentialgleichung und einer Lösung der homogenen Differentialgleichung. Anders ausgedrückt: Die Menge aller Lösungen der inhomogenen Differentialgleichung erhalten wir, indem wir zur Menge der Lösungen der homogenen Gleichung eine spezielle Lösung (zu jedem Element) hinzuzählen. Solch eine Menge (Unterraum plus spezielles Element) bezeichnet man auch als affinen Unterraum. (iv) Die Lösungen der homogenen Differentialgleichung bilden einen Unterraum der C 1 -Funktionen. Dasselbe Resultat gilt auch für Systeme gewöhnlicher Differentialgleichungen. Beweis. (i) Es gilt d (x1 − x2 )(t) = ẋ1 (t) − ẋ2 (t) = h(t) − g(t)x1 (t) − (h(t) − g(t)x2 (t)) dt = − g(t)(x1 (t) − x2 (t)). (ii) Dies folgt wieder aus einer direkten Rechnung d (x1 (t) + x0 (t)) = h(t) − g(t)x1 (t) − g(t)x0 (t) = h(t) − g(t)(x1 (t) + x0 (t)). dt (iii) Die ist eine Umformulierung der obigen Aussagen. (iv) Wie in (ii) erhalten wir, dass die Summe von zwei Lösungen der homogenen Differentialgleichung wieder eine Lösung der homogenen Differentialgleichung ist. Sei λ ∈ R beliebig. Dann gilt d (λx(t)) = λẋ(t) = −λg(t)x(t). dt Beispiel 9.5 (Inhomogene Differentialgleichung, eindimensional). Wir untersuchen die Differentialgleichung ẋ(t) = g(t)x(t) + h(t). Die „Methode der Variation der Konstanten“ von Lagrange besteht darin, einen Ansatz der Form t Z x(t) = C(t) · exp g(τ ) dτ t0 zu machen, also die Lösung für die zugehörige homogene Differentialgleichung durch Ersetzen der Konstanten C durch eine Funktion C(t) zu modifizieren. Dies ist genau dann eine Lösung, wenn Ċ(t)e... + C(t)e... g(t) = g(t)C(t)e... + h(t) gilt. Wir erhalten Zt Zτ h(τ ) · exp − C(t) = t0 g(ρ) dρ dτ + C0 . t0 23 9.2. HOMOGENE LINEARE SYSTEME Mit Hilfe des Eindeutigkeitsresultates für gewöhnliche Differentialgleichungen erhalten wir also: Theorem 9.6. Die eindeutig bestimmte Lösung von ẋ(t) = g(t)x(t) + h(t) mit Anfangswert x(t0 ) = C0 ist durch τ t Zt Z Z x(t) = C0 + h(τ ) · exp − g(ρ) dρ dτ · exp g(σ) dσ t0 t0 t0 gegeben. 9.2. Homogene lineare Systeme. Lemma 9.7. Sei I ⊂ R ein offenes Intervall und I 3 t 7→ A(t) ∈ Rn×n stetig. Dann gibt es zu jedem t0 ∈ I und jedem x0 ∈ Rn eine eindeutig bestimmte Lösung x ∈ C 1 (I, Rn ) des Anfangswertproblems ( ẋ(t) = A(t)x(t), x(t0 ) = x0 . Entscheidend ist hier, dass die Lösung auf ganz I existiert. Eine analoge Argumentation funktioniert für die inhomogene Gleichung ẋ(t) = A(t)x(t) + b(t) und stetigem b ∈ Rn . Das Resultat gilt auch in Banachräumen. Beweis. Theorem 8.16, angewandt auf Teilintervalle von I, liefert die Eindeutigkeit der Lösung. Das Theorem von Picard-Lindelöf liefert die Existenz einer Lösung auf einem kleinen Zeitintervall. Die Lösung existiert auf ganz I: Auf Rn und Rn×n betrachten wir Normen mit kAxkRn ≤ kAkRn×n · kxkRn . Sei (a, b) 6= I das maximale offene Existenzintervall, auf dem eine C 1 -Lösung x existiert. Sei ohne Einschränkung (b − 3δ, b + 3δ) ⊂ I für ein δ > 0 und t0 < b − 3δ sowie t0 − 3δ > a. Sei CA ≥ 1 mit kA(t)k ≤ CA für t ∈ [t0 − 2δ, b + 2δ]. Für die Lösung x(t) erhalten wir aus Zt A(τ ) · x(τ ) dτ x(t) = x(t0 ) + t0 für alle t ∈ [t0 , b) Zt kx(t)k ≤ kx(t0 )k + CA · kx(τ )k dτ t0 und somit mit dem Lemma von Gronwall kx(t)k ≤ kx0 k · eCA ·|b−t0 | ≡ Cx , also eine gleichmäßige Schranke, d. h. Cx hängt nicht von t ab. Dies widerspricht Bemerkung 8.11 und es gilt daher (a, b) = I. Theorem 9.8. Sei I ⊂ R ein offenes Intervall und sei I 3 t 7→ A(t) ∈ Rn×n stetig. Dann bilden die Lösungen x(t) der homogenen linearen Differentialgleichung ẋ(t) = A(t)x(t) einen Unterraum U von C 1 (I, Rn ). Bezeichne mit x(t; t0 , x0 ) die Lösung mit x(t0 ) = x0 . Dann ist die Abbildung Rn 3 x0 7→ (I 3 t 7→ x(t; t0 , x0 )) ∈ U für festes t0 ∈ I ein Vektorraumisomorphismus. Das Resultat gilt auch in Banachräumen. 24 9. LINEARE DIFFERENTIALGLEICHUNGEN Beweis. Wir haben bereits in Lemma 9.4 gesehen, dass U ein Vektorraum ist. Daraus folgt auch, dass x0 7→ x(·; t0 , x0 ) eine lineare Abbildung ist: Die Lösung zum Anfangswert λx0 ist λx(·; t0 , x0 ) = x(·; t0 , λx0 ), da beides Lösungen sind und denselben Anfangswert haben. Ebenso erhalten wir x(·; t0 , x1 ) + x(·; t0 , x2 ) = x(·, t0 , x1 + x2 ). Da jede Lösung der linearen homogenen Differentialgleichung einen Anfangswert zur Zeit t0 besitzt und dieser die Lösung eindeutig bestimmt, ist die Abbildung surjektiv und injektiv. Korollar 9.9. (i) Die Lösungen (x(·; t0 , ei ))1≤i≤n bilden eine Basis aller Lösungen der homogenen Differentialgleichung ẋ(t) = A(t)x(t). (ii) Die Abbildung Rn 3 x0 7→ x(t1 ; t0 , x0 ) ∈ Rn ist ein Vektorraumisomorphismus. Bemerkung 9.10. (i) Sei (xi )1≤i≤n eine Basis des Lösungsraumes. Dann nennen wir (xi )i ein Fundamentalsystem. (ii) Setze X(t) = (x1 (t), . . . , xn (t)). X(t) mit (xi )i wie oben heißt Lösungs- oder Fundamentalmatrix. Sie erfüllt Ẋ(t) = A(t)X(t). Jede Lösung hat die Gestalt X(t)v für ein v ∈ Rn . Ist B ∈ Rn×n regulär, so ist X(t)B ebenfalls eine Lösungsmatrix. Alle Lösungsmatrizen sind von dieser Form. (iii) Ist Xe (t) die Lösungsmatrix mit Xe (t0 ) = 11, so erfüllt eine beliebige Lösungsmatrix X(t) X(t) = Xe (t) · X(t0 ), denn auf beiden Seiten stehen Lösungsmatrizen mit den gleichen Anfangswerten. (iv) Eine Lösung zum Anfangswert x(t0 ) = x0 ist durch Xe (t)x0 gegeben. Lemma 9.11. Sei A = aij 1≤i,j≤n ∈ Rn×n invertierbar. Dann gilt j ∂ det A = det A · a−1 i . ∂aij Beweis. Wir verwenden Resultate über die Determinante und die Inverse einer Matrix; vergleiche [4, Lemma 2.14] und benachbarte Resultate. Setze bij := (−1)i+j det Aji , wobei Aij die Matrix bezeichnet, die entsteht, wenn man die i-te Zeile und die j-te Spalte streicht, also die Zeile und Spalte, in der aij steht. Es gilt a−1 det A · j i δki = (−1)i+j = n X det Aij bji = , det A det A aij bjk . j=1 Daraus erhalten wir, da bji nicht von aij abhängt, mit i = k j ∂ det A = bji = det A · a−1 i . i ∂aj Theorem 9.12 (Wronski-Determinante). Sei X(t) = (xij (t)) eine Lösungsmatrix des linearen Differentialgleichungssystems ẋ(t) = A(t) · x(t) mit zeitabhängigen Ma trizen A = aij ∈ C 0 (I, Rn×n ). Setze ϕ(t) := det X(t). Dann gilt ϕ̇(t) = tr A(t) · ϕ(t). 9.4. DIE EXPONENTIALFUNKTION FÜR MATRIZEN ? 25 Beweis. Wir benutzen Lemma 9.11 und erhalten n n X X j d ∂ det X(t) ∂xij (t) ϕ(t) = = det X(t) · x−1 i ẋij i dt ∂t ∂xj (t) i,j=1 i,j=1 = det X(t) · n X x−1 j i aik xkj = det X(t) · tr (X(t))−1 A(t)X(t) i,j,k=1 = det X(t) · tr X(t)(X(t))−1 A(t) = det X(t) · tr A(t). Korollar 9.13. Sind die Spalten xi , 1 ≤ i ≤ n, einer Matrix X mit Ẋ(t) = A(t)X(t) für ein t linear unabhängig, so gilt dies auch für alle anderen Zeiten in einem Intervall, in dem A(t) stetig ist. 9.3. Inhomogene lineare Systeme. Bemerkung 9.14. Wir wollen das System ẋ(t) = A(t)x(t) + b(t) für stetige Funktionen t 7→ A(t) ∈ Rn×n und t 7→ b(t) ∈ Rn lösen. Sei X(t) die Lösungsmatrix des homogenen Systems ẋ(t) = A(t)x(t) mit Ẋ(t) = A(t)X(t) und X(t0 ) = 11. Wie bei der Variation der Konstanten machen wir einen Ansatz x(t) = X(t) · v(t) und versuchen, den im homogenen Fall konstanten Vektor v so zu wählen, dass wir eine Lösung der inhomogenen Gleichung mit Anfangswert x0 erhalten. Es ist ! Ax + b = ẋ = Ẋv + X v̇ = AXv + X v̇. Rt Also sollte b = X v̇ gelten. Setze daher v(t) := x0 + X −1 (τ )b(τ ) dτ . Somit ist die t0 Lösung durch Zt x(t) = X(t) x0 + X −1 (τ )b(τ ) dτ t0 gegeben, denn man rechnet nach, dass diese Formel eine Lösung liefert. 9.4. Die Exponentialfunktion für Matrizen ?. Definition 9.15. Eine Norm auf dem Raum Rn×n der Matrizen und eine Norm auf Rn heißen verträglich, wenn (i) kA · Bk ≤ kAk · kBk, (ii) kAxk ≤ kAk · kxk für alle A, B ∈ Rn×n und alle x ∈ Rn gilt. Beispiele 9.16. s s n n P P 2 i (x ) und kAk = (i) kxk = i=1 i,j=1 2 aij , siehe [4, vor Lemma 1.23]. Mit die- ser Norm ist Rn×n ein vollständiger normierter Raum, d. h. ein Banachraum, jede Cauchyfolge konvergiert also. Ebenso gilt, dass jeder normierte endlichdimensionale R- oder C-Vektorraum ein Banachraum ist, denn für endlichdimensionale Vektorräume sind alle Normen äquivalent, d. h. für beliebige Normen k · k1 und k · k2 gibt es ein C > 0 mit 1 kxk1 ≤ kxk2 ≤ C · kxk1 C für alle x. 26 9. LINEARE DIFFERENTIALGLEICHUNGEN (ii) Sei k · k eine beliebige Norm auf Rn . Definiere kAk := sup kAxk. kxk=1 Hier ist kAxk ≤ kAk · kxk für kxk = 1 nach Definition klar und folgt sonst durch Skalierung. Wegen kBxk ≤ kBk für alle kxk = 1 und sup kAxk = sup kAxk kxk=1 kxk≤1 erhalten wir kA · Bk = sup kABxk ≤ sup kxk=1 kyk=kBk kAyk = kBk · sup kAyk = kAk · kBk. kyk=1 Lemma 9.17. Sei I ⊂ R offen, I 3 t 7→ A(t) ∈ Rn×n differenzierbar, ebenso B(t) und I 3 t 7→ x(t) ∈ Rn×n . Dann sind auch die folgenden Ausdrücke differenzierbar und es gilt d d d (A(t)B(t)) = A(t) · B(t) + A(t) · B(t), dt dt dt d d d (A(t)x(t)) = A(t) · x(t) + A(t) · x(t). dt dt dt Beweis. Dies folgt direkt aus der Produktregel, angewandt auf die Definition der entsprechenden Matrixprodukte. Wir wollen eA , A eine Matrix, bestimmen und auch ableiten. Dies kann man in diesem konkreten Fall explizit machen, indem man den eindimensionalen Beweis anpasst. Das folgende Theorem liefert eine allgemeine Methode dafür. Theorem 9.18. Seien E, F Banachräume, Ω ⊂ E offen und zusammenhängend. Sei (fn ) eine Folge differenzierbarer Abbildungen fn : Ω → F . Gelte: (i) Es gibt x0 ∈ Ω, so dass fn (x0 ) in F konvergiert. (ii) Zu jedem Punkt x ∈ Ω gibt es eine Umgebung Br (x) ⊂ Ω, so dass (fn0 ) gleichmäßig konvergiert. Dann konvergiert die Folge (fn ) in jeder solchen Umgebung Br (x) gleichmäßig. Für x ∈ Ω gilt 0 lim fn (x) = lim fn0 (x). n→∞ n→∞ Beide Voraussetzungen sind nötig; Gegenbeispiele sind die Funktionenfolgen fn (x) = n und fn (x) = 1 n sin(nx). Beim zweiten Beispiel ist fn0 sogar gleichmäßig beschränkt, lim n→∞ sin(nx) n ≡ 0 ist differenzierbar, aber der Grenzwert der Ableitungen lim fn0 (x) = lim cos(nx) n→∞ n→∞ existiert nicht. 9.4. DIE EXPONENTIALFUNKTION FÜR MATRIZEN ? 27 Beweis. Für y, z ∈ Br (x) gilt 1 Z d kfn (y) − fm (y) − (fn (z) − fm (z))k = (f − f )(ty + (1 − t)z) dt m dt n 0 1 Z 0 0 = (fn − fm )(ty + (1 − t)z)hy − zi dt 0 ≤ kz − yk · sup 0 kfn0 (w) − fm (w)k w∈Br (x) ≤ 2r · (9.1) sup 0 kfn0 (w) − fm (w)k. w∈Br (x) Mit der umgekehrten Dreiecksungleichung können wir die linke Seite nach unten mit . . . ≥ |kfn (y) − fm (y)k − kfn (z) − fm (z)k| abschätzen. Wir erhalten kfn (y) − fm (y)k ≤ 2r · 0 kfn0 (w) − fm (w)k + kfn (z) − fm (z)k. sup w∈Br (x) Konvergiert fn (z) für n → ∞, so konvergiert daher fn gleichmäßig in Br (x). Dies liefert, dass die Menge der Punkte x, in der fn (x) für n → ∞ konvergiert, in Ω offen, abgeschlossen und nicht leer ist. Somit konvergiert fn in ganz Ω. (Dies benötigt etwas Topologie oder ein elementares Argument für E = R.) Wir definieren f (y) := lim fn (y) und g(y) := lim fn0 (y). n→∞ n→∞ Zur Vertauschbarkeit der Grenzwertbildung mit der Ableitung: Sei ε > 0. Wähle eine Kugel Br (x) wie in der Annahme. Dann gibt es ein n0 , so dass für alle m, n ≥ n0 0 (w)k ≤ ε für alle w ∈ Br (x) gilt. Sei weiterhin n so die Abschätzung kfn0 (w) − fm 0 groß, dass kg(w) − fn (w)k ≤ ε für alle w ∈ Br (x) gilt. In (9.1) betrachten wir den Grenzwert m → ∞ und erhalten für n ≥ n0 in Br (x) kf (y) − f (z) − (fn (y) − fn (z))k ≤ ε · ky − zk. Nach Definition der Ableitung im Punkt x gibt es zu jedem n ≥ n0 ein r0 ≤ r, so dass für y ∈ Br0 (x) die Abschätzung kfn (y) − fn (x) − fn0 (x)hy − xik ≤ ε · ky − xk gilt. Für ky − xk ≤ r0 erhalten wir daher mit Hilfe der obigen Ungleichungen und der Dreiecksungleichung kf (y) − f (x) − g(x)hy − xik ≤ kf (y) − f (x) − (fn (y) − fn (x))k + kfn (y) − fn (x) − fn0 (x)hy − xik + kfn0 (x) − g(x)k · ky − xk ≤ 3ε · ky − xk. Wir haben für ein beliebiges ε > 0 ein r0 > 0 gefunden, so dass kf (y) − f (x) − g(x)hy−xik ≤ ε·ky−xk für y ∈ Br0 (x) gilt. Damit ist g(x) = f 0 (x). Die Behauptung folgt. Korollar 9.19. Sei g(x) = ∞ P ai xi eine Potenzreihe, die in Br (0) konvergiert. Sei i=0 I 3 t → A(t) ∈ RN ×N stetig differenzierbar mit kA(t)k < r für alle t ∈ I für eine verträgliche Norm k · k. Gelte h i A(t)Ȧ(t) − Ȧ(t)A(t) = A(t), Ȧ(t) = 0. 28 9. LINEARE DIFFERENTIALGLEICHUNGEN (Ohne diese Bedingung sieht die Ableitung deutlich komplizierter aus.) Dann existiert n ∞ X X g(A(t)) := lim ai Ai (t) ≡ ai Ai (t), n→∞ i=0 i=0 ist in I differenzierbar und die Ableitung erfüllt n ∞ X X d g(A(t)) = lim iai Ai−1 (t)Ȧ(t) = iai Ai−1 (t)Ȧ(t). n→∞ dt i=1 i=1 Beweis. Hierbei ist Ai induktiv durch A0 = 11 und Ai+1 := A · Ai definiert. Wir wollen Theorem 9.18 anwenden. Setze n X fn (t) := ai Ai (t). i=0 (i) Es gilt für m > n m m X X ai Ai (t) ≤ |ai | · kA(t)ki . kfm (t) − fn (t)k = i=n+1 i=n+1 Wegen kA(t)k < r und da die Potenzreihe für reelle x absolut konvergiert, ist (fn (t)) für festes t ∈ I eine Cauchyfolge in RN ×N , k · k . Da RN ×N , k · k ein Banachraum ist, existiert der Grenzwert lim fn (t) ∈ RN ×N . n→∞ (ii) Es gilt aufgrund der Produktregel n X d iai Ai−1 (t)Ȧ(t), fn (t) ≡ fn0 (t) = dt i=1 da A(t) und Ȧ(t) vertauschen. Wie oben sieht man, dass der Grenzwert lim fn0 (t) =: h(t) existiert, da Potenzreihen im Inneren ihres Konvergenzn→∞ radiusses differenzierbar sind und die Ableitung durch die absolut konvergente Potenzreihe der Ableitungen der Summanden gegeben ist. Sei t in einem Intervall J, in dem kA(t)k ≤ r0 < r gilt. Dort gilt für m > n m m X X 0 0 i−1 i−1 kfm (t) − fn (t)k = iai A (t)Ȧ(t) ≤ iai A (t) · Ȧ(t) i=n+1 i=n+1 ! m X ≤ i|ai |kA(t)ki−1 · Ȧ(t) . i=n+1 Wegen kA(t)k ≤ r0 und der gleichmäßigen absoluten Konvergenz von ∞ P iai xi i=0 auf Br0 (0) konvergiert auch fn0 für t ∈ J gleichmäßig: Für jedes ε > 0 gibt 0 es ein n0 , so dass für alle m > n ≥ n0 die Abschätzung kfm (t) − fn0 (t)k ≤ ε 0 für alle t ∈ J gilt. Mit m → ∞ sieht man, dass fn gleichmäßig gegen h(t) konvergiert. Nach Theorem 9.18 erhalten wir also d d lim fn (t) = lim fn (t) n→∞ dt dt n→∞ und die Behauptung folgt. Korollar 9.20. Sei A ∈ Rn×n . d tA e = etA A = AetA . dt 9.5. SYSTEME MIT KONSTANTEN KOEFFIZIENTEN 29 Beweis. Für die zweite Darstellung schreibt man Ȧ(t) im Beweis der Ableitungsregeln für Potenzreihen auch bei fn0 bereits nach links. Lemma 9.21. Seien B, C ∈ Rn×n . Dann gilt (i) (ii) (iii) (iv) (v) (vi) eB+C = eB · eC , falls BC = CB, −1 eA = e−A , (s+t)A e = esA · etA für s, t ∈ R, eA+λ11 = eλ · eA für λ ∈ R, −1 eC BC = C −1 eB C, falls C invertierbar ist, ediag(λ1 ,...,λn ) = diag eλ1 , . . . , eλn für λi ∈ R. Beweis. (i) eB und eC konvergieren absolut. Daher dürfen wir die Reihen gliedweise miteinander multiplizieren (Beweis wie im Reellen) und erhalten ∞ ∞ ∞ X n X X B k C n−k Bp X C q · = p! q=0 q! k!(n − k)! n=0 k=0 p=0 ∞ X n ∞ X X (B + C)n n B k C n−k = = = eB+C . n! n! k n=0 n=0 eB · eC = k=0 (ii) Folgt aus (i) mit der Rechnung 11 = e0 = eA−A = eA · e−A . (iii) Dies folgt unmittelbar aus (i). (iv) Dies folgt ebenso aus (i), da A11 = 11A gilt. k (v) Per Induktion erhält man C −1 BC = C −1 B k C für alle k. Dies setzt man in die Anfangsstücke der Potenzreihe ein und erhält die Behauptung durch Grenzübergang. (vi) Dies funktioniert analog, denn per Induktion erhält man diag(λ1 , . . . , λn )k = diag λk1 , . . . , λkn . 9.5. Systeme mit konstanten Koeffizienten. Analog zum eindimensionalen Fall erhalten wir Lemma 9.22. Seien A ∈ Rn×n , x0 ∈ Rn , t0 ∈ R. Dann hat das Anfangswertproblem ( ẋ(t) = Ax(t), x(t0 ) = x0 die Lösung x(t) = eA(t−t0 ) x0 . Für A = A(t) funktioniert solch ein Vorgehen, mit (t − t0 )A durch ein Integral ersetzt, falls alle Matrizen A(t), t ∈ R, kommutieren. Beweis. Die Eindeutigkeit ist klar. Es gilt ẋ(t) = eA(t−t0 ) Ax0 = AeA(t−t0 ) x0 = Ax(t) und der Anfangswert ist wie gewünscht. Bemerkung 9.23. Lässt sich A mit Hilfe einer invertierbaren Matrix B auf eine einfache Gestalt C = BAB −1 bringen, so können wir eA = B −1 eC B einfacher bestimmen, z. B. wenn C eine Diagonalmatrix ist. 30 9. LINEARE DIFFERENTIALGLEICHUNGEN Ist A eine Matrix, die aus genau einem Jordankästchen besteht, so können wir eA wie folgt ausrechnen: Sei λ ∈ R oder C und 0 1 0 ... 0 λ 0 ... ... 0 λ 1 0 ... 0 . .. . .. .. 0 λ . . . . . . .. 0 λ . . . . . .. . 0 0 A = ... . . . . . . . . . 0 = ... . . . . . . . . . ... + ... . . . . . . . . . 0 . . . .. .. .. . . .. . 0 1 . λ 0 . λ 1 . . 0 ... ... 0 0 0 ... ... 0 λ 0 ... ... 0 λ ≡ D + N. Per Induktion folgt, dass N k = k mij , k ≥ 1, mit k mij = δji+k gilt. N k ist also eine Matrix, die in der k-ten oberen Nebendiagonalen Einsen und sonst Nullen enthält. Die Matrizen D und N kommutieren, somit auch D und alle Potenzen N k , sowie beliebige Potenzen N k untereinander. Beachte auch, dass N i = 0 für alle i ≥ n gilt. Somit erhalten wir ! n−1 X ti N i tA tD+tN tD tN tλ e =e = e · e = e 11 · i! i=0 2 n−1 t t 1 1!t . . . (n−1)! 2! .. .. .. . . 0 1 . . .. .. .. = etλ t2 . .. . . . 2! .. .. t . . 1 1! 0 ... ... 0 1 Besteht A (oder C) aus mehreren Jordankästchen, so ist für jeden Block entsprechend zu verfahren. Differentialgleichungen höherer Ordnung sind wie üblich zunächst als Systeme von Differentialgleichungen erster Ordnung umzuschreiben. Beispiel 9.24. Wir wollen die Differentialgleichung ẍ(t) = 4ẋ(t) − 4x(t) für beliebige Anfangswerte lösen. Wir schreiben die Differentialgleichung als System erster Ordnung: d x ẋ 0 1 x = = ẍ −4 4 ẋ dt ẋ Aus 1 = λ2 − 4λ + 4 4−λ √ 4± (−4)2 −4·4 erhalten wir die Eigenwerte λ = = 2. Für λ = 2erhalten die Matrix 1,2 2 −2 1 1 . Diese hat den Rang 1 und einen Eigenvektor zum Eigenwert 2. −4 2 2 1 −2 . Wir erhalten Definiere die orthogonale Matrix D := √15 2 1 −λ 0 = det −4 =D T z }| d 1 1 √ −2 dt 5 =D =D T { z }| { z }| 1 2 x 1 2 0 1 1 1 √ = √ 1 ẋ −4 4 5 −2 1 5 2 1 −8 9 1 −2 1 1 √ = −4 2 2 1 −2 5 5 =D T { z }| −2 1 1 √ 1 −2 5 2 x 1 ẋ { 2 x 1 ẋ 9.6. STABILITÄT LINEARER SYSTEME = 2 0 5 2 1 √ 5 1 −2 31 2 x . 1 ẋ Die Matrix ( 20 52 ) ist zwar nicht in JordanscherNormalform, jedoch lässt sich auch 2 5 1 5t hier leicht eAt bestimmen. Es gilt e( 0 2 )t = e2t . Somit lautet die allgemeine 0 1 √ √ Lösung mit Parametern a 5, b 5 ∈ R √ √ ae2t + 5tbe2t 1 1 2 5a x 2t 1 5t √ √ = 5 . =e be2t ẋ 0 1 5b 5 −2 1 Dies multiplizieren wir von links mit D und erhalten 2t 2t x 1 −2 ae + 5tbe2t ae + b(5t − 2)e2t = = . ẋ 2 1 be2t a2e2t + b(10t + 1)e2t Man überprüft leicht, dass e2t und (5t − 2)e2t oder auch e2t und te2t tatsächlich eine Basis des zweidimensionalen Lösungsraumes der Gleichung ẍ = 4ẋ − 4x sind. Bemerkung 9.25. Allgemeiner kann man aus der Darstellung für eAt im Falle, dass A ∈ Cn×n in Jordanscher Normalform ist, ablesen, dass es eine Basis des Lösungsraumes mit Elementen der Form p(t)eλt gibt, wobei λ ein Eigenwert von A und p ein Polynom mit deg p < n ist. Damit lassen sich Lösungen häufig schnell durch Probieren finden. 9.6. Stabilität linearer Systeme. In einer Vorlesung über dynamische Systeme beschäftigt man sich intensiver mit dem Verhalten von Lösungen. Definition 9.26. Sei E ein Banachraum und f : [0, ∞) × E → E stetig. Sei x : [0, ∞) → E eine C 1 -Lösung der gewöhnlichen Differentialgleichung ẋ(t) = f (t, x(t)), t ∈ [0, ∞). (i) Dann heißt x stabil, falls es zu jedem ε > 0 ein δ > 0 gibt, so dass alle Lösungen y der Differentialgleichung ẏ(t) = f (t, y(t)) mit ky(0) − x(0)k < δ für alle t ≥ 0 existieren und ky(t) − x(t)k < ε für alle t ∈ [0, ∞) erfüllen. (Dies bedeutet, dass Lösungen y existieren und nahe bei x bleiben.) (ii) x heißt asymptotisch stabil, falls x stabil ist und ein δ > 0 existiert, so dass alle Lösungen y mit ky(0) − x(0)k < δ auch lim ky(t) − x(t)k = 0 t→∞ erfüllen. (iii) x heißt instabil, falls x nicht stabil ist. (iv) x heißt stationär, falls f (t, x) = 0 für alle t gilt. Diese Definition verwenden wir auch, falls f (t, ·) nur auf geeigneten offenen Teilmengen Ω ⊂ E definiert ist, z. B. für f : [0, ∞) × Bα (0) → E. Da wir Stabilitätsaussagen in Abhängigkeit der Eigenwerte formulieren wollen, beschränken wir uns nun auf den Fall E = Rn bzw. E = Cn . Unendlichdimensional betrachtet man für Stabilitätsfragen das Spektrum σ(A) des linearen Operators A ∈ L(E). Bemerkung 9.27. Sei A ∈ R2×2 . Sei ẋ(t) = Ax(t) ein generisches zweidimensionales lineares System gewöhnlicher Differentialgleichungen. Generisch bedeutet hier, dass das charakteristische Polynom von A in C[X] keine doppelten Nullstellen 32 9. LINEARE DIFFERENTIALGLEICHUNGEN hat und 0 kein Eigenwert ist. Somit ist A über C diagonalisierbar und 0 der einzige stationäre Punkt. Seien λ1 , λ2 ∈ C2 die (möglicherweise komplexen) Nullstellen des charakteristischen Polynoms. Ist ein Eigenwert nicht reell, so gilt λ̄1 = λ2 , die Eigenwerte sind also komplex konjugiert zueinander, da sonst das charakteristische Polynom keine reellen Koeffizienten hätte. Seien x1 , x2 ∈ C Eigenvektoren von A zu den Eigenwerten λ1 , λ2 . Dann lösen y1 (t) := eλ1 t x1 und y2 (t) := eλ2 t x2 die Differentialgleichung und bilden ein Fundamentalsystem. Es treten die folgenden Fälle auf: (i) λ1 , λ2 < 0: 0 ist asymptotisch stabil. (ii) λ1 > 0, λ2 < 0 oder umgekehrt: 0 ist instabil, Lösungen laufen entlang von Kurven, die im Fall |λ1 | = |λ2 | Hyperbeln sind. (Phasenportrait zeichnen.) (iii) λ1 , λ2 > 0: 0 ist instabil. (iv) λi ∈ C \ R: (a) λ1 = ir, λ2 = −ir, r ∈ R: Komplexe Lösungen sind eirt x1 ≡ eirt (a + ib) und e−irt (a − ib), a, b ∈ R2 da aus Ax1 = λ1 x1 direkt Ax̄1 = λ̄1 x̄1 folgt. Eine reelles Fundamentalsystem ist durch eirt (a + ib) + e−irt (a − ib) = (cos(rt) + i sin(rt))(a + ib) + (cos(rt) − i sin(rt))(a − ib) = 2 cos(rt)a − 2 sin(rt)b und i eirt (a + ib) − e−irt (a − ib) = (− sin(rt) + i cos(rt))(a + ib) + (− sin(rt) − i cos(rt))(a − ib) = − 2 sin(rt)a − 2 cos(rt)b = 2 cos rt + π2 a − 2 sin rt + π2 b. gegeben. Lösungen „rotieren“ also um den Ursprung herum. Somit ist 0 stabil, aber nicht asymptotisch stabil. (b) Gilt λ1 = s + ir, λ2 = s − ir, so erhalten wir dieselben Lösungen wie im Falle s = 0, jedoch mit est multipliziert. Lösungen „schrauben“ sich also um den Ursprung herum und nähern sich ihm, falls s < 0 gilt (0 ist stabil) und entfernen sich für s > 0 (0 ist instabil). Bemerkung 9.28. ? Bei nichtlinearen gewöhnlichen Differentialgleichungen von der Form ẋ(t) = f (x(t)) heißt ein stationärer Punkt linear stabil, falls x0 ein stabiler Punkt der affin linearen Differentialgleichung ẋ(t) = df (x0 )hx(t) − x0 i ist. Dies ist äquivalent zur Stabilität von 0 für y(t) := x(t) − x0 unter der linearen Differentialgleichung ẏ(t) = df (x0 )hy(t)i. Den Zusammenhang zwischen linearer Stabilität und Stabilität werden wir im Stabilitätssatz bzw. Instabilitätssatz noch genauer auch im nicht autonomen Fall betrachten. Bemerkung 9.29. Im nichtlinearen Fall kann man Stabilität mit Hilfe von Lyapunovfunktionen untersuchen. Eine Lyapunovfunktion ist eine Funktion L, die d L(x(t)) ≤ 0 dt erfüllt. Hiermit kann man unter geeigneten Voraussetzungen folgern, dass x(t) gegen ein Minimum von L konvergiert. 9.7. DER STABILITÄTSSATZ 33 Beispiel: Sei L : Rn → R in C 1 . Dann erfüllt eine Lösung der Differentialgleichung ẋ(t) = −∇L(x(t)) d L(x(t)) = DL(x(t))hẋ(t)i = −DL(x(t))h∇L(x(t))i = −k∇L(x(t))k2 ≤ 0. dt Lemma 9.30. Sei A ∈ Cn×n . Seien λi , 1 ≤ i ≤ n, die Eigenwerte von A entsprechend ihrer algebraischen Vielfachheiten. Gilt Re λi < α für 1 ≤ i ≤ n, so folgt At e ≤ c · eαt für alle t ≥ 0 mit einer geeigneten Konstanten c > 0. Beweis. Es gibt eine invertierbare Matrix B ∈ Cn×n , so dass BAB −1 in Jordan−1 scher Normalform ist. Es folgt eBAB t = BeAt B −1 . Anhand der Formel für eAt für Jordanblöcke in Bemerkung 9.23 erhalten wir die Abschätzung At e ≤ p(t) · exp t · max Re λi ≤ c · eαt , 1≤i≤n da die strikte Ungleichung Re λi < α gilt. Der Betrag der Transformationsmatrizen lässt sich durch eine weitere Konstante abschätzen. Theorem 9.31. Sei A ∈ Cn×n . Seien λi die Eigenwerte von A mit Re λ1 ≤ . . . ≤ Re λn . Dann ist die Lösung x(t) ≡ 0 der gewöhnlichen Differentialgleichung ẋ(t) = Ax(t) im Fall (i) Re λn < 0 asymptotisch stabil. (ii) Re λn > 0 instabil. (iii) Re λn = 0 nicht asymptotisch stabil; es kann Stabilität oder Instabilität vorliegen. Beweis. Benutze, dass sich jede Lösung in der Form eAt x0 mit x0 ∈ Rn darstellen lässt. Betrachte im Fall Re λn = 0 die Matrizen 0 0 0 1 A= und A= . 0 0 0 0 Details: Übung. 9.7. Der Stabilitätssatz. Bei kleinen Störungen, beispielsweise bei einem Zusatzterm g(t, x) = x2 ist die Stabilität erhalten. Theorem 9.32 (Stabilitätssatz). Sei A ∈ Cn×n und gelte für die Eigenwerte λi , 1 ≤ i ≤ n, die Ungleichung Re λi < 0. Sei g : [0, ∞) × Bα (0) → Cn , α > 0, stetig und gelte |g(t, x)| lim = 0, |x| |x|→0 gleichmäßig in t ∈ [0, ∞). (Insbesondere gilt also g(t, 0) = 0.) Dann ist die Lösung x(t) ≡ 0 der Differentialgleichung ẋ(t) = Ax(t) + g(t, x(t)) asymptotisch stabil. Beweis. Nach Lemma 9.30 gibt es Konstanten c > 1 und β > 0 mit Re λi < −β < 0, 1 ≤ i ≤ n, und At e ≤ c · e−βt für alle t ≥ 0. 34 9. LINEARE DIFFERENTIALGLEICHUNGEN Aufgrund des asymptotischen Verhaltens von g gibt es δ mit 0 < δ < α und β |g(t, z)| ≤ 2c |z| für alle |z| ≤ δ und alle t ≥ 0. Wir behaupten nun, dass aus |y(0)| ≡ |y0 | ≤ ε < δc für eine Lösung y der Differentialgleichung bereits β |y(t)| ≤ c · ε · e− 2 t für alle t ≥ 0, für die die Lösung existiert, folgt. Dies beweist dann das Theorem, weil hieraus mit c · ε ≤ α2 bereits Langzeitexistenz und asymptotische Stabilität folgen. Zum Beweis der Behauptung: Wir benutzen die Darstellungsformel aus Bemerkung 9.14 für Lösungen inhomogener linearer Differentialgleichungen und erhalten mit b(t) = g(t, y(t)) für eine Lösung y mit Startwert y0 und X(t) = eAt Zt At y(t) = e y0 + eA(t−s) g(s, y(s)) ds. 0 Mit den Abschätzungen an eAt und g erhalten wir daraus −βt |y(t)| ≤ |y0 |ce Zt + ce−β(t−s) β |y(s)| ds 2c 0 solange |y(s)| ≤ δ für alle 0 ≤ s ≤ t gilt. Definiere ϕ(t) := |y(t)|eβt . Dann folgt nach Multiplikation mit eβt β ϕ(t) ≤ cε + 2 Zt ϕ(s) ds. 0 β Mit dem Lemma von Gronwall erhalten wir daraus ϕ(t) ≤ cεe 2 t oder, äquivalent s. o. β dazu, |y(t)| ≤ cεe− 2 t < δ, solange |y(t)| ≤ δ ist. Daher gilt stets |y(t)| < δ < α und somit lässt sich die Lösung auch auf ganz [0, ∞) fortsetzen. Der Beweis des Instabilitätssatzes ist etwas komplizierter, da A auch im instabilen Fall Eigenwerte mit negativem Realteil besitzen kann. Theorem 9.33 (Instabilitätssatz). Sei A ∈ Cn×n mit Re λ > 0 für mindestens einen Eigenwert λ von A. Erfülle g die Voraussetzungen aus Theorem 9.32. Dann ist die Lösung x(t) ≡ 0 der Differentialgleichung ẏ(t) = Ay(t) + g(t, y(t)) instabil. Beweis. Zunächst transformieren wir die Gleichung. Seien λ1 , . . . , λn die Eigenwerte von A entsprechend ihrer algebraischen Vielfachheiten. Sei C ∈ Cn×n invertierbar, so dass B = C −1 AC in Jordanscher Normalform ist, d. h. für B = bij 1≤i,j≤n gilt bii = λi , bii+1 ∈ {0, 1} und bij = 0 sonst. Definiere H := diag η, η 2 , . . . , η n für η > 0. Wir erhalten H −1 = diag η −1 , η −2 , . . . , η −n sowie D ≡ dij 1≤i,j≤n := H −1 BH mit dij = bij η j−i für beliebige Matrizen B. In unserem Fall erhalten wir dii = λi , dii+1 ∈ {0, η} sowie dij = 0 sonst. Wir setzen y(t) = CHz(t) und erhalten die Differentialgleichung ż(t) = H −1 C −1 ẏ(t) = H −1 C −1 [Ay(t) + g(t, y(t))] = H −1 C −1 ACHz(t) + H −1 C −1 g(t, CHz(t)) 35 9.7. DER STABILITÄTSSATZ = Dz(t) + f (t, z(t)) mit f (t, ·) = H −1 C −1 g(t, CH·). Die Funktion f erfüllt dieselbe Abfallbedingung wie g, denn aus |g(t, z)| ≤ ε|z| für |z| ≤ δ folgt |f (t, z)| = H −1 C −1 g(t, CHz) ≤ H −1 C −1 · ε · kCHk · |z| δ für |z| ≤ kCHk . Damit haben wir unsere Differentialgleichung auf die Form ż i = λi z i +ηz i+1 + f i (t, z), 1 ≤ i ≤ n, transformiert, wobei der Term in geschweiften Klammern nur auftritt, wenn die i-te Zeile/Spalte nicht die letzte Zeile/Spalte eines Jordankästchens ist. Seien I := {k ∈ {1, . . . , n} : Re λk > 0} und S := {k ∈ {1, . . . , n} : Re λk ≤ 0}. Wir definieren die wachsenden bzw. nichtwachsenden Anteile der Lösung durch X X z j (t)2 bzw. ψ(t) := z j (t)2 . ϕ(t) := j∈I j∈S Fixiere η > 0 so klein, dass 0 < 6η < Re λj für alle j ∈ I gilt. Fixiere weiterhin δ > 0 so, dass aufgrund der Abfallbedingung |f (t, x)| ≤ η|x| für alle |x| ≤ δ gilt. Angenommen, es gelten |z(0)| ≤ δ und ψ(0) < ϕ(0). Wir erhalten, solange |z(t)| ≤ δ und ψ(t) ≤ ϕ(t) gelten 2 2 d X d X Re z j (t) + Im z j (t) dt dt j∈I j∈I X X j j =2 Re z (t) Re ż (t) + 2 Im z j (t) Im ż j (t) ϕ̇(t) = j∈I =2 X =2 X =2 X j∈I Re j Re ż (t) + i Im ż j (t) Re z j (t) − i Im z j (t) j∈I Re ż j (t)z j (t) j∈I Re λj z j (t) +ηz j+1 (t) + f j (t, z) z j (t) j∈I =2 X j∈I X j 2 X Re λj z (t) + 2η Re z j+1 (t)z j (t) +2 Re f j (t, z)z j (t) . j∈I j∈I Nun gelten X j∈I 2 X j 2 Re λj z j (t) > 6η z (t) = 6ηϕ(t) j∈I und, sofern dieser Term auftritt, X X j+1 j j+1 j ≤ z (t) · z (t) (t) Re z (t)z j∈I j∈I X 1 2 1 j 2 j+1 z (t) + z (t) ≤ ϕ(t), ≤ 2 2 j∈I 36 9. LINEARE DIFFERENTIALGLEICHUNGEN da auch j + 1 ∈ I gilt, falls dieser Term in geschweiften Klammern überhaupt auftritt. Weiterhin ist X X j j j f (t, z) · z j (t) Re f (t, z)z (t) ≤ j∈I j∈I sX p p 2 ≤ |f j (t, z)| · ϕ(t) ≤ |f (t, z)| · ϕ(t). j∈I Nach Voraussetzung an f gilt weiterhin p p √ |f (t, z)| ≤ η · |z| = η ϕ + ψ ≤ η 2ϕ ≤ 2η ϕ. Somit erhalten wir ϕ̇(t) > 12ηϕ(t) − 2ηϕ(t) − 4ηϕ(t) = 6ηϕ(t). Eine entsprechende Rechnung für ψ ergibt X X j 2 X ψ̇(t) = 2 Re λj z (t) + 2η Re z j+1 (t)z j (t) +2 Re f j (t, z)z j (t) . j∈S j∈S j∈S Durch Kombination der obigen Abschätzungen, die entsprechend auch für ψ gelten, erhalten wir daraus mit Re λj ≤ 0 für j ∈ S solange ψ(t) ≤ ϕ(t) gilt p p ψ̇(t) ≤ 0 · ψ(t) + 2ηψ(t) + 4η ψ(t) · ϕ(t) ≤ 2ηϕ(t) + 4ηϕ(t) < ϕ̇(t). Somit bleibt die Ungleichung ψ(t) ≤ ϕ(t) gültig, solange |z(t)| ≤ δ ist. Andererseits wächst jedoch ϕ im Falle ϕ 6= 0 unter diesen Bedingungen mindestens exponentiell in t. Also existiert t0 ≥ 0 mit |z(t0 )| = δ. Daher ist die Lösung x(t) ≡ 0 instabil. Beispiele 9.34. (i) Die Lösung x(t) ≡ 0 der Differentialgleichung ẋ(t) = −εx(t) + αx2 (t), ε > 0, α ∈ R, ist asymptotisch stabil. (ii) Wir untersuchen die Differentialgleichung ẋ(t) = αx(t) + βx3 (t), α, β ∈ R, und die zugehörige linearisierte Gleichung um x ≡ 0 ẋ(t) = αx(t) auf Stabilität. Wir erhalten: linearisierte Gleichung α<0 asymptotisch stabil α>0 instabil α = 0, β < 0 α = 0, β = 0 stabil α = 0, β > 0 nichtlineare Gleichung asymptotisch stabil instabil asymptotisch stabil stabil instabil 9.8. Rand- und Eigenwertprobleme ?. Bemerkung 9.35. ? (i) Sei Ω ⊂ Rn offen. Wir erinnern daran, dass C k (Ω) für k = 0, 1, . . . , ∞ der Raum aller k-fach (beliebig oft, falls k = ∞) in Ω stetig differenzierbaren Funktionen ist. C k Ω ist der Raum aller dieser Funktionen, deren (partielle) Ableitungen bis zur Ordnung k sich stetig und beschränkt auf Ω fortsetzen lassen. Ist k < ∞, so versehen wir ihn mit der C k -Norm kukC k (Ω) := 9.8. RAND- UND EIGENWERTPROBLEME ? k P P i=0 |α|=i 37 kDα ukC 0 (Ω) , wobei kukC 0 (Ω) := sup |u(x)| die Supremumsnorm und x∈Ω α ein Multiindex ist. (ii) Motivation: Die Schwingung einer Membran oder Saite wird durch d2 u(x, t) = ∆u(x, t) in Ω × R, dt2 Ω ⊂ Rn offen, beschrieben. Der Ansatz u(x, t) = α(t)v(x) führt zu der Gleichung α̈ · v = α∆v. Für eine schwingende nicht gedämpfte Saite ist α(t) = sin(µ(t − t0 )), also α̈ = −µ2 α. Als Gleichung im Ort erhält man mit λ = µ2 ( v 00 (x) + λv(x) = 0 in (a, b), v(a) = v(b) = 0. k2 π 2 , k ∈ N, für λ = (b−a) Lösungen sind die Funktionen v(x) = sin kπ(x−a) 2. b−a Bemerkung 9.36. Wir hatten gesehen, dass das System ẋ(t) = F (t)x(t) + g(t), 0 F ∈ C ([a, b], R n×n 0 ), g ∈ C ([a, b], Rn ) mit einer Fundamentalmatrix X mit Ẋ(t) = F (t)X(t) des homogenen Systems die Lösung Zt x(t) = X(t)d + X(t) X −1 (τ )g(τ ) dτ a besitzt. Dies bleibt auch auf dem abgeschlossenen Intervall richtig, man kann die Daten nämlich stetig über [a, b] hinaus fortsetzen. Theorem 9.37. Seien F ∈ C 0 ([a, b], Rn×n ), g ∈ C 0 ([a, b], Rn ), A, B ∈ Rn×n und c ∈ Rn . Betrachte das Randwertproblem ( ẋ(t) = F (t)x(t) + g(t), Ax(a) + Bx(b) = c. Sei X eine Fundamentalmatrix des zugehörigen linearen Systems. Dann sind die folgenden Aussagen äquivalent: (i) Das Randwertproblem ist für beliebige g ∈ C 0 ([a, b], Rn ) und c ∈ Rn lösbar. (ii) Die charakteristische Matrix CX := AX(a) + BX(b) ist invertierbar. (iii) Das zugehörige homogene Randwertproblem ( ẋ(t) = F (t)x(t), Ax(a) + Bx(b) = 0 besitzt nur die triviale Lösung x = 0. Beweis. Die allgemeine Lösung des inhomogenen Systems hat die Form t Z x(t) = X(t)d + X(t) X −1 (τ )g(τ ) dτ . a 38 9. LINEARE DIFFERENTIALGLEICHUNGEN Wir setzen dies in die Randbedingung ein und erhalten Zb (AX(a) + BX(b)) d + BX(b) | {z } (9.2) =CX X −1 (τ )g(τ ) dτ = c. a n Dies ist für beliebige c ∈ R genau dann nach d auflösbar, wenn CX regulär ist. Im Spezialfall g ≡ 0 und c = 0 erhält man eine Bedingung dafür, dass eine Lösung der homogenen Differentialgleichung existiert. Sie ist genau dann eindeutig lösbar, wenn es nur ein d gibt, das die Bedingung erfüllt. Aus (AX(a)+BX(b))d = CX d = 0 sieht man, dass dies genau dann der Fall ist, wenn CX regulär und damit invertierbar ist. 9.9. Selbstadjungierte Eigenwertprobleme ?. Wir untersuchen das folgende Sturm-Liouvillesche Eigenwertproblem d 1 (Lx)(t) ≡ − r(t) dt (p(t)ẋ(t)) − q(t)x(t) = λx(t) in [a, b], (9.3) R1 x ≡ α11 x(a) + α21 ẋ(a) = γ 1 , 2 R x ≡ β12 x(b) + β22 ẋ(b) = γ 2 mit p ∈ C 1 ([a, b], R), p(t) 6= 0 für alle t ∈ [a, b], q, r ∈ C 0 ([a, b], R) mit r(t) > 0 für alle t ∈ [a, b], αji , βji , γ i ∈ R mit α11 , α21 6= 0 und β12 , β22 6= 0 sowie λ ∈ C und x ∈ C 2 ([a, b], C). Hier ist es wichtig, dass die auftretenden Koeffizienten reellwertig sind. Definition 9.38. (i) Definiere den Operator A : x ∈ C 2 ([a, b], C) : R1 x = 0 = R2 x → C 0 ([a, b], C) {z } | ≡D(A)⊂C 0 ([a,b],C) durch Ax := Lx für x ∈ D(A). (ii) Eine Zahl λ ∈ C heißt Eigenwert von A, falls es ein u ∈ D(A) \ {0} mit Au = λu gibt. u heißt dann Eigenfunktion von A zum Eigenwert λ. (iii) Zum Eigenwertproblem (9.3) definieren wir ein zugehöriges unitäres Skalarprodukt durch Zb hu, viL := r(t)u(t)v(t) dt a für u, v ∈ C 0 ([a, b], C). Bemerkung 9.39. (i) λ ist genau dann ein Eigenwert von A, wenn Au = λu nicht eindeutig lösbar ist, da Au = λu stets die triviale Lösung u ≡ 0 besitzt. (ii) Sei {ϕ1 = ϕ1 (t, λ), ϕ2 = ϕ2 (t, λ)} ein Fundamentalsystem der gewöhnlichen Differentialgleichung Au − λu = 0. Dann ist eine beliebige Lösung x = c1 ϕ1 + c2 ϕ2 , ci ∈ C, genau dann eine Lösung von (9.3) mit γ ≡ 0, falls 2 X cj Ri ϕj (·, λ) = 0 j=1 für i = 1, 2 gilt. Mit Linearer Algebra erhalten wir, dass es Lösungen mit c1 , c2 6= 0 genau dann gibt, falls 1 R ϕ1 (·, λ) R1 ϕ2 (·, λ) ∆(λ) := det =0 R2 ϕ1 (·, λ) R2 ϕ2 (·λ) gilt. 9.9. SELBSTADJUNGIERTE EIGENWERTPROBLEME ? 39 Theorem 9.40. (i) A ist ein symmetrischer Operator, d. h. für u, v ∈ D(A) gilt hAu, viL = hu, AviL . (ii) Alle Eigenwerte λ sind reell. Die zugehörigen Eigenfunktionen können wir ebenfalls reellwertig wählen. (iii) Seien u1 , u2 ∈ D(A) Eigenfunktionen zu Eigenwerten λ1 6= λ2 . Dann gilt hu1 , u2 iL = 0. Beweis. (i) Mit partieller Integration erhalten wir Zb hAu, viL = − d (p(t)u̇(t))v(t) − q(t)u(t)v(t) dt dt a Zb = b p(t)u̇(t)v̇(t) + q(t)u(t)v(t) dt − p(t)u̇(t)v(t) , a a Zb hu, AviL = b p(t)u̇(t)v̇(t) + q(t)u(t)v(t) dt − p(t)u(t)v̇(t) , a a b hAu, viL − hu, AviL = p(t) u(t)v̇(t) − u̇(t)v(t) = 0. a Die beiden Randterme fallen einzeln, d. h. für t = a und t = b, weg, denn aus den Randbedingungen folgt (hier nur für t = b vorgerechnet) R2 u = β12 u(b) + β22 u̇(b) = 0, R2 v = β12 v(b) + β22 v̇(b) = 0. Wegen β12 , β22 = 6 0 hat die Matrix u(b) u̇(b) v(b) v̇(b) also einen nichttrivialen Kern. Daher verschwindet die oben als Randterm auftretende Determinante davon. (ii) Gelte Au = λu mit u ∈ D(A) \ {0}. Es folgt λhu, uiL = hλu, uiL = hAu, uiL = hu, AuiL = hu, λuiL = λ̄hu, uiL . Daher ist λ reell. Sei u eine Eigenfunktion. Da die Koeffizienten und λ in der linearen Gleichung (A − λ)u = 0 alle reell sind, sind auch der Realteil und der Imaginärteil von u Eigenfunktionen zum selben Eigenwert. Eine dieser beiden Funktionen ist von Null verschieden. (iii) Zur Orthogonalität bezüglich des h·, ·iL -Skalarproduktes: Auch hier rechnet man genau wie in der Linearen Algebra unter Benutzung von λi ∈ R λ1 hu1 , u2 iL = hλ1 u1 , u2 iL = hAu1 , u2 iL = hu1 , Au2 iL = λ2 hu1 , u2 iL = λ2 hu1 , u2 iL . Hieraus folgt hu1 , u2 iL = 0. Bemerkung 9.41. ? Man kann mit Zusatzaufwand folgendes zeigen: A besitzt unendlich viele Eigenwerte λi ∈ R, i ∈ N. Nach Umnummerierung gilt |λi | → ∞ für i → ∞. 40 10. MAßTHEORIE Seien ui zugehörige normierte und paarweise orthogonale Eigenfunktionen, d. h. gelte Aui = λi ui und hui , uj iL = δij für alle i, j. Dann können wir f ∈ D(A) als f (t) = ∞ X hf, ui iL ui i=1 mit noch genauer zu definierender Konvergenz schreiben. Für weitere Details, auch im Falle von mehreren Raumdimensionen, siehe [9]. 10. Maßtheorie Wollen wir gewissen Teilmengen von Rn einen Flächeninhalt zuordnen, so müssen wir uns zunächst einmal mit den Mengen beschäftigen, für die dies sinnvoll möglich ist. Aufgrund des Banach-Tarski-Paradoxons ist dies nicht für alle Teilmengen von Rn in sinnvoller Weise möglich. 10.1. Messbare Räume. 10.1.1. σ-Algebren. Definition 10.1 (σ-Algebra). Sei X eine Menge. Dann heißt A ⊂ P(X) eine σ-Algebra über (oder auf) X, falls die folgenden Eigenschaften erfüllt sind: (i) X ∈ A, (ii) A ∈ A =⇒ {A ∈ A, S (iii) Aj ∈ A für alle j ∈ N =⇒ Aj ∈ A. j∈N Ist A eine σ-Algebra über X, so heißt (X, A) ein messbarer Raum und jedes A ∈ A heißt A-messbar. Bemerkung 10.2. ? Sei A eine σ-Algebra und seien Aj ∈ A, j ∈ N. Dann gilt auch m m [ \ \ ∅, A0 \ A1 , Aj , Aj , Aj ∈ A. j=0 j=0 j∈N Beweis. Wir betrachten nur endliche Vereinigungen. Definiere dazu Bk := Ak für m S S k ≤ m und Bk := Am für k > m. Wir erhalten Aj = Bj ∈ A. j=0 j∈N Benutze die De Morganschen Regeln für die anderen Aussagen. Definition 10.3. ? (i) Ein Mengensystem S ⊂ P(X) heißt unter allen endlichen Mengenoperationen abgeschlossen, falls • A ∈ S =⇒ {A ∈ S und m S • Aj ∈ S, 1 ≤ j ≤ m ∈ N, =⇒ Aj ∈ S gelten. j=1 (Nach De Morgan bleiben dann auch endliche Schnitte in A.) (ii) Ein Mengensystem S ⊂ P(X) heißt unter allen abzählbaren Mengenoperationen abgeschlossen, falls • A ∈ S =⇒ {A ∈ S und S • Aj ∈ S, j ∈ N, =⇒ Aj ∈ S gelten. j∈N (Nach De Morgan bleiben dann auch abzählbare Schnitte in A.) (iii) S ⊂ P(X) heißt Algebra über X, falls • X ∈ S, • A ∈ S =⇒ {A ∈ S und • A, B ∈ S =⇒ A ∪ B ∈ S gelten. Bemerkung 10.4. ? Sei S ⊂ P(X) mit X ∈ S. 41 10.1. MESSBARE RÄUME (i) Dann ist S genau dann eine Algebra, wenn S unter allen endlichen Mengenoperationen abgeschlossen ist. (ii) Dann ist S genau dann eine σ-Algebra, wenn S unter allen abzählbaren Mengenoperationen abgeschlossen ist. (iii) Sei S eine Algebra und für jede disjunkte S Folge (Bj )j∈N ⊂ S, d. h. für eine Folge mit Bi ∩ Bj = ∅ für i 6= j, gelte Bj ∈ S. Dann ist S eine σ-Algebra. j∈N Beweis. Wir zeigen nur die letzte Behauptung: j S S Setze B0 := A0 und Bj+1 := Aj+1 \ Aj für j ∈ N. Dann folgt Aj = j∈N k=0 · S Bj ∈ A. j∈N Beispiele 10.5. (i) {∅, X} und P(X) sind σ-Algebren. (ii) {A ⊂ X : A oder {A ist höchstens abzählbar} ist eine σ-Algebra. (iii) Sei J eine nichtleere T Menge und Aα ⊂ P(X), α ∈ J, seien σ-Algebren über X. Dann ist auch Aα eine σ-Algebra über X. α∈J (iv) Sei B eine σ-Algebra über Y und f : X → Y eine Abbildung. Dann ist f −1 (B) := f −1 (B) : B ∈ B eine σ-Algebra über X, das Urbild von B. (v) Sei A eine σ-Algebra über X und f : X → Y eine Abbildung. Dann ist f∗ (A) := B ⊂ Y : f −1 (B) ∈ A eine σ-Algebra über Y , das direkte Bild von A unter f . Beweis. Übung. Direktes Nachrechnen. 10.1.2. Die Borelsche σ-Algebra. Definition 10.6. Sei S ⊂ P(X). Dann heißt \ Aσ (S) := {A ⊂ P(X) : A ⊃ S, A ist σ-Algebra über X} die von S erzeugte σ-Algebra und S ein Erzeugendensystem von Aσ (S). Bemerkung 10.7. (i) Da P(X) = A im obigen Schnitt vorkommt und da der Schnitt von σ-Algebren wieder eine σ-Algebra ist, ist Aσ (S) selbst wieder eine σ-Algebra. (ii) Aσ (S) ist die kleinste σ-Algebra, die S enthält. (iii) ? Ist S eine σ-Algebra, so gilt Aσ (S) = S. (iv) ? Aus S ⊂ T folgt Aσ (S) ⊂ Aσ (T ). (v) ? Ist S = {A}, so folgt Aσ (S) = {∅, A, {A, X}. Definition 10.8. (i) Sei (X, O) ein topologischer Raum. Dann heißt die von O erzeugte σ-Algebra Borelsche σ-Algebra von X: B(X). A ∈ B(X) heißt Borelsche Teilmenge von X oder Borelmenge. (ii) Wir schreiben B n := B(Rn ). T (iii) A ⊂ X heißt Gδ -Menge, falls es offene Mengen Oj , j ∈ N, mit Oj = A j∈N gibt. (Eselsbrücke: Gebiet, Durchschnitt) (iv) FS ⊂ X heißt Fσ -Menge, falls es abgeschlossene Mengen Fj , j ∈ N, mit Fj = F gibt. (Eselsbrücke: fermé, Summe) j∈N 42 10. MAßTHEORIE Beispiele 10.9. (i) Sei F die Menge aller abgeschlossenen Teilmengen eines topologischen Raumes X. Dann gilt B(X) = Aσ (F). (ii) Jede Gδ -Menge und jede Fσ -Menge ist eine Borelmenge. (iii) A ist genau dann eine Fσ -Menge, wenn {A eine Gδ -Menge ist. (iv) ? Jedes abgeschlossene Intervall ist eine Fσ -Menge und eine Gδ -Menge. (v) ? Q ⊂ R ist als abzählbare Menge eine Fσ -Menge, aber keine Gδ -Menge. 10.1.3. Das zweite Abzählbarkeitsaxiom. Definition 10.10. Sei X ein topologischer Raum. (i) Dann erfüllt X das erste Abzählbarkeitsaxiom, falls jeder Punkt eine höchstens abzählbare Umgebungsbasis besitzt. (Dies ist in jedem metrischen Raum erfüllt.) (ii) Dann erfüllt X das zweite Abzählbarkeitsaxiom, falls die Topologie eine höchstens abzählbare Basis besitzt. (iii) Dann heißt X Lindelöfscher Raum, falls jede offene Überdeckung von X eine höchstens abzählbare Teilüberdeckung besitzt. Im Falle metrischer Räume benötigen wir den Begriff eines Lindelöfschen Raumes nicht. Theorem 10.11. Sei X ein metrischer Raum. Dann sind die folgenden Aussagen äquivalent: (i) X erfüllt das zweite Abzählbarkeitsaxiom, (ii) X ist ein Lindelöfscher Raum und (iii) X ist separabel. Beweis. ? • „(i) =⇒ (ii)“: Sei M eine abzählbare Basis der Topologie und {Oα : α ∈ J} eine offene Überdeckung von X. Da M eineSabzählbare Basis ist, gibt es zu jedem α ∈ J Mengen Mα,j ∈ M mit Oα = Mα,j . Die Menge {Mα,j : α ∈ j∈N J, j ∈ N} ⊂ M überdeckt nach Konstruktion ebenfalls X und ist abzählbar, da M dies ist. Zu jeder dieser abzählbar vielen verschiedenen Mengen Mα,j gibt es nun ein αj mit Mα,j ⊂ Oαj . Somit bilden die abzählbar vielen Mengen Oαj die gesuchte abzählbare Teilüberdeckung. • „(ii) =⇒ (iii)“: Sei n ∈ N>0 fest. Dann ist die Menge Un := {B1/n (x) : x ∈ X} eine offene Überdeckung von X. Nach Voraussetzung gibt es Punkte xn,k ∈ X, so dass Nn := {B1/n (xn,k ) : k ∈ N} eine abzählbare Teilüberdeckung von X ist. Sei nun n ∈ N>0 nicht mehr fixiert. Die Menge D := {xn,k : n ∈ N>0 , k ∈ N} ist höchstens abzählbar. Seien x ∈ X und ε > 0 beliebig. Wir wollen zeigen, dass es ein xn,k ∈ D mit d(xn,k , x) < ε gibt. Sei dazu n ∈ N>0 so groß, dass ε > n1 > 0 gilt. Die Menge Nn überdeckt X. Somit gibt es xn,k mit x ∈ B n1 (xn,k ) ⊂ Bε (xn,k ). Wir haben also ein xn,k ∈ D mit d(x, xn,k ) < ε wie gewünscht gefunden. • „(iii) =⇒ (i)“: Dies ergibt sich direkt aus dem nachfolgenden Lemma 10.12, da die Abzählbarkeit der dichten Teilmenge auch die Abzählbarkeit der in diesem Lemma definierten Menge M impliziert. Lemma 10.12. Sei X ein metrischer Raum und D ⊂ X dicht. Definiere M := {Br (a) : a ∈ D, r ∈ Q>0 }. Dann lässt sich jede offene Menge als Vereinigung von Mengen in M darstellen. 43 10.1. MESSBARE RÄUME Beweis. Seien O ⊂ X offen und x ∈ O beliebig. Dann gibt es ein (durch Verkleinern ohne Einschränkung) rationales ε > 0 mit Bε (x) ⊂ O. Da D ⊂ X dicht ist, gibt es ein y ∈ D mit d(x, y) < ε/2. Es folgt x ∈ Bε/2 (y) ⊂ Bε (x) ⊂S O. Zu jedem x ∈ O erhalten wir solch einen Ball B x ≡ Bε/2 (y) und es folgt O = Bx. x∈O Korollar 10.13. (i) Sei X ein separabler metrischer Raum und A ⊂ X eine abzählbare dichte Teilmenge. Dann gilt B(X) = Aσ ({Br (a) : a ∈ A, r ∈ Q>0 }). (ii) Sei X ⊂ Rn . Dann besitzt X mit der induzierten Metrik eine höchstens abzählbare Basis der Topologie. Beweis. (i) Definiere S := {Br (a) : a ∈ A, r ∈ Q>0 }. Sei O die Topologie von X. Nach Lemma 10.12 folgt O ⊂ Aσ (S). Weiterhin gilt S ⊂ O. Da Inklusionen bei der Bildung einer σ-Algebra erhalten werden und die von einer σ-Algebra erzeugte σ-Algebra wieder diese σ-Algebra ist, folgt B(X) = Aσ (O) ⊂ Aσ (Aσ (S)) = Aσ (S) ⊂ Aσ (O). Somit gilt überall Gleichheit. (ii) X ist als Teilmenge eines separablen Raumes ebenfalls separabel. Daher folgt die Behauptung aus Theorem 10.11. 10.1.4. Erzeugung der Borelschen σ-Algebra durch Intervalle ?. Definition 10.14. (i) Auf Rn definieren wir die natürliche partielle Produktordnung durch a≤b ⇐⇒ ak ≤ bk ∀1 ≤ k ≤ n n für a, b ∈ R . (ii) Eine Teilmenge J ⊂ Rn heißt Quader oder Intervall, falls es Intervalle Jk ⊂ R, n Q 1 ≤ k ≤ n, mit J = Jk gibt. i=1 (iii) Für a ≤ b ∈ Rn definieren wir (a, b) := (a, b] := n Y k=1 n Y k=1 (iv) (v) (vi) (vii) ak , bk , ak , bk [a, b] := und [a, b) := n Y k k a ,b , k=1 n Y k k a ,b . k=1 Weiterhin definieren wir (a, b), [a, b], (a, b] und [a, b) als leere Menge ∅, falls a ≤ b nicht gilt. (a, b) ⊂ Rn heißt offener Quader oder offenes Intervall und [a, b] ⊂ Rn heißt abgeschlossener Quader oder abgeschlossenes Intervall. (Offene Quader sind offene Mengen und abgeschlossene Quader sind abgeschlossene Mengen.) Wir definieren J(n) als die Menge aller offenen Quader in Rn . Wir definieren den abgeschlossenen Halbraum Hk (α) := x∈ Rn : xk ≥ α . Ist die Grundmenge klar, so schreiben wir beispielsweise xk ≥ α für die Menge x ∈ Rn : xk ≥ α . Insbesondere erzeugen die abgeschlossenen Halbräume bereits die Borelsche σAlgebra über Rn . 44 10. MAßTHEORIE Theorem 10.15. Definiere AQ := Aσ ({(a, b) : a, b ∈ Qn }), A0 := Aσ ({Hk (α) : 1 ≤ k ≤ n, α ∈ Q}) und A1 := Aσ ({Hk (α) : 1 ≤ k ≤ n, α ∈ R}). Dann gilt B n = Aσ (J(n)) = AQ = A0 = A1 . Beweis. AQ ⊂ Aσ (J(n)) ⊂ B n ist klar. Da sich in Rn jede offene Menge als abzählbare Vereinigung von offenen Quadern (a, b) mit a, b ∈ Qn schreiben lässt und Aσ (Aσ (·)) = Aσ (·) gilt, folgt B n ⊂ Aσ (AQ ) = AQ . Die restlichen Überlegungen führen wir nur eindimensional aus. Sie lassen sich leicht auf den S allgemeinen Fall übertragen. Sei a ∈ R beliebig. Mit Q 3 ak & a, k ∈ N, folgt [ak , ∞) = (a, ∞). Für a ∈ Q gilt (−∞, a) = {[a, ∞) ∈ A0 . Für k∈N S a ∈ R und Q 3 ak % a folgt (−∞, a) = (−∞, ak ). Somit gilt (a, b) ∈ A0 für k∈N beliebige a, b ∈ R. Klar ist A0 ⊂ A1 ⊂ B n . Wegen (a, b) ∈ A0 folgt wie oben aber auch A0 = B n . 10.1.5. Produkte Borelscher σ-Algebren. Wie bei Produkträumen üblich behandeln wir insbesondere den Fall von zwei Faktoren. Verallgemeinerungen auf mehr Faktoren ergeben sich dann per Induktion. Bemerkung 10.16. ? Seien (Xj , Oj ), j = 1, 2, topologische Räume. Dann wissen wir (Kapitel 3.5, Produkträume), dass O1 O2 := {O1 × O2 : (O1 , O2 ) ∈ O1 × O2 } eine Basis der Produkttopologie auf X1 ×X2 ist. (Die Notation ist hier praktisch, aber nicht sehr verbreitet.) Bereits am Beispiel der σ-Algebra A := {∅, A, {A, X} sieht man, dass A A im Allgemeinen keine σ-Algebra mehr ist, da man durch Vereinigungen auch Mengen bekommt, die nicht in Produktgestalt sind. Daher definieren wir. Definition 10.17. Seien (Xj , Aj ), j = 1, 2, messbare Räume. Wir definieren die Produkt-σ-Algebra A1 ⊗A2 von A1 und A2 als die kleinste σ-Algebra über X1 ×X2 , die A1 A2 enthält: A1 ⊗ A2 := Aσ (A1 A2 ). Jedoch bilden die Produkte S1 S2 von Erzeugendensystemen wieder ein Erzeugendensystem der Produkt-σ-Algebra. Theorem 10.18. Seien Xj beliebige Mengen und Sj ⊂ P(Xj ) mit Xj ∈ Sj für j = 1, 2. Dann gilt Aσ (S1 ) ⊗ Aσ (S2 ) = Aσ (S1 S2 ). Beweis. • „⊃“: Wir erhalten nach Definition Aσ (S1 S2 ) ⊂ Aσ (Aσ (S1 ) Aσ (S2 )) ≡ Aσ (S1 ) ⊗ Aσ (S2 ). • „⊂“: Sei nun A1 × A2 ∈ Aσ (S1 ) Aσ (S2 ), also insbesondere A1 ∈ Aσ (S1 ). Führen wir die Operationen einer σ-Algebra, die aus Elementen Sk ∈ S1 die Menge A1 erzeugen, mit Sk × X2 ∈ S1 S2 statt mit Sk aus, so sehen wir, dass A1 × X2 ∈ Aσ (S1 S2 ) gilt. Ebenso folgt X1 × A2 ∈ Aσ (S1 S2 ). Somit ist auch A1 ×A2 = (A1 ×X2 )∩(X1 ×A2 ) ∈ Aσ (S1 S2 ). Hieraus folgt Aσ (S1 )⊗Aσ (S2 ) = Aσ (Aσ (S1 )Aσ (S2 )) ⊂ Aσ (S1 S2 ) wie behauptet. Wir vergleichen nun B(X1 ) ⊗ B(X2 ) und B(X1 × X2 ) für topologische Räume Xj , j = 1, 2. Theorem 10.19. Seien (Xj , Oj ), j = 1, 2, topologische Räume. Dann gilt B(X1 ) ⊗ B(X2 ) ⊂ B(X1 × X2 ). 45 10.1. MESSBARE RÄUME Beweis. Die Produkttopologie O auf X1 × X2 enthält O1 O2 . Es folgt Aσ (O1 O2 ) ⊂ Aσ (O) = B(X1 × X2 ). Nach Theorem 10.18 folgt B(X1 ) ⊗ B(X2 ) = Aσ (O1 O2 ) und somit die Behauptung. Im obigen Beweis steht an einer Stelle nur „⊂“, da eine Topologie unter beliebigen Vereinigungen abgeschlossen ist, eine σ-Algebra jedoch nur unter abzählbaren Vereinigungen. In [1, Aufgabe 19, Seite 19] finden sich kompliziertere Beispiele, die zeigen, dass nachfolgend das zweite Abzählbarkeitsaxiom nötig ist. Es gilt jedoch Theorem 10.20. Seien Xj , j = 1, 2, topologische Räume, die jeweils das zweite Abzählbarkeitsaxiom erfüllen. Dann gilt B(X1 × X2 ) = B(X1 ) ⊗ B(X2 ). Beweis. Seien Mj , j = 1, 2, abzählbare Basen der Topologien auf Xj . Dann ist M1 M2 eine abzählbare Basis der Produkttopologie O auf X1 × X2 . Jede offene Menge in X1 ×X2 lässt sich also als abzählbare Vereinigungen solcher Basiselemente darstellen. Daher folgt O ⊂ B(X1 )⊗B(X2 ). Dies impliziert B(X1 ×X2 ) = Aσ (O) ⊂ B(X1 ) ⊗ B(X2 ). Die umgekehrte Inklusion gilt nach Theorem 10.19 allgemein. Somit folgt die Behauptung. Korollar 10.21. Es gilt B m ⊗B n = B m+n und B m = B 1 ⊗ . . . ⊗ B 1 für m, n ∈ N>0 . | {z } m Stück 10.1.6. Die Messbarkeit von Schnitten. Definition 10.22. Seien C ⊂ X × Y und (a, b) ∈ X × Y . Dann heißen C[a] := {y ∈ Y : (a, y) ∈ C} und C [b] := {x ∈ X : (x, b) ∈ C} Schnitte von C bezüglich a ∈ X bzw. b ∈ Y . (Diese Notation ist nicht weit verbreitet.) Theorem 10.23. Seien (X, A) und (Y, B) messbare Räume und C ∈ A ⊗ B. Sei (a, b) ∈ X × Y . Dann gelten {y ∈ Y : (a, y) ∈ C} ∈ B und {x ∈ X : (x, b) ∈ C} ∈ A. Beweis. Definiere n o C := C ∈ A ⊗ B : C[x] ∈ B und C [y] ∈ A für alle (x, y) ∈ X × Y . Wir behaupten, dass C eine σ-Algebra über X × Y ist: Sei (x, y) ∈ X × Y beliebig. (i) X × Y ∈ C ist klar. (ii) Sei C ∈ C. Dann gilt ({C)[x] = {(C[x] ) ∈ B. Analog folgt die zweite Bedingung und somit ist auch {C ∈ C. (iii) Wegen [ j∈N Cj [x] = [ (Cj )[x] j∈N und einer analogen Rechnung mit „ [y] “ ist C auch unter abzählbaren Vereinigungen abgeschlossen. Sei A × B ∈ A B. Dann gilt für beliebige (x, y) ∈ X × Y ( B, x ∈ A, (A × B)[x] = ∅, x 6∈ A 46 10. MAßTHEORIE und eine analoge Beziehung für „ [y] “. Somit gilt AB ⊂ C. Dies impliziert A⊗B ⊂ C, da C eine σ-Algebra ist. Nach Definition von C gilt aber auch C ⊂ A⊗B. Somit folgt die Behauptung. 10.2. Maße. 10.2.1. Mengenfunktionen. Definition 10.24. Seien X eine Menge und C ⊂ P(X) mit ∅ ∈ C. Sei ϕ : C → [0, ∞] eine Abbildung mit ϕ(∅) = 0. Solch ein ϕ heißt auch Mengenfunktion. S (i) ϕ heißt σ-subadditiv, wenn für jede Folge (Aj )j∈N ⊂ C mit Aj ∈ C j∈N ϕ [ Aj ≤ j∈N X ϕ(Aj ) j∈N gilt. ϕ heißt subadditiv, wenn die entsprechende Bedingung für Vereinigungen von endlich vielen Mengen erfüllt ist. (ii) Eine Abbildung ϕ : C → [0, ∞] (oder . . . → K) S mit ϕ(∅) = 0 heißt σ-additiv, falls für jede disjunkte Folge (Aj )j∈N ⊂ C mit Aj ∈ C auch j∈N ϕ [ Aj = j∈N X ϕ(Aj ) j∈N gilt. ϕ heißt additiv, wenn die entsprechende Bedingung für disjunkte Vereinigungen von endlich vielen Mengen erfüllt ist. (iii) Eine σ-subadditive Funktion ϕ : C → S [0, ∞] heißt σ-endlich, falls X ∈ C ist und es eine Folge (Aj )j∈N ⊂ C mit Aj = X und ϕ(Aj ) < ∞ für alle j ∈ N j∈N gibt. (iv) Ist ϕ eine σ-subadditive Funktion, X ∈ C und gilt ϕ(X) < ∞, so heißt ϕ endlich. Diese Begriffe stehen wie folgt in Beziehung zueinander. Bemerkung 10.25. ? (i) Eine σ-subadditive Funktion ist subadditiv. (ii) Eine σ-additive Funktion ist additiv. (iii) Eine σ-additive Funktion auf einer σ-Algebra mit Werten in [0, ∞] ist σsubadditiv. (iv) Eine additive Funktion auf einer σ-Algebra mit Werten in [0, ∞] ist subadditiv. (v) Ist eine σ-endliche Funktion auf einer σ-Algebra definiert, so können wir die Folge auch disjunkt wählen. Definiere dazu B0 := A0 und induktiv Bk := k−1 S Ak \ Ak für k > 0. k=0 10.2.2. Maßräume. Definition 10.26. (i) Sei A eine σ-Algebra über X. Sei µ : A → [0, ∞] eine σ-additive Funktion. Dann heißt µ ein (positives) Maß auf X und (X, A, µ) ein Maßraum. (ii) Gilt zusätzlich µ(X) = 1, so heißt µ Wahrscheinlichkeitsmaß und (X, A, µ) ein Wahrscheinlichkeitsraum. Beispiele 10.27. 10.2. MAßE 47 (i) ? Sei X eine Menge, a ∈ X. Dann ist das Diracmaß die Abbildung δa : P(X) → [0, ∞] mit ( 1, a ∈ A, δa (A) := 0, a 6∈ A für beliebige A ⊂ X. (ii) ? Sei X eine Menge. Dann ist das Zählmaß H0 : P(X) → [0, ∞] einer Menge A ⊂ X als die Anzahl der Punkte in A für endliche Mengen A und sonst als ∞ definiert. (iii) Sei (X, A, µ) ein Maßraum und A ∈ A. Dann ist (A, A|A , µ|A ) ebenfalls ein Maßraum. Dabei sind A|A := {B ∩ A : B ∈ A} = {B : B ∈ A und B ⊂ A} und µ|A (B) := µ(B) für alle B ∈ A|A , wobei wir genauer µ(iA (B)) mit der kanonischen Einbettung iA : A → X schreiben sollten. 10.2.3. Eigenschaften von Maßen. Bemerkung 10.28. Erinnerung: • „% “ schreiben wir bei einer monotonen Folge, die konvergiert. • „↑ “ schreiben wir, falls sämtliche Folgeglieder kleiner oder gleich dem Grenzwert sind. Es gelten die folgenden Rechenregeln. Theorem 10.29. Sei (X, A, µ) ein Maßraum. Seien A, B ∈ A und sei (Aj )j∈N ⊂ A. Dann gelten (i) µ(A ∪ B) + µ(A ∩ B) = µ(A) + µ(B), (ii) µ(B \ A) = µ(B) − µ(A) für A ⊂ B und µ(A) < ∞, (iii) A ⊂ B =⇒ µ(A) ≤ µ(B), d. h. µ ist (bezüglich der durch Inklusion definierten natürlichen Teilordnung) wachsend, (die Aussagen bis hier gelten auch für additive statt σ-additive Abbildungen µ) ! S (iv) µ(Ak ) % µ Aj für A0 ⊂ A1 ⊂ A2 ⊂ . . ., j∈N (Stetigkeit des Maßes ! von unten) T (v) µ(Ak ) & µ Aj für A0 ⊃ A1 ⊃ A2 ⊃ . . . mit µ(A0 ) < ∞ (Stetigkeit des j∈N Maßes von!oben) und S P (vi) µ Aj ≤ µ(Aj ), d. h. µ ist σ-subadditiv. j∈N j∈N Beweis. ˙ (i) σ-Additivität impliziert Additivität. Daher folgt aus A ∪ B = A∪(B \ A) µ(A ∪ B) = µ(A) + µ(B \ A). ˙ Analog folgt aus B = (A ∩ B)∪(B \ A) µ(A ∩ B) + µ(B \ A) = µ(B). Wir addieren die beiden Gleichungen und erhalten µ(A ∪ B) + µ(A ∩ B) + µ(B \ A) = µ(A) + µ(B) + µ(B \ A). Ist µ(B\A) < ∞, so folgt die Behauptung. Sonst implizieren die obigen beiden Identitäten µ(A ∪ B) = µ(B) = ∞. Daraus folgt die Behauptung auch im Fall µ(B \ A) = ∞. 48 10. MAßTHEORIE ˙ (ii) Die Annahme A ⊂ B impliziert B = A∪(B \ A). Daraus folgt µ(B) = µ(A) + µ(B \ A). Wegen µ(A) < ∞ dürfen wir dies abziehen und erhalten µ(B) − µ(A) = µ(B \ A). (iii) Aus A ⊂ B folgt auch hier wieder µ(B) = µ(A)+µ(B \A), wegen µ(B \A) ≥ 0 also insbesondere µ(B) ≥ µ(A). (iv) Wir definieren disjunkte Mengen Bk durch A−1 := ∅ und induktiv Bk := Ak \ Ak−1 für k ∈ N. Nach Konstruktion sind die Mengen Bk disjunkt und erfüllen ∞ ∞ m S S S Bk ∈ A sowie Bk = Aj und Bk = Am . Aus der σ-Additivität j=0 k=0 k=0 erhalten wir µ [ ! [ Aj = µ j∈N Bk = lim m→∞ k∈N = lim µ m→∞ m X µ(Bk ) k=0 ! m [ Bk = lim µ(Am ). m→∞ k=0 Wegen A0 ⊂ A1 ⊂ . . . folgt aufgrund der Monotonie des Maßes (iii), dass „% “ gilt. (v) Da (Ak )k eine fallende Folge ist, ist die Folge (A0 \Ak )k wachsend. Elementare Mengenmanipulationen liefern ! \ [ A0 \ Ak = (A0 \ Ak ). k∈N k∈N Somit folgt ! µ(A0 ) − µ \ Ak ! (ii) = µ A0 \ k∈N \ Ak ! =µ k∈N (iv) = [ (A0 \ Ak ) k∈N lim µ(A0 \ Am ) = µ(A0 ) − lim µ(Am ). m→∞ {z } | m→∞ =µ(A0 )−µ(Am ) Hieraus folgt die Behauptung. (vi) Wir definieren wiederum induktiv eine disjunkte Folge in A durch B0 := A0 k−1 S S S und Bk := Ak \ Aj für k > 0. Nach Definition gelten Bk = Ak und j=0 k∈N k∈N Bk ⊂ Ak für k ∈ N. Wir benutzen die σ-Additivität von µ und erhalten ! ! [ [ X (iii) X µ Ak = µ Bk = µ(Bk ) ≤ µ(Ak ) k∈N k∈N k∈N k∈N wie behauptet. 10.2.4. Nullmengen. Definition 10.30. Sei (X, A, µ) ein Maßraum. (i) Eine Menge N ∈ A mit µ(N ) = 0 heißt µ-Nullmenge. Mit Nµ bezeichnen wir die Menge aller µ-Nullmengen. (ii) Das Maß µ bzw. der Maßraum (X, A, µ) heißt vollständig, wenn für jede Nullmenge N ∈ Nµ und alle Teilmengen M ⊂ N stets M ∈ A gilt. (iii) Wir definieren Mµ := {M ⊂ X : es gibt eine µ-Nullmenge N mit M ⊂ N } und Aµ := {A ∪ M : A ∈ A, M ∈ Mµ }. 49 10.3. ÄUßERE MAßE Auf Aµ definieren wir µ wie folgt: Sei B ∈ Aµ beliebig. Seien A ∈ A und M ∈ Mµ mit B = A ∪ M . Dann definieren wir µ(B) := µ(A). (Hier ist insbesondere noch die Wohldefiniertheit nachzuweisen.) X, Aµ , µ heißt Vervollständigung von (X, A, µ). Bemerkung 10.31. ? (i) Aufgrund der Monotonie gilt für M ∈ A und Nullmengen N ∈ Nµ mit M ⊂ N stets M ∈ Nµ . Somit ist µ genau dann vollständig, wenn jede Teilmenge einer µ-Nullmenge wieder eine µ-Nullmenge ist. (ii) Aufgrund der σ-(Sub-)Additivität von µ sind abzählbare Vereinigungen von Nullmengen selbst wieder Nullmengen. (iii) µ ist genau dann vollständig, wenn Mµ ⊂ A gilt. (iv) Jeder Maßraum mit A = P(X) ist vollständig. Insbesondere sind also das Diracmaß und das Zählmaß vollständig. Theorem 10.32. Sei (X, A, µ) ein Maßraum. (a) Dann ist X, Aµ , µ ein vollständiger Maßraum mit µ ⊂ µ, d. h. µ ist eine Fortsetzung von µ. (b) Ist (X, B, ν) ein vollständiger Maßraum und ν ⊃ µ, so gilt auch ν ⊃ µ, d. h. µ ist die kleinste vollständige Fortsetzung von µ. Beweis. (i) Aµ ist eine σ-Algebra: • X ∈ Aµ ist klar. • Komplemente: Wir schreiben eine beliebige Menge aus Aµ in der Form A ∪ M mit A ∈ A und M ⊂ N , wobei N ∈ A eine Nullmenge ist. Ohne Einschränkung dürfen wir annehmen, dass A∩N = ∅ gilt, betrachte sonst M ∩ {A bzw. N ∩ {A statt M bzw. N . Es gilt {(A ∪ M ) = {(A ∪ N ) ∪ | {z } ∈A (N \ M ) | {z } ∈ Aµ . ⊂N = Nullmenge • Abzählbare Vereinigungen gehören wieder zu Aµ , da abzählbare Vereinigungen von Nullmengen wieder Nullmengen sind. (ii) Wohldefiniertheit von µ : Aµ → [0, ∞]: Seien A1 , A2 ∈ A und M1 , M1 ⊂ N für eine (ohne Einschränkung gemeinsame) µ-Nullmenge N . Gelte A1 ∪ M1 = A2 ∪ M2 . Es folgt µ(A1 ∪ M1 ) = µ(A1 ) ≤ µ(A2 ∪ N ) = µ(A2 ) + µ(N ) − µ(A2 ∩ N ) = µ(A2 ) = µ(A2 ∪ M2 ). Die umgedrehte Ungleichung folgt analog. (iii) Vollständigkeit: Sei A0 eine beliebige µ-Nullmenge und B ⊂ A0 beliebig. Wir wollen zeigen, dass auch B ∈ Aµ gilt. Nach Definition gibt es A, N ∈ A und M ⊂ N mit µ(A) = 0, µ(N ) = 0, M ⊂ N und A0 = A ∪ M . Insbesondere gilt B ⊂ A0 ⊂ A ∪ N mit A ∪ N ∈ A und µ(A ∪ N ) = 0. Somit folgen B ∈ Mµ , ∅ ∪ B ∈ Aµ und daher die Vollständigkeit. (iv) Es ist klar, dass µ eine Fortsetzung von µ ist. Die σ-Additivität von µ folgt direkt aus der σ-Additivität von µ. Dies zeigt den ersten Teil. (v) Sei (X, B, ν) ein vollständiger Maßraum mit B ⊃ A und ν|A = µ. Damit gilt Nµ ⊂ Nν und folglich erhalten wir auch Mµ ⊂ Mν . Aufgrund der Vollständigkeit können wir die Inklusionskette zu Mµ ⊂ Mν ⊂ B fortsetzen. Nach Definition von Aµ ist somit Aµ ⊂ B. Schließlich ist ν ⊃ µ klar und die Behauptung folgt. 50 10. MAßTHEORIE 10.3. Äußere Maße. 10.3.1. Konstruktion äußerer Maße. Definition 10.33. Sei X eine Menge. (i) Eine Funktion µ∗ : P(X) → [0, ∞] mit µ∗ (∅) = 0 heißt äußeres Maß auf X, falls sie wachsend und σ-subadditiv ist. (ii) Eine Familie K ⊂ P(X) heißt Überdeckungsklasse für X, falls sie ∅ und eine S Folge (Kj )j∈N mit Kj = X enthält. j∈N Bemerkung 10.34. ? (i) Ein Maß ist genau dann ein äußeres Maß, wenn es auf ganz P(X) definiert ist. Beweisidee. Die σ-Subadditivität folgt aus der σ-Additivität: Theorem 10.29 (vi). (ii) ? Definiere für A ⊂ X die Funktion µ∗ durch ( 0, A = ∅, ∗ µ (A) := 1, A 6= ∅. Dann ist µ∗ ein äußeres Maß auf X aber kein Maß, falls X aus mindestens zwei Punkten besteht. (iii) Seien a, b ∈ Rn . Sei A(a, b) eine Menge mit (a, b) ⊂ A(a, b) ⊂ [a, b]; wir betrachten also Quader, bei denen wir Randpunkte beliebig weglassen oder hinzufügen dürfen. Dann ist {A(a, b) : a, b ∈ Rn } eine Überdeckungsklasse von Rn . Insbesondere ist J(n) eine Überdeckungsklasse von Rn . (iv) Sei X ein separabler metrischer Raum. Dann ist {O : O ⊂ X ist offen und diam O < ε} eine Überdeckungsklasse für X. Beweis. Benutze Theorem 10.11. Im folgenden Theorem konstruieren wir äußere Maße. Theorem 10.35. Sei K eine Überdeckungsklasse von X. Sei ν : K → [0, ∞] eine Funktion mit ν(∅) = 0. Für A ⊂ X definieren wir X [ µ∗ (A) := inf ν(Kj ) : Kj ∈ K für alle j ∈ N und A ⊂ Kj . j∈N j∈N ∗ Dann ist µ ein äußeres Maß auf X. Wir nennen µ∗ das von (K, ν) induzierte äußere Maß auf X. Beweis. Klar ist, dass µ∗ : P(X) → [0, ∞] wachsend ist und dass µ∗ (∅) = 0 gilt. σ-Subadditivität: Sei (Aj )j∈N ⊂ P(X) eine Folge. Sei ε > 0 beliebig. Dann gibt es nach Definition von µ∗ zu jedem j ∈ N eine Folge (Kj,k )k∈N ⊂ K mit [ X ε Aj ⊂ Kj,k und ν(Kj,k ) ≤ µ∗ (Aj ) + j+1 . 2 k∈N k∈N S S S Wegen Aj ⊂ Kj,k erhalten wir j∈N j∈N k∈N ! ∗ µ [ j∈N Aj ≤ XX X ν(Kj,k ) ≤ µ∗ (Aj ) + j∈N k∈N j∈N Somit folgt die Behauptung. ε 2j+1 ! ≤ X ∗ µ (Aj ) + ε. j∈N 51 10.3. ÄUßERE MAßE 10.3.2. Das Lebesguesche äußere Maß. Wir sprechen auch vom äußeren Lebesguemaß. Definition 10.36. (i) Seien a, b ∈ Rn . Dann heißt Voln (a, b) := Q n bj − aj , a ≤ b, j=1 0, sonst das n-dimensionale Volumen des Intervalles (a, b) ⊂ Rn . (ii) Sei A ⊂ Rn . Dann heißt X [ λ∗n (A) := inf Voln (Ij ) : Ij ∈ J(n) für alle j ∈ N und A ⊂ Ij j∈N j∈N das n-dimensionale Lebesguesche äußere Maß. Wir zeigen nun, dass das n-dimensionale Lebesguesche äußere Maß tatsächlich ein äußeres Maß ist und dass sich das Lebesguemaß nicht ändert, wenn wir Teile des Randes des Quaders (a, b) hinzunehmen. Theorem 10.37. λ∗n ist ein äußeres Maß auf Rn . Für a, b ∈ Rn und A ⊂ Rn mit (a, b) ⊂ A ⊂ [a, b] gilt λ∗n (A) = Voln (a, b). Der zweite Teil besagt, dass die Seitenflächen eines Quaders keinen Beitrag zum Lebesgueschen äußeren Maß liefern. Beweis. (i) Da die Intervalle J(n) eine Überdeckungsklasse für Rn bilden, liefert Theorem 10.35, dass λ∗n ein äußeres Maß ist. (ii) Seien a, b ∈ Rn . Wir definieren die Folge (Ij )j∈N ⊂ J(n)Soffener Quader durch I0 := (a, b) und Ij = ∅ für j ∈ N>0 . Dann gilt (a, b) ⊂ Ij . Nach Definition j∈N erhalten wir somit λ∗n ((a, b)) ≤ X Voln (Ij ) = Voln (a, b). j∈N (iii) Die Lebesgueschen äußeren Maße von (a, b), A und [a, b] stimmen überein: Sei ε > 0. Sei 1 ≤ k ≤ n. Sei c ∈ ak , bk . Dann gibt es zu einer Seite S := a1 , b1 × . . . × ak−1 , bk−1 × {c} × ak+1 , bk+1 × . . . × [an , bn ] einen offenen Quader I ∈ J(n) mit S ⊂ I und Voln (I) < ε. Somit folgt λ∗n (S) = 0. Entsprechend gibt es zu a, b ∈ Rn auch 2n Seiten (Jj )1≤j≤2n von [a, b] mit λ∗n (Jj ) = 0 und [a, b] = (a, b) ∪ 2n [ Jj . j=1 Da aus der σ-Subadditivität auch die Subadditivität folgt, erhalten wir λ∗n ([a, b]) ≤ λ∗n ((a, b)) + 2n X λ∗n (Jj ) = λ∗n ((a, b)). j=1 Wegen (a, b) ⊂ A ⊂ [a, b] erhalten wir somit aus der Monotonie von λ∗n λ∗n ((a, b)) ≤ λ∗n (A) ≤ λ∗n ([a, b]) ≤ λ∗n ((a, b)). Somit gilt hier überall Gleichheit. 52 10. MAßTHEORIE (iv) Wir zeigen nun, dass es keine Aufteilung gibt, die ein kleineres Infimum als Voln (a, b) liefert: Sei (Ij )j∈N ⊂ J(n) eine Folge von offenen Quadern mit N S S Ij . Dann [a, b] ⊂ Ij . Da [a, b] kompakt ist, gibt es N ∈ N mit [a, b] ⊂ j=1 j∈N folgt Voln (a, b) ≤ N X Voln (Ij ) ≤ j=0 X Voln (Ij ), j∈N wobei sich die erste Ungleichung durch Zerlegung in kleinere Intervalle ergibt (Details: Übung). Wir gehen nun zum Infimum über und erhalten Voln (a, b) ≤ λ∗n ([a, b]). Die Behauptung folgt nun aus der bereits hergeleiteten Ungleichung λ∗n ([a, b]) ≤ Voln (a, b). Bemerkung 10.38. Seien a, b ∈ Rn . Für ein beliebiges Intervall J(a, b) ⊂ Rn mit (a, b) ⊂ J(a, b) ⊂ [a, b] gilt nach Theorem 10.37 stets λ∗n (J(a, b)) = Voln (a, b). Wir setzen daher Voln J(a, b) := λ∗n (J(a, b)) und nennen auch dies das n-dimensionale Volumen des Intervalles J(a, b). Definition 10.39. ? Sei J ⊂ Rn ein Intervall. Dann heißt J linksseitig, rechtsseitig bzw. beidseitig abgeschlossen, falls es a, b ∈ Rn mit J = [a, b), J = (a, b] bzw. J = [a, b] gibt. Wir bezeichnen die Menge aller dieser Intervalle bzw. Quader mit Jl (n), Jr (n) bzw. J(n). Für die Definition des Lebesgueschen äußeren Maßes hätten wir auch linksseitig, rechtsseitig oder beidseitig abgeschlossene Intervalle verwenden können. Theorem 10.40. Sei A ⊂ Rn und J ∈ Jl (n), Jr (n), J(n) . Dann gilt X [ λ∗n (A) = inf Voln (Jj ) : Jj ∈ J für alle j ∈ N und A ⊂ Jj . j∈N j∈N Beweisidee. Weitere Details finden sich bei [1, Satz 3.4]. • Wir betrachten nur den Fall Jl (n). Die anderen Fälle folgen analog. • „≥“: Überdeckt eine Familie von offenen Intervallen der Form (a, b) eine Menge, so auch die Familie mit Mengen der Form [a, b). n Q • „≤“: Sei ε > 0 beliebig. Wenn aj , bj eine Menge überdeckt, so auch j=1 n Q j j j a −ε b −a j , b . Solche Quader haben ein um den Faktor (1 + ε)n j=1 größeres Volumen. 10.3.3. Lebesgue-Stieltjessche äußere Maße ?. Definition 10.41. (i) Sei F : R → R monoton wachsend und linksseitig stetig, gelte also lim F (x) = F (x0 ) x<x0 x→x0 für alle x0 ∈ R. Dann heißt F eine maßerzeugende Funktion. (ii) Gilt zusätzlich lim F (x) = 0 und lim F (x) = 1, so heißt F eine Verteix→−∞ lungsfunktion. x→∞ 53 10.3. ÄUßERE MAßE (iii) Ist F eine maßerzeugende Funktion, so definieren wir auf der Menge der Intervalle der Form [a, b) eine wachsende Funktion νF mit Werten in R durch ( F (b) − F (a), a < b, νF ([a, b)) := 0, a≥b für a, b ∈ R. Theorem 10.42. Sei F eine maßerzeugende Funktion. Für A ⊂ R definieren wir X [ µ∗F (A) := inf νF (Ij ) : Ij = [aj , bj ) mit aj , bj ∈ R ∀ j ∈ N und A ⊂ Ij . j∈N j∈N µ∗F Dann ist ein äußeres Maß auf R. Wir nennen µ∗F das von F erzeugte Lebesgue-Stieltjessche äußere Maß. Für −∞ < a < b < ∞ gilt µ∗F ([a, b)) = F (b) − F (a). Beweis. (i) Intervalle der angegebenen Form bilden eine Überdeckungsklasse von R. Somit ist µ∗F nach Theorem 10.35 ein äußeres Maß. (ii) Seien a, b ∈ R mit a < b. Wir S definieren I0 := [a, b) und Ij := ∅ für alle j ∈ N>0 . Dann folgt [a, b) ⊂ Ij und wir erhalten j∈N µ∗F ([a, b)) ≤ X νF (Ij ) = νF (I0 ) = F (b) − F (a). j∈N (iii) Sei nun umgekehrt (Ij )j∈N eine Familie von Intervallen der Form S P Ij = [aj , bj ) mit [a, b) ⊂ Ij . Wir möchten zeigen, dass F (b) − F (a) ≤ νF (Ij ) gilt. j∈N j∈N Gehen wir dann auf der rechten Seite zum Infimum über, so folgt die Behauptung. Sei dazu ε > 0. Da F linksseitig stetig ist, gibt es c, cj > 0, j ∈ N, mit F (b) − F (b − c) < ε/2 und F (aj ) − F (aj − cj ) < ε2−(j+2) . S Aufgrund der vorausgesetzten Inklusion gilt [a, b − c] ⊂ [a, b) ⊂ [aj , bj ) ⊂ j∈N S (aj − cj , bj ). Da [a, b − c] ein kompaktes Intervall ist, gibt es ein N ∈ N mit j∈N [a, b − c] ⊂ N S (aj − cj , bj ). Da F monoton wachsend ist, erhalten wir j=0 N X X F (b − c) − F (a) ≤ (F (bj ) − F (aj − cj )) ≤ (F (bj ) − F (aj − cj )), j=0 j∈N wobei wir für die erste Ungleichung zunächst das größte bj und das kleinste aj − cj verwenden und dann die Nichtnegativität von geeigneten Paaren von Termen benutzen. Somit folgt F (b) − F (a) = F (b) − F (b − c) + F (b − c) − F (a) X ≤ ε/2 + F (bj ) − F (aj ) + F (aj ) − F (aj − cj ) {z } | j∈N ≤ε2−(j+2) X X ≤ (F (bj ) − F (aj )) + ε = νF (Ij ) + ε. j∈N j∈N Da ε > 0 beliebig war, folgt die Behauptung. 54 10. MAßTHEORIE Bemerkung 10.43. (i) Ist F (x) = x, so folgt µ∗F = λ∗1 wegen Theorem 10.40. (ii) Analoge Resultate gelten für rechtsseitig stetige Funktionen und rechtsseitig abgeschlossene Intervalle. 10.3.4. Hausdorffsche äußere Maße ?. Definition 10.44. Sei X ein metrischer Raum und sei A ⊂ X. Seien s > 0 und ε > 0. Dann definieren wir ∞ X [ Hεs (A) := inf (diam Oj )s : Oj ∈ O, diam(Oj ) < ε und A ⊂ Oj . j=0 j∈N Bemerkung 10.45. (i) Häufig verwendet man auch P ωs j∈N diam Oj 2 s um eine schönere Normierung zu erhalten. Hierbei ist ωs für s ∈ N das Lebesguesche äußere Maß der ndimensionalen Euklidischen Einheitskugel. (ii) Man erhält dasselbe Maß, wenn man nicht fordert, dass die Mengen Oj offen sind. (Übung.) (iii) Ist X separabel, so bilden die offenen Mengen mit Durchmesser kleiner als ε eine Überdeckungsklasse von X. Somit ist Hεs in diesem Fall nach Theorem 10.35 ein äußeres Maß auf X. (iv) Für ε1 > ε2 gilt Hεs1 ≤ Hεs2 , weil für größere ε > 0 mit mehr Mengen überdeckt werden kann. Daher existiert auch der Grenzwert für ε & 0 in [0, ∞]. Aufgrund der letzten Bemerkung können wir im Grenzwert ε & 0 ein Maß definieren. Definition 10.46. (i) Sei X ein metrischer Raum und sei s > 0. Dann definieren wir für A ⊂ X H∗s (A) ≡ Hs (A) := lim Hεs (A) = sup Hεs (A). ε&0 ε>0 H∗s Wir nennen das s-dimensionale Hausdorffsche äußere Maß auf X. (ii) Für s = 0 definieren wir H0 ≡ H∗0 als das Zählmaß auf X, das jedem A die Anzahl der Punkte in A zuordnet und Werte in N ∪ {∞} hat. Theorem 10.47. Sei X ein separabler metrischer Raum und sei s ≥ 0. Dann ist H∗s ein äußeres Maß auf X. Beweis. Für s = 0 ist Hs ein Maß und da es auf ganz P(X) definiert ist, auch ein äußeres Maß. Sei s > 0. Es ist klar, dass H∗s : P(X) → [0, ∞] wachsend ist und dass H∗s (∅) = 0 gilt. σ-Subadditivität: Sei (Aj )j∈N ⊂ P(X) eine Familie von Mengen. Für jedes ε > 0 ist Hεs nach Bemerkung 10.45 ein äußeres Maß auf X. Somit erhalten wir [ X X Hεs Aj ≤ Hεs (Aj ) ≤ H∗s (Aj ). j∈N j∈N j∈N Wir lassen nun auf der linken Seite ε & 0 und erhalten die Behauptung. 10.4. Messbare Mengen. 55 10.4. MESSBARE MENGEN 10.4.1. Motivation. Bei einer „schönen“ beschränkten Menge A ⊂ Rn erwarten wir, dass die Summe der Volumina von disjunkten Quadern der Form [a, b), die A überdecken, λ∗n (A) approximieren. Da die linken Seiten für das Volumen nicht relevant sind, sollte das bereits definierte X [ In Voln (Ij ) : Ij ∈ J(n) für j ∈ N mit A ⊂ λ∗n (A) = inf j∈N j∈N eine Approximation des Inhaltes von A von außen liefern. Umschließen wir A mit einer Menge D, beispielsweise einem großen Quader, so liefert eine entsprechende Approximation für D \ A Quader, die nach A hinein∗ ∗ reichen. Somit sollte λD n,∗ (A) := λn (D) − λn (D \ A) den Inhalt von A von innen approximieren. Da die Approximationen des Inhaltes von außen und innen übereinstimmen sollten, werden wir damit definieren, was wir oben vage mit einer „schönen“ Menge gemeint haben. Wir werden daher fordern, dass für solche Mengen A ⊂ Rn λ∗n (D) = λ∗n (A) + λ∗n (D \ A) für alle D mit A ⊂ D ⊂ Rn gilt. In der nachfolgenden Definition können wir die Gleichheit durch eine Ungleichung ersetzen, weil sich die andere Ungleichung aus der Subadditivität ergibt. 10.4.2. Die σ-Algebra der µ∗ -messbaren Mengen. Definition 10.48. Sei µ∗ ein äußeres Maß auf einem Raum X. Dann heißt eine Teilmenge A ⊂ X µ∗ -messbar, falls für alle D ⊂ X µ∗ (D) ≥ µ∗ (A ∩ D) + µ∗ {A ∩ D gilt. Die Menge aller µ∗ -messbaren Teilmengen von X bezeichnen wir mit A(µ∗ ). Eine Menge N ⊂ X mit µ∗ (N ) = 0 heißt eine µ∗ -Nullmenge. Bemerkung 10.49. (i) Jede µ∗ -Nullmenge ist µ∗ -messbar. Beweis. Sei N ⊂ X mit µ∗ (N ) = 0 und sei D ⊂ X beliebig. Da µ∗ monoton ist, folgt 0 ≤ µ∗ (D ∩ N ) ≤ µ∗ (N ) = 0. Somit gilt µ∗ (D ∩ N ) = 0. Nochmals aufgrund der Monotonie von µ∗ erhalten wir µ∗ (N ∩ D) + µ∗ ({N ∩ D) = µ∗ ({N ∩ D) ≤ µ∗ (D). Somit ist N eine µ∗ -messbare Menge. (ii) Sei (a) (b) (c) A ⊂ X. Dann sind die folgenden drei Aussagen äquivalent: A ∈ A(µ∗ ). µ∗ (D) ≥ µ∗ (A ∩ D) + µ∗ ({A ∩ D) für alle D ⊂ X mit µ∗ (D) < ∞. µ∗ (D) = µ∗ (A ∩ D) + µ∗ ({A ∩ D) für alle D ⊂ X. Beweis. Die Implikationen „(iia) =⇒ (iib)“ und „(iic) =⇒ (iia)“ sind klar. „(iib) =⇒ (iic)“: Sei D ⊂ X beliebig. Da µ∗ subadditiv ist, erhalten wir µ∗ (D) = µ∗ ((A ∩ D) ∪ ({A ∩ D)) ≤ µ∗ (A ∩ D) + µ∗ ({A ∩ D). Im Falle µ∗ (D) < ∞ liefert diese Ungleichung, kombiniert mit (iib) gerade (iic). Auch im Falle µ∗ (D) = ∞ folgt aus der obigen Ungleichung die Behauptung. Der folgende Erweiterungs- und Fortsetzungssatz von Carathéodory besagt, dass die µ∗ -messbaren Mengen eine σ-Algebra bilden. 56 10. MAßTHEORIE Theorem 10.50. Sei µ∗ ein äußeres Maß auf X. Dann ist A(µ∗ ) eine σ-Algebra auf X und µ := µ∗ |A(µ∗ ) ist ein vollständiges Maß auf A(µ∗ ). µ heißt das von µ∗ auf X induzierte Maß. Beweis. (i) ∅ ist eine Nullmenge und daher gilt ∅ ∈ A(µ∗ ). (ii) Die definierende Formel µ∗ (D) = µ∗ (A ∩ D) + µ∗ ({A ∩ D) ist symmetrisch in A und {A. Somit ist A genau dann µ∗ -messbar, falls die für {A gilt. (iii) Endliche Vereinigungen sind wieder µ∗ -messbar: Seien A, B ∈ A(µ∗ ) beliebig. Sei D ⊂ X. Dann gilt aufgrund der µ∗ Messbarkeit von A µ∗ (D) ≥ µ∗ (A ∩ D) + µ∗ {A ∩ D . Nun wenden wir die Definition von µ∗ -Messbarkeit für B mit der Menge {A∩D an und erhalten für den letzten Term µ∗ {A ∩ D ≥ µ∗ B ∩ {A ∩ D + µ∗ {B ∩ {A ∩ D . Zusammen mit der Subadditivität erhalten wir daraus µ∗ (D) ≥ µ∗ (A ∩ D) + µ∗ B ∩ {A ∩ D + µ∗ {B ∩ {A ∩ D Subadd. ≥ µ∗ (A ∩ D) ∪ B ∩ {A ∩ D + µ∗ {B ∩ {A ∩ D . Es gelten die Mengengleichheiten (A∩D)∪ B ∩ {A ∩ D = A ∪ B ∩ {A ∩ D = (A ∪ B) ∩ D und nach de Morgan {(A ∪ B) = {A ∩ {B. Wir erhalten also µ∗ (D) ≥ µ∗ ((A ∪ B) ∩ D) + µ∗ {(A ∪ B) ∩ D . Dies besagt gerade, dass A ∪ B auch eine µ∗ -messbare Menge ist. Somit ist A(µ∗ ) eine Algebra über X. (iv) Wir wollen zeigen, dass A(µ∗ ) eine σ-Algebra S ist. Sei dazu (Aj )j∈N eine disjunkte Folge in A(µ∗ ). Wir setzen A := Aj und wollen nachweisen, dass j∈N auch A eine µ∗ -messbare Menge ist. Dann folgt die Behauptung nach Bemerkung 10.4. Sei D ⊂ X beliebig. Zunächst wenden wir Bemerkung 10.49 mit (A0 ∪ A1 ) ∩ D an und erhalten unter Benutzung von A0 ∩ A1 = ∅ bei der zweiten Gleichheit ∗ µ ((A0 ∪ A1 ) ∩ D) = µ∗ (((A0 ∪ A1 ) ∩ D) ∩ A0 ) + µ∗ ((A0 ∪ A1 ) ∩ D) ∩ {A0 = µ∗ (A0 ∩ D) + µ∗ (A1 ∩ D). Per Induktion folgt hieraus m m [ X µ∗ (Aj ∩ D) (10.1) µ∗ Aj ∩ D = j=0 j=0 für alle m ∈ N. Nach Definition von A als Vereinigung der Aj ’s und aufgrund der Monotonie folgt somit m X µ∗ (A ∩ D) ≥ µ∗ (Aj ∩ D) für alle m ∈ N. j=0 Im Grenzwert m → ∞ erhalten wir daraus µ∗ (A ∩ D) ≥ ∞ P µ∗ (Aj ∩ D). j=0 Andererseits ist µ∗ eine σ-subadditive Funktion. Daher gilt sogar Gleichheit ∞ X (10.2) µ∗ (A ∩ D) = µ∗ (Aj ∩ D). j=0 57 10.4. MESSBARE MENGEN Wir haben bereits gezeigt, dass endliche Vereinigungen wieder µ∗ -messbar sind. Also folgt für m ∈ N m m [ [ µ∗ (D) = µ∗ { Aj ∩ D + µ∗ Aj ∩ D . j=0 j=0 Aufgrund der Monotonie für den ersten Term und der per Induktion bewiesenen Formel für den zweiten Term (10.1) folgt daraus m X µ∗ (D) ≥ µ∗ {A ∩ D + µ∗ (Aj ∩ D). j=0 Nun lassen wir m → ∞, benutzen (10.2) und erhalten ∞ X µ∗ (D) ≥ µ∗ {A ∩ D + µ∗ (Aj ∩ D) = µ∗ {A ∩ D + µ∗ (A ∩ D). j=0 Somit ist A wie behauptet eine µ∗ -messbare Menge und A(µ∗ ) eine σ-Algebra. (v) µ∗ |A(µ∗ ) ist σ-additiv: Setze dazu D = X in (10.2). Somit ist µ∗ |A(µ∗ ) ein Maß auf A(µ∗ ). (vi) Vollständigkeit: Sei N ∈ A(µ∗ ) eine µ∗ -Nullmenge und A ⊂ N . Dann folgt µ∗ (A) = 0 aufgrund der Monotonie und Bemerkung 10.49 impliziert, dass A eine µ∗ -messbare Menge ist. Somit ist µ vollständig. 10.4.3. Lebesguesche und Hausdorffsche Maße. Bemerkung 10.51. Sei µ∗ ein äußeres Maß. Sei µ := µ∗ |A(µ∗ ) das in Theorem 10.50 definierte induzierte Maß. Dann heißen die Mengen in A(µ∗ ) µ-messbar und die µ∗ -Nullmengen auch µ-Nullmengen. Dies wenden wir insbesondere auf das Lebesgue- und das Hausdorffmaß an. Bemerkung 10.52. (i) Sei λ∗n das Lebesgue äußere Maß auf Rn . Dann bezeichnen wir das gemäß Theorem 10.50 induzierte Maß λn als das n-dimensionale Lebesguemaß oder n-dimensionale Labesguesche Maß auf Rn . Die λn -messbaren Mengen heißen Lebesgue messbar. (ii) ? Sei F : R → R eine maßerzeugende Funktion. Dann bezeichnen wir das von µ∗F auf R induzierte Maß µF als das Lebesgue-Stieltjessche Maß auf R. (iii) ? Sei X ein separabler metrischer Raum und s > 0. Dann heißt das von H∗s auf X erzeugte Maß Hs das s-dimensionale Hausdorffmaß auf X. 10.4.4. Metrische Maße. Wir wollen in diesem Kapitel ein Kriterium angeben, das sicherstellt, dass zumindest die Borelsche σ-Algebra B(X) eines metrischen Raumes X eine Teilmenge von A(µ∗ ) ist. Definition 10.53. Sei X ein metrischer Raum und µ∗ ein äußeres Maß auf X. Gilt für alle Mengen A, B ⊂ X mit d(A, B) ≡ inf d(x, y) > 0 x∈A y∈B µ∗ (A ∪ B) = µ∗ (A) + µ∗ (B), so heißen µ∗ und das auf A(µ∗ ) induzierte Maß µ metrisch. Theorem 10.54. Sei µ∗ ein metrisches äußeres Maß auf einem metrischen Raum X. Dann gilt B(X) ⊂ A(µ∗ ). Beweis. 58 10. MAßTHEORIE (i) Da A(µ∗ ) eine σ-Algebra ist und die σ-Algebra B(X) von den offenen Mengen erzeugt wird, brauchen wir nur nachzuweisen, dass jede offene Menge µ∗ messbar ist. (ii) Weiterhin genügt es nach Bemerkung 10.49 zu zeigen, dass für jede offene Menge O und für jede Menge D ⊂ X mit µ∗ (D) < ∞ µ∗ (D) = µ∗ (O ∩ D) + µ∗ {O ∩ D gilt. Seien nun O und D solche Mengen. (iii) Wir definieren für n ∈ N>0 1 On := x ∈ X : d x, {O > n und 1 1 An := x ∈ X : < d x, {O ≤ . n+1 n Nach Definition von On gilt d On , {O ≥ n1 > 0. Sei x ∈ Ak mit k > 0. Wir erhalten für z ∈ {O und y ∈ X 1 < d x, {O ≤ d(x, z) ≤ d(x, y) + d(y, z). k+1 Wir gehen zum Infimum über alle z ∈ {O über und erhalten für y ∈ Ak+2 1 1 ≤ d(x, y) + d y, {O ≤ d(x, y) + . k+1 k+2 Bilden wir nun das Infimum über alle x ∈ Ak und alle y ∈ Ak+2 , so erhalten wir 1 1 d(Ak , Ak+2 ) ≥ − > 0. k+1 k+2 Analog erhalten wir d(Ak , Ak+j ) > 0 für alle j ≥ 2. (iv) Nun ist µ∗ ein metrisches Maß und wir erhalten per Induktion und aufgrund der Monotonie n n X [ ˙ A2j ∩ D ≤ µ∗ (D). µ∗ (A2j ∩ D) = µ∗ j=1 j=1 die obere Schranke für die Summe bleibt auch im Grenzwert n → ∞ gültig. Eine entsprechende Ungleichung erhalten wir für die Summe der ungeraden Folgeglieder. Insgesamt erhalten wir also ∞ X µ∗ (Ak ∩ D) ≤ 2µ∗ (D) < ∞. k=1 Daher ist (rn )n∈N>0 mit rn := ∞ P µ∗ (Ak ∩ D) eine Nullfolge. Weiterhin gilt k=n nach Definition von On und Aj ∞ [ 1 O \ On = x ∈ O : d x, {O ≤ = Aj . n j=n Da µ∗ eine σ-subadditive Funktion ist, erhalten wir 0 ≤ µ∗ ((O \ On ) ∩ D) ≤ ∞ X µ∗ (Aj ∩ D) = rn . j=n ∗ Daher ist die Folge (µ ((O \ On ) ∩ D))n∈N>0 eine Nullfolge. 59 10.5. DAS LEBESGUESCHE MAß (v) Aufgrund der Subadditivität von µ∗ gilt µ∗ (O ∩ D) ≤ µ∗ (On ∩ D) + µ∗ ((O \ On ) ∩ D). Es gilt d On ∩ D, {O ∩ D ≥ d On , {O ≥ n1 . Da µ∗ ein metrisches und ein äußeres Maß ist, erhalten wir somit µ∗ (On ∩ D) + µ∗ {O ∩ D = µ∗ On ∪ {O ∩ D ≤ µ∗ (D). Durch Addition der letzten beiden Ungleichungen erhalten wir mit µ∗ (D) < ∞ µ∗ (O ∩ D) + µ∗ {O ∩ D ≤ µ∗ (D) + µ∗ ((O \ On ) ∩ D) für n > 0. Wir haben gezeigt, dass der letzte Term für n → ∞ gegen Null konvergiert. Somit folgt die Behauptung. Korollar 10.55. λ∗n ist ein metrisches äußeres Maß auf Rn . Insbesondere ist jede Borelmenge Lebesgue messbar. Beweis. ? Wir wollen nachweisen, dass λ∗n ein metrisches Maß ist. Seien dazu A, B ⊂ Rn mit d(A, B) > 0. Definiere δ := 12 d(A, B). Nach Definition gibt es für jedes ε > 0 eine Folge (Ij )j∈N ⊂ Jl (n) 10.40 um Jl (n) statt J(n) verwenden S– benutze PTheorem zu dürfen – mit A∪B ⊂ Ij und λ∗n (Ij ) ≤ λ∗n (A∪B)+ε. Indem wir die Quader j∈N j∈N Ij gegebenenfalls weiter unterteilen, dürfen wir ohne Einschränkung annehmen, dass diam(Ij ) < δ für alle j ∈ N gilt. Somit hat kein Ij einen nichtleeren Schnitt mit A und mit B. Alle Quader mit A ∩ Ij 6= ∅ fassen S wir als Folge (Ij0 )j∈N alle S zusammen, 00 anderen als Folge (Ij )j∈N . Wir erhalten A ⊂ Ik0 sowie B ⊂ Il00 . Somit gilt k∈N λ∗n (A) + λ∗n (B) ≤ X Voln (Ik0 ) + k∈N X l∈N Voln (Il00 ) = l∈N X Voln (Ij ) ≤ λ∗n (A ∪ B) + ε. j∈N Wir lassen nun ε & 0. Die umgekehrte Ungleichung erhalten wir aus der Subaddi tivität von λ∗n . Bemerkung 10.56. ? Der Beweis von Korollar 10.55 überträgt sich auf den Fall des Lebesgue-Stieltjesschen äußeren Maßes µ∗F auf R und den des Hausdorffschen äußeren Maßes H∗s , s > 0. Insbesondere sind Borelmengen für µ∗F und H∗s messbar. 10.5. Das Lebesguesche Maß. 10.5.1. Der Lebesguesche Maßraum. Definition 10.57. (i) Sei λ∗n das Lebesguesche äußere Maß. Dann nennen wir die σ-Algebra A(λ∗n ) die σ-Algebra der Lebesgue messbaren Teilmengen des Rn : L(n). (ii) λ∗n -Nullmengen heißen Lebesguesche Nullmengen oder Lebesgue Nullmenge. (iii) (Rn , L(n), λn ) heißt Lebesguescher Maßraum. Wir fassen einige Eigenschaften des Lebesgueschen Maßes noch einmal zusammen. Theorem 10.58. ? (i) (Rn , L(n), λn ) ist ein σ-endlicher vollständiger Maßraum. (ii) B n ⊂ L(n). (iii) Für a, b ∈ Rn und (a, b) ⊂ A ⊂ [a, b] gelten A ∈ L(n) und λn (A) = Voln (a, b). (iv) Jede kompakte Teilmenge von Rn ist Lebesgue messbar und hat endliches Maß. (v) Eine Menge N ⊂ Rn ist genau dann eine Lebesgue S Nullmenge, P falls es zu jedem ε > 0 eine Folge (Ij )j∈N ⊂ J(n) mit N ⊂ Ij und λn (Ij ) < ε j∈N j∈N gibt. (vi) Jede abzählbare Teilmenge des Rn ist eine Lebesgue Nullmenge. 60 10. MAßTHEORIE Beweis. (i) Nach Theorem 10.37 ist λ∗n ein äußeres Maß und somit ist λn nach Theorem 10.50 vollständig. S σ-Endlichkeit: Definiere Q := [−1, 1]n . Dann gelten Rn = j · Q und j∈N (ii) (iii) (iv) (v) (vi) λn (jQ) = (2j)n . Siehe Korollar 10.55. Definiere N := [a, b] \ (a, b) und M := A \ (a, b). Dann ist N eine Lebesgue Nullmenge und da das Lebesguemaß vollständig ist, auch M . Somit ist A = ˙ M ∪(a, b) messbar und es gilt λn (A) = λn ((a, b)) = Voln (a, b). Die Messbarkeit folgt aus einer Darstellung als Differenz zweier offener Mengen. Durch Umschließen mit einem großen Quader sehen wir, dass das Maß endlich ist. Dies ist gerade die Definition davon, dass eine Menge Maß Null hat. Eine einpunktige Menge ist eine Lebesgue Nullmenge. Somit gilt dies auch für eine abzählbare Menge. Durch ein einfaches Überdeckungsargument erhalten wir Beispiel 10.59. ? Eine Koodinatenhyperebene {xi = 0} und jede Teilmenge davon ist eine Lebesgue Nullmenge. 10.5.2. Die Regularität des Lebesgueschen Maßes. Definition 10.60. Sei X ein topologischer Raum und (X, A, µ) ein Maßraum mit B(X) ⊂ A. (i) Dann heißt µ von außen regulär, falls für jedes A ∈ A µ(A) = inf{µ(O) : O ⊂ X ist offen und A ⊂ O} gilt. (ii) µ heißt von innen regulär, falls für jedes A ∈ A µ(A) = sup{µ(K) : K ⊂ X ist kompakt und K ⊂ A} gilt. (iii) µ heißt regulär, falls (X, A, µ) bzw. µ von außen und von innen regulär ist. (iv) µ heißt lokal endlich, falls es zu jedem x ∈ X eine Umgebung U ∈ U(x) mit µ(U ) < ∞ gibt. (v) Ist B(X) = A, so heißt µ ein Borelsches Maß auf X. βn := λn |Bn heißt BorelLebesguesches Maß auf Rn . Bemerkung 10.61. (i) Ist µ lokal endlich, so gibt es zu jeder kompakten Menge K ⊂ X eine offene Umgebung U von K mit µ(U ) < ∞. Beweis. Einfaches Überdeckungsargument. (ii) Sei X Hausdorffsch und lokal kompakt, d. h. jeder Punkt in X besitzt eine kompakte Umgebung, dann ist µ genau dann lokal endlich, wenn für jede kompakte Menge K ⊂ X auch µ(K) < ∞ gilt. Beweis. Folgt direkt nach Definition und mit einem Überdeckungsargument. Theorem 10.62. Das Lebesguesche Maß ist regulär. Beweis. Sei A ∈ L(n) beliebig. 61 10.5. DAS LEBESGUESCHE MAß (i) Regularität von außen: Sei ε > 0 beliebig. Dann gibt es nach Definition Intervalle (Ij )j∈N ⊂ J(n) mit [ X A⊂ Ij und Voln (Ij ) ≤ λn (A) + ε. j∈N Somit gilt für O := S j∈N Ij j∈N λn (A) ≤ λn (O) ≤ X λn (Ij ) = j∈N X Voln (Ij ) ≤ λn (A) + ε. j∈N Daher ist λn von außen regulär. (ii) ? Regularität von innen: Wir nehmen zunächst zusätzlich an, dass A beschränkt ist. Sei ε > 0 beliebig. Sei C ⊂ Rn eine kompakte Menge mit A ⊂ C, beispielsweise ein großer abgeschlossener Würfel. Da µ von außen regulär ist, gibt es eine offene Menge O ⊂ Rn mit C \ A ⊂ O und λn (O) ≤ λn (C \ A) + ε. Nach Theorem 10.29 (ii) und wegen µ(A) < ∞ folgt λn (O) ≤ λn (C \ A) + ε ≤ λn (C) − λn (A) + ε. Wir definieren nun K := C \ O und erhalten K ⊂ A, C ⊂ K ∪ O sowie λn (C) ≤ λn (K ∪ O) ≤ λn (K) + λn (O) ≤ λn (K) + λn (C) − λn (A) + ε. Umstellen ergibt λn (A)−ε ≤ λn (K). Dies impliziert die Regularität von innen für beschränkte Teilmengen A ⊂ X. (iii) ? Sei nun A ∈ L(n) wieder beliebig. Sei ohne Einschränkung λn (A) 6= 0. Wir fixieren α > 0 mit α < λn (A). (Anders als bei einem Ansatz mit λn (A) − ε können wir damit auch den Fall λn (A) = ∞ mitbehandeln.) Wir definieren Bj := A ∩ Bj (0). Dann folgt nach Theorem 10.29 (iv) λn (A) = lim λn (Bj ). j→∞ Somit gibt es ein k ∈ N mit λn (Bk ) > α. Aufgrund der bereits gezeigten inneren Regularität für beschränkte Mengen existiert eine kompakte Menge K ⊂ X mit K ⊂ Bk ⊂ A und λn (K) > α. Da α < λn (A) beliebig war, folgt hieraus die Regularität von innen auch im Falle unbeschränkter Mengen. Korollar 10.63. Sei A ∈ L(n). Dann gibt es eine Fσ -Menge F und eine Gδ -Menge G mit F ⊂ A ⊂ G und λn (F ) = λn (A) = λn (G). Ist A beschränkt, so können wir auch G beschränkt wählen. Aus dem Beweis geht hervor, dass F sogar als Vereinigung von abzählbar vielen kompakten Mengen gewählt werden kann. Beweis. (i) Sei zunächst λn (A) < ∞. Dann gibt es aufgrund der Regularität von λn zu jedem k ∈ N>0 eine kompakte Menge Kk und eine offene Menge Ok mit Kk ⊂ A ⊂ Ok und 1 k ≤ λn (Kk ) ≤ λn (A) ≤ λn (Ok ) ≤ λn (A) + k1 . S T Wir definieren nun F := Kk und G := Ok . Dann gilt F ⊂ A ⊂ G λn (A) − k∈N>0 k∈N>0 und wir erhalten nach Theorem 10.29 (ii) λn (A \ F ) ≤ λn (A \ Kk ) ≤ 1 k und λn (G \ A) ≤ λn (Ok \ A) ≤ 1 k für jedes k ∈ N>0 . Da λn (F ) ≤ λn (A) < ∞ und λn (A) < ∞ gelten, folgt aus Theorem 10.29 (ii) λn (F ) = λn (A) = λn (G). (ii) Sei nun λn (A) = ∞. Dann gibt es aufgrund der inneren Regularität des Lebesguemaßes kompakte Mengen Kk ⊂ A mit λn (Kk ) ≥ k. Wir definieren S F := Kk sowie G := Rn und erhalten die Behauptung. k∈N 62 10. MAßTHEORIE (iii) Die Aussage über die Beschränktheit von G ist klar. Theorem 10.64. ? Sei O ⊂ Rn offen. Dann gibt es eine Folge paarweise disjunkter S Intervalle (Ij )j∈N ⊂ Rn von Intervallen der Form [a, b) mit a, b ∈ Qn und Ij = j∈N O. Für jede solche Folge gilt λn (O) = X Voln (Ij ). j∈N Beweis. Für k ∈ N definieren wir eine Familie von Würfeln o n n Wk := a + 0, 2−k : a ∈ 2−k Zn . n Jede dieser Familien überdeckt S R S . Sei Ok := {W ∈ Wk : W ⊂ O}. Dann ist W gilt und dass wir solche Würfel auswählen leicht einzusehen, dass O = k∈N W ∈Ok können, dass die Vereinigung disjunkt wird (kleine Übung). Wegen Theorem 10.29 (iv) ist die zweite Aussage klar. 10.5.3. Eine Charakterisierung Lebesgue messbarer Mengen. Definition 10.65. (i) Sei X ein topologischer Raum. Dann heißt X σ-kompakt, falls es eine Folge S (Kk )k∈N ⊂ P(X) kompakter Teilmengen von X mit Kk = X gibt. k∈N (ii) Eine Teilmenge M eines topologischen Raumes heißt σ-kompakt, falls M mit der von X induzierten Topologie σ-kompakt ist. Theorem 10.66. Sei A ⊂ Rn . Dann sind die folgenden Aussagen äquivalent: (i) A ist Lebesgue messbar. (ii) Es gibt eine σ-kompakte Teilmenge S ⊂ Rn und eine Lebesguesche Nullmenge N mit A = S ∪ N . Beweis. • „(i) =⇒ (ii)“: Da (Rn , L(n), λn )S ein σ-endlicher Maßraum ist, gibt es eine Folge (Aj )j∈N ⊂ L(n) mit A = Aj und λn (Aj ) < ∞. Zu jedem j ∈ N j∈N gibt es aufgrund des Beweises von Korollar 10.63 eine σ-kompakte Menge Sj ⊂ Rn mit Sj ⊂ Aj und λn (Sj ) = λn (Aj ). Definiere Nj := Aj \ Sj . Dann S ist Nj eine Nullmenge und es gilt Aj = Sj ∪ Nj . Wir definieren S S := Sj und N := Nj . Dann ist S eine σ-kompakte Menge und N j∈N j∈N eine Nullmenge und es gilt A = S ∪ N . • „(ii) =⇒ (i)“: Wegen B n ⊂ L(n) und da jede Nullmenge ebenfalls Lebesgue messbar ist, ist auch A = S ∪ N Lebesgue messbar. Theorem 10.67. Das Lebesguesche Maß λn ist die Vervollständigung des BorelLebesgueschen Maßes βn . Beweis. ? (i) Bβnn ⊂ L(n): Sei A ∈ Bβnn . Dann gibt es nach Definition B, N ∈ B n mit λn (N ) = 0 und M ⊂ N mit A = B ∪ M . Da λn vollständig ist, ist M eine Lebesgue Nullmenge. Wegen B n ⊂ L(n) folgt also A = B ∪ M ∈ L(n). Dies zeigt die behauptete Inklusion. (ii) L(n) ⊂ Bβnn : Sei A ∈ L(n). Wir haben in Theorem 10.66 gezeigt, dass es ein B ∈ B n und eine Lebesguesche Nullmenge M mit A = B ∪ M gibt. Nach Korollar 10.63 gibt es eine Menge G ∈ B n mit M ⊂ G und λn (G) = λn (M ) = 0. Nach Definition der Vervollständigung folgt damit G ∈ Bβnn und daher die Behauptung. 63 10.5. DAS LEBESGUESCHE MAß 10.5.4. Bilder Lebesgue messbarer Mengen. Theorem 10.68. Sei N ⊂ Rn eine λn -Nullmenge und f ∈ C 0,1 (N, Rm ) mit m ≥ n. Dann ist f (N ) eine λm -Nullmenge. Beweis. ? (i) Da jede λn -Nullmenge vermöge Rn × {0} ⊂ Rm auch eine λm -Nullmenge ist, genügt es den Satz für den Fall n = m zu beweisen. (Im Fall m > n braucht N nicht einmal eine λn -Nullmenge zu sein.) (ii) Sei f zunächst global Lipschitzstetig, d. h. es gibt L > 0 mit |f (x) − f (y)| ≤ |x−y| für alle x, y ∈ N . Sei ε > 0. Da N eine λn -Nullmenge ist, gibt es Quader und S sogar Würfel P(kleine Übung) P n(Ij )j∈N der Kantenlängen √ (aj )j∈N mit N ⊂ Ij und ε > λn (Ij ) = aj . Es gilt diam(Ij ) = aj n. Da f Lipschitz j∈N j∈N j∈N √ stetig mit Lipschitzkonstante L ist, folgt diam f (Ij ) ≤ Laj n. Somit √ gilt f (Ij ) ⊂ Jj für einen abgeschlossenen Quader der Kantenlänge 2Laj n und Voln (Jj ) = 2n Ln anj nn/2 = cS abhängige Konstante n λn (Ij ) für Peine nur von nP cn > 0. Somit ist f (N ) ⊂ Jj mit λn (Jj ) = cn λn (Ij ) < cn ε. Dies j∈N j∈N j∈N zeigt die Behauptung für eine global Lipschitzstetige Funktion f . (iii) Sei nun f : N → Rn lokal Lipschitz stetig, d. h. zu jedem x ∈ N gibt es ein Ux ∈ U(x), so dass f |Ux ∩N global Lipschitz stetig ist. Da auch Ux ∩ N eine λn -Nullmenge ist, ist f (Ux ∩ N ) nach dem bereits Gezeigten ebenfalls eine λn Nullmenge. Da N als Teilmenge von Rn ein separabler und somit Lindelöfscher Raum ist, besitzt die Überdeckung {Ux ∩ N : x ∈ N } eine abzählbare Teilüberdeckung {Ux ∩SN : x ∈ N0 } mit einer abzählbaren Menge N0 ⊂ N . Wir erhalten f (N ) = f (Ux ∩ N ). Somit ist f (N ) die abzählbare Vereinigung x∈N0 von λn -Nullmengen und somit selbst eine λn -Nullmenge. Korollar 10.69. Sei U ⊂ Rn offen. Sei f ∈ C 1 (U, Rm ) mit m ≥ n. Ist N ⊂ U eine λn -Nullmenge, so ist auch f (N ) eine λm -Nullmenge. Damit können wir zeigen, dass das Bild einer Lebesgue messbaren Menge wieder Lebesgue messbar ist. Theorem 10.70. Seien A ∈ L(n) und f ∈ C 0,1 (A, Rm ) mit m ≥ n. Dann gilt auch f (A) ∈ L(m). Beweis. Nach Theorem 10.66 gibt es eine σ-kompakte Teilmenge S ⊂ Rn und eine λn -Nullmenge N mit A = S ∪ N . Da f stetig ist, ist auch f (S) wieder σ-kompakt. Nach Theorem 10.68 ist auch f (N ) eine λm -Nullmenge. Nochmals nach Theorem 10.66 gilt daher auch f (A) = f (S) ∪ f (N ) ∈ L(m). Korollar 10.71. ? Seien U ⊂ Rn offen und f ∈ C 1 (U, Rm ) mit m ≥ n. Sei A ∈ L(n) mit A ⊂ U . Dann folgt f (A) ∈ L(m). Die folgenden Beispiele zeigen, dass unsere Voraussetzungen in den obigen Resultaten auch nötig sind. Bemerkung 10.72. ? (i) Stetige Bilder von Nullmengen sind i. Allg. keine Nullmengen mehr. Betrachte dazu raumfüllende Kurven. (ii) Ohne die Bedingung m ≥ n an die Dimensionen sind die Bilder von Nullmengen i. Allg. keine Nullmengen mehr. Betrachte dazu R2 3 (x, 0) 7→ x ∈ R. (iii) Es gibt A ∈ L(n) und f ∈ C 0 (A, Rm ) mit m ≥ n und f (A) 6∈ L(n). (Siehe [1, Bemerkung 5.14 (a)].) 64 10. MAßTHEORIE (iv) Es gibt A ∈ L(n) und f ∈ C 0,1 (A, Rm ) mit m < n, so dass f (A) nicht messbar ist. (Sei V eine nicht messbare Teilmenge von R. Dann ist V × {0} ⊂ R2 eine Nullmenge und daher messbar, jedoch ist die Projektion auf die erste Komponente nicht messbar.) (v) Sei A ⊂ Rn . Dann ist A genau dann Lebesgue messbar, wenn es zu jedem x ∈ A eine offene Umgebung U ∈ U(x) gibt, so dass A ∩ U messbar ist. Beweis. • „=⇒“: Klar ist, dass aus der Lebesgue Messbarkeit von A auch die von A ∩ U für jede offene Umgebung U von x ∈ A folgt. • „⇐=“: Wähle zu jedem Punkt eine solche offene Umgebung Ux . Da A als Teilmenge eines separablen Raumes auch selbst separabel und damit Lindelöfsch ist, gibt es eine höchstens abzählbare Teilmenge A0 ⊂ A mit S S A⊂ Ux . Es folgt A = Ux ∩ A. Somit haben wir A als höchstens x∈A0 x∈A0 abzählbare Vereinigung messbarer Mengen dargestellt. Daher ist A selbst ebenfalls messbar. 10.5.5. Die Translationsinvarianz des Lebesgueschen Maßes. Definition 10.73. ? Sei a ∈ Rn . Dann heißt die Abbildung τa mit Rn 3 x 7→ x + a ∈ Rn Translation um den Vektor a ∈ Rn . Lemma 10.74. Die Borelsche und die Lebesguesche σ-Algebra über Rn sind translationsinvariant, d. h. es gelten τa (B n ) = B n und τa (L(n)) = L(n) für alle a ∈ Rn . Beweis. ? (i) Urbilder von Borelmengen unter stetigen Funktionen sind wieder Borelmen−1 gen. Sei a ∈ Rn . Damit folgt τa (B n ) = τ−a (B n ) ⊂ B n . Angewandt mit −a n n statt a erhalten wir τ−a (B ) ⊂ B und wir erhalten daraus B n = τa ◦ τ−a (B n ) ⊂ τa (B n ) ⊂ B n . (ii) Da Translationen glatte Abbildungen sind, erhalten wir mit Theorem 10.70 τb (L(n)) ⊂ L(n) für alle b ∈ Rn und daher L(n) = τa (τ−a (L(n))) ⊂ τa (L(n)) ⊂ L(n). Somit gilt überall in dieser Formel Gleichheit. Theorem 10.75. Das Lebesguesche und das Borel-Lebesguesche Maß sind translationsinvariant, d. h. für alle a ∈ Rn gelten λn = λn ◦ τa und βn = βn ◦ τa . Beweis. ? Die Lebesgue messbaren und die Borel messbaren Mengen sind translationsinvariant. Ebenso ist die Menge der Quader translationsinvariant und das Volumen Voln : J(n) → R ist unabhängig von Translationen. Somit folgt die Behauptung nach Definition. Haarsche Maße verallgemeinern translationsinvariante Maße. Der folgende Satz ist für offene Mengen eine einfache Übungsaufgabe. Theorem 10.76 (Steinhaus). ? Sei A ∈ L(n) mit λn (A) > 0. Dann ist A − A eine Nullumgebung. Beweis. Durch Schneiden mit einer großen Kugel dürfen wir ohne Einschränkung annehmen, dass zusätzlich A beschränkt ist und somit λn (A) < ∞ gilt. Da das Lebesguemaß regulär ist, gibt es eine kompakte Menge K und eine offene Menge O mit K ⊂ A ⊂ O und 0 < λn (K) < λn (O) ≤ 23 λn (K). 65 10.5. DAS LEBESGUESCHE MAß Da die abgeschlossenen Mengen K und {O disjunkt sind und K kompakt ist, ist δ := d K, {O > 0. Sei x ∈ Bδ (0) beliebig. Wir behaupten, dass K ∩ (x + K) 6= ∅ gilt. Sonst erhalten wir aus der Additivität und Translationsinvarianz λn (K∪(x+K)) = λn (K)+λn (x+ K) = 2λn (K). Nach Definition von δ gelten x + K ⊂ O und K ∪ (x + K) ⊂ O. Daraus folgt 2λn (K) = λn (K ∪ (x + K)) ≤ λn (O) ≤ 23 λn (K). Widerspruch. Also ist K ∩ (x + K) 6= ∅ für alle x ∈ Bδ (0), d. h. es gibt y, z ∈ K mit y = x + z. Somit erhalten wir Bδ (0) ⊂ K − K ⊂ A − A wie behauptet. 10.5.6. Eine Charakterisierung des Lebesgueschen Maßes. Theorem 10.77. Sei µ ein translationsinvariantes lokal endliches Maß auf B n bzw. L(n). Dann gilt µ = αn βn bzw. µ = αn λn mit αn := µ ([0, 1)n ). Beweis. ? (i) Wir zeigen zunächst µ([a, b)) = αn Voln ([a, b)) für alle a, b ∈ Rn . Dazu benutzen wir vollständige Induktion nach n. Sei zunächst n = 1. Definiere g(s) := µ([0, s)) für s > 0. Die Funktion g : (0, ∞) → (0, ∞) ist wachsend und es gilt aufgrund der Translationsinvarianz von µ ˙ s + t)) g(s + t) = µ([0, s + t)) = µ([0, s)∪[s, = µ([0, s)) + µ([s, s + t)) = µ([0, s)) + µ([0, t)) = g(s) + g(t) für beliebige s, t > 0. Per Induktion erhalten wir g(s) = sg(1) zunächst für s ∈ Q und dann aufgrund der Monotonie auch für beliebige s > 0. Es gilt s = Vol1 ([0, s)) nach Definition des Volumens und α1 = µ([0, 1)) nach Definition von α1 . Somit erhalten wir µ([0, s)) = g(s) = sg(1) = sµ([0, 1)) = Vol1 ([0, s))α1 für alle s > 0. Daher gilt µ([α, β)) = µ([0, β − α)) = α1 Vol1 ([0, β − α)) = α1 Vol1 ([α, β)) für alle α, β ∈ R wie behauptet. (ii) Sei nun n ≥ 2. Fixiere dazu a0 , b0 ∈ Rn−1 und definiere für α, β ∈ R µ1 ([α, β)) := µ([α, β) × [a0 , b0 )). Definiert man allgemeiner für A ∈ B 1 bzw. A ∈ L(1) µ1 (A) := µ(A × [a0 , b0 )), so erhalten wir ein translationsinvariantes lokal endliches Maß auf B 1 bzw. L(1). Daher können wir die Induktionsannahme n = 1 anwenden und erhalten µ1 ([α, β)) = µ1 ([0, 1)) Vol1 ([α, β)) für alle α, β ∈ R. Seien nun a = a1 , . . ., an , b = b1 , . . . , bn ∈ Rn beliebig. Wir definieren dazu a0 := a2 , . . . , an und b0 := b2 , . . . , bn und benutzen nachfolgend µ1 mit diesen Vektoren a0 , b0 ∈ Rn−1 . Es folgt µ([a, b)) = µ a1 , b1 × [a0 , b0 ) = µ1 a1 , b1 = µ1 ([0, 1)) Vol1 a1 , b1 (siehe oben) 1 1 0 0 = µ ([0, 1) × [a , b )) Vol1 a , b . Eine analoge Argumentation für die anderen Komponenten mit Induktion liefert nun n Y µ([a, b)) = µ ([0, 1)n ) Vol1 aj , bj = αn Voln ([a, b)). j=1 66 10. MAßTHEORIE Dies zeigt die Behauptung des Theorems für linksseitig abgeschlossene Quader. (iii) Sei nun A ∈ Bn bzw. A ∈ L(n) beliebig. Sei (Ij )j∈N ⊂ Jl (n) eine Folge von linksseitig abgeschlossenen Quadern, die A überdeckt. Dann folgt X X µ(A) ≤ µ(Ij ) = αn λn (Ij ). j∈N j∈N Da es in der Definition des Lebesgueschen äußeren Maßes egal war, welche Quader wir benutzen, siehe Theorem 10.40, können wir das Infimum über alle solchen Überdeckungen betrachten und erhalten µ(A) ≤ αn λ∗n (A) = αn λn (A), da auf B n bzw. L(n) stets λ∗n = λn gilt. (iv) Die umgekehrte Ungleichung zeigen wir durch Betrachtung von Komplementen. Sei dazu zunächst B ∈ B n bzw. B ∈ L(n) beschränkt. Wir wählen einen großen Quader I ∈ Jl (n) mit B ⊂ I ⊂ I. I ist kompakt und µ ist lokal endlich. Daher gilt µ I < ∞. Es folgt µ(B) < ∞ und ebenso gilt λn (B) < ∞. Daher erhalten wir nach (ii), nach Theorem 10.29 (ii) (zweimal) und (iii) (ii) αn λn (I) − µ(B) = µ(I) − µ(B) (iii) ≤ αn λn (I \ B) Thm. 10.29 µ(I \ B) Thm. 10.29 αn λn (I) − αn λn (B). = = Die Terme ohne B heben sich gegenseitig weg und wir erhalten mit (iii) die behauptete Gleichheit µ(B) = αn λn (B). (v) Sei nun A ∈ B n bzw. A ∈ L(n) beliebig. Wir definieren beschränkte Mengen Bj := A ∩ Bj (0) in B n bzw. L(n) für j ∈ N und erhalten µ(A) Thm. 10.29 = (iv) lim µ(Bj ) = αn lim λn (Bj ) j→∞ j→∞ Thm. 10.29 = αn λn (A) wie behauptet. Bemerkung 10.78. ? Es ist wichtig, dass µ lokal endlich ist. Sonst ist das Zählmaß H0 auf B n bzw. L(n) ein Gegenbeispiel. 10.5.7. Die Bewegungsinvarianz des Lebesgueschen Maßes. Wir wollen mit Theorem 10.77 das Lebesguesche Maß und das Hausdorffmaß vergleichen. Dazu benötigen wir als Vorbereitung Lemma 10.79. Das n-dimensionale Hausdorffmaß Hn auf Rn ist lokal endlich und es gilt Hn ([0, 1)n ) > 0. Beweis. (i) Lokal endlich: Zunächst sind Borelmengen H∗n -messbar, siehe Bemerkung 10.56. (Dies war in der Definition von „lokal endlich“ bereits gefordert worden.) Wir wählen nun Würfel als Umgebungen von Punkten und wollen zeigen, dass deren n-dimensionales Hausdorffmaß Hn endlich ist. Der Würfel [−a, a]n lässt sich in mn gleich große Würfel der Kantenlänge 2a m und mit Durchmesser 2a √ n (bis auf Seitenflächen) disjunkt zerlegen. Für große Werte von m sind m diese Durchmesser kleiner als ein beliebig festes ε > 0. Somit erhalten wir n 2a √ n n n Hε ([−a, a] ) ≤ |{z} m = 2n an nn/2 . n m Anzahl | {z } Durchmesser Somit bleibt die linke Seite für ε & 0 beschränkt und wir erhalten, dass jeder Punkt eine Umgebung mit endlichem Hn -Maß besitzt. 67 10.5. DAS LEBESGUESCHE MAß (ii) Positivität: Sei ε > 0 beliebig. (Wir arbeiten hier mit den Maßen Hεn , weil das näher an der Definition des Hausdorffmaßes ist. Letztlich benötigen wir jedoch keine Durchmesserschranke ε.) Sei (Uj )j∈N ⊂ P(Rn ) eine beliebige Folge mit diam Uj < ε, j ∈ N, die [0, 1)n überdeckt. Zu jeder dieser Mengen Uj , j ∈ N gibt es einen Würfel Ij mit Kantenlänge ≤ 2 diam Uj und Uj ⊂ Ij . Somit erhalten wir X X 1 = λn ([0, 1)n ) ≤ Voln (Ij ) ≤ 2n (diam Uj )n . j∈N j∈N Daraus folgt 2−n ≤ Hεn ([0, 1)n ) für alle ε > 0 und somit erhalten wir die Abschätzung Hn ([0, 1)n ) ≥ 2−n > 0. Korollar 10.80. Das n-dimensionale Hausdorffsche Maß Hn auf Rn ist eine Erweiterung von αn λn mit αn := Hn ([0, 1)n ), d. h. jedes A ∈ L(n) ist Hn -messbar und es gilt für solche Mengen Hn (A) = αn λn (A). Beweis. ? (i) Nach Lemma 10.79 ist das Hn -Maß auf Rn lokal endlich. Direkt aus der Definition folgt, dass Hn translationsinvariant ist, d. h. es gilt Hn (A) = Hn (τa (A)) für alle A ⊂ Rn und alle Translationen τa . Somit folgt nach Theorem 10.77 Hn (A) = αn λn (A) für alle A ∈ B n . Es bleibt zu zeigen, dass L(n)-Mengen auch Hn -messbar sind und dass die Gleichheit auch für A ∈ L(n) gilt. (ii) Lebesguesche Nullmengen sind auch Hausdorffsche Nullmengen: Anschaulicher Beweis: Sei ε > 0 eine beliebige Durchmesserschranke. Sei δ > 0 ebenfalls beliebig. Dann gibt es nach Definition eine Folge (Ij )j∈N P S von Quadern mit Voln (Ij ) < δ und N ⊂ Ij . Ohne Einschränkung j∈N j∈N dürfen wir annehmen, dass jeder Quader einen Durchmesser < ε hat, sonst zerlegen wir jeden Quader so lange in 2n kongruente kleinere Quader, bis dies erfüllt ist; die Summe der Volumina bleibt dabei unverändert. Weiterhin dürfen wir ohne Einschränkung annehmen, dass die längste Kantenlänge jedes dieser Quader maximal die doppelte Länge der kürzesten Seite besitzt. Sonst halbieren wir diesen Quader senkrecht zu dieser längsten Kante und iterieren dies gegebenenfalls. Nun sind die Volumina und (diam Ij )n für jeden dieser Quader bis auf positive Faktoren c(n) gegeneinander abgeschätzt. Somit ist c(n)δ eine obere Schranke für das Hausdorffmaß. Es folgt die Behauptung. Analog zeigt man auch leicht, dass jede Hausdorff Nullmenge eine Lebesguesche Nullmenge ist. Formalerer Beweis: Sei N eine Lebesguesche Dann PNullmenge und sei ε > 0. S Voln (Ij ) < ε und N ⊂ Ij . gibt es eine Folge (Ij )j∈N von Quadern mit j∈N j∈N Nach (i) erhalten wir H∗n (Ij ) = Hn (Ij ) = αn λn (Ij ) für alle j ∈ N. Es folgt X [ X H∗n (N ) ≤ H∗n Ij ≤ H∗n (Ij ) = αn Voln (Ij ) < αn ε. j∈N j∈N j∈N Daher ist N auch eine Hn -Nullmenge. (iii) Sei nun A ∈ L(n). Nach Theorem 10.66 können wir A = S ∪ N mit einer σ-kompakten Menge S und somit S ∈ B n und einer λn - und daher auch Hn Nullmenge N schreiben. Somit ist A auch Hn -messbar. Daher folgen aus (i) und (ii) Hn (A) ≤ Hn (S) + Hn (A) = Hn (S) = αn λn (S) ≤ αn λn (A) 68 10. MAßTHEORIE und analog αn λn (A) = αn λn (S) = Hn (S) ≤ Hn (A). Es folgt Hn (A) = αn λn (A) für alle A ∈ L(n) wie behauptet. Korollar 10.81. Das Lebesguesche und das Borel-Lebesguesche Maß sind bewegungsinvariant, d. h. für jede Bewegung ϕ des Rn gelten λn = λn ◦ϕ und βn = βn ◦ϕ. Wir erinnern daran, dass eine Bewegung eine Selbstabbildung des Rn ist, die Abstände erhält und benutzen, dass sich jede Bewegung ϕ : Rn → Rn in der Form ϕ(x) = T x + a mit T ∈ O(n) und a ∈ Rn schreiben lässt. Beweis. ? Sei ϕ : Rn → Rn eine Bewegung. Sei A ∈ L(n) bzw. A ∈ B n . Dann gilt nach Theorem 10.70 auch ϕ(A) ∈ L(n) bzw., da ϕ eine offene Abbildung ist, auch ϕ(A) ∈ B n . Direkt nach Definition ist das Hausdorffmaß bewegungsinvariant. Somit erhalten wir mit Theorem 10.77 αn λn (ϕ(A)) = Hn (ϕ(A)) = Hn (A) = αn λn (A). Nach Lemma 10.79 ist αn > 0. Somit folgt die Behauptung. 10.5.8. Der spezielle Transformationssatz. Theorem 10.82. Sei T ∈ L(Rn ). Dann gilt λn (T (A)) = | det T | · λn (A) für alle A ∈ L(n). Beweis. ? (i) Nach Theorem 10.70 gilt T (A) ∈ L(n). (ii) Ist det T = 0, so liegt T (A) in einer Hyperebene. Da λn bewegungsinvariant ist, können wir ohne Einschränkung annehmen, dass dies eine Koordinatenhyperebene ist. Teilmengen von Koordinatenhyperebenen sind aber λn Nullmengen. Somit folgt die Behauptung in diesem Fall. (iii) Gelte also det T 6= 0. Wir definieren µ(A) := λn (T (A)) für A ∈ L(n). Es ist leicht zu sehen, dass µ ein lokal endliches translationsinvariantes Maß auf L(n) ist. Nach Theorem 10.77 gilt somit µ = µ ([0, 1)n ) λn . Somit folgt die Behauptung, wenn wir noch λn (T ([0, 1)n )) = | det T | zeigen. (iv) Ist (T e1 , . . . , T en ) eine Permutation der Standardbasis (e1 , . . . , en ), so gilt T ([0, 1)n ) = [0, 1)n und daher | det T | = 1 wie behauptet. (v) Sei T bezüglich der Standardbasis durch die Matrix α 0 ··· 0 0 1 · · · 0 .. .. . . . . . . .. 0 0 ··· 1 mit α ∈ R6=0 dargestellt. Dann gelten | det T | = |α| und ( [0, α) × [0, 1)n−1 , für α > 0, n T ([0, 1) ) = n−1 (−α, 0] × [0, 1) , für α < 0. Somit gilt auch hier | det T | = |α| = λn (T ([0, 1)n )) wie behauptet. 10.5. DAS LEBESGUESCHE MAß 69 (vi) Sei nun T bezüglich der Standardbasis durch 1 0 0 ··· 0 1 1 0 · · · 0 0 0 1 · · · 0 .. .. .. . . .. . . . . . 0 0 0 ··· 1 dargestellt. Dann gilt det T = 1. T ([0, 1)n ) hat die Form A×[0, 1)n−2 , wobei A ein „linksseitig abgeschlossenes“ Parallelogramm mit Ecken (0, 0), (1, 1), (1, 2) und (0, 1) ist.Wir definieren B1 := A × [0, 1)n−2 ∩ {x2 < 1} und B2 := A × [0, 1)n−2 \ B1 . Es gelten B1 , B2 ∈ B n , B1 ∪ (B2 − e2 ) = [0, 1)n sowie B1 ∩ (B2 − e2 ) = ∅. Da λn translationsinvariant ist, erhalten wir λn (T ([0, 1)n )) = λn (B1 ∪ B2 ) = λn (B1 ) + λn (B2 ) = λn (B1 ) + λn (B2 − e2 ) = λn ([0, 1)n ) = 1. Also gilt auch in diesem Fall die Behauptung. (vii) Sei nun T ∈ L(Rn ) beliebig mit det T 6= 0. Dann lässt sich T mit Zeilenund Spaltenumformungen auf die Einheitsmatrix bringen. Dies bedeutet, dass T = T1 ◦ . . . ◦ Tk für Matrizen Tj , 1 ≤ j ≤ k, wie oben behandelt, gilt. Für jede dieser Abbildungen/Matrizen können wir daher die Behauptung bereits benutzen. Damit erhalten wir mit dem Determinantenmultiplikationssatz λn (T (A)) = λn ((T1 ◦ . . . ◦ Tk )(A)) = | det T1 | · λn ((T2 ◦ . . . ◦ Tk )(A)) = | det T1 | · | det T2 | · . . . · | det Tk | · λn (A) = | det T | · λn (A). Die Behauptung folgt. Korollar 10.83. Es gilt λn (Br (0)) = rn λn (B1 (0)). Beweis. Für T x = rx gilt det T = rn . 10.5.9. Nicht Lebesgue messbare Mengen ?. Lemma 10.84. Es gibt eine nicht Lebesgue messbare Teilmenge A ⊂ R. Beweis. Sei B ⊂ R eine Q-Basis des Q-Vektorraumes R. Sei b0 ∈ B. Wir definieren A := hB \ {b0 }i. Wir behaupten, dass A nicht messbar ist. Dies zeigen wir durch einen Widerspruchsbeweis. Es gilt λ1 (A) > 0, da wir sonst [ λ1 (R) = λ1 A + qb0 = 0 q∈Q erhalten. Somit können wir Theorem 10.76 anwenden und erhalten, dass A − A eine Nullumgebung ist. Da A ein Vektorraum ist, folgt zunächst A − A = A und dann, da A eine Nullumgebung ist, A = R. Widerspruch. Weitere Resultate in diese Richtung finden sich in [1, S. 55 ff.]. 70 11. INTEGRATIONSTHEORIE 11. Integrationstheorie 11.1. Messbare Funktionen. Sei (X, A, µ) in diesem Kapitel stets ein σ-endlicher vollständiger Maßraum und sei E ein Banachraum. 11.1.1. Einfache und messbare Funktionen. Definition 11.1 (µ-fast überall). Sei A eine Aussageform auf X. Dann sagen wir, dass A µ-fast überall, kurz µ-f. ü., gilt, falls es eine µ-Nullmenge N gibt, so dass A(x) für alle x ∈ X \ N gilt. Beispiele 11.2. ? (i) Seien f, g : X → R Funktionen. Dann gilt f ≥ g µ-fast überall, falls es eine µ-Nullmenge N gibt, so dass für jedes x ∈ X \ N die Aussage f (x) ≥ g(x) gilt. (ii) Seien f, fj : X → E, j ∈ N, Funktionen. Dann konvergiert fj fast überall gegen f , falls es eine µ-Nullmenge N mit fj (x) → f (x) für alle x ∈ X \ N gibt. (iii) Eine Abbildung f : X → E ist genau dann µ-fast überall beschränkt, wenn es eine µ-Nullmenge N und ein c ≥ 0 mit kf (x)k ≤ c für alle x ∈ X \ N gibt. (iv) Gelte eine Aussage(form) A µ-fast überall. Dann ist die Menge {x ∈ X : A(x) gilt nicht} eine µ-Nullmenge. Beweis. Als Teilmenge einer Nullmenge in einem vollständigen Maßraum ist diese Menge selbst wieder eine Nullmenge. (Dieses Resultat gilt in einem nicht vollständigen Maßraum i. a. nicht.) Funktionen, die insbesondere nur endlich viele Werte annehmen, heißen einfach. Definition 11.3 (µ-einfach). Eine Funktion f : X → E heißt µ-einfach, falls die folgenden Eigenschaften erfüllt sind: (i) f (X) ist endlich, (ii) f −1 ({e}) ∈ A für jedes e ∈ E und (iii) µ f −1 (E \ {0}) < ∞. Wir bezeichnen die Teilmenge der µ-einfachen Funktionen unter allen Abbildungen X → E mit EF(X, µ, E). Definition 11.4. Eine Funktion f : X → E heißt µ-messbar, falls es eine Folge (fj )j∈N ⊂ EF(X, µ, E) mit fj → f für j → ∞ µ-fast überall in X gibt. Wir definieren L0 (X, µ, E) := {f : X → E : f ist µ-messbar}. Bemerkung 11.5. ? (i) Ist klar, um welchen Maßraum es sich handelt, so sprechen wir auch von einfachen bzw. messbaren Funktionen statt von µ-einfachen bzw. µ-messbaren Funktionen. (ii) Einfachheit und Messbarkeit kann man analog auch für nicht vollständige Maßräume definieren. Bemerkung 11.6. (i) ? Es gilt EF(X, µ, E) ⊂ L0 (X, µ, E) ⊂ Abb(X, E) und alle diese Räume sind Vektorräume bzw. Untervektorräume. 11.1. MESSBARE FUNKTIONEN 71 (ii) Seien m ∈ N, ej ∈ E, Aj ∈ A mit µ(Aj ) < ∞, 1 ≤ j ≤ m. Definiere m P ej χAj , wobei χAj wie üblich die charakteristische Funktion der Menge f := j=1 Aj bezeichnet. Dann gilt f ∈ EF(X, µ, E). Gelten außerdem ej 6= 0 für 1 ≤ j ≤ m und ej 6= ek sowie Aj ∩ Ak = ∅ für m P alle 1 ≤ j 6= k ≤ m, so heißt ej χAj Normalform der einfachen Funktion f . j=1 (iii) ? Jede einfache Funktion besitzt eine (bis auf Umnummerierung) eindeutig bestimmte Normalform. (iv) ? Seien f : X → E und g : X → K µ-einfach bzw. µ-messbar. Dann sind auch kf k : X → R und gf µ-einfach bzw. µ-messbar. Insbesondere sind EF(X, µ, K) und L0 (X, µ, K) Unteralgebren von Abb(X, K). (v) ? Sei A ∈ A und f : X → E eine Abbildung. Definiere das Maß ν auf {B ∈ A : B ⊂ A} als Einschränkung von µ auf diese Menge. Dann sind die folgenden Aussagen äquivalent: (a) f |A ∈ EF(A, ν, E) bzw. f |A ∈ L0 (A, ν, E) und (b) χA f ∈ EF(X, µ, E) bzw. χA f ∈ L0 (X, µ, E). Beweis. Übung. (vi) ? Sei f ∈ L0 (X, µ, K). Dann ist g : X → R mit ( 1 , f (x) 6= 0, g(x) := f (x) 0, sonst ebenfalls µ-messbar. Entsprechendes gilt für µ-einfache Funktionen. (vii) ? Sei e ∈ E \ {0} und gelte µ(X) = ∞. Dann gilt χX e ∈ L0 (X, µ, E), da (X, A, µ) σ-endlich ist, jedoch ist χX e 6∈ EF(X, µ, E). 11.1.2. Ein Messbarkeitskriterium. Definition 11.7. Sei f : X → E eine Funktion. (i) f heißt A-messbar, falls Urbilder offener Mengen messbar sind, d. h. f −1 (O) ist für alle offenen O ⊂ E messbar. (ii) ? Gibt es eine µ-Nullmenge N ⊂ X, so dass f (X \ N ) separabel ist, so heißt f µ-fast separabelwertig. Bemerkung 11.8. ? (i) Jede Teilmenge und daher insbesondere jeder Unterraum eines separablen metrischen Raumes ist separabel. (ii) Ist E separabel, so ist jede Funktion f : X → E µ-fast separabelwertig. (iii) Jeder endlichdimensionale normierte Vektorraum ist separabel. Daher sind alle Funktionen f : X → Rn µ-fast separabelwertig. Theorem 11.9. ? Sei f : X → E eine Funktion. Dann ist f genau dann µ-messbar, wenn sie A-messbar und µ-fast separabelwertig ist. Beweis. • „=⇒“: Sei f µ-messbar, d. h. f ∈ L0 (X, µ, E), also durch einfache Funktionen approximierbar. µ-fast separabelwertig: ? Nach Definition gibt es eine Folge (ϕj )j∈N ⊂ EF(X, µ, E) einfacher Funktionen, die f fast überall approximieren. Also existiert eine Nullmenge N ⊂ XSmit ϕj (x) → f (x) für j → ∞ für alle x ∈ X \ N . Die Bildmenge F := ϕj (X) ist separabel und somit ist auch j∈N F separabel. Aufgrund der Konvergenz ϕj (x) → f (x) gilt f (X \ N ) ⊂ F . 72 11. INTEGRATIONSTHEORIE Als Teilmenge eines separablen metrischen Raumes ist auch f (X \N ) selbst wieder separabel. A-Messbarkeit: Sei O ⊂ E eine beliebige offene Teilmenge. Definiere für n ∈ N>0 die Mengen On := y ∈ O : dist(y, E \ O) > n1 . Nach Definition ist On offen und es gilt On ⊂ O. Sei x ∈ X \ N . Aufgrund der Konvergenz sind für x ∈ X \ N die Aussagen f (x) ∈ O und ∃ n > 0 ∃ m > 0 ∀ j ≥ m : ϕj (x) ∈ On äquivalent. Wir erhalten daraus [ \ f −1 (O) ∩ (X \ N ) = ϕ−1 j (On ) ∩ (X \ N ). n,m>0 j≥m Es gilt ϕ−1 j (On ) ∈ A für alle n > 0 und alle j ∈ N, denn ϕj ist eine µ-einfache Funktion und für µ-einfache Funktionen gilt ϕ−1 j (Z) ∈ A für beliebige Mengen Z ⊂ E. Da A eine σ-Algebra ist, folgt somit auch f −1 (O) ∩ (X \ N ) ∈ A. Das Maß µ ist vollständig. Somit ist mit N auch f −1 (O) ∩ N eine µNullmenge und wir erhalten f −1 (O) = f −1 (O) ∩ (X \ N ) ∪ f −1 (O) ∩ N ∈ A. • „⇐=“: Sei nun f µ-fast separabelwertig und A-messbar. Wir betrachten die Fälle µ(X) < ∞ und µ(X) = ∞ separat. µ(X) < ∞: Sei n ∈ N. Nach Voraussetzung gibt es eine µ-Nullmenge, so dass f (X \N ) separabel ist. Daher gibt es eine abzählbare dichte Teilmenge {ej : j ∈ N} von f (X \ N ). Kleine Kugeln um diese Punkte überdecken die Menge f (X \ N ) bereits und daher gilt [ 1 (ej )) . X=N∪ f −1 (B n+1 {z } j∈N | =:Xj,n Da f eine A-messbare Funktion ist, gilt Xj,n ∈ A für alle j, n ∈ N. Wegen µ(X) < ∞ und der Stetigkeit von unten können wir X bis auf eine Menge von kleinem Maß bereits mit endlich vielen Mengen überdecken: Es gibt m = m(n) ∈ N, so dass ! m [ 1 µ X\ Xj,n ≤ n+1 2 j=0 {z } | =:Yn gilt. Auf den Mengen Xj,n wollen wir nun (ϕn )n∈N ⊂ EF(X, µ, E) als ej definieren, müssen diese aber auf den Schnitten von Mengen Xj,n leicht modifizieren und setzen daher j−1 e , x ∈ X \ S X , 0 ≤ j ≤ m(n), j j,n k,n ϕn (x) := k=0 0, sonst. Nach Definition folgt |ϕn (x)−f (x)| ≤ 1 n+1 für x ∈ X\Yn = m S Xj,n . Würde j=0 das Maß der Ausnahmemengen Yn nicht nur immer kleiner, sondern wären diese Mengen auch ineinander enthalten, so folgte die Behauptung. Nun benötigen wir jedoch noch eine Zusatzkonstruktion. Wir setzen ∞ S Zn := Yn+k und erhalten eine absteigende Folge von Mengen mit der k=0 Abschätzung µ(Zn ) ≤ ∞ P k=0 µ(Yn+k ) ≤ 1 2n . Somit ist Z := T n∈N Zn aufgrund 73 11.1. MESSBARE FUNKTIONEN der Stetigkeit von µ von oben eine µ-Nullmenge. Wir definieren ( ϕn (x), x ∈ X \ Zn , ψn (x) := 0, x ∈ Zn . Es gilt (ψn )n∈N ⊂ EF(X, µ, E). Sei nun x ∈ X \ Z beliebig. Dann gibt es ein m ∈ N mit x 6∈ Zm . Da die Folge (Zn )n∈N absteigend ist, folgt für alle n ≥ m ebenso x 6∈ Zn und wir erhalten |ψn (x) − f (x)| = |ϕn (x) − f (x)| ≤ 1 n+1 für alle n ≥ m, da x 6∈ Yn für alle n ≥ m gilt. Daher gilt lim ψn (x) = f (x) für alle x 6∈ Z. n→∞ Somit ist f eine µ-messbare Funktion. µ(X) = ∞: Nach Generalvoraussetzung ist (X, µ, A) ein σ-endlicher Maßraum. S Somit erhalten wir eine disjunkte Folge von Mengen (Xj )j∈N ⊂ A mit Xj = X und µ(Xj ) < ∞ für alle j ∈ N. Wir haben gerade im j∈N Fall µ(Xj ) < ∞ gezeigt, dass es für jedes j ∈ N eine Folge (ϕj,k )k∈N ⊂ EF(X, µ, E) und eine Nullmenge Nj mit ϕj,k (x) → f (x) für k S → ∞ und x ∈ Xj \ Nj gibt. Wir definieren nun die Nullmenge N := Nj , die j∈N nichts mit N aus dem Fall µ(X) < ∞ zu tun hat, und als Funktionenfolge (ϕk )k∈N ⊂ EF(X, µ, E) eine Art Diagonalfolge: ( ϕj,k (x), x ∈ Xj für ein j ≤ k, ϕk (x) := 0, sonst. Nach Definition gilt für k → ∞ und alle x ∈ X \ N die Aussage ϕk (x) → f (x). Dies zeigt die Behauptung auch in diesem Fall. Korollar 11.10. Sei E separabel und f : X → E eine Abbildung. Dann sind die folgenden Aussagen äquivalent: (i) f ist µ-messbar und (ii) f ist A-messbar. Dies folgt zwar direkt aus Theorem 11.9, der besseren Lesbarkeit halber führen wir den Beweis hier jedoch nochmals für den Fall, dass E separabel ist. Beweis. • „=⇒“: Sei f µ-messbar, d. h. f ∈ L0 (X, µ, E), also durch einfache Funktionen ϕj ∈ EF(X, µ, E), j ∈ N, approximierbar. Sei N eine µ-Nullmenge mit ϕj (x) → f (x) für j → ∞ für alle x ∈ X \ N . Wir wollen die AMessbarkeit von f zeigen. Sei O ⊂ E eine beliebige offene Teilmenge. Definiere für n ∈ N>0 die Mengen On := y ∈ O : dist(y, E \ O) > n1 . Nach Definition ist On offen und es gilt On ⊂ O. Sei x ∈ X \ N . Aufgrund der Konvergenz sind für x ∈ X \ N die Aussagen f (x) ∈ O und ∃ n > 0 ∃ m > 0 ∀ j ≥ m : ϕj (x) ∈ On äquivalent. Wir erhalten daraus [ \ f −1 (O) ∩ (X \ N ) = ϕ−1 j (On ) ∩ (X \ N ). n,m>0 j≥m Es gilt ϕ−1 j (On ) ∈ A für alle n > 0 und alle j ∈ N, denn ϕj ist eine µ-einfache Funktion und für µ-einfache Funktionen gilt ϕ−1 j (Z) ∈ A für beliebige Mengen Z ⊂ E. Da A eine σ-Algebra ist, folgt somit auch f −1 (O) ∩ (X \ N ) ∈ A. 74 11. INTEGRATIONSTHEORIE Das Maß µ ist vollständig. Somit ist mit N auch f −1 (O) ∩ N eine µNullmenge und wir erhalten f −1 (O) = f −1 (O) ∩ (X \ N ) ∪ f −1 (O) ∩ N ∈ A. • „⇐=“: Sei nun f A-messbar. Wir betrachten die Fälle µ(X) < ∞ und µ(X) = ∞ separat. µ(X) < ∞: Sei n ∈ N. Nach Voraussetzung ist E separabel. Daher gibt es eine abzählbare dichte Teilmenge {ej : j ∈ N} von E. Kleine Kugeln um diese Punkte überdecken die Menge E bereits und daher gilt [ 1 (ej )) . X=N∪ f −1 (B n+1 {z } j∈N | =:Xj,n Da f eine A-messbare Funktion ist, gilt Xj,n ∈ A für alle j, n ∈ N. Wegen µ(X) < ∞ und der Stetigkeit von unten können wir X bis auf eine Menge von kleinem Maß bereits mit endlich vielen Mengen überdecken: Es gibt m = m(n) ∈ N, so dass ! m [ 1 µ X\ Xj,n ≤ n+1 2 j=0 {z } | =:Yn gilt. Auf den Mengen Xj,n wollen wir nun (ϕn )n∈N ⊂ EF(X, µ, E) als ej definieren, müssen diese aber auf den Schnitten von Mengen Xj,n leicht modifizieren und setzen daher j−1 e , x ∈ X \ S X , 0 ≤ j ≤ m(n), j j,n k,n ϕn (x) := k=0 0, sonst. Nach Definition folgt |ϕn (x)−f (x)| ≤ 1 n+1 für x ∈ X\Yn = m S Xj,n . Würde j=0 das Maß der Ausnahmemengen Yn nicht nur immer kleiner, sondern wären diese Mengen auch ineinander enthalten, so folgte die Behauptung. Nun benötigen wir jedoch noch eine Zusatzkonstruktion. Wir setzen ∞ S Zn := Yn+k und erhalten eine absteigende Folge von Mengen mit der k=0 Abschätzung µ(Zn ) ≤ ∞ P k=0 µ(Yn+k ) ≤ 1 2n . Somit ist Z := T Zn aufgrund n∈N der Stetigkeit von µ von oben eine µ-Nullmenge. Wir definieren ( ϕn (x), x ∈ X \ Zn , ψn (x) := 0, x ∈ Zn . Es gilt (ψn )n∈N ⊂ EF(X, µ, E). Sei nun x ∈ X \ Z beliebig. Dann gibt es ein m ∈ N mit x 6∈ Zm . Da die Folge (Zn )n∈N absteigend ist, folgt für alle n ≥ m ebenso x 6∈ Zn und wir erhalten 1 |ψn (x) − f (x)| = |ϕn (x) − f (x)| ≤ für alle n ≥ m, n+1 da x 6∈ Yn für alle n ≥ m gilt. Daher gilt lim ψn (x) = f (x) für alle x 6∈ Z. n→∞ Somit ist f eine µ-messbare Funktion. µ(X) = ∞: Nach Generalvoraussetzung ist (X, µ, A) ein σ-endlicher Maßraum. S Somit erhalten wir eine disjunkte Folge von Mengen (Xj )j∈N ⊂ A mit Xj = X und µ(Xj ) < ∞ für alle j ∈ N. Wir haben gerade im j∈N 75 11.1. MESSBARE FUNKTIONEN Fall µ(Xj ) < ∞ gezeigt, dass es für jedes j ∈ N eine Folge (ϕj,k )k∈N ⊂ EF(X, µ, E) und eine Nullmenge Nj mit ϕj,k (x) → f (x) fürSk → ∞ und x ∈ Xj \ Nj gibt. Wir definieren nun die Nullmenge N := Nj und als j∈N Funktionenfolge (ϕk )k∈N ⊂ EF(X, µ, E) eine Art Diagonalfolge: ( ϕj,k (x), x ∈ Xj für ein j ≤ k, ϕk (x) := 0, sonst. Nach Definition gilt für k → ∞ und alle x ∈ X \ N die Aussage ϕk (x) → f (x). Dies zeigt die Behauptung auch in diesem Fall. Damit erhalten wir Theorem 11.11. (i) Seien E, F separable Banachräume. Sei f ∈ L0 (X, µ, E) und g : f (X) → F stetig. Dann gilt g ◦ f ∈ L0 (X, µ, gilt kf k ∈ L0 (X, µ, R). F ). Insbesondere 1 n n (ii) Eine Abbildung f = f , . . . , f → K ist genau dann µ-messbar, wenn dies für jede Funktion f i , 1 ≤ i ≤ n, gilt. (iii) ? Seien g, h : X → R Funktionen. Dann ist f := g +ih genau dann µ-messbar, wenn g und h zwei µ-messbare Funktionen sind. (iv) Seien f ∈ L0 (X, µ, E) und g ∈ L0 (X, µ, F ). Dann folgt (f, g) ∈ L0 (X, µ, E × F ). Beweis. ? (i) Sei O ⊂ F offen. Dann ist g −1 (O) aufgrund der Stetigkeit von g ebenfalls offen. Nach Definition der induzierten Topologie gibt es daher eine offene Menge U ⊂ E mit g −1 (O) = U ∩ f (X). Korollar 11.10 ist f −1 (U ) ∈ A. Nach −1 −1 −1 −1 Also gilt (g ◦ f ) (O) = f g (O) = f (U ∩ f (X)) = f −1 (U ). Nochmals mit 11.10 erhalten wir daraus die µ-Messbarkeit von g ◦ f . (ii) „=⇒“: Wir schreiben f i = πi ◦ f und erhalten die µ-Messbarkeit aus dem bereits Gezeigten, da die Projektion πi stetig ist. n Q „⇐=“: Sei zunächst K = R. Sei I ∈ J(n). Dann gilt I = Ij mit Ij ∈ J(1), j=1 −1 1 ≤ j ≤ n. Nach Annahme gilt f j (Ij ) ∈ A. Nun gilt aber f −1 (I) = n T j −1 f (Ij ) ∈ A. Da die von den Quadern J(n) erzeugte σ-Algebra gleich j=1 n B ist, folgt aus f −1 (J(n)) ⊂ A auch f −1 (B n ) ⊂ A. Nach Korollar 11.10 erhalten wir die Behauptung. Im Fall K = C benutzen wir die Identifikation C ∼ = R2 . (iii) Dies ist ein Spezialfall von (ii). (iv) Übung. 11.1.3. Messbare numerische Funktionen. Definition 11.12. (i) Eine Funktion f : X → R heißt numerisch. (ii) Eine numerische Funktion f : X → R heißt µ-messbar, falls f −1 ({+∞}) ∈ A, f −1 ({−∞}) ∈ A undf −1 (O) ∈ A für jede offene Menge O ⊂ R gelten. Wir schreiben L0 X, µ, R für die Menge aller µ-messbaren numerischen Funktionen. Bemerkung 11.13. ? (i) Jede Funktion f : X → R ist genau dann µ-messbar, wenn sie als numerische Funktion f : X → R aufgefasst µ-messbar ist, da f −1 ({±∞}) = ∅ gilt. (ii) L0 X, µ, R ist (für X 6= ∅) kein Vektorraum, da ∞ − ∞ nicht erklärt ist. 76 11. INTEGRATIONSTHEORIE Theorem 11.14. Sei f : X → R den Aussagen äquivalent: (i) f ∈ L0 X, µ, R , (ii) {x ∈ X : f (x) < α} ∈ A für (iii) {x ∈ X : f (x) ≤ α} ∈ A für (iv) {x ∈ X : f (x) > α} ∈ A für (v) {x ∈ X : f (x) ≥ α} ∈ A für eine numerische Funktion. Dann sind die folgen- jedes jedes jedes jedes α∈Q α∈Q α∈Q α∈Q bzw. bzw. bzw. bzw. α ∈ R, α ∈ R, α ∈ R und α ∈ R. Beweis. • „(i) =⇒ (ii)“: Sei α ∈ Q bzw. α ∈ R. Dann gilt nach Voraussetzung f −1 ({−∞}), f −1 ((−∞, α)) ∈ A. Wir erhalten {x : f (x) < α} = f −1 ([−∞, α)) = f −1 ({−∞}) ∪ f −1 ((−∞, α)) ∈ A. • „(ii) =⇒ (iii) =⇒ (iv) =⇒ (v)“: Benutze dafür die folgenden Identitäten: ∞ n o \ {x ∈ X : f (x) ≤ α} = x ∈ X : f (x) < α + 1j , j=1 {x ∈ X : f (x) > α} = {{x ∈ X : f (x) ≤ α}, ∞ n o \ {x ∈ X : f (x) ≥ α} = x ∈ X : f (x) > α − 1j . j=1 • „(v) =⇒ (i)“: Sei O ⊂ R offen. Dann ist O als abzählbare Vereinigung offener Intervalle darstellbar. Indem wir jedes dieser Intervalle durch halboffene Intervalle mit rationalenSEndpunkten ausschöpfen, sehen wir, dass es αj , βj ∈ Q, j ∈ N, mit O = [αj , βj ) gibt. Wir erhalten j∈N f −1 (O) = [ f −1 ([αj , βj )) = j∈N f −1 [ j∈N {x ∈ X : f (x) ≥ αj } ∩ {x ∈ X : f (x) < βj } ∈ A. {z } | Schließlich gelten \ ({−∞}) = {x ∈ X : f (x) < j} | {z } j∈N ={{x∈X : f (x)≥βj } und f −1 ({+∞}) = ={{x∈X : f (x)≥j} Die Behauptung folgt. \ {x : f (x) ≥ j}. j∈N 11.1.4. Der Verband der messbaren numerischen Funktionen. Definition 11.15. ? Sei (V, ≤) eine partiell geordnete Menge. (i) Sei T ⊂ V . Dann heißt a ∈ V untere Schranke von T , falls a ≤ x für alle x ∈ T gilt. (ii) Sei T ⊂ V . Ein a ∈ V heißt Infimum (oder größte untere Schranke), falls a eine Untere Schranke von T ist und für alle unteren Schranken y von T bereits y ≤ a gilt. (iii) Obere Schranke und Supremum (oder kleinste obere Schranke) sind analog definiert. (iv) Eine partiell geordnete Menge (V, ≤) heißt Verband, falls für a, b ∈ V das Infimum a ∧ b und das Supremum a ∨ b in V existieren. (v) U ⊂ V heißt Unterverband von V , falls U mit der von V induzierten Ordnung ein Verband ist. (vi) Ein K-Vektorraum V heißt partiell geordnet, falls auf V eine partielle Ordnung „≤“ existiert, die in der folgenden Weise mit der Vektorraumstruktur verträglich ist: Für alle x, y, z ∈ V mit x ≤ y und alle λ ≥ 0, d. h. λ ∈ R+ bzw. λ ∈ R+ ⊂ C, gelten 11.1. MESSBARE FUNKTIONEN 77 • x + z ≤ y + z und • λx ≤ λy. (vii) Ein partiell geordneter Vektorraum, der ein Verband ist, heißt Vektorverband. (viii) Ein Untervektorraum eines Vektorverbandes, der gleichzeitig Unterverband ist, heißt Untervektorverband. Beispiele 11.16. ? (i) Sei V ein Verband (bzw. Vektorverband). Sei X eine Menge. Dann ist die Menge Abb(X, V ) bezüglich der punktweisen Ordnung ein Verband (bzw. Vektorverband. (ii) R ist ein Verband, R ein Vektorverband. (iii) Im Vektorverband Abb(X, R) gelten f ∨ g = 21 (f + g + |f − g|) und f ∧ g = 1 2 (f + g − |f − g|). (iv) Die beschränkten Abbildungen X → R bilden einen Untervektorverband von Abb(X, R). (v) Ist X ein topologischer Raum, so bilden die stetigen Abbildungen X → R einen Untervektorverband von Abb(X, R). (vi) EF(X, µ, R) und L0 (X, µ, R) sind Untervektorverbände von Abb(X, R), da |f | für eine µ-messbare Funktion ebenfalls µ-messbar ist. (vii) Sei V ein Vektorverband und x, y, z ∈ V . Dann gelten (x∨y)+z = (x+z)∨(y+z), (−x)∨(−y) = −(x∧y) und x+y = (x∨y)+(x∧y). Beweis. (a) • Sei u ∈ V . Aus u ≥ x und u ≥ y folgt u + z ≥ (x + z) ∨ (y + z). Da dies für beliebige solche u gilt, dürfen wir nach Definition von x ∨ y insbesondere u = x ∨ y wählen und erhalten daraus (x ∨ y) + z ≥ (x + z) ∨ (y + z). • Sei umgekehrt u ≥ (x + z) ∨ (y + z). Wir erhalten u ≥ x + z und u ≥ y +z und daraus u−z ≥ x und u−z ≥ y sowie u−z ≥ x∨y und daher u ≥ (x ∨ y) + z. Da dies für beliebige solche u gilt, erhalten wir (x + z) ∨ (y + z) ≥ (x ∨ y) + z. • Da schließlich „≤“ antisymmetrisch ist, erhalten wir daraus die behauptete Gleichheit. (b) Nach Definition gilt sup{−x, −y} = − inf{x, y}. (c) Es gilt x ∨ y = (−y + (x + y)) ∨ (−x + (x + y)) = ((−y) ∨ (−x)) + (x + y) = −(x ∧ y) + (x + y). Umstellen liefert die Behauptung. (viii) Sei V ein Vektorverband. Dann definieren wir für x ∈ V den positiven Anteil x+ := x ∨ 0, den negativen Anteil x− := (−x) ∨ 0 und den Betrag von |x| := x ∨ (−x). Es gelten x = x+ − x− , |x| = x+ + x− sowie x+ ∧ x− = 0. Beweis. (a) Mit (vii) erhalten wir x+ − x− = x ∨ 0 − ((−x) ∨ 0) = (x ∨ 0) + (x ∧ 0) = x + 0 = x. (b) Wir kombinieren dies mit (vii) und erhalten x+ + x− = x + 2x− = x + ((−2x) ∨ 0) = (−x) ∨ x = |x|. (c) Analog erhalten wir (x+ ∧ x− ) − x− = (x+ − x− ) ∧ (x− − x− ) = x ∧ 0 = −((−x) ∨ 0) = −x− . Addition von x− liefert die Behauptung. (ix) Für eine Funktion f : X → R definieren wir entsprechend den positiven Teil f + , den negativen Teil f − und den Betrag |f |. Auch in diesem Fall gelten f + ≥ 0, f − ≥ 0, f = f + − f − und |f | = f + + f − . Die Menge L0 X, µ, R ist ein Unterverband von Abb X, R und unter abzählbaren Verbandsoperationen stabil. 78 11. INTEGRATIONSTHEORIE Theorem 11.17. Seien f, fj ∈ L0 X, µ, R , j ∈ N. Sei k ∈ N. Sei λ ∈ R. Dann gilt f + , f − , |f |, −f, λf, max fj , min fj , 0≤j≤k 0≤j≤k sup fj , inf fj , lim fj , lim fj ∈ L0 X, µ, R , j∈N j∈N j∈N j∈N alle diese Funktionen sind also µ-messbar. Beweis. (i) Supremum: Nach Theorem 11.14 gilt {x ∈ X : fj (x) > α} ∈ A für jedes α ∈ R. Somit folgt [ x ∈ X : sup fj (x) > α = {x ∈ X : fj (x) > α} ∈ A. j∈N j∈N Daher folgt nach Theorem 11.14 auch, dass sup fj eine µ-messbare Funktion j∈N ist. (ii) ? Infimum: Aus fj ∈ L0 X, µ, R folgt auch −fj ∈ L0 X, µ, R . Somit ist auch inf fj = − sup(−fj ) eine µ-messbare Funktion. j∈N j∈N (iii) Endliche Suprema und Infima: Betrachte Funktionenfolgen die konstant werden, also fj = fk für j ≥ k erfüllen und wende die Resultate über abzählbare Infima und Suprema an. (iv) Hieraus folgt f + , f − ∈ L0 X, µ, R . (v) |f |, −f, λf ∈ L0 X, µ, R ist einfach direkt zu sehen. (vi) Limes Inferior und Limes Superior: Benutze lim fj = inf sup fk j→∞ j k≥j und die obigen Resultate. und lim fj = sup inf fk j→∞ j k≥j Definition 11.18. (i) Sei EF(X, µ, R+ ) der positive Kegel in EF(X, µ, R), d. h. der Kegel aller Funktionen in EF(X, µ, R) mit Werten in R+ . (ii) Definiere R+ := [0, ∞] und L0 X, µ, R+ als die Menge aller nichtnegativen µ-messbaren numerischen Funktionen auf X. Es gilt Theorem 11.19. Für eine Funktion f : X → R+ sind die folgenden beiden Aussagen äquivalent: (i) f ∈ L0 X, µ, R+ . (ii) Es gibt eine wachsende Folge (fj )j∈N ⊂ EF(X, µ, R+ ) mit fj → f (punktweise) für j → ∞. Beweis. • „(i) =⇒ (ii), Beweisskizze: Wir definieren Funktionen fj : X → R+ wie folgt. Zunächst schneiden wir fj auf Höhe j ab, dann erniedrigen wir jeden Funktionswert bis auf das nächstkleinere ganzzahlige Vielfache von 2−j . • „(ii) =⇒ (i): Benutze Theorem 11.17. • „(i) =⇒ (ii): ? Wir führen die Beweisidee aus: Aufgrund der σ-Endlichkeit von (A, µ) dürfen wir wie im Beweis von Theorem 11.9 ohne Einschränkung annehmen, dass µ(X) < ∞ gilt. Sei j ∈ N. Wir definieren ( {x ∈ X : k2−j ≤ f (x) < (k + 1)2−j }, k = 0, . . . , j2j − 1, Aj,k := {x ∈ X : f (x) ≥ j}, k = j2j . 79 11.1. MESSBARE FUNKTIONEN Für festes j sind die Mengen Aj,k , k = 0, . . . , j2j disjunkt und nach Theorem 11.14 gilt Aj,k ∈ A für alle j, k. Wegen µ(X) < ∞ folgt auch µ(Aj,k ) < ∞ für alle j, k. Nach Bemerkung 11.6 (ii) gilt für alle j ∈ N j fj := j2 X k2−j χAj,k ∈ EF(X, µ, R). k=0 Es gilt 0 ≤ fj ≤ fj+1 für alle j ∈ N. Zur punktweisen Konvergenz: Sei x ∈ X. Ist f (x) = ∞, so gilt fj (x) = j für alle j ∈ N. Somit erhalten wir fj (x) → f (x) für j → ∞. Ist f (x) < j, so gilt fj (x) ≤ f (x) < fj (x) + 2−j für j ∈ N. Also folgt auch in diesem Fall lim fj (x) = f (x). j→∞ Korollar 11.20. (i) Sei f ∈ L0 X, µ, R beliebig. Dann gibt es eine Folge (fj )j∈N ⊂ EF(X, µ, R) mit fj → f (punktweise) für j → ∞. (ii) Sei f ∈ L0 (X, µ, R+ ) beschränkt. Dann gibt es eine wachsende Folge (fj )j∈N ⊂ EF(X, µ, R+ ), die gleichmäßig gegen f konvergiert. (iii) ? Ist f ∈ L0 (X, µ, R) beschränkt. Dann gibt es eine Folge (fj )j∈N ⊂ EF(X, µ, R), die gleichmäßig gegen f konvergiert. P fj ∈ L0 X, µ, R+ . (iv) Sei (fj )j∈N ⊂ L0 X, µ, R+ . Dann folgt j∈N Beweis. (i) ? Zerlege f als f = f + − f − und wende Theorem 11.19 an. Wir erhalten Folgen (fj+ )j∈N , (fj− )j∈N ⊂ EF(X, µ, R). Da dies ein Vektorraum ist, gilt (fj+ − fj− )j∈N ⊂ EF(X, µ, R). Die Konvergenz ist klar. (ii) ? Aus dem Beweis von Theorem 11.19 folgt für j > sup f die Abschätzung X fj (x) ≤ f (x) < fj (x) + 2−j und daher die gleichmäßige Konvergenz. (iii) ? Wir zerlegen wieder f als f = f + − f − und wenden (ii) an. (iv) Nach Theorem 11.19 gibt es zu jedem j ∈ N eine monoton wachsende Folge (ϕj,k )k∈N ⊂ EF(X, µ, R+ ) mit ϕj,k % fj für k → ∞. Wir definieren sk,n := k P ϕj,n für k, n ∈ N. Für festes k ∈ N ist (sk,n )n∈N ⊂ EF(X, µ, R+ ) monoton j=0 k P wachsend. Für n → ∞ erhalten wir sk,n → sk := fj . Somit gilt nach j=0 Theorem 11.19 (sk )k∈N ⊂ L0 X, µ, R+ . (Dies zeigt die Abgeschlossenheit unter endlichen Summen, die bisher noch nicht klar war.) Nach Theorem 11.17 ∞ P folgt lim sk = sup sk = fj ∈ L0 X, µ, R+ . k→∞ k∈N j=0 11.1.5. Punktweise Grenzwerte messbarer Funktionen. Wir wollen nun die Resultate über punktweise Konvergenz, wie beispielsweise Theorem 11.17, auf vektorwertige Funktionen und µ-fast überall konvergierende Folgen übertragen. Theorem 11.21. Sei (fj )j∈N ⊂ L0 (X, µ, E) und sei f : X → E eine Funktion. Konvergiert (fj )j∈N µ-fast überall (punktweise) gegen f , so ist f auch µ-messbar. Beweis. Wir benutzen Theorem 11.9 und zeigen, dass f eine µ-fast separabelwertige und A-messbare Funktion ist. (i) ? f ist µ-fast separabelwertig: Sei M eine µ-Nullmenge mit fj (x) → f (x) für j → ∞ und x ∈ X \M . Nach Theorem 11.9 ist jedes fj µ-fast separabelwertig. 80 11. INTEGRATIONSTHEORIE Somit gibt es zu jedem j ∈ N Nullmengen Nj , so dass fj (X \ Nj ) separabel ist. Daher gibt es höchstens abzählbare Mengen Bj mit Bj ⊂ fj ({Nj ) = S fj (X \ Nj ) ⊂ B j , j ∈ N. Wir setzen B := Bj und erhalten j∈N [ [ fj ({Nj ) ⊂ j∈N B j ⊂ B. j∈N S Nun definieren wir N := M ∪ Nj . Als abzählbare Vereinigung von µT Nullmengen ist N eine µ-Nullmenge. Es gilt {N = {M ∩ {Nj ⊂ {Nk für j∈N j∈N beliebige k ∈ N. Für x ∈ X \ M gilt lim fj (x) = f (x). Daher erhalten wir j→∞ f ({N ) ⊂ [ fj ({Nj ) ⊂ B = B. j∈N Als Teilmenge eines separablen metrischen Raumes B ist f ({N ) daher separabel. (ii) f ist A-messbar: Sei O ⊂ E offen. Definiere On := x ∈ O : dist(x, {O) > n1 für n ∈ N>0 . Sei M wiederum die µ-Nullmenge in X mit fj (x) → f (x) für j → ∞ und x ∈ {M . Dann erhalten wir aufgrund der Offenheit von O (kleine Übung) [ \ f −1 (O) ∩ {M = fj−1 (On ) ∩ {M. m,n∈N>0 j≥m −1 fj (On ) ∈ A für Nach Theorem 11.9 gilt alle j, n ∈ N>0 . Hieraus folgt f −1 (O) ∩ {M ∈ A. Nach Voraussetzung ist M eine µ-Nullmenge. Somit ist auch f −1 (O) ∩ M eine µ-Nullmenge und wir erhalten f −1 (O) = f −1 (O) ∩ {M ∪ f −1 (O) ∩ M ∈ A. Nun liefert Theorem 11.9 die Behauptung. Bemerkung 11.22. ? In nicht vollständigen Maßräumen gibt es Gegenbeispiele, siehe [1, Bemerkung X.1.15]. 11.1.6. Radonmaße. Definition 11.23. (i) Sei X ein σ-kompakter und lokal kompakter metrischer Raum. Sei A eine σAlgebra mit A ⊃ B(X). Dann heißt ein reguläres lokal endliches Maß auf A Radonmaß. (ii) Ein Radonmaß heißt regelmäßig, falls µ vollständig ist und für jede nichtleere offene Teilmenge O ⊂ X bereits µ(O) > 0 gilt. Bemerkung 11.24. (i) Sei X ein lokal kompakter metrischer Raum. Sei K ⊂ X kompakt. Dann besitzt K eine relativ kompakte offene Umgebung, d. h. es gibt eine relativ kompakte offene Menge, die K enthält. Beweis. Zu jedem x ∈ K gibt es eine relativ kompakte offene Umgebung Ux . Da K kompakt ist, überdecken bereits endlich viele dieser Umgebungen K: n n S S Ux1 , . . . , Uxn . Wir definieren U := Uxj und erhalten U = U xj (kleine j=1 j=1 Übung). Somit ist U eine offene Umgebung von K und U ist als Vereinigung endlich vieler kompakter Mengen selbst wieder kompakt. (ii) Sei X ein lokal kompakter metrischer Raum. Dann sind die folgenden Aussagen äquivalent: 81 11.1. MESSBARE FUNKTIONEN (a) X ist σ-kompakt, (b) es gibt (Uj )j∈N mit Uj ⊂ X offen, jedes Uj ist relativ kompakt, es gilt S U j ⊂ Uj+1 für alle j ∈ N und Uj = X, j∈N (c) X ist ein Lindelöfscher Raum, (d) X erfüllt das zweite Abzählbarkeitsaxiom, (e) X ist separabel. Beweis. S • „(iia) =⇒ (iib)“: Seien Xj , j ∈ N, kompakte Mengen mit Xj = j∈N X. Sei U0 eine relativ kompakte Obermenge von X0 ; die Existenz einer solchen Menge haben wir in (i) gezeigt. Induktiv können wir so relativ kompakte offene Mengen Uj ⊂ X mit Uj ⊃ U j−1 ∪ Xj finden, da U j−1 ∪ Xj kompakt ist, j ∈ N>0S. Da die Mengen Xj die Menge X überdecken, erhalten wir auch X = Uj . j∈N • „(iib) =⇒ (iic)“: Sei O = {Oa : a ∈ A} eine offene Überdeckung von X. Wir behaupten, dass O eine höchstens abzählbare Teilüberdeckung besitzt. Da sich jede der Mengen U j aufgrund der Kompaktheit durch endlich viele Mengen aus O überdecken lässt, bildet die Vereinigung aller S dieser Mengen eine höchstens abzählbare Vereinigung von Uj = X. j∈N • „(iic) =⇒ (iia)“: Zu jedem Punkt x ∈ X gibt es eine offene relativ kompakte Umgebung Ux . Da X Lindelöfsch ist,Süberdecken bereits abzählbar viele dieser Mengen X, gelte also X = Uxj . Damit gilt auch j∈N S X= U xj . Somit ist X ein σ-kompakter Raum. j∈N Der Rest der Äquivalenzen folgt aus Theorem 10.11. (iii) Das n-dimensionale Lebesgueschem Maß λn ist ein regelmäßiges Radonmaß auf Rn . Beweis. ? Nach Theorem 10.58 ist λn vollständig und L(n) enthält die Borelmengen. Nach Theorem 10.62 ist λn regulär. Die lokale Endlichkeit und λn (O) > 0 für alle nichtleeren offenen Mengen sind klar. Somit folgt die Behauptung. (iv) Das s-dimensionale Hausdorffmaß Hs auf Rn ist genau für s ≥ n ein Radonmaß und genau für s = n regelmäßig. Beweis. ? Nach Bemerkung 10.56 und Theorem 10.54 sind Borelmengen Hs messbar. Aus Korollar 10.80 und Theorem 10.62 folgt die Regularität im Fall s = n. Sei O ⊂ Rn offen und nichtleer. Dann gilt (Übung) ( 0, s > n, s H (O) = ∞, s < n. Daher ist Hs , s < n, kein Radonmaß auf Rn . Hieraus folgt aber für s > n die Regularität, da Hs in diesem Fall identisch verschwindet. Im Falle s > n ist Hs auf Rn nicht regelmäßig. Nach Lemma 10.79 ist Hn lokal endlich auf Rn und damit ein Radonmaß. Nach Korollar 10.80 erhalten wir schließlich Hn (O) > 0 und damit die Behauptung. Theorem 11.25. Sei µ ein vollständiges Radonmaß auf X. Dann ist C 0 (X, E) ein Untervektorraum von L0 (X, µ, E). Beweis. ? Sei µ auf der σ-Algebra A definiert. Sei f ∈ C 0 (X, E). 82 11. INTEGRATIONSTHEORIE (i) A-Messbarkeit: Sei O ⊂ E offen. Dann ist aufgrund der Stetigkeit von f auch f −1 (O) offen. Nun enthält A nach Definition des Radonmaßes die Borelmengen. Daher ist f −1 (O) ∈ A. S (ii) Separabilität: Seien Xj , j ∈ N, kompakte Mengen mit Xj = X. Dann ist j∈N jede Menge f (Xj ), j ∈ N, aufgrund der Stetigkeit von f ebenfalls kompakt und S daher insbesondere separabel. Folglich ist auch f (X) = f (Xj ) separabel. j∈N Die Behauptung folgt nun aus Theorem 11.9. Für den reellwertigen Satz von Lusin folgen wir [6]. Wir benötigen als Vorbereitung das Lemma von Urysohn. Wir behandeln es zunächst für topologische Räume, geben jedoch auch einen kürzeren Beweis im Falle von metrischen Räumen. Theorem 11.26. Sei X ein Hausdorffraum, K ⊂ X kompakt und p ∈ X \ K. Dann gibt es offene Mengene U, W ⊂ X mit p ∈ U , K ⊂ W und U ∩ W = ∅. Beweis. Da X ein Hausdorffraum ist, gibt es zu jedem q ∈ K disjunkte offene Mengen Uq und Vq mit p ∈ Uq und q ∈ Vq . Da K kompakt ist, wird K bereits von endlich vielen der offenen Mengen Vq überdeckt; gelte also ohne Einschränkung K ⊂ Vq1 ∪ . . . ∪ Vqn . Somit leisten die Menge U := Uq1 ∩ . . . ∩ Uqn und V := Vq1 ∪ . . . ∪ Vqn das Gewünschte. Theorem 11.27. Sei T (Kα )α eine Familie von kompakten Mengen in einem Hausdorffraum X. Gelte Kα = ∅. Dann gibt es bereits eine endliche Teilfamilie von α (Kα )α mit leerem Durchschnitt. Beweis. Sei K1 ein festes Element dieser Familie. Dann genügt es, die Behauptung für die Familie {Kα ∩ K1 }α zu zeigen, d. h. wir dürfen ohne Einschränkung annehmen, dass X kompakt ist, da wir sonst T X durch K1 ersetzen können. S Nach den De Morganschen Regeln gilt Kα = ∅ genau dann, wenn {Kα = X α α gilt. Nun ist {Kα α eine Familie aus offenen Mengen, die die kompakte Menge X überdeckt. Somit gilt dies auch für eine endliche Teilfamilie. Aufgrund der obigen Äquivalenz ist dies gerade die gesuchte Teilfamilie. Theorem 11.28. Sei X ein lokal kompakter Hausdorffraum. Sei U ⊂ X offen und sei K ⊂ U kompakt. Dann gibt es eine offene Menge V , so dass V kompakt ist und K⊂V ⊂V ⊂U gilt. Beweis. (i) Jeder Punkt in K besitzt eine offene Umgebung mit kompaktem Abschluss. Da K kompakt ist, überdecken bereits endlich viele dieser Umgebungen K. Sei G die Vereinigung dieser endlich vielen offenen Umgebungen. (ii) Ist U = X, so können wir V = G wählen und sind fertig. (iii) Sonst sei C := X \ U . Nach Theorem 11.26 gibt es zu jedem p ∈ C eine offene Menge Wp mit K ⊂ Wp und, da p, ebenfalls aufgrund dieses Theorems, eine offene zu Wp diskunkte Umgebung besitzt, p 6∈ W p . Die Familie {C ∩ G ∩ W p }p∈C besteht aus kompakten Mengen. Ihr Schnitt ist wegen p 6∈ W p die leere Menge. Nach Theorem 11.27 gibt es somit Punkte p1 , . . . , pn ∈ C mit C ∩ G ∩ W p1 ∩ . . . ∩ W pn = ∅. 83 11.1. MESSBARE FUNKTIONEN Wir definieren V := G ∩ Wp1 ∩ . . . ∩ Wpn und erhalten auch die Inklusion V ⊂ U , denn es gilt V ⊂ G ∩ W p1 ∩ . . . ∩ W pn und die Menge auf der rechten Seite ist zu C = X \ U disjunkt, aus V ∩ C = ∅ erhalten wir also V ⊂ {C = U wie gewünscht. Einfache Eigenschaften unterhalbstetiger Funktionen wiederholen bzw. erwähnen wir nachfolgend. Analoge Resultate gelten für oberhalbstetige Funktionen. Bemerkung 11.29. (i) f : X → R ist (in einem metrischen Raum X) unterhalbstetig, falls für jedes x ∈ X und jede Folge (xn )n∈N mit xn → x für n → ∞ auch lim f (xn ) ≥ f (x) n→∞ (ii) (iii) (iv) (v) gilt. f : X → R ist (in einem topologischen Raum X) unterhalbstetig, falls die Mengen f −1 ((a, ∞)) für alle a ∈ R offen sind. In einem metrischen Raum stimmen die beiden Definitionen von Unterhalbstetigkeit überein (Übung). Die charakteristische Funktion einer offenen Menge ist unterhalbstetig. Das Supremum von unterhalbstetigen Funktionen ist wieder unterhalbstetig (Übung; benutze die topologische Definition). Theorem 11.30 (Lemma von Urysohn). Sei X ein lokal kompakter Hausdorffraum, V ⊂ X offen und K ⊂ V kompakt. Dann gibt es f ∈ Cc0 (X, [0, 1]) mit χK ≤ f ≤ χV . Beweis. Wir setzen r0 := 0 und r1 := 1. Sei (ri )i∈N eine Aufzählung von Q ∩ (0, 1). Dann gibt es nach Theorem 11.28 zunächst eine offene Menge V0 , so dass V 0 kompakt ist und dann eine offene Menge V1 mit K ⊂ V1 ⊂ V 1 ⊂ V0 ⊂ V 0 ⊂ V. Seien nun n ≥ 2 und seien Vr1 , . . . , Vrn bereits so gewählt, dass für ri < rj bereits V rj ⊂ Vri gilt. Dann ist eine der Zahlen r1 , . . . , rn , wir nehmen an, dass dies ri ist, die größte unter diesen Zahlen mit ri < rn+1 und eine, wir nehmen an, dass dies rj ist, die kleinste unter diesen Zahlen mit rn+1 < rj . Wiederum nach Theorem 11.28 finden wir eine Menge Vrn+1 mit V rj ⊂ Vrn+1 ⊂ V rn+1 ⊂ Vri . Auf diese Weise erhalten wir eine Familie {Vr }r∈Q∩[0,1] von offenen Mengen mit K ⊂ V1 , V 0 ⊂ V , kompakten Mengen V r und r<s =⇒ V s ⊂ Vr . Wir definieren nun die Funktionen fr := r · χVr , ( 1, x ∈ V s , gs := s, sonst, f := sup r∈Q∩[0,1] fr und g := inf s∈Q∩[0,1] gs . Jede der Funktion fr , r ∈ Q ∩ [0, 1], und f sind unterhalbstetig. Ebenso sind g und jede der Funktionen gs , s ∈ Q ∩ [0, 1], oberhalbstetig. Es ist klar, dass 0 ≤ f ≤ 1, f (x) = 1 für x ∈ K gelten und dass supp f ⊂ V 0 gilt. Wir behaupten, dass auch f = g gilt. Dies impliziert dann die Stetigkeit und damit die Behauptung. Angenommen, es gilt fr (x) > gs (x) für ein x ∈ X. Dann folgen x ∈ Vr , x 6∈ V s und r > s. Dies impliziert jedoch Vr ⊂ Vs im Widerspruch zu den obigen Folgerungen. Somit gilt fr ≤ gs für beliebige r, s ∈ Q ∩ [0, 1] und wir erhalten im Grenzwert f ≤ g. 84 11. INTEGRATIONSTHEORIE Sei nun x ∈ X mit f (x) < g(x). Dann gibt es r, s ∈ Q ∩ [0, 1] mit f (x) < r < s < g(x). Aus der ersten Ungleichung folgt x 6∈ Vr , aus der zweiten erhalten wir x ∈ V s . Dies widerspricht jedoch der konstruierten Schachtelung der Mengen {Vs }s∈Q∩[0,1] . Somit erhalten wir f = g und das Theorem folgt. Für den Tietze-Urysohnschen Fortsetzungssatz in metrischen Räumen folgen wir [3]. Theorem 11.31 (Tietze-Urysohnscher Fortsetzungssatz). Sei E ein metrischer Raum, A ⊂ E abgeschlossen. Sei f : A → R stetig und beschränkt. Dann gibt es eine stetige Abbildung g : E → R mit g|A = f und sup g(x) = sup f (y) x∈E sowie y∈A inf g(x) = inf f (y). x∈E y∈A Beweis. ? (i) Ohne Einschränkung dürfen wir annehmen, dass inf f (y) = 1 und sup f (y) = y∈A y∈A 2 gelten. Falls nicht, so ist f konstant und die Aussage trivial oder wir ersetzen f durch αf + β mit α, β ∈ R, so dass diese Annahmen erfüllt sind und transformieren später g entsprechend zurück. (ii) Definiere f (x), x ∈ A, g(x) := f (y)d(x, y) inf , x 6∈ A. y∈A d(x, A) (iii) Beschränktheit: „≥ 1“: Es gilt für alle y ∈ A die Ungleichung d(x, y) ≥ d(x, A). Somit erhalten wir f (y)d(x,y) ≥ f (y) ≥ 1. d(x,A) n) „≤ 2“: Sei (yn )n∈N ⊂ A eine Folge mit d(x,y d(x,A) → 1 für n → ∞. Somit erhalten wir d(x, yn ) ≤ lim f (yn ) ≤ 2 lim f (yn ) n→∞ n→∞ d(x, A) und die Behauptung folgt. ◦ (iv) Stetigkeit von g: Für x ∈ A ist dies klar. (v) Stetigkeit in E \ A: Da x 7→ d(x, A) stetig und in E \ A positiv ist, genügt der Nachweis, dass h : E \ A 3 x 7→ inf (f (y)d(x, y)) stetig ist. Sei r := d(x, A). y∈A Ist d(x, x0 ) ≤ ε < r, x0 ∈ E \ A also ein Punkt nahe x, so folgt d(x, y) ≤ d(x0 , y) + ε. Folglich erhalten wir f (y)d(x, y) ≤ f (y)(d(x0 , y) + ε) und daraus h(x) ≤ h(x0 ) + 2ε, da f (y) ≤ 2. Analog erhalten wir h(x0 ) ≤ h(x) + 2ε. Somit ist g in E \ A stetig. (vi) Stetigkeit für x ∈ ∂A: Sei ε > 0 beliebig. Dann gibt es aufgrund der Stetigkeit von f ein r > 0 mit |f (x) − f (y)| ≤ ε für alle y ∈ A ∩ Br (x). Wir definieren C := A∩Br (x) und D := A\Br (x). Sei nun x0 ∈ E\A mit d(x, x0 ) ≤ r/4. Dann gilt für y ∈ D die Ungleichung d(x0 , y) ≥ d(x, y)−d(x, x0 ) ≥ 43 r und somit folgt inf (f (y)d(x0 , y)) ≥ 34 r. Andererseits gilt aber f (x)d(x0 , x) ≤ 2d(x0 , x) ≤ r/2. y∈D Diese beiden Ungleichungen widersprechen sich. Somit folgt inf (f (y)d(x0 , y)) = inf (f (y)d(x0 , y)). y∈A y∈C Für y ∈ C gilt jedoch f (x) − ε ≤ f (y) ≤ f (x) + ε und inf d(x0 , y) = d(x0 , A). y∈C Somit erhalten wir (f (x) − ε)d(x0 , A) ≤ inf (f (y)d(x0 , y)) ≤ (f (x) + ε)d(x0 , A). y∈A Also erhalten wir für x ∈ E \ A mit d(x, x0 ) ≤ r/4 die Abschätzung |g(x0 ) − f (x)| ≤ ε. Andererseits gilt für x0 ∈ A und d(x, x0 ) ≤ r/4 die Abschätzung 11.1. MESSBARE FUNKTIONEN 85 |g(x0 ) − f (x)| = |f (x0 ) − f (x)| ≤ ε. Somit folgt insgesamt auch die Stetigkeit für x ∈ ∂A. Korollar 11.32. Sei E ein metrischer Raum. Seien A, B ⊂ E abgeschlossen mit A ∩ B = ∅ (also disjunkt). Dann gibt es eine stetige Funktion f : E → [0, 1] mit f (x) = 1 für alle x ∈ A und f (x) = 0 für alle x ∈ B. Beweis. Beachte dazu, dass die Funktion χA : A ∪ B → R stetig ist und sich somit auch stetig auf E fortsetzen lässt. Theorem 11.33 (Lusin). Sei (X, A, µ) ein Maßraum mit einem lokal kompakten Hausdorffraum X. Sei µ lokal endlich, regulär und vollständig. Sei f : X → R eine A- oder, nach Theorem 11.9 äquivalent dazu, µ-messbare Funktion. Sei A ⊂ X mit µ(A) < ∞ und gelte f (x) = 0 für x 6∈ A. Sei ε > 0. Dann gibt es eine Funktion g ∈ Cc0 (X) mit µ({x : f (x) 6= g(x)}) < ε (11.1) und sup |g(x)| ≤ sup |f (x)|. x∈X x∈X Beweis. (i) Wir nehmen zunächst an, dass 0 ≤ f < 1 gilt und dass A kompakt ist. Sei (fj )j∈N die im Beweis von Theorem 11.19 konstruierte Folge einfacher Funktionen mit fj → f für j → ∞. Wir definieren t1 := f1 und tn := fn − fn−1 für n ∈ N. Beachte, dass das anfängliche Abschneiden auf Höhe j wegen 0 ≤ f ≤ 1 in der Definition von fj nie nötig war. Somit sind die Funktionen 2n tn charakteristische Funktionen von gewissen Mengen Tn ⊂ A. ∞ P Nach Konstruktion gilt f (x) = tn (x) für alle x ∈ X. Sei V offen mit n=1 A ⊂ V und kompaktem Abschluss V . Solch eine Menge V gibt es aufgrund der zunächst zusätzlich vorausgesetzten Kompaktheit von A. Da µ regulär ist, gibt es kompakte Mengen Kn ⊂ Tn und offene Mengen Vn mit Tn ⊂ Vn ⊂ V und µ(Vn \Kn ) < 2−n ε. Nach dem Urysohnschen Lemma gibt es stetige Funktionen hn : X → R mit χKn ≤ hn ≤ χVn . Damit definieren wir g : X → R vermöge ∞ P g(x) := 2−n hn (x). Die zugrundeliegende Folge konvergiert gleichmäßig. n=1 Somit ist g stetig. Nach Konstruktion gilt supp g ⊂ V . Außerhalb von Vn \ Kn ∞ S gilt 2−n hn (x) = tn (x). Somit folgt g(x) = f (x) in X \ (Vn \ Kn ). Für n=1 ∞ S die Ausnahmemenge gilt µ (Vn \ Kn ) < ε. Dies zeigt (11.1), falls A n=1 kompakt ist und 0 ≤ f < 1 gilt. (ii) Ist A nicht kompakt, so gibt es wegen µ(A) < ∞ eine kompakte Menge K ⊂ A mit beliebig kleinem µ(A \ K). Betrachte nun K statt A. Dann kann man wie oben mit χK f fortfahren, um (11.1) zu erhalten. (iii) Ist f nicht beschränkt, so betrachten wir T die Mengen Bn := {x ∈ A : |f (x)| > n}. Da f Werte in R annimmt gilt somit Bn = ∅. Nach Voraussetzung gilt n∈N µ(A) < ∞. Somit liefert Theorem 10.29 (iv) µ(Bn ) → 0 für n → ∞. Wenn wir die obigen Überlegungen nun auf die Funktion n1 (1 − χBn )f ± für hinreichend großes n ∈ N anwenden, folgt (11.1) auch in diesem Fall. 86 11. INTEGRATIONSTHEORIE (iv) Setze r := sup |f (x)|. Definiere ϕ : R → R durch x∈X −r, t < r, ϕ(t) := t, |t| ≤ r, r, t > r. Dann erfüllt ϕ ◦ g zusätzlich zu (11.1) auch sup |ϕ ◦ g| = sup |f |. X X Lemma 11.34. Sei (X, A, µ) ein Maßraum. Seien Ek ⊂ X, k ∈ N, messbare ∞ P µ(Ek ) < ∞. Dann ist die Menge A aller Punkte x ∈ X mit der Mengen mit k=0 Eigenschaft, dass {k ∈ N : x ∈ Ek } unendlich ist, eine Nullmenge. Beweis. Wir definieren Dk := ∞ S Ej . Dann sind die Mengen Dk geschachtelt, j=k Dk+1 ⊂ Dk , und es gilt µ(Dk ) → 0 für k → ∞. Weiterhin gilt A = ∞ T Dk . Es k=0 folgt µ(A) ≤ µ(Dk ) → 0 für k → ∞ und daher ist A wie behauptet eine Nullmenge. Als Korollar zum Satz von Lusin erhalten wir Korollar 11.35. Seien die Voraussetzungen des Satzes von Lusin, Theorem 11.33 erfüllt und gelte zusätzlich |f | ≤ 1. Dann gibt es eine Folge (gn )n∈N ⊂ Cc0 (X) mit |gn (x)| ≤ 1 für alle x ∈ X und f (x) = lim gn (x) n→∞ für fast alle x ∈ X. Beweis. Zu n ∈ N gibt es nach Theorem 11.33 eine Funktion gn ∈ Cc0 (X) mit |gn (x)| ≤ 1 für alle x ∈ X und eine Menge En mit µ(En ) ≤ 2−n , so dass f (x) = gn (x) für alle x ∈ X \ En gilt. Nach Lemma 11.34 gibt es eine Nullmenge A ⊂ X, so dass für alle x ∈ X \ A der Punkt x nur in höchstens endlich vielen Mengen En liegt. Daher gilt für x ∈ X \ A auch lim gn (x) = lim f (x) = f (x). Wir erhalten n→∞ n→∞ die Behauptung. Theorem 11.36 (Lusin). ? Sei X ein σ-kompakter lokal kompakter metrischer Raum. Sei µ ein vollständiges Radonmaß auf X und sei f ∈ L0 (X, µ, E). Sei A ⊂ X eine µ-messbare Menge mit µ(A) < ∞. Dann gibt es zu jedem ε > 0 eine kompakte Teilmenge K ⊂ X mit µ(A \ K) < ε und f |K ∈ C 0 (K, E). Der Beweis dieser vektorwertigen Version des Satzes von Lusin ist etwas technisch. Beweis. (i) Da µ regulär ist und µ(A) < ∞ gilt, gibt es eine kompakte Menge X̃ ⊂ A mit µ A \ X̃ < ε/2. Wir definieren f˜ := f |X̃ . Es gilt µ X̃ < ∞. Im Rest des Beweises betrachten wir alle Komplemente stets bezüglich X̃, also {B ≡ X̃ \ B. (ii) Da f eine µ-messbare Funktion ist, ist f nach Theorem 11.9 µ-fast separa˜ belwertig. Somit gibt es eine µ-Nullmenge N ⊂ X̃, so dass f {N separabel ˜ ist. Nach Theorem 10.11 n o besitzt der topologische Raum f {N eine abzähl- Ṽj : j ∈ N . Nach Definition der Relativtopologie gibt es offene Mengen Vj ⊂ E mit Vj ∩ f˜ {N = Ṽj , j ∈ N. bare Basis 87 11.2. INTEGRIERBARE FUNKTIONEN (iii) Nochmals nach Theorem 11.9 ist f˜−1 (Vj ) für beliebiges j ∈ N eine µ-messbare Menge. Da µ regulär ist und µ X̃ < ∞ gilt, gibt es für j ∈ N eine kompakte Menge Kj ⊂ X und eine offene Menge Uj ⊂ X mit Kj ⊂ f˜−1 (Vj ) ⊂ Uj und S µ(Uj \ Kj ) < ε · 2−(j+3) . Für U := (Uj \ Kj ) gilt somit µ(U ) < ε/4. j∈N (iv) Definiere Y := {(U ∪ N ). Wir behaupten, dass f˜|Y eine stetige Funktion ist. Sei V ⊂ E offen. Da die Mengen {Vj : j ∈ N} eine Basis der Topologie von f˜ {N ⊂ E bilden, gibt es eine Teilmenge {Vjk : k ∈ N} (wir verwenden diese S Notation auch, falls diese Teilmenge endlich ist) mit V ∩ f˜ {N = Vjk ∩ k∈N f˜ {N . Hieraus folgt [ (11.2) f˜−1 (V ) ∩ {N = f˜−1 (Vjk ) ∩ {N. k∈N Nach Wahl der Mengen Ul gilt f˜−1 (Vl ) ∩ Y ⊂ Ul ∩ Y für alle l ∈ N. Es ergibt sich ! [ Y = {(U ∪ N ) = {U ∩ {N = { Uj \ Kj ∩ {N | {z } j∈N =Uj ∩{Kj \ ⊂ {Uj ∪ Kj ⊂ j∈N \ {Uj ∪ f˜−1 (Vj ) ⊂ {Ul ∪ f˜−1 (Vl ) j∈N für beliebige l ∈ N. Wir behaupten, dass f˜−1 (Vl ) ∩ Y = Ul ∩ Y gilt. Dazu zeigen wir, dass sogar der Schnitt mit einer größeren Menge als Y gleich ist, wobei wir gerade eben gezeigt haben, dass die hier angegebene Menge größer ist, dass also f˜−1 (Vl ) ∩ {Ul ∪ f˜−1 (Vl ) = Ul ∩ {Ul ∪ f˜−1 (Vl ) gilt. Dies ist wahr, denn die linke Seite ist gleich f˜−1 (Vl ) und die rechte Seite ist Ul ∩ f˜−1 (Vl ) = f˜−1 (Vl ) wegen f˜−1 (Vl ) ⊂ Ul . Dies zeigt, dass f˜−1 (Vl ) ∩ Y = Ul ∩ Y gilt. Dies benutzen wir im letzten Schritt und erhalten −1 f˜|Y (V ) = f˜−1 (V ) ∩ Y = f˜−1 (V ) ∩ {N ∩ {U [ (11.2) [ −1 = Ujk ∩ Y. === f˜ (Vjk ) ∩ {N ∩ {U | {z } k∈N Die Menge S =Y k∈N Ujk ist eine offene Teilmenge von X. Somit ist auch k∈N S Ujk k∈N ˜ eine offene Teilmenge von Y . Also ist f |Y stetig. (v) Da µ regulär ist, und µ(Y ) ≤ µ X̃ < ∞ gilt, gibt es eine kompakte Menge K ⊂ Y mit µ(Y \K) < ε/4. Es gilt f˜|K = f |K ∈ C 0 (K, E). Weiterhin erhalten wir die Abschätzung µ X̃ \ K ≤ µ(Y \ K) + µ {Y \ K ≤ µ(Y \ K) + µ(U ) < ε/2. | {z } ⊂U Somit folgt µ(A \ K) = µ A \ X̃ + µ X̃ \ K < ε. Die Behauptung folgt. 11.2. Integrierbare Funktionen. Sei in diesem Abschnitt stets (X, A, µ) ein σendlicher vollständiger Maßraum und sei E ein Banachraum. Wir wollen stets annehmen, dass µ-einfache Funktionen in ihrer Normalform dargestellt sind. Weiterhin definieren wir ∞ · 0E := 0 =: −∞ · 0E mit dem Nullvektor 0E ∈ E. 88 11. INTEGRATIONSTHEORIE 11.2.1. Das Integral für einfache Funktionen. Definition 11.37. Sei ϕ ∈ EF(X, µ, E), also eine µ-einfache Funktion, und sei m P ej χAj eine Darstellung in Normalform. ϕ= j=0 (i) Dann definieren wir Z Z Z Z m X := ϕ dµ ≡ ϕ dµ ≡ ϕ ≡ ϕ ej µ(Aj ). X j=0 X R ϕ heißt Integral von ϕ über X bezüglich des Maßes µ. (ii) Ist A eine µ-messbare Menge, so heißt Z Z ϕ dµ := χA ϕ dµ A X Integral von ϕ über A bezüglich des Maßes µ. Bemerkung 11.38. R (i) ? ϕ dµ ist wohldefiniert. A Beweis. Nach Bemerkung 11.6 ist das Produkt µ-einfacher Funktionen wieder µ-einfach und auf eindeutige Weise in Normalform darstellbar. (ii) ? Sei ϕ = n P fk χBk mit fk ∈ E \ {0} und Bk ∈ A mit Bj ∩ Bk = ∅ für k=0 j 6= k. Dann ist ϕ eine µ-einfache Funktion. Diese ist nicht notwendigerweise in Normalform dargestellt. Trotzdem gilt Z n X ϕ dµ = fk µ(Bk ). k=0 X Beweis. Ordne Summanden geeignet um und fasse sie geeignet zusammen. R (iii) Das Integral · dµ : EF(X, µ, E) → E ist linear. X Beweis. ? (a) Skalarmultiplikation: Klar. (b) Summen: Betrachte Mengen der Form Ai ∩ Bj statt Ai und Bj auf denen dann beide Summanden konstant sind. Benutze nun die obige Formel für Integrale einfacher Funktionen, die nicht in Normalform sind. (iv) ? Für A, B ∈ A mit A ∩ B = ∅ und ϕ ∈ EF(X, µ, E) gilt Z Z Z ϕ dµ = ϕ dµ + ϕ dµ. A∪B A B Beweis. Benutze χA∪B ϕ = χA ϕ + χB ϕ. (v) Für ϕ ∈ EF(X, µ, E) und A ∈ A gilt Z Z ϕ dµ ≤ kϕk dµ ≤ kϕkL∞ · µ(A). A A Beweis. Nach Bemerkung 11.6 ist auch kϕk eine µ-einfache Funktion. Die Behauptung folgt somit aus der Dreiecksungleichung für Summen. R R (vi) Für ϕ, ψ ∈ EF(X, µ, R) mit ϕ ≤ ψ gilt ϕ dµ ≤ ψ dµ. A A 11.2. INTEGRIERBARE FUNKTIONEN 89 Beweis. Schreibe ψ = ϕ + (ψ − ϕ). Beachte nun, dass aus ψ − ϕ ≥ 0 auch R ϕ − ψ dµ ≥ 0 folgt. Benutze nun die Linearität des Integrals. A 11.2.2. Die L1 -Seminorm. Definition 11.39. Sei V ein K-Vektorraum. Dann heiß p : V → R eine Seminorm auf V , falls p die folgenden Bedingungen erfüllt: (i) p(v) ≥ 0 für alle v ∈ V , (ii) p(λv) = |λ|p(v) für alle v ∈ V und alle λ ∈ K, (iii) p(v + w) ≤ p(v) + p(w) für alle v, w ∈ V . Für v ∈ V und r > 0 definieren wir den offenen Semiball um v mit Radius r als Brp (v) := {w ∈ V : p(v − w) < r}. Eine Menge O ⊂ V heißt p-offen, falls es zu jedem v ∈ O ein r > 0 mit Brp (v) ⊂ O gibt. Bemerkung 11.40. (i) ? Sei (V, p) eine Vektorraum mit Seminorm p. Dann ist p genau dann eine Norm, wenn p−1 ({0}) = {0} gilt. (ii) Ist K ⊂ Rn kompakt, so ist p(f ) := sup |f (x)| eine Seminorm aber keine x∈K Norm auf CR0 (Rn ). (iii) kϕkL1 := kϕk dµ für ϕ ∈ EF(X, µ, E) ist eine Seminorm. Gibt es eine X nichtleere µ-Nullmenge in A, so ist k · kL1 keine Norm auf EF(X, µ, E). (iv) ? Op := {O ⊂ V : O ist p-offen} ist eine Topologie auf V . Wir nennen sie die von p erzeugte Topologe. Diese Topologie ist im allgemeinen nicht Hausdorffsch und in diesem Fall daher auch nicht metrisch. (v) ? Eine lineare Abbildung A : V → E heißt (p)-beschränkt, falls es ein M ≥ 0 mit kAvk ≤ M p(v) für alle v ∈ V gibt. Für eine lineare Abbildung A : V → E sind die folgenden Aussagen äquivalent: (a) A ist stetig, (b) A ist stetig in 0, (c) A ist beschränkt. Beweis. Wir geben nur die nichttrivialen Teile des Beweises an. Auch sie funktionieren wie in normierten Räumen. • Sei A stetig in 0. Dann ist A−1 B1E (0) in (V, p) offen, d. h. es gibt ein δ > 0 mit Bδp (0) ⊂ A−1 B1E (0) . Wir wenden A an und erhalten E aufgrund der Homogenität A (B1p (0)) ⊂ B1/δ (0) sowie kAvk ≤ 1δ p(v) für alle v ∈ V . • Ist umgedreht A nicht stetig in 0, so gibt es für jedes n ∈ N>0 ein vn ∈ V mit p(vn ) ≤ n1 und vn 6∈ A−1 B1E (0) . Die letzte Aussage ist äquivalent zu kAvn k ≥ 1. Somit ist A auch nicht beschränkt. R (vi) · dµ : EF(X, µ, E) → E ist stetig. X Beweis. Wir verwenden die Seminorm k · kL1 . Benutze nun die Dreiecksungleichung. Obwohl eine Seminorm keine Metrik definiert definieren wir: Definition 11.41. Sei V ein Vektorraum mit Seminorm p. (i) Eine Folge (vn )n∈N heißt Cauchyfolge in (V, p), wenn es zu jedem ε > 0 ein n0 ∈ N mit p(vn − vm ) < ε für alle n, m ≥ n0 gilt. 90 11. INTEGRATIONSTHEORIE (ii) Eine Folge (vn )n∈N konvergiert gegen v ∈ V , falls es zu jedem ε > 0 ein n0 ∈ N mit p(vn − v) < ε für alle n ≥ n0 gibt. (iii) Der Raum (V, p) heißt vollständig, genauer: folgenvollständig, falls jede Cauchyfolge in (V, p) konvergiert. Bemerkung 11.42. (i) Es gilt vn → v für n → ∞ genau dann, wenn p(vn − v) → 0 für n → ∞ gilt. Dieser Grenzwert braucht jedoch nicht eindeutig zu sein, da für alle w ∈ V mit p(v − w) = 0 ebenfalls p(vn − w) → 0 für n → ∞ gilt. (ii) Die Menge der Cauchyfolgen in (V, p) ist ein Unterraum aller Folgen in (V, p). Definition 11.43. Auf EF(X, µ, E) verwenden wir stets die Seminorm k · kL1 . (i) Eine Cauchyfolge in EF(X, µ, E) heißt L1 -Cauchyfolge. (ii) Eine Funktion f : X → E heißt µ-integrierbar oder bezüglich des Maßes µ integrierbar, falls es eine L1 -Cauchyfolge (ϕj )j∈N ⊂ EF(X, µ, E) mit ϕj → f µ-fast überall für j → ∞ gibt. (iii) Die Menge aller µ-integrierbaren Funktionen f : X → E bezeichnen wir mit L1 (X, µ, E). Theorem 11.44. Es gelten die folgenden Inklusionen von Untervektorräumen: EF(X, µ, E) ⊂ L1 (X, µ, E) ⊂ L0 (X, µ, E). Beweis. ? Die erste Inklusion gilt nach Definition, die zweite folgt aus Theorem 11.21. 11.2.3. Das Lebesgue-Bochnersche Integral. Die folgende Definition stimmt für Funktionen in EF mit unserer bisherigen Definition überein. Definition 11.45. Sei f ∈ L1 (X, µ, E) und (ϕj )j∈N ⊂ EF(X, µ, E) eine L1 Cauchyfolge mit ϕj → f µ-fast überall. Dann definieren wir das Bochner-Lebesguesche Integral von f über X bezüglich µ durch Z Z f dµ := lim ϕj dµ. j→∞ X X Wir müssen noch die Wohldefiniertheit zeigen: Diese Definition hängt nicht von der speziellen Wahl der Folge (ϕj )j∈N ab und der Grenzwert existiert in E. Lemma 11.46. Sei (ϕj )j∈N ⊂ EF(X, µ, E) eine Cauchyfolge. Dann gibt es eine Teilfolge (ϕjk )k∈N von (ϕj )j∈N und ein f ∈ L1 (X, µ, E) mit (a) ϕjk → f für k → ∞ µ-fast überall. (b) Zu ε > 0 gibt es eine Menge Aε ∈ A mit µ(Aε ) < ε, so dass (ϕjk )k∈N in X \ Aε gleichmäßig gegen f konvergiert. Beweis. (i) Nach Definition einer Cauchyfolge gibt es nk ∈ N mit kϕi − ϕj k < 2−2k für alle i, j ≥ nk . Wir dürfen ohne Einschränkung annehmen, dass (nk )k∈N ⊂ N monoton wachsen ist und erhalten eine Teilfolge (ψk )k∈N ≡ (ϕnk )k∈N von (ϕj )j∈N mit kψi − ψj kL1 < 2−2j für alle i ≥ j ≥ 0. (ii) Wir definieren Bl := x ∈ X : kψl+1 (x) − ψl (x)k ≥ 2−l . Es folgt Bl ∈ A und da jede der Funktionen ψl µ-einfach ist, gilt µ(Bl ) < ∞. Also sind auch die Funktionen χBl µ-einfache Funktionen und wir erhalten Z Z 2−l µ(Bl ) = 2−l χBl dµ ≤ kψl+1 − ψl k dµ = kψl+1 − ψl kL1 < 2−2l . X X 91 11.2. INTEGRIERBARE FUNKTIONEN ∞ S Somit gilt µ(Bl ) < 2−l für alle l ∈ N. Daher erhalten wir für An := Bn+k k=0 T die Abschätzung µ(An ) ≤ 2−n+1 für alle n ∈ N. Somit ist A := An eine n∈N µ-Nullmenge. (iii) Wir möchten nun zeigen, dass wir An als Ausnahmemenge Aε nehmen können, ∞ T (X \ Bn+k ). Dann falls n ∈ N hinreichend groß ist. Sei dazu x ∈ X \ An = k=0 erhalten wir kψl+1 (x) − ψl (x)k < 2−l für alle l ≥ n. Somit konvergiert die ∞ P (ψl+1 − ψl ) aufgrund des Majorantenkriteriums auf X \ An Reihe ψ0 + l=0 S gleichmäßig. In {A = {An erhalten wir somit punktweise Konvergenz. n∈N Wir definieren daher ( f (x) := lim ψk (x), k→∞ x ∈ X \ A, x ∈ A. 0, Da außerhalb der µ-Nullmenge A Konvergenz vorliegt, erhalten wir ψk = ϕnk → f µ-fast überall für k → ∞. Fixiere nun n ∈ N mit µ(An ) ≤ 2−n+1 < ε. Dann haben wir in X \ An bereits gezeigt, dass (ϕjk )k∈N in X \An gleichmäßig gegen f konvergert. Somit erhalten wir die Behauptung mit Aε := An . Lemma 11.47. Seien (ϕj )j∈N und (ψj )j∈N L1 -Cauchyfolgen in EF(X, µ, E), die µ-fast überall gegen dieselbe Funktion konvergieren. Dann gilt lim kϕj −ψj kL1 = 0. j→∞ Beweis. (i) Sei ε > 0. Für j ∈ N definieren wir ηj := ϕj − ψj . Als Differenz von Cauchyfolgen ist auch (ηj )j∈N eine Cauchyfolge in EF(X, µ, E). Daher gibt es N ∈ N mit kηj − ηk kL1 < ε/8 für alle j, k ≥ N . (ii) Da ηN eine µ-einfache Funktion ist, gelten A := {x ∈ X : ηN (x) 6= 0} ∈ A und µ(A) < ∞. Nach Voraussetzung konvergiert (ηj )j∈N µ-fast überall gegen Null. Nach Lemma 11.46 gibt es eine Menge B ∈ A mit µ(B) < 8(1+kηεN kL∞ ) und eine Teilfolge (ηjk )k∈N von (ηj )j∈N , so dass (ηjk )k∈N in X \ B gleichmäßig gegen 0 konvergiert. Daher gibt es jK ≥ N , so dass ε für x ∈ A \ B kηjK (x)k ≤ 8(1 + µ(A)) R gilt. Insbesondere folgt hieraus kηjK k dµ ≤ ε/8. A\B (iii) Aus der Cauchyfolgenbedingung für ηj und nach Wahl von B erhalten wir Z Z Z kηjK k dµ ≤ kηjK − ηN k dµ + kηN k dµ B B B ≤ kηjK − ηN k L1 + kηN kL∞ · µ(B) < ε/4. (iv) Da ηN nur auf A nicht verschwindet, erhalten wir mit der Cauchyfolgenbedingung für ηjK Z Z Z kηjK k dµ ≤ kηjK − ηN k dµ + kηN k dµ X\A X\A X\A | ≤ kηjK − ηN kL1 < ε/8. {z =0 } 92 11. INTEGRATIONSTHEORIE (v) Da wir über diskunkte µ-messbare Teilmengen getrennt integrieren dürfen, erhalten wir aus den obigen Abschätzungen Z kηjK k dµ < ε/8 + ε/8 + ε/4 = ε/2. kηjK kL1 ≤ (X\A)∪(A\B)∪B (vi) Somit erhalten wir aus der Dreiecksungleichung für j ≥ N die Abschätzung kηj kL1 ≤ kηjK kL1 + kηj − ηjK kL1 < ε/2 + ε/8 < ε. Nach Definition von ηj folgt somit die Behauptung. Korollar 11.48. Seien (ϕj )j∈N und (ψj )j∈N Cauchyfolgen in EF(X, µ, E), die µ-fast überall gegen dieselbe Funktion konvergieren. Dann konvergieren auch die R R Folgen ϕj dµ und ψj dµ und haben denselben Grenzwert. X X j∈N j∈N Beweis. Wegen Z Z ϕj dµ − ϕk dµ ≤ kϕj − ϕk kL1 X X für alle j, k ∈ N sind auch die Folgen der Integrale Cauchyfolgen in E und konvergieren daher gegen eϕ bzw. eψ ∈ E. Mit Lemma 11.47 und der Stetigkeit der Norm erhalten wir Z Z Z Z ϕk dµ = lim ϕj dµ − ψj dµ ϕj dµ − lim keϕ − eψ k = lim j→∞ j→∞ k→∞ X X X X Z ≤ lim kϕj − ψj k dµ = lim kϕj − ψj kL1 = 0 j→∞ j→∞ X wie behauptet. Dies rechtfertigt die obige Definition des Bochner-Lebesgueschen Integrales. 11.2.4. Die Vollständigkeit von L1 . Wir definieren auf L1 (X, µ, E) eine Seminorm und zeigen die Vollständigkeit bezüglich dieser Norm. Lemma 11.49. Sei f ∈ L1 (X, µ, E). Dann gilt kf k ∈ L1 (X, µ, R). Sei (ϕj )j∈N ⊂ EF(X, µ, E) eine Cauchyfolge mit ϕj → f µ-fast überall, so gilt Z Z kf k dµ = lim kϕj k dµ. j→∞ X X Beweis. Da Seminormen die Dreiecksungleichung erfüllen, erfüllen sie auch die umgekehrte Dreiecksungleichung. Somit erhalten wir kkϕj kE − kϕk kE kL1 ≤ kϕj − ϕk kL1 für alle j, k ∈ N. Daher ist auch kϕj k ≡ kϕj kE ⊂ EF(X, µ, R) eine L1 Cauchyfolge und es gilt kϕj k → kf k µ-fast überall. Somit folgt kf k ∈ L1 (X, µ, R) 1 und wir erhalten mit Korollar R R 11.48 und nach Definition des Integrals für L Funktionen kf k dµ = lim kϕj k dµ. X j→∞ X Korollar 11.50. k · kL1 mit kf kL1 := R kf k dµ ist Seminorm auf L1 (X, µ, E), die X L1 -Seminorm. Der Beweis besteht darin, die Eigenschaften einer Seminorm auf EF(X, µ, E) zu benutzen und zu zeigen, dass diese im Grenzwert erhalten bleiben. Beweis. ? Seien f, g ∈ L1 (X, µ, E) und (ϕj )j∈N , (ψj )j∈N ⊂ EF(X, µ, E) Cauchyfolgen mit ϕj → f und ψj → g für j → ∞ µ-fast überall in X. 93 11.2. INTEGRIERBARE FUNKTIONEN (i) Positive Semidefinitheit: Es gilt Z Z kf kL1 = kf k dµ = lim kϕj k dµ = lim kϕj kL1 ≥ 0, j→∞ X j→∞ X da k · kL1 auf EF(X, µ, E) positiv semidefinit ist und der Grenzwert nach Lemma 11.49 existiert. (ii) Dreiecksungleichung: Es gilt kf + gkL1 = lim kϕj + ψj kL1 ≤ lim (kϕj kL1 + kψj kL1 ) = kf kL1 + kgkL1 . j→∞ j→∞ (iii) kαf kL1 = |α| · kf kL1 ist eine einfache Übung. Bemerkung 11.51. ? Da k · kL1 eine Seminorm auf L1 (X, µ, E) definiert, wollen wir L1 (X, µ, E) ab jetzt als topologischen Raum mit der von dieser Seminorm induzierten Topologie betrachten. Theorem 11.52. (i) EF(X, µ, E) ist dicht in L1 (X, µ, E). (ii) L1 (X, µ, E) ist folgenvollständig. Die Beweisideen sind wie folgt: (i) Benutze ϕj aus der f ∈ EF(X, µ, E) approximierenden Cauchyfolge mit hinreichend großem j ∈ N. (ii) Zu einer Cauchyfolge (fj )j∈N ⊂ L1 (X, µ, E) wählen wir ϕj ∈ EF(X, µ, E) mit kϕj − fj kL1 < 2−j . Eine Teilfolge davon konvergiert nach Lemma 11.46 auch µ-fast überall punktweise. Sei f dieser Grenzwert. Dann ist diese Teilfolge gerade eine Folge in EF(X, µ, E), die f wie gewünscht approximiert und daher f ∈ L1 (X, µ, E) und die Folgenvollständigkeit zeigt. Beweis. ? (i) Sei f ∈ L1 (X, µ, E) und (ϕj )j∈N ⊂ EF(X, µ, E) eine L1 -Cauchyfolge mit ϕj → f µ-fast überall für j → ∞. Sei k ∈ N beliebig. Dann ist auch (ϕj − ϕk )j∈N ⊂ EF(X, µ, E) eine L1 -Cauchyfolge mit (ϕj − ϕk ) → (f − ϕk ) µ-fast überall für j → ∞. Nach Lemma 11.49 folgt somit kf −ϕk kL1 = lim kϕj −ϕk k j→∞ für beliebige k ∈ N. Sei ε > 0. Da (ϕj )j∈N eine Cauchyfolge ist, gibt es N ∈ N mit kϕj −ϕk kL1 < ε für alle j, k ≥ N . Mit j → ∞ erhalten wir kf − ϕN kL1 ≤ ε. Somit liegt EF(X, µ, E) in L1 (X, µ, E) dicht. (ii) Sei (fj )j∈N ⊂ L1 (X, µ, E) eine Cauchyfolge. Sei ε > 0. Sei M ∈ N mit kfj − fk kL1 < ε/2 für alle j, k ≥ M . Aufgrund der Dichtheit EF ⊂ L1 gibt es zu j ∈ N ein ϕj ∈ EF(X, µ, E) mit kfj − ϕj kL1 < 2−j . Nach Dreiecksungleichung für die Seminorm k · kL1 gilt kϕj − ϕk kL1 ≤ kϕj − fj kL1 + kfj − fk kL1 + kfk − ϕk kL1 < 2−j + ε/2 + 2−k . Es folgt, dass (ϕj )j∈N ⊂ EF(X, µ, E) eine L1 -Cauchyfolge ist. Nach Lemma 11.46 gibt es somit eine Teilfolge (ϕjk )k∈N von (ϕj )j∈N und ein f ∈ L1 (X, µ, E) mit ϕjk → f µ-fast überall für k → ∞. Aus dem Beweis des ersten Teiles sehen wir, dass es ein N ≥ M mit kf −ϕjN kL1 < ε/4 gibt. Nach Dreiecksungleichung erhalten wir kf − fj kL1 ≤ kf − ϕjN kL1 + kϕjN − fjN kL1 + kfjN − fj kL1 < ε {z } | {z } | {z } | <ε/4 <2−jN <ε/2 für j ≥ N genügend groß, wobei die Terme aufgrund der letzten Ungleichung, der Wahl der Funktionen ϕj und der Cauchyfolgenbedingung für (fj )j∈N wie angegeben beschränkt sind. Somit folgt fj → f in L1 (X, µ, E). 94 11. INTEGRATIONSTHEORIE 11.2.5. Elementare Eigenschaften des Integrals. Wir zeigen in diesem Kapitel, dass gewisse Eigenschaften des Integrals für EF-Funktionen auch für L1 -Funktionen erhalten bleiben. Theorem 11.53. R (i) Die Abbildung · dµ : L1 (X, µ, E) → E ist linear und stetig und es gilt X Z Z f dµ ≤ kf k dµ = kf kL1 . X X (ii) R · dµ : L1 (X, µ, R) → R ist eine stetige positive Linearform, d. h. die Abbil- X dung ist stetig und Funktionen f ∈ L1 mit f (x) ≥ 0 für (µ-fast) alle x ∈ X werden auf eine nichtnegative reelle Zahl abgebildet. (iii) Sei F ein Banachraum und T ∈ L(E, F ). Dann gelten T f ∈ L1 (X, µ, F ) und Z Z T f dµ = T f dµ X X 1 für alle f ∈ L (X, µ, E). Beweis. Für ein f ∈ L1 (X, µ, E) sei (ϕj )j∈N ⊂ EF(X, µ, E) eine L1 -Cauchyfolge mit ϕj → f punktweise µ-fast überall. Dann folgt aus Z Z ϕj dµ ≤ kϕj k dµ = kϕj kL1 X X für alle j ∈ N durch Grenzübergang Z Z f dµ ≤ kf k dµ = kf kL1 . X X Hieraus folgen die Stetigkeit und die gewünschte Abschätzung. Die anderen Behauptungen folgen analog durch Approximation und Grenzübergang. (Details: Übung.) Korollar 11.54. (i) Die Abbildung f ≡ f 1 , . . . , f n : X → Rn ist genau dann µ-integrierbar, wenn dies für jede Komponente f j , 1 ≤ j ≤ n, gilt. Dann gilt Z Z Z f dµ = f 1 dµ, . . . , f n dµ . X X X (ii) ? Seien g, h : X → R und f := g + ih. Dann gilt f ∈ L1 (X, µ, C) genau dann, wenn g, h ∈ L1 (X, µ, R) gilt. In diesem Fall ist Z Z Z f dµ = g dµ + i h dµ. X X X (iii) Eine Funktion f : X → R ist genau dann µ-integrierbar, falls dies für f + = max{f, 0} und f − = max{−f, 0} gilt. (Beachte f = f + −f − .) In diesem Falle gelten Z Z Z Z Z Z f dµ = f + dµ − f − dµ und |f | dµ = f + dµ + f − dµ. X Beweis. X X X X X 95 11.2. INTEGRIERBARE FUNKTIONEN (i) Wir benutzen Theorem 11.53. • „=⇒“: Sei f ∈ L1R. Dann giltR dies auch für die Komponenten f j = πj ◦ f j . Weiterhin ist πj f dµ = f j dµ. Daraus erhalten wir die Darstellung X R X der Komponenten von f . • „⇐=“: Sei ij : R → Rn die Einbettung x 7→ xej in die j-te Komponente. n P ij ◦ f j . Ist f j ∈ L1 für alle j, so folgt die Behauptung aus f = j=1 (ii) ? Mit der Identifikation R2 ∼ = C ist dies eine Umformulierung des ersten Teiles. (iii) Dies folgt aus den Darstellungen f + = (f + |f |)/2, f − = (|f | − f )/2, f = f + − f − und |f | = f + + f − , der Linearität des Integrals und da nach Lemma 11.49 mit f ∈ L1 auch |f | ∈ L1 gilt. Lemma 11.55. ? Seien f ∈ L1 (X, µ, E) und A ∈ A. Dann gilt χA f ∈ L1 (X, µ, E). Beweis. Sei (ϕj )j∈N ⊂ EF(X, µ, E) eine L1 -Cauchyfolge mit ϕj → f punktweise µfast überall. Dann ist auch χA ϕj ∈ EF(X, µ, E). Klar ist χA ϕj → χA f punktweise µ-fast überall. Wegen χA g ≤ g für jede nichtnegative Funktion g und der Positivität (oder Monotonie) des Integrals erhalten wir Z Z Z kχA ϕj − χA ϕk k = χA kϕj − ϕk k dµ ≤ kϕj − ϕk k dµ X X X für alle j, k ∈ N. Somit ist (χA ϕj )j∈N ⊂ EF(X, µ, E) eine L1 -Cauchyfolge und wir erhalten χA f ∈ L1 (X, µ, E). Dieses Resultat motiviert Definition 11.56. ? Seien f ∈ L1 (X, µ, E) und A ∈ A. Dann definieren wir das Integral von f über A durch Z Z f dµ := χA f dµ. A X 1 Bemerkung 11.57. Sei f ∈ L (X, µ, R) mit f ≥ 0. Dann ist die Abbildung Z ν : A → [0, ∞) mit A 7→ f dµ A ein endliches (d. h. es gilt ν(X) < ∞) Maß. µ-Nullmengen spielen bei der Integration von Funktionen keine Rolle. Lemma 11.58. Sei f ∈ L1 (X, µ, E) und sei g : X → E eine Funktion mit f = g µ1 fast R überall. R Dann gilt auch g ∈ L (X, µ, E) und für die Integrale gilt die Beziehung f dµ = g dµ. X X Beweis. Eine L1 -Cauchyfolge (ϕj )j∈N ⊂ EF(X, µ, E) mit ϕj → f punktweise µfast überall hat diese Eigenschaften auch für g statt f , da sich diese Funktionen nur auf einer µ-Nullmenge unterscheiden. Somit folgt die Behauptung. Korollar 11.59. (i) Sei f : X → E eine Abbildung mit f = 0 µ-fast überall. Dann ist f ∈ R L1 (X, µ, E) und es gilt f dµ = 0. X R (ii) Seien f, g ∈ L1 (X, µ, R) und gelte f ≤ g µ-fast überall. Dann gilt f dµ ≤ X R g dµ. X 96 11. INTEGRATIONSTHEORIE Beweis. Klar. Theorem 11.60. Seien f ∈ L1 (X, µ, E) und α > 0. Dann ist µ({x ∈ X : kf (x)k ≥ α}) < ∞. Beweis. Wir definieren A :=S{x ∈ X : kf (x)k ≥ α}. Seien weiterhin Ai ∈ A, i ∈ N, mit µ(Ai ) < ∞, Ai % und Ai = X. Es gilt αχE∩Ai ≤ kf k. Aus der Monotonie i∈N des Integrals und der Stetigkeit des Maßes von unten erhalten wir Z ∞ > kf kL1 ≥ α χE∩Ai dµ = αµ(E ∩ Ai ) → αµ(E). X Hieraus folgt die Behauptung. Bemerkung 11.61. ? Ist µ({x ∈ X : kf (x)k ≥ α}) ≡ µ(Xα ) < ∞ bereits bekannt, so erhält man mit χXα α ∈ EF(X, µ, E) die Abschätzung Z Z 1 1 αχXα dµ ≤ kf k dµ. µ(Xα ) = α α X X 11.2.6. Konvergenz in L1 . Theorem 11.62. Sei (fj )j∈N ⊂ L1 (X, µ, E) mit fj → f in L1 (X, µ, E). (i) Dann gibt es eine Teilfolge (fjk )k∈N von (fj )j∈N , so dass • fjk → f punktweise µ-fast überall für k → ∞. • Zu jedem ε > 0 gibt es eine Menge A ∈ A mit µ(A) < ε, so dass fjk ⇒ f in RX \ A für Rk → ∞ gilt. (ii) Es gilt fj dµ → f dµ für j → ∞. X X Der Beweis ähnelt dem von Lemma 11.46 für einfache Funktionen. Beweis. ? (i) Wir dürfen ohne Einschränkung f ≡ 0 annehmen, da wir sonst (fj − f )j∈N betrachten können. Nach Übergang zu einer Teilfolge, vergleiche beispielsweise den Beweis von Lemma 11.46, dürfen wir ohne Einschränkung annehmen, dasss kfl −fm kL1 < 2−2l für alle m ≥ l ≥ 0 gilt. Wir lassen m → ∞ und erhalten aufgrund der Ste tigkeit von k·kL1 die Abschätzung kfl kL1 = kfl −0kL1 = fl − lim fm = m→∞ L1 lim kfl − fm kL1 ≤ 2−2l . Wir definieren Bl := x ∈ X : kfl (x)k ≥ 2−l . Wem→∞ gen kfl k ∈ L1 ⊂ L0 gilt Bl ∈ A. Es folgt mit Theorem 11.60 Z Z −l 2 µ(Bl ) ≤ kfl k dµ ≤ kfl k dµ = kfl kL1 ≤ 2−2l für alle l ∈ N. Bl X Somit ist µ(Bl ) ≤ 2−l für alle l ∈ N. Wir definieren An := ∞ S Bn+k , n ∈ N, k=0 und erhalten hierfür die Abschätzung µ(An ) ≤ 2 · 2−n . Somit ist N := ∞ T An n=0 eine µ-Nullmenge. In X \ An gilt kfl − 0k < 2−l für alle l ≥ n. Somit erhalten wir die gewünschte gleichmäßige Konvergenz falls wir n ∈ N so groß fixieren, dass µ(An ) < ε gilt, und wir A = An wählen. Für x ∈ X \ N gilt x 6∈ Am für ein m ∈ N und somit (nutze die gleichmäßige Konvergenz in X \ Am ) punktweise Konvergenz fl (x) → 0 für l → ∞. 11.3. KONVERGENZSÄTZE 97 (ii) Nach Dreiecksungleichung folgt Z Z Z fj dµ − f dµ ≤ kfj − f k dµ = kfj − f kL1 X X X für alle j ∈ N. Nach Voraussetzung konvergiert die rechte Seite für j → ∞ gegen Null. Korollar 11.63. Sei f ∈ L1 (X, µ, E). Dann ist kf kL1 = 0 genau dann, wenn f = 0 µ-fast überall gilt. Beweis. • „=⇒“: Die konstante Folge fj ≡ 0 konvergiert in L1 (X, µ, E) gegen f . Nach Theorem 11.62 konvergiert eine Teilfolge von (fj )j∈N µ-fast überall gegen f . Somit gilt f = 0 µ-fast überall. • „⇐=“: EsRgilt kf k = 0 µ-fast überall. Benutze nun Lemma 11.58 und erhalte kf kL1 = kf k dµ = 0. X 11.3. Konvergenzsätze. Wir werden sehen, dass sich das Lebesguesche Integral bei punktweiser Grenzwertbildung besser als das Riemannsche Integral verhält. Nach Theorem 11.19 wissen wir, dass sich jede Funktion f ∈ L0 X, µ, R+ durch eine wachsende Folge (ϕj )j∈N ⊂ EF(X, µ, R+ ) mit ϕj → f punktweise für j → ∞ approximieren lässt. Wir werden in Bemerkung 11.67 sehen, dass das nachfolgend definierte Lebesguesche Integral mit dem bereits definierten Lebesgue-Bochnerschen Integral übereinstimmt, falls beide definiert sind. Daher verzichten wir hier auch auf die Einführung einer neuen Bezeichnung für das Integral. Definition 11.64. Sei f ∈ L0 X, µ, R+ und (ϕj )j∈N ⊂ EF(X, µ, R+ ) eine wachsende Folge mit ϕj → f punktweise für j → ∞. Dann definieren wir das (Lebesguesche) Integral von f über X bezüglich des Maßes µ durch Z Z ϕj dµ. f dµ := lim j→∞ X X Für A ∈ A ist das (Lebesguesche) Integral von f über A bezüglich des Maßes µ durch Z Z := ϕj dµ f dµ lim j→∞ A A definiert. Wir weisen im folgenden Lemma und Korollar nach, dass das hier definierte Integral für f ∈ L0 X, µ, R+ wohldefiniert ist. Lemma 11.65. Seien ϕk , ψ ∈ EF(X, µ, R+ ), k ∈ N. Sei (ϕk )k∈N wachsend und gelte ψ ≤ lim ϕk . Dann gilt k→∞ Z Z ψ dµ ≤ lim ϕk dµ. k→∞ X Beweis. Sei ψ = m P X αj χAj die Normalform von ψ. Sei λ > 1. Wir definieren Bk := j=0 {x ∈ X : λϕk (x) ≥ ψ(x)}, k ∈ N. Da (ϕk )k∈N wachsend ist, erhalten wir Bk ⊂ Bk+1 . 98 11. INTEGRATIONSTHEORIE Wegen λ > 1 folgt S Bk = X. Mit der Stetigkeit des Maßes von unten und mit k∈N ψχBk ≤ λϕk erhalten wir Z m m X X ψ dµ = αj µ(Aj ) = lim αj µ(Aj ∩ Bk ) k→∞ j=0 X j=0 Z Z ψχBk dµ ≤ λ lim = lim k→∞ ϕk dµ. k→∞ X X Da λ > 1 beliebig war, folgt die Behauptung. Korollar 11.66. Seien (ϕj )j∈N , (ψj )j∈N ⊂ EF(X, µ, R+ ) wachsende Funktionenfolgen mit lim ϕj = lim ψj (punktweise). Dann gilt j→∞ j→∞ Z lim Z ϕj dµ = lim j→∞ ψj dµ j→∞ X in R+ . X Beweis. Nach Voraussetzung gilt ψk ≤ lim ψj = lim ϕj für jedes feste k ∈ N. j→∞ j→∞ Daher erhalten wir nach Lemma 11.65 Z Z ϕj dµ. ψk dµ ≤ lim j→∞ X X Mit k → ∞ folgt hieraus Z Z ψk dµ ≤ lim lim ϕj dµ. j→∞ k→∞ X X Die Behauptung folgt nun aus Symmetriegründen. Dies zeigt die Unabhängigkeit des Lebesgueschen Integrals von der Auswahl der monoton approximierenden Folge. Bemerkung 11.67. (i) Seien f, g ∈ L0 X, µ, R+ mit f ≤ g µ-fast überall. Dann folgt Z Z f dµ ≤ g dµ. X X (ii) Für Rf ∈ L0 X, µ, R+ sind die folgenden Aussagen äquivalent: (a) f dµ = 0. X (b) {x ∈ X : f (x) > 0} ist eine Nullmenge. (c) Es gilt f = 0 µ-fast überall. Beweis. • „(iia) =⇒ (iib)“: Setze Aj := {xR ∈ X : f (x) > 1/j} für j ∈ N>0 . Dann R gilt 0 ≤ µ(Aj ) = χAj dµ ≤ j f dµ = 0 und wir erhalten µ(Aj ) = X X S 0. Nun gilt {x ∈ X : f (x) > 0} = Aj und die Behauptung folgt j>0 wahlweise aus der Stetigkeit des Maßes von unten oder der abzählbaren Subadditivität. • „(iib) =⇒ (iic)“: Klar. 99 11.3. KONVERGENZSÄTZE • „(iic) =⇒ (iia)“: (Beachte, dass wir hier die Definition des Integrales für f ∈ L0 verwenden müssen.) Sei N eine Nullmenge mit f = 0 in X \ N . Dann gelten f χX\N = 0 und f χN ≤ ∞χN . Wir erhalten Z Z Z Z 0 ≤ f dµ = f χN dµ + f χX\N dµ ≤ ∞ dµ + 0 = 0. X X 0 (iii) Seien f, g ∈ L X N X, µ, R+ und α ∈ [0, ∞]. Dann gilt Z Z Z (αf + g) dµ = α f dµ + g dµ. X X X (Im Falle α = ∞ approximieren wir αf monoton von unten durch ϕj = jχ{x∈X : f (x)>0} .) R (iv) Sei f ∈ L0 (X, µ, R+ ) und sei f dµ < ∞. Dann gilt f ∈ L1 (X, µ, R+ ) und das X R Lebesguesche Integral und das Bochner-Lebesguesche Integral f dµ stimmen X überein. Beweis. Sei (ϕj )j∈N ⊂ EF(X, µ R+ ) eine monoton wachsende Folge mit ϕj → R f für j → ∞. Nach Definition und wegen f dµ < ∞ gibt es daher für jedes R RX ε > 0 ein N ∈ N mit 0 ≤ f dµ − ϕj dµ < ε für alle j ≥ N . Seien X X indem wir für das letzte Gleichheitszeichen in Rk ≥ j ≥ NR. Wir erhalten R ϕk − ϕj = ϕk − ϕj zum Grenzwert k → ∞ übergehen Z Z Z Z Z |ϕk − ϕj | dµ = (ϕk − ϕj ) dµ ≤ f − ϕj dµ = f dµ − ϕj dµ < ε. X X X X X 1 Deher ist (ϕj )j∈N ⊂ EF(X, µ, R+ ) eine L -Cauchyfolge mit ϕj → f für j → ∞ nicht nur µ-fast überall, sondern sogar überall. Somit gilt f ∈ L1 (X, µ, R+ ) ⊂ L0 (X, µ, R+ ). Wir können nun (ϕj )j∈N auch zur Berechnung von f ∈ L1 benutzen und erhalten die Gleichheit der beiden Integrale. R 1 (v) Sei f ∈ L (X, µ, R+ ). Dann ist das Lebesguesche Integral f dµ endlich und X stimmt mit dem Bochner-Lebesgueschen Integral überein. Beweis. ? Übung unter Benutzung von Theorem 11.19, vergleiche auch [1, Bemerkung 3.3 (e)(ii)]. Benutze alternativ den Satz von der monotonen Konvergenz, Theorem 11.68, aus dem nächsten Kapitel. (vi) Sei f ∈ L0 X, µ, R+ . Dann gilt Z Z f dµ = sup ϕ dµ : ϕ ∈ EF(X, µ, R+ ) mit ϕ ≤ f µ-fast überall . X X 11.3.1. Satz von der monotonen Konvergenz. Das folgende Resultat wird auch als Satz von Beppo Levi (1875-1961) bezeichnet. Theorem 11.68 (Satz von der monotonen Konvergenz). Sei (fj )j∈N ⊂ L0 X, µ, R+ monoton wachsend. Dann gilt Z Z lim fj dµ = lim fj dµ in R+ . j→∞ X Beweis. j→∞ X 100 11. INTEGRATIONSTHEORIE (i) Wir definieren f : X → R+ durch f (x) := lim fj (x). Da L0 X, µ, R+ unj→∞ ter Supremumsbildung und daher auch unter monotoner Limesbildung abge0 schlossen ist, R R siehe Theorem 11.17, gilt f ∈ L X, µ, R+ . Aus fj ≤ f folgt fj dµ ≤ f dµ für alle j ∈ N (Monotonie des Lebesgue-Integrales, siehe X X R R Bemerkung 11.67). Somit folgt lim fj dµ ≤ f dµ. j→∞ X X (ii) Sei ϕ ∈ EF(X, µ, R+ ) beliebig mit ϕ ≤ f . Sei λ > 1. Wir definieren Mengen Aj := {x : ϕ(x) ≤ λfj (x)} für j ∈ N. Die Folge (Aj )j∈N ist monoton wachsend ∞ S Aj = X. Somit folgt ϕχAj % ϕ (monotone Konvergenz). Da und es gilt j=0 ϕχ R Aj ∈ EF(X, µ, R+ ) gilt, können wir diese Funktionen zur Berechnung von ϕ dµ benutzen. Nach Definition von Aj gilt weiterhin ϕχAj ≤ λfj . Wir X erhalten also Z Z j→∞ X Z ϕχAj dµ ≤ λ lim ϕ dµ = lim fj dµ. j→∞ X X Da λ > 1 beliebig war, gilt diese Ungleichung auch im Grenzwert λ = 1 für beliebige ϕ ∈ EF(X, µ, R+ ) mit ϕ ≤ f . Wir gehen nun auf der linken Seite dieser Ungleichung zum Supremum Funktionen ϕ über und R R über alle solche erhalten nach Bemerkung 11.67 f dµ ≤ lim fj dµ. j→∞ X X Die Behauptung folgt. Korollar 11.69. ? Sei (fj )j∈N ⊂ L0 X, µ, R+ . Dann gilt Z X ∞ ∞ Z X fj dµ in R+ . fj dµ = X j=0 j=0 X Beweis. Nach Korollar 11.20 ist L0 X, µ, R+ unter Summenbildung abgeschlossen. Somit folgt die Behauptung aus dem Satz von der monotonen Konvergenz. Bemerkung 11.70. ? Für nichtwachsende Folgen ist der Satz über R die monotone Konvergenz i. A. falsch. Sei fj = 1j χ[0,j] . Dann gilt fj ⇒ 0, jedoch fj dλ1 = 1 für R alle j ∈ N. 11.3.2. Das Lemma von Fatou. Theorem 11.71 (Lemma von Fatou). Sei (fj ) ⊂ L0 X, µ, R+ Folge. Dann gilt Z Z lim fj dµ ≤ lim fj dµ in R+ . j→∞ eine beliebige j→∞ X X Beweis. Wir definieren gj := inf fk . Da L0 unter Infimumsbildung abgeschlossen k≥j ist, folgt gj ∈ L0 X, µ, R+ . Nach Definition ist die Konvergenz gj % lim fj j→∞ monoton. Somit folgt aus dem Satz von der monotonen Konvergenz Z Z Z lim fj dµ = lim gj = lim gj dµ. j→∞ j→∞ X j→∞ X X R R Sei k ≥ j. Dann gilt gj ≤ fk und wir erhalten gj dµ ≤ fk dµ. Damit gilt auch X X R R gj dµ ≤ inf fk dµ. Daraus wird im Grenzwert j → ∞ auf der rechten Seite der X k≥j X 101 11.3. KONVERGENZSÄTZE Limes inferior und zusammen mit dem ersten Teil des Beweises erhalten wir die Behauptung. Gibt es eine Majorante, so erhalten wir die umgekehrte Ungleichung für den Limes superior. R Korollar 11.72. Sei (fj )j∈N ⊂ L0 X, µ, R+ . Sei g ∈ L0 X, µ, R+ mit g dµ < X ∞ und fj ≤ g µ-fast überall für alle j ∈ N. Dann folgt Z Z fj dµ ≤ lim lim fj dµ in R+ . j→∞ j→∞ X X Beweis. ? Sei N eine Nullmenge mit fj (x) ≤ g(x) für alle x ∈ X \ N . Indem wir nur über X \ N integrieren, dürfen wir, da dies den Wert der Integrale nicht ändert, ohne Einschränkung annehmen, dass überall fj ≤ g gilt. Wir definieren gj := g − fj und erhalten aus dem Lemma von Fatou Z Z Z Z Z Z fj dµ. lim fj dµ = g dµ − lim gj dµ ≤ lim gj dµ = g dµ − lim j→∞ X Wegen X R j→∞ X j→∞ j→∞ X X g dµ < ∞ folgt hieraus die Behauptung. X X Theorem 11.73. Sei f ∈ L0 (X, µ, E). Dann sind die folgenden Aussagen äquivalent: (i) f ∈ L1 (X, µ, E), 1 (ii) kf R k ∈ L (X, µ, R) und (iii) kf k dµ < ∞. X R Ist eine dieser drei Bedingungen erfüllt, so gilt f dµ ≤ kf kL1 < ∞. X Beweis. • „(i) =⇒ (ii)“: Dies ist ein Teil von Lemma 11.49. • „(ii) =⇒ (iii)“: Ist klar, da das Lebesgue-Bochnersche Integral wohldefiniert und daher insbesondere „< ∞“ ist. • „(iii) =⇒ (ii)“: Dies folgt aus Bemerkung 11.67 (iv). • „(ii) =⇒ (i)“: Nach Definition von L0 (X, µ, E) gibt es eine Folge (ϕj )j∈N ⊂ EF(X, µ, E) mit ϕj → f µ-fast überall. Wir modifizieren die Folge (ϕj )j∈N nun so, dass wir zusätzlich eine µ-integrierbare Majorante haben. Dazu definieren wir Aj := {x ∈ X : kϕj (x)k ≤ 2kf (x)k} und fj := ϕj χAj . Als Urbild der L0 (X, µ, R)-Funktion 2kf k − kϕj k von [0, ∞) gilt Aj ∈ A. Somit erhalten wir fj , indem wir ϕj auf einer Amessbaren Menge zusätzlich Null setzen. Daher gilt (fj )j∈N ⊂ EF(X, µ, E). Wir behaupten nun, dass auch fj → f µ-fast überall gilt. Sei dazu N ⊂ A eine Menge mit µ(N ) = 0 und ϕj (x) → f (x) für alle x ∈ X \ N . Sei x ∈ X \ N . Wir unterscheiden zwei Fälle: – Gilt f (x) 6= 0, so existiert aufgrund der punktweisen Konvergenz mit kf (x)k statt ε ein k = k(x) mit kϕj (x) − f (x)k ≤ kf (x)k für alle j ≥ k. Mit der umgekehrten Dreiecksungleichung erhalten wir kϕj (x)k − kf (x)k ≤ kf (x)k und somit x ∈ Aj für j ≥ k(x). Für j ≥ k(x) erhalten wir also fj (x) = ϕj (x) und somit gilt fj (x) → f (x). – Ist f (x) = 0, so folgt im Falle x ∈ Aj bereits ϕj (x) = fj (x) = 0. Sonst ist χAj (x) = 0 und wir erhalten ebenfalls fj (x) = ϕj (x)χAj (x) = 0. 102 11. INTEGRATIONSTHEORIE Insgesamt erhalten wir fj → f in X \ N punktweise für j → ∞. Es gilt für alle j ∈ N und alle x ∈ X die Ungleichung kf (x) − fj (x)k ≤ 3kf (x)k, da sie in Aj aus der Dreiecksungleichung folgt und da in X \ Aj bereits fj = 0 gilt. Nach Korollar 11.72 erhalten wir daraus Z Z lim kf − fj k dµ ≤ lim kf − fj k dµ = 0, j→∞ j→∞ X X da der Integrand auf der rechten Seite µ-fast überall 0 ist. R Sei ε > 0 beliebig. Dann gibt es m ∈ N mit kf − fj k dµ < ε/2 für alle X j ≥ m. Seien j, k ∈ N mit j, k ≥ m beliebig. Somit erhalten wir aus der Dreiecksungleichung Z Z Z kfj − fk kL1 = kfj − fk k dµ ≤ kfj − f k dµ + kf − fj k dµ < ε. X X X 1 Somit ist (fj )j∈N ⊂ EF(X, µ, E) eine L -Cauchyfolge. Wegen fj → f µ-fast überall ist f eine µ-integrierbare oder L1 -Funktion. Die letzte Behauptung folgt aus der Dreiecksungleichung für L1 -Funktionen, siehe Theorem 11.53. Wir erhalten dazu zwei Korollare: Korollar 11.74. Seien (fj )j∈N ⊂ L1 (X, µ, E) und f ∈ L0 (X, µ, E). Gelten fj → f µ-fast überall und lim kfj kL1 < ∞, so ist f ∈ L1 (X, µ, E) und es gilt kf kL1 ≤ j→∞ lim kfj kL1 . j→∞ Beweis. Nach Lemma 11.58 dürfen wir ohne Einschränkung annehmen, dass fj → f überall punktweise gilt. Nach dem Lemma von Fatou und nach Voraussetzung folgt daraus Z Z Z kf k dµ = lim kfj k dµ ≤ lim kfj k dµ < ∞. j→∞ X j→∞ X X 1 Nach Theorem 11.73 erhalten wir nun f ∈ L (X, µ, E). Korollar 11.75. ? Sei (fj )j∈N ⊂ L1 (X, µ, R+ ). Sei f ∈ L1 (X, µ, R). Angenommen es gelten Z Z fj → f µ-fast überall und fj dµ → f dµ X X 1 für j → ∞. Dann folgt fj → f in L (X, µ, R). Beweis. Wir dürfen wieder annehmen, dass fj → f überall punktweise gilt. Es gelten f ≥ 0 und |fj − f | ≤ fj + f . Somit erhalten wir aus dem Lemma von Fatou Z Z Z 2 f dµ = lim (fj + f − |fj − f |) dµ ≤ lim (fj + f − |fj − f |) dµ j→∞ X j→∞ X X Z |fj − f | dµ. f dµ − lim =2 j→∞ X 1 Z X R Da f ∈ L (X, µ, R) ist, folgt nach Theorem 11.73 f dµ < ∞. Somit erhalten wir X R lim |fj − f | dµ = 0 und die Behauptung folgt. j→∞ X 103 11.3. KONVERGENZSÄTZE 11.3.3. Integration numerischer Funktionen. Wir können das Lebesguesche Integral für numerische Funktionen f = f + − f − definieren, bei denen das Integral über den positiven und den negativen Anteil, d. h. über f + und f − endlich ausfallen. Definition ∈ L0 X, µ, R . Dann heißt f bezüglich µ integrierbar, R + 11.76. SeiRf − falls f dµ < ∞ und f dµ < ∞ gelten. In diesem Fall heißt X X Z Z f dµ − f dµ := X Z + X f − dµ X das (Lebesguesche) Integral von f über X bezüglich des Maßes µ. Bemerkung 11.77. ? (i) Für f ∈ L0 X, µ, R sind die folgenden drei Aussagen äquivalent: (a) fR ist bezüglich µ Lebesgue integrierbar. (b) |f | dµ < ∞. X (c) Es gibt g ∈ L1 (X, µ, R) mit |f | ≤ g µ-fast überall. Beweis. • „(ia) =⇒ (ib)“: Dies gilt wegen |f | = f + + f − . • „(ib) =⇒ (ic)“: Nach Theorem 11.73 erhalten wir |f | ∈ L1 (X, µ, R). Wir können also g = |f | wählen. + • „(ic) 11.67 (i) impliziert R + =⇒ (ia)“: Es gilt f ≤ |f | ≤ g und Bemerkung f dµ < ∞. Entsprechendes gilt auch für f − . X (ii) Sei f ∈ L0 (X, µ, R). Dann ist f genau dann bezüglich µ Lebesgue integrierbar, falls f µ-integrierbar ist. In diesem Fall stimmen das Lebesguesche Integral von f über X und das Bochner-Lebesguesche Integral überein, wir müssen in diesem Fall also nicht angeben, welches Integral wir verwenden. Beweis. Wir benutzen (i), Theorem 11.73 und Bemerkung 11.67 (iv). (iii) Sei f ∈ L0 X, µ, R bezüglich µ Lebesgue integrierbar. Dann ist {x ∈ X : |f (x)| = ∞} eine µ-Nullmenge. 11.3.4. Der Satz von der dominierten Konvergenz. Der folgende Satz heißt auch der Satz von Lebesgue oder der Satz von der majorisierten Konvergenz. Er wird häufig angewandt. Theorem 11.78 (Satz von der dominierten Konvergenz). Sei (fj )j∈N ⊂ L1 (X, µ, E). Sei g ∈ L1 (X, µ, R). Sei f : X → E eine Abbildung. Gelte (i) kfj k ≤ g µ-fast überall für alle j ∈ N und (ii) fj → f µ-fast überall für j → ∞. Dann ist auch die Funktion f µ-integrierbar und es gelten Z Z fj → f in L1 (X, µ, E) sowie fj dµ → f dµ in E. X X Beweis. Wir definieren gj := sup kfk −fl k für j ∈ N. Nach Theorem 11.17 erhalten k,l≥j wir gj ∈ L0 X, µ, R+ . Nach Voraussetzung gilt gj → 0 µ-fast überall. Aufgrund der anderen Voraussetzung und der Dreiecksungleichung erhalten wir kfk −fl k ≤ 2g 104 11. INTEGRATIONSTHEORIE µ-fast überall für beliebige k, l ∈ N. Daher gilt auch |gj | ≤ 2g µ-fast überall für beliebige j ∈ N. Wir wenden Korollar 11.72 an und erhalten Z Z gj dµ ≤ 0 ≤ lim lim gj dµ = 0. j→∞ j→∞ X Offensichtlich folgt auch lim R X gj dµ = 0. Wir erhalten lim R j→∞ X j→∞ X gj dµ = 0. (Man sieht leicht, dass die Konvergenz sogar monoton ist.) Daher gibt es zu beliebigem ε > 0 ein N ∈ N, so dass für alle k, l ≥ j ≥ N Z Z kfk − fl k dµ ≤ sup kfr − fs k dµ < ε r,s≥j {z } X X | =gj gilt. Somit ist (fj )j∈N ⊂ L1 (X, µ, E) eine Cauchyfolge in diesem Raum. Nach Theorem 11.52 ist L1 (X, µ, E) vollständig, es gibt also ein h ∈ L1 (X, µ, E) mit kfj − hkL1 → 0 für j → ∞. Momentan ist noch nicht klar, dass f = h auch nur µ-fast überall gilt. Nach Theorem 11.62 besitzt (fj )j jedoch eine Teilfolge (fjk )k mit fjk → h µ-fast überall für k → ∞. Nach Voraussetzung gilt aber fj → f µ-fast überall. Dies überträgt sich insbesondere auch auf beliebige Teilfolgen. Somit gilt h = f µ-fast überall. Nach Korollar 11.63 gilt kh − f kL1 = 0, da h = f µ-fast überall gilt. Wir erhalten also kfj − f kL1 ≤ kfj − hkL1 + kh − f kL1 → 0 für j → ∞. Dies liefert die erste Behauptung. Nach der Dreiecksungleichung, Theorem 11.53, folgt auch die Konvergenz der Integrale. Bemerkung 11.79. Das Beispiel aus Bemerkung 11.70 zeigt auch hier, dass die Aussage ohne eine µ-integrierbare Majorante i. A. nicht gilt. Als Korollar erhalten wir Theorem 11.80 (Integrabilitätskriterium). ? Seien f ∈ L0 (X, µ, E) und g ∈ L1 (X, µ, R) mit kf k ≤ g µ-fast überall. Dann gilt auch f ∈ L1 (X, µ, E). Beweis. Da kf k und g nichtnegative reellwertige R R Funktionen sind, gilt aufgrund der Monotonie für die Lebesgueintegrale kf k ≤ g < ∞. Nach Theorem 11.73 folgt nun die Behauptung. Korollar 11.81. ? Sei α ∈ [0, ∞). (i) Seien f ∈ L1 (X, µ, E) und g ∈ L0 (X, µ, K) mit |g| ≤ α µ-fast überall. Dann ist gf µ-integrierbar und es gilt Z gf dµ ≤ αkf kL1 . X 0 (ii) Sei f ∈ L (X, µ, E). Gelte kf k ≤ α µ-fast überall und sei µ(X) < ∞. Dann ist f µ-integrierbar und es gilt Z f dµ ≤ kf kL1 ≤ αµ(X). X Beweis. 105 11.3. KONVERGENZSÄTZE (i) Das Produkt gf ist eine µ-messbare Funktion. Es gilt kgf k ≤ αkf k µ-fast überall und αkf k ist µ-integrierbar. Nach Theorem 11.80 ist gf daher eine µintegrierbare Funktion. Aufgrund der Dreiecksungleichung für Integrale und der Monotonie des Integrals erhalten wir nun Z Z Z gf dµ ≤ kgf k dµ ≤ αkf k dµ = αkf kL1 . X X X (ii) Da µ(X) < ∞ gilt, erhalten wir χX ∈ L1 (X, µ, R). Aus f ∈ L0 (X, µ, E) folgt auch kf k ∈ L0 (X, µ, E). Aus dem ersten Teil (mit vertauschten Rollen) erhalten wir, dass kf k = kf k · χX ∈ L1 (X, µ, R) ist sowie Z kf k dµ ≤ αkχX kL1 = αµ(X) < ∞. X Aus Theorem 11.73 folgt nun f ∈ L1 (X, µ, E). Bemerkung 11.82. ? Ist eine Funktion f auf einer Teilmenge eines Maßraumes definiert, so bezeichnen wir mit f auch die triviale Fortsetzung, d. h. die Fortsetzung durch 0. Entsprechend definieren wir µ-Messbarkeit, µ-Integrierbarkeit und das Integral als µ-Messbarkeit, µ-Integrierbarkeit bzw. das Integral der trivialen Fortsetzung. Theorem 11.83 (gliedweise Integration von Reihen). Sei (fj )j∈N ⊂ L1 (X, µ, E) ∞ ∞ R ∞ P P P mit kfj k dµ < ∞. Dann konvergiert fj µ-fast überall absolut, fj ist j=0 X j=0 j=0 µ-integrierbar und es gilt Z X ∞ fj dµ = X j=0 ∞ Z X fj dµ. j=0 X Beweis. ∞ P (i) Wir definieren g := kfj k. Diese Funktion ist als Betrag und Summe von j=0 µ-messbaren Funktionen selbst wieder eine µ-messbare numerische Funktion. Nach Korollar 11.69 dürfen wir bei nichtnegativen numerischen Funktionen Summation und Integration vertauschen und erhalten daher zusammen mit der Voraussetzung an die Reihe der Integrale Z ∞ Z X kfj k dµ < ∞. g dµ = j=0 X X Somit ist g Lebesgue integrierbar und N := {x ∈ X : g = ∞} eine µ∞ P Nullmenge. Also konvergiert fj µ-fast überall absolut. j=0 (ii) Wir definieren gk := k P fj und wollen f (x) := j=0 ∞ P fj (x) definieren. Für x 6∈ N j=0 ist f aufgrund der absoluten Konvergenz wohldefiniert; diese Funktion setzen wir trivial auf X durch Null fort. Wir erhalten gk → f in X \ N und kgk k ≤ k P kfj k ≤ g. Aus dem Satz von der dominierten Konvergenz, angewandt auf j=0 die Partialsummen gk , erhalten wir f ∈ L1 (X, µ, E) und Z Z Z X ∞ Z ∞ X fj dµ = lim gk dµ = lim gk dµ = fj dµ. j=0 X k→∞ k→∞ X X X j=0 106 11. INTEGRATIONSTHEORIE Dies zeigt die Behauptung. 11.3.5. Parameterintegrale. Theorem 11.84 (Stetigkeit von Parameterintegralen). Sei M ein metrischer Raum und f : X × M → E mit (i) f (·, m) ∈ L1 (X, µ, E) für jedes m ∈ M , (ii) f (x, ·) ∈ C 0 (M, E) für µ-fast alle x ∈ X und (iii) es existiere g ∈ L1 (X, µ, R) mit kf (x, m)k ≤ g(x) für alle (x, m) ∈ X × M . Dann ist die Abbildung F : M → E mit Z m 7→ f (x, m) dx, X d. h. wir integrieren bezüglich der Variablen x und bezüglich des Maßes µ, wohldefiniert und stetig. Beweis. (a) Nach Voraussetzung ist f (·, m) ∈ L1 (X, µ, E) und somit das Integral wohldefiniert. (b) Wir zeigen die Folgenstetigkeit von F : Sei (mj )j∈N ⊂ M eine Folge mit mj → m für j → ∞. Wir definieren die Folge fj := f (·, mj ) für j ∈ N. Da f (x, ·) nach Voraussetzung für µ-fast alle x ∈ X stetig ist, folgt fj → f (·, m) für j → ∞ µfast überall punktweise. Wir wenden den Satz von der dominierten Konvergenz auf die Folge (fj )j∈N an und erhalten Z Z Z lim F (mj ) = lim fj dµ = lim fj dµ = f (x, m) dx = F (x). j→∞ j→∞ j→∞ X X X Dies zeigt die Behauptung. Das folgende Resultat über die Differenzierbarkeit von Parameterintegralen wird sehr häufig bei der Untersuchung von partiellen Differentialgleichungen benötigt. Es lässt sich zwar leicht auf Teilmengen U eines Banachraumes verallgemeinern, jedoch kenne ich dafür keine Anwendungen. Theorem 11.85 (Differenzierbarkeit von Parameterintegralen). Sei U ⊂ Rn offen. Sei f : X × U → E eine Funktion, so dass (i) f (·, y) ∈ L1 (X, µ, E) für jedes y ∈ U , (ii) f (x, ·) ∈ C 1 (U, E) für µ-fast alle x ∈ X und (iii) sei g ∈ L1 (X, µ, R) mit ∂ ≤ g(x) f (x, y) ∂y j für alle (x, y) ∈ X × U und alle 1 ≤ j ≤ n. Dann ist die Abbildung Z F : U → E mit y 7→ f (x, y) dx X stetig differenzierbar und es gilt Z ∂ ∂ F (y) = f (x, y) dx ∂y j ∂y j X für alle y ∈ U und alle 1 ≤ j ≤ n. Wir betrachten hier die Abschätzung an ∂y∂ j f (x, y) als erfüllt, wenn g(x) = ∞ in Punkten gilt, in denen die Ableitung nicht existiert. 11.4. DIE LEBESGUESCHEN RÄUME 107 Beweis. Seien y ∈ U und 1 ≤ j ≤ n. Sei (hk )k∈N ⊂ R eine Nullfolge mit hk 6= 0 und [y, y + hk ej ] ⊂ U für alle k ∈ N. Wir betrachten die Differenzenquotienten fk (x) := f (x, y + hk ej ) − f (x, y) hk für x ∈ X und k ∈ N. Für µ-fast alle x ∈ X ist f bezüglich der zweiten Variablen eine C 1 -Funktion. Für solche x erhalten wir mit dem Mittelwertsatz ∂ kfk (x)k ≤ sup j f (x, y) ≤ g(x). y∈U ∂y (x,y) Weiterhin erhalten wir für solche x punktweise Konvergenz fk (x) → ∂f∂y für j k → ∞. Nach dem Satz von der dominierten Konvergenz erhalten wir Z Z F (y + hk ej ) − F (y) ∂ f (x, y) dx. lim = lim fk dµ = k→∞ k→∞ hk ∂y j X X Dies zeigt, dass die Funktion F in jedem Punkt y ∈ U partiell differenzierbar ist. Wir wollen nun Theorem 11.84 anwenden. Die erste Voraussetzung dort folgt aus der obigen Anwendung des Satzes von der dominierten Konvergenz, die zweite und dritte folgen direkt aus den Voraussetzungen dieses Theorems. Somit sind die partiellen Ableitungen ∂y∂ j F (y) in U stetig. Daher folgt die behauptete stetige Differenzierbarkeit. 11.4. Die Lebesgueschen Räume. Wir sprechen häufiger von Lp -Räumen. Seien in diesem Kapitel (X, A, µ) ein vollständiger σ-endlicher Maßraum und sei E ein Banachraum. 11.4.1. Wesentlich beschränkte Funktionen ?. Definition 11.86. Sei f ∈ L0 (X, µ, E). Dann heißt f wesentlich beschränkt, falls es α ∈ R mit µ({x ∈ X : kf (x)k > α}) = 0 gibt. Wir bezeichnen kf kL∞ := inf {α ≥ 0 : µ({x ∈ X : kf (x)k > α}) = 0} ∈ [0, ∞] als µ-wesentliches Supremum (engl.: essential supremum) von f . Wir schreiben später laxerweise auch wieder kf kL∞ ≡ sup kf k. X Bemerkung 11.87. (i) Für f ∈ L0 (X, µ, E) sind die folgenden Aussagen äquivalent: (a) f ist µ-wesentlich beschränkt, (b) kf kL∞ < ∞ und (c) f ist µ-fast überall beschränkt. (ii) Für f ∈ L0 (X, µ, E) gilt kf (x)k ≤ kf kL∞ für µ-fast alle x ∈ X. (iii) Es gilt kαf + gkL∞ ≤ |α| · kf kL∞ + kgkL∞ für alle α ∈ R und alle f, g ∈ L0 (X, µ, E). (iv) Sei X ein σ-kompakter lokal kompakter metrischer Raum und µ ein regelmäßiges Radonmaß auf X. Dann gilt für f ∈ C 0 (X, E) kf kL∞ = kf kC 0 (X,E) . Beweis. Wäre kf kL∞ < kf (x)k für ein x ∈ X, so erhalten wir aufgrund der Stetigkeit kf kL∞ ≤ kf (y)k für alle y ∈ Bε (x) für ein ε > 0. Nach Definition des wesentlichen Supremums gilt µ(Bε (x)) = 0, aufgrund der Regelmäßigkeit von µ jedoch µ(Bε (x)) > 0. Widerspruch. Die umgekehrte Ungleichung ist klar. 108 11. INTEGRATIONSTHEORIE 11.4.2. Die Höldersche und die Minkowskische Ungleichung. Definition 11.88. Sei f ∈ L0 (X, µ, E). Wir definieren 1/p Z kf kLp ≡ kf kLp (X) := kf kp dµ X für p ∈ [1, ∞). (Wir setzen ∞α := ∞ für alle α > 0.) Dann definieren wir Lp (X, µ, E) := f ∈ L0 (X, µ, E) : kf kLp < ∞ . Bemerkung 11.89. ? Wir erinnern an den zu p ∈ [1, ∞] konjugierten Exponenten p für p ∈ (1, ∞). q ∈ [1, ∞] (oder p0 ) mit p1 + 1q = 1, also q = p−1 Theorem 11.90. Sei p ∈ [0, ∞] und q der zu p konjugierte Exponent. (i) Seien f ∈ Lp (X, µ, R) und g ∈ Lq (X, µ, R). Dann ist f g ∈ L1 (X, µ, R) und es gilt die Höldersche Ungleichung Z Z f g dµ ≤ |f g| dµ ≤ kf kLp · kgkLq . X X (ii) Seien f, g ∈ Lp (X, µ, E). Dann ist auch f + g ∈ Lp (X, µ, E) und es gilt die Minkowskische Ungleichung kf + gkLp ≤ kf kLp + kf kLp oder Dreiecksungleichung. Gelegentlich werden die Höldersche Ungleichung auch für lediglich µ-messbare Funktionen f und g benutzt. In diesem Falle sind die rechten Seiten gegebenenfalls gleich +∞. Beweis. Übung; passe den Beweis für das Riemannintegral oder für `p (N) an. Korollar 11.91. ? Sei p ∈ [1, ∞]. Dann ist Lp (X, µ, E) ein Untervektorraum von L0 (X, µ, E) und k · kLp ist eine Seminorm auf Lp (X, µ, E). Bemerkung 11.92. ? (i) Sei f ∈ L0 (X, µ, E). Dann sind die folgenden Aussagen äquivalent: • kf kLp = 0 für beliebiges p ∈ [1, ∞] und • µ({x ∈ X : f (x) 6= 0}) = 0. (ii) {f ∈ L0 (X, µ, E) : f = 0 µ-fast überall} ist für beliebiges p ∈ [1, ∞] ein Untervektorraum von Lp (X, µ, E). (iii) Es gelten die folgenden Inklusionen von Untervektorräumen: EF(X, µ, E) ⊂ Lp (X, µ, E) ⊂ L0 (X, µ, E). 11.4.3. Die Vollständigkeit der Lebesgueschen Räume. Wir benutzen nun auch [6]. Theorem 11.93. Sei p ∈ [1, ∞]. Dann ist Lp (X, µ, E) mit der Seminorm k · kLp folgenvollständig. Beweis. (i) Sei zunächst 1 ≤ p < ∞: Sei (fn )n∈N eine Cauchyfolge in Lp (X, µ, E). Gelte (nach Auswahl einer Teilfolge ohne Einschränkung) kfi+1 − fi kLp < 2−i für i ∈ N. Wir definieren gk := k X i=0 kfi+1 − fi k und g := ∞ X i=0 kfi+1 − fi k. 11.4. DIE LEBESGUESCHEN RÄUME 109 Aufgrund der Dreiecksungleichung gilt R R kgk kLp < 2 für alle k ∈ N. Nach dem Lemma von Fatou ( limfn ≤ lim fn für fn ≥ 0), angewandt auf kgk kp , folgt kgkLp ≤ 2. Somit gilt µ-fast überall g(x) < ∞, d. h. die zugehörige Reihe konvergiert absolut. Also konvergiert auch f1 (x) + ∞ X (fi+1 (x) − fi (x)) i=1 für µ-fast alle x ∈ X. Wir definieren f (x) als diesen Grenzwert für diese x und sonst f (x) := 0. Somit gilt fast überall f (x) = lim fi (x). i→∞ Nach Theorem 11.21 ist auch f als Grenzwert µ-messbarer Funktionen selbst wieder µ-messbar. Wir wollen nun zeigen, dass fi auch in Lp gegen f konvergiert: Sei ε > 0. Dann gibt es N ∈ N mit kfn − fm kLp < ε für m, n ≥ N . Sei m > N . Dann folgt mit Fatou Z Z kfi − fm kp dµ ≤ εp . kf − fm kp dµ ≤ lim i→∞ X X p Hieraus folgt f −fm ∈ L (X, µ, E), also auch f ∈ Lp (X, µ, E). Weiterhin folgt hieraus kf − fm kLp → 0 für m → ∞. (ii) Sei nun p = ∞: Definiere Ak := {x ∈ X : kfk (x)k > kfk kL∞ } und Bm,n := {x ∈ X : kfm (x) − fn (x)k > kfn − fm kL∞ }. S S Setze N := Ak ∪ Bm,n . Dann ist E als abzählbare Vereinigung von k∈N m,n∈N µ-Nullmengen selbst wieder eine µ-Nullmenge. In X \ N konvergiert fn gleichmäßig gegen eine Funktion, die wir f nennen, auf N setzen wir f (x) := 0. Die Messbarkeit von f ist klar. Es folgt f ∈ L∞ sowie kfn − f kL∞ → 0 für n → ∞. Im Verlauf des Beweises haben wir auch das folgende Resultat mitbewiesen: Theorem 11.94. Sei 1 ≤ p ≤ ∞. Sei (fn )n∈N eine Cauchyfolge in Lp (X, µ, E) mit Grenzwert f . Dann besitzt (fn )n∈N eine Teilfolge (fnk )k∈N , so dass fnk (x) → f (x) für k → ∞ für µ-fast alle x ∈ X gilt. 11.4.4. Approximierbarkeit. Wir wollen untersuchen, wie sich Lp -Funktionen approximieren lassen. Theorem 11.95. Sei 1 ≤ p < ∞. Dann ist EF(X, µ, E) dicht in Lp (X, µ, E) bezüglich der k · kLp -Seminorm. Beweis. Sei f ∈ Lp (X, µ, E). Wegen Lp ⊂ L0 gibt es (ϕj )j∈N ⊂ EF(X, µ, E) mit ϕj → f µ-fast überall für j → ∞. Diese Folge möchten wir so modifizieren, dass wir zusätzlich eine µ-integrierbare Majorante haben und definieren dazu Aj := {x ∈ X : kϕj (x)k ≤ 2kf k} und ψj := χAj ϕj . Dann folgt auch (ψj )j∈N ⊂ EF(X, µ, E) und es gilt ψj → f µ-fast überall, vergleiche den Beweis von Theorem 11.73. Um den Satz von der dominierten Konvergenz anwenden zu können, betrachten wir die Abschätzung kψj − f k ≤ kψj k + kf k ≤ 3kf k 110 11. INTEGRATIONSTHEORIE und sehen, dass 3p kf kp ∈ L1 (X, µ, E) eine µ-integrable Majorante für kψj − f kp ist. Somit folgt Z kψj − f kpLp = kψj − f kp dµ → 0 für j → ∞. X Dies zeigt die behauptete Dichtheit. Das folgende Resultat kann ich nur für einen endlichdimensionalen Zielraum zeigen. Lemma 11.96. Sei f ∈ L∞ (X, µ, Rn ). Dann gibt es (fj )j∈N ⊂ EF(X, µ, Rn ) mit kf − fj kL∞ → 0 für j → ∞. Beweis. Sei ε > 0. Sei R := sup kf (x)k. Da BR (0) präkompakt ist, gibt es N ∈ N x∈X und Punkte aj ∈ Rn , 1 ≤ j ≤ N , mit N S Bε (aj ) ⊃ BR (0) ⊃ f (X). Induktiv finden S wir mit A0 = Bε (a0 ), A1 := Bε (a1 ) \ A0 und Aj := Bε (aj ) \ Ai µ-messbare j=0 i<j Mengen Aj ⊂ Bε (aj ) mit Aj ∩ Ai = ∅ für alle i < j. Wir erhalten N X χf −1 (Ai ) ai ≤ ε. f − ∞ i=1 L Die Behauptung folgt. Theorem 11.97. Sei 1 ≤ p < ∞. Sei X ein lokal kompakter σ-kompakter Hausdorffraum. Sei µ lokal endlich, regulär und vollständig. Dann liegt Cc0 (X) bezüglich der Lp -Seminorm dicht in Lp (X, µ, E). Beweis. Sei f ∈ Lp (X, R (Xi )i∈N eine Folge offener präkomS µ, E) und sei ε > 0. Sei pakter Mengen mit Xi = X. Da µ : A 7→ kf kp dµ ein Maß auf X ist, gibt es i∈N A !1/p R p aufgrund der Stetigkeit von unten ein i mit kf k dµ ≥ kf kLp (X) − ε. Wir Xi setzen A := Xi und f1 := f χA und erhalten kf − f1 kLp < ε. Nach Theorem 11.95 gibt es eine Funktion f2 ∈ EF (A, µ, E) mit kf1 −f2 kLp < ε. Nach Lusin gibt es eine Funktion g ∈ Cc0 (A) mit f2 = g außerhalb einer Menge B mit µ(B) < δ mit kgkL∞ ≤ kf2 kL∞ . Ist δ > 0 klein genug, so folgt 1/p Z kg − f2 kLp ≤ (2kf2 kL∞ )p dµ ≤ 2δ 1/p kf2 kL∞ < ε. B Mit der Dreiecksungleichung folgt nun kf − gkLp ≤ kf − f1 kLp + kf1 − f2 kLp + kf2 − gkLp < 3ε. Somit erhalten wir die Behauptung. 11.4.5. Lp -Räume. Definition 11.98. Wir definieren N := {f ∈ L0 (X, µ, E) : f = 0 µ-fast überall} und den Quotientenraum Lp (X, µ, E) := Lp (X, µ, E)/N . Für die Äquivalenzklasse [f ] ∈ Lp (X, µ, E) definieren wir k[f ]kLp := kf kLp . Bemerkung 11.99. 11.4. DIE LEBESGUESCHEN RÄUME 111 (i) Nach Bemerkung 11.92 ist N für p ∈ [1, ∞] und p = 0 ein Untervektorraum von Lp (X, µ, E). Somit ist der Quotientenraum wohldefiniert. (ii) Die Inklusionen Lp (X, µ, E) ⊂ L0 (X, µ, E) übertragen sich auf die Quotienten: Lp (X, µ, E) ⊂ L0 (X, µ, E). (iii) Die Abbildung k · kLp ist auf Lp wohldefiniert: Für f, g ∈ Lp (X, µ, E) mit f = g µ-fast überall gilt nämlich kf kLp = kgkLp . (iv) Es gilt k[f ]kLp = 0 genau für [f ] = [0]. (v) Da sich die Eigenschaften der Seminorm k · kLp auf Lp (X, µ, E), p ∈ [1, ∞], auf k · kLp auf Lp (X, µ, E) übertragen, ist k · kLp eine Norm auf Lp (X, µ, E). (vi) Wir folgen ab jetzt der Konvention, dass wir statt [f ] = f + N ∈ Lp (X, µ, E), p ∈ {0} ∪ [1, ∞], f ∈ Lp (X, µ, E) schreiben. Für p ∈ [1, ∞] haben wir bereits oben in der Bezeichnung keinen Unterschied zwischen der Seminorm k · kLp auf Lp (X, µ, E) und der Norm k · kLp auf Lp (X, µ, E) gemacht. (vii) Für f ∈ L0 (X, µ, E) ist f (x) nicht wohldefiniert. (viii) Wir schreiben f ≤ g für f, g ∈ L0 (X, µ, E), falls f ≤ g µ-fast überall gilt, wenn es also Repräsentanten gibt, die diese Ungleichung erfüllen. Dies wenden wir entsprechend auch auf andere Aussagen an. (ix) Es gilt Lp (X, µ, E) = f ∈ L0 (X, µ, E) : kf kLp < ∞ . Theorem 11.100. (i) Für p ∈ [1, ∞] ist Lp (X, µ, E) ein Banachraum. (ii) Ist H ein Hilbertraum (z. B. H = R), so ist L2 (X, µ, H) mit dem Skalarprodukt Z hf, gi := hf (x), g(x)iH dµ X ebenfalls ein Hilbertraum. Beweis. (i) Wir haben bereits gesehen, dass Lp (X, µ, E) mit der Norm k · kLp ein normierter Raum ist. Die Vollständigkeit folgt direkt aus der Folgenvollständigkeit von Lp (X, µ, E), denn ist ([fn ])n∈N ⊂ Lp (X, µ, E) eine Cauchyfolge, so auch (fn )n∈N ⊂ Lp (X, µ, E). Ist f ∈ Lp (X, µ, E) mit fn → f für n → ∞, so folgt auch [fn ] → [f ] in Lp (X, µ, E) für n → ∞. (ii) Wir müssen überprüfen, dass h·, ·i ein Skalarprodukt auf L2 (X, µ, E) definiert. (a) Messbarkeit: Wir schreiben hf, giH als Verkettung von x 7→ (f (x), g(x)) mit dem stetigen Skalarprodukt auf H. Nach Theorem 11.11 ist diese Funktion messbar. (b) Integrierbarkeit: Folgt aus der Hölderschen Ungleichung. R (c) Symmetrie und Linearität sind klar. Die Positivität folgt, da kf k2 = 0 bereits f ≡ 0 fast überall und damit f = 0 in L2 (X, µ, H) impliziert. Insbesondere erhalten wir R Korollar 11.101. L2 (X, µ, R) mit hf, gi := f g ist ein reeller Hilbertraum und X R L2 (X, µ, C) mit hf, gi := f g ist ein unitärer Skalarproduktraum und ein komplexer X Hilbertraum. 11.4.6. Einbettungen. Theorem 11.102. Sei X ein endlicher Maßraum. Dann ist die Einbettung Lp (X, µ, E) ,→ Lq (X, µ, E) mit f 7→ f für ∞ ≥ p ≥ q ≥ 1 stetig. Unter den Voraussetzungen von Theorem 11.97 hat sie ein dichtes Bild in Lq . 112 11. INTEGRATIONSTHEORIE Beweis. (i) Linearität und Injektivität sind klar. (ii) Stetigkeit: Wir benutzen die Höldersche Ungleichung mit pq + p−q p = 1 und erhalten 1/q !1/q p−q Z q/p Z Z p p kf kLq = kf kq · 1 1 p−q kf kp · ≤ X = kf kLp · (µ(X)) p−q pq . (iii) Dichtes Bild: Klar, da Cc0 (X) in beiden Räumen dicht liegt. Bemerkung 11.103. ? (i) Wir erinnern an die Definition lp (N) = Lp (N, H0 , R) und die Einbettungen l1 ,→ lq ,→ lp ,→ l∞ für alle 1 ≤ q ≤ p ≤ ∞. Verglichen mit dem Fall µ(X) < ∞ sind dies gerade die umgekehrten Inklusionen. (ii) Man überzeugt sich, dass keine der Inklusionen bei p 6= q in die umgekehrte Richtung gültig sind. (iii) Somit ist [−2, −1] ∪ N mit dem Lebesgueschen Maß auf [−2, −1] und dem Zählmaß auf N ein Beispiel für einen Raum, über dem die Lp -Räume nicht geschachtelt sind. Lemma 11.104. Seien p ∈ [1, ∞] und f ∈ Lp (X, µ, R). Sei q der zu p konjugierte Exponent. Dann ist die Abbildung Z q Tf : L (X, µ, R) → R, g 7→ f g dµ X eine stetige Linearform, also ein Element aus (Lq )0 . Die Operatornorm erfüllt kTf k(Lq )0 ≤ kf kLp . Beweis. Die Höldersche Ungleichung impliziert Z |Tf g| = f g ≤ kf kLp · kgkLq . Bemerkung 11.105. ? Diese Abbildung werden wir in der Funktionalanalysis noch genauer untersuchen. (i) Es gilt kTf k(Lq )0 = kf kLp . (ii) Somit ist die Abbildung Lp 3 f 7→ Tf ∈ (Lq )0 linear und isometrisch. (iii) Diese Abbildung ist für p > 1 surjektiv. (iv) Im Fall p = 1, X = [0, 1] mit dem Lebesguemaß gilt auch für das Diracmaß δ0 ∈ (L∞ )0 . Es liegt jedoch nicht im Bild dieser Abbildung. (v) Damit sieht man im Fall p ∈ (1, ∞), dass die kanonische Injektion von Lp in den Bidualraum aus der linearen Algebra ein isometrischer Isomorphismus ist. Beweis. Vorlesung über Funktionalanalysis. Bemerkung 11.106. ? (i) Ist Ω ⊂ Rn offen und λn (∂Ω) = 0, so spielen die Funktionswerte auf der Null- menge ∂Ω keine Rolle und wir können Funktionen in Lp (Ω, E) und Lp Ω, E identifizieren. Entsprechend können wir auch Funktionen betrachten, die auf einer Nullmenge nicht definiert sind. Wir können sogar zwei Funktionen betrachten, die auf verschiedenen Nullmengen nicht definiert sind, da Nullmengen für Lp Funktionen, p ∈ {0} ∪ [1, ∞], irrelevant sind. 113 11.5. DER SATZ VON FUBINI (ii) Eine absolut Riemann integrierbare Funktion liegt in L1 und das Riemannsche Integral stimmt mit dem Lebesgueschen Integral überein. Beweisidee. (i) Klar. (ii) Ist die Funktion auf endlich vielen Teilintervallen jeweils konstant, so ist die Behauptung klar. Approximiere nun. Siehe [1, Theorem X.5.3, S. 135] für Details. 11.5. Der Satz von Fubini. Um zu zeigen, dass Elemente in L(m + n) gewisse Eigenschaften haben, definieren wir C(m, n) und wollen anschließend zeigen, dass C(m, n) = L(m + n) gilt. Definition 11.107. Wir definieren C(m, n) als die Menge aller A ∈ L(m + n) mit (i) A[x] ∈ L(n) für λm -fast alle x ∈ Rm , (ii) x → 7 λn (A[x] )R ist λm -messbar und (iii) λm+n (A) = λn (A[x] ) dx. Rm Bemerkung 11.108. (i) ? Eindimensional, d. h. für m = 1 gilt für A ∈ C(1, n) insbesondere Zb λn+1 (A) = λn (A[x] ) dx, a falls π1 (A) ⊂ (a, b) gilt. Dies heißt Cavalierisches Prinzip. (ii) L(m) L(n) ⊂ C(m, n) ist klar. S (iii) Sei (Aj )j∈N ⊂ C(m, n) eine aufsteigende Folge. Dann gilt auch Aj ∈ j∈N C(m, n). Beweis. Wir zeigen die drei definierenden Eigenschaften von C(m, n). (i) Die erste Bedingung ist offensichtlicherweise erfüllt, da die abzählbare Vereinigung von Ausnahmenullmengen wieder eine Nullmenge ist, führen diesen Teil aber aus, um Bezeichnungen einzuführen: Sei Mj ⊂ Rm eine Nullmenge, so dass S S (Aj )[x] ∈ L(n) für x 6∈SMj gilt. Wir setzen A := Aj und M := Mj . Dann gilt A[x] = (Aj )[x] ∈ L(n) für x 6∈ M . j∈N j∈N j∈N (ii) Für x ∈ {M gilt aufgrund der Stetigkeit des Maßes von unten λn (A[x] ) = lim λn ((Aj )[x] ). Als Grenzwert von λm -messbaren Funktionen ist also j→∞ x 7→ λm (A[x] ) selbst wieder λm -messbar, das Verhalten auf der Nullmenge M stört dabei nicht. (iii) Nach Voraussetzung gilt für alle j ∈ N Z λm+n (Aj ) = λn ((Aj )[x] ) dx. Rm Zum Integral auf der rechten Seite: Da die Mengen (Aj )[x] eine in j monoton wachsende Familie bilden, erhalten wir aus dem Satz über die monotone Konvergenz Z Z λn (A[x] ) dx. lim λn (Aj )[x] dx = j→∞ Rm Rm 114 11. INTEGRATIONSTHEORIE Wir benutzen nun für den Grenzwert von λm+n (Aj ) die Stetigkeit des Maßes von unten und erhalten zusammen mit den obigen Gleichungen Z Z λn (Aj )[x] dx = λm+n (A) = lim λm+n (Aj ) = lim λn (A[x] ) dx. j→∞ j→∞ Rm Rm Insgesamt erhalten wir daraus A ∈ C(m, n). (iv) Sei (Aj )j∈N ⊂ C(m, T n) eine absteigende Folge. Gelte λm+n (Ak ) < ∞ für ein k ∈ N. Dann gilt Aj ∈ C(m, n). j∈N Beweis. Wir zeigen nacheinander wieder die drei definierenden Eigenschaften für C(m, n). (i) Dies funktioniert wie für aufsteigende Folgen. (ii) Dies funktioniert wie für aufsteigende Folgen. (iii) Gehe analog wie für aufsteigende Folgen vor. Hier erhält man die Gleichheit Z Z lim j→∞ Rm λn ((Aj )[x] ) dx = λn (A[x] ) dx Rm aus dem Satz von der dominierten Konvergenz, da wir eine λm -integrierbare Majorante haben. S (v) Sei (Aj )j∈N ⊂ C(m, n) eine disjunkte Folge. Dann gilt auch Aj ∈ C(m, n). j∈N Beweis. Es ist leicht zu sehen, dass die charakterisierenden Bedingungen für C(m, n) unter endlichen disjunkten Vereinigungen erhalten bleiben. Nun folgt die Behauptung aus der Abgeschlossenheit von C(m, n) unter aufsteigenden Vereinigungen. (vi) Jede offene Menge in Rm+n liegt auch in C(m, n). Beweis. Jede offene Menge lässt sich als abzählbare disjunkte Vereinigung von halboffenen Intervallen schreiben. Wegen L(m) L(n) ⊂ C(m, n) liegt jedes dieser Intervalle in C(m, n). Daher liegt auch die disjunkte Vereinigung dieser Mengen in C(m, n). (vii) Jede beschränkte Gδ -Menge in Rm+n gehört zu C(m, n). Beweis. Dies ist klar, da wir bereits wissen, dass offene Mengen zu C(m, n) gehören und C(m, n) unter abzählbaren Schnitten absteigender Familien abk T T T Aj = Bk geschlossen ist. Da Bk := Aj offen ist mit Bk ⊃ Bk+1 und j=0 j∈N gilt, können wir das Resultat über absteigende Familien anwenden. k∈N (viii) Sei A eine λm+n -Nullmenge. Dann gilt A ∈ C(m, n) und es gibt eine λm Nullmenge M ⊂ Rm , so dass λn (A[x] ) = 0 für jedes x ∈ {M gilt. Beweis. Wir weisen nur den zweiten Teil der Behauptung nach. Daraus folgt dann A ∈ C(m, n) direkt nach Definition von C(m, n). Dazu definieren wir für j ∈ N die Mengen Aj := A ∩ Bjm+n (0). Wir erhalten S eine aufsteigende Folge (Aj )j∈N von beschränkten λm+n -Nullmengen mit Aj = A. Nach Korollar 10.63 gibt es beschränkte Gδ -Mengen Gj mit j∈N 11.5. DER SATZ VON FUBINI 115 Aj ⊂ Gj und λm+n (Gj ) = λm+n (Aj ) = 0. Da Gδ -Mengen zu C(m, n) gehören, gilt Z 0 = λm+n (Gj ) = λn ((Gj )[x] ) dx. Rm da dieses letzte Integral verschwindet, gibt es für jedes j ∈ N jeweils eine λm -Nullmenge Mj mit λn ((Gj )[x] ) = 0 für x 6∈ Mj . Es gilt für alle x ∈ Rm [ [ [ (Gj )[x] . (Aj )[x] ⊂ A[x] = Aj = j∈N [x] j∈N j∈N Die S Menge auf der rechten Seite ist für x außerhalb der λm -Nullmenge M := Mj eine Nullmenge. Daher erhalten wir die Behauptung. j∈N Theorem 11.109. Es gilt C(m, n) = L(m + n). Beweis. Nach Definition gilt C(m, n) ⊂ L(m + n). (i) Sei A ∈ L(m + n) zunächst zusätzlich beschränkt. (a) Dann gibt es eine beschränkte Gδ -Menge G mit A ⊂ G und λm+n (G) = λm+n (A). Daher ist G \ A eine beschränkte λm+n -Nullmenge. (Dieser Schluss benutzt die Beschränktheit von A.) Wir haben am Ende von Bemerkung 11.108 gesehen, dass dann auch (G \ A)[x] = G[x] \ A[x] für fast alle x ∈ Rm eine λn -Nullmenge ist. Da λn vollständig ist, gilt für diese x ∈ Rm auch G[x] ∈ L(n). Für diese x ∈ Rm folgt aus der Darstellung A[x] = G[x] ∩ {(G[x] \ A[x] ) auch A[x] ∈ L(n). (b) Weiterhin folgt für diese x aus λn (G[x] \A[x] ) = 0, dass λn (G[x] ) = λn (A[x] ) ist. Wir haben in Bemerkung 11.108 gesehen, dass G ∈ C(m, n) gilt. Somit ist auch die Abbildung x 7→ λn (A[x] ), die λm -fast überall mit der entsprechenden Abbildung für G statt A übereinstimmt, λm -messbar. (c) Schließlich gilt Z Z λm+n (A) = λm+n (G) = λn (G[x] ) dx = λn (A[x] ) dx. Rm Rm Insgesamt erhalten wir A ∈ C(m, n), wenn A ∈ L(m + n) beschränkt ist. (ii) Sei nun A ∈ L(m + n) beliebig. Dann erhaltenSwir mit Aj := A ∩ Bj (0) eine aufsteigende Folge (Aj )j∈N ⊂ L(m + n) mit Aj = A. Wir haben gerade j∈N gezeigt, dass Aj ∈ C(m, n) für jedes j ∈ N gilt. Da C(m, n) unter Vereinigungen von aufsteigenden Familien abgeschlossen ist, erhalten wir A ∈ C(m, n) wie behauptet. Korollar 11.110. Sei A ∈ L(m + n) mit λm+n (A) < ∞. Dann gilt λn (A[x] ) < ∞ für λm -fast alle x ∈ Rm . Beweis. Nach Theorem 11.109 gilt A ∈ C(m, n). Somit erhalten wir Z λn (A[x] ) dx = λm+n (A) < ∞. Rm Dies ist aber nur möglich, falls λn (A[x] ) < ∞ wie behauptet für λm -fast alle x ∈ Rm gilt. Wir beobachten, dass für A ⊂ Rm+n und x ∈ Rm die Gleichheit χA (x, ·) = χA[x] gilt. Daher erhalten wir aus Theorem 11.109 Lemma 11.111. Sei f ∈ EF(Rm+n , λm+n , E). Dann gelten: 116 11. INTEGRATIONSTHEORIE m (i) f (x, ·) ∈ EF(Rn , λn , E) für λm -fast R alle x ∈ R . m (ii) Die Funktion R → E mit x 7→ f (x, y) dy ist λm -integrierbar. Rn (iii) Es gilt Z Z Z f= f (x, y) dy dx. Rm Rm+n Rn Beweis. (i) Wir schreiben f in Normalform als f = k P ej χAj . Für x ∈ Rm erhalten wir j=0 daraus f (x, ·) = k P j=0 ej χ(Aj )[x] . Nach Theorem 11.109 bzw. der ersten definie- renden Eigenschaft von C(m, n) sind die Mengen (Aj )[x] λm -fast alle in L(n) und nach Korollar 11.110 haben λm -fast alle davon endliches λn -Maß. Somit gilt f (x, ·) ∈ EF(Rn , λn , E) für λm -fast alle x ∈ Rm . (ii) Wir definieren Z g(x) := f (x, y) dy = k X ej λn ((Aj )[x] ), j=0 Rn wobei sich die zweite Gleichheit aus der Definition des Integrals für einfache Funktionen ergibt. Nach Theorem 11.109 bzw. der zweiten definierenden Eigenschaft von C(m, n), die sich auf die Produkte mit den Vektoren ej und die Summe überträgt, ist x 7→ g(x) eine λm -messbare Funktion. Es folgt aufgrund der dritten definierenden Eigenschaft von C(m, n) und wegen f ∈ EF(Rm+n , λm+n , E) (für die Endlichkeit) Z kgk dx ≤ k X j=0 Rm Z kej k λn ((Aj )[x] ) dx = k X kej kλm+n (Aj ) < ∞. j=0 Rm Somit ist (x 7→ g(x)) ∈ L1 (Rm , λm , E). (iii) Wir benutzen nun die Definition des Integrals für einfache Funktionen, die dritte definierende Eigenschaft von C(m, n) und schließlich die Zeile, in der wir g definiert haben und erhalten Z Z Z Z k k X X f (x, y) dy dx. ej λn ((Aj )[x] ) dx = f= ej λm+n (Aj ) = j=0 Rm+n j=0 Rm Rm Rn Bemerkung 11.112. (i) Wir hätten die Rollen von x und y auch vertauschen können und ein analoges Ergebnis erhalten. (ii) Wir schreiben nun auch Lp (Rm , E) ≡ Lp (Rm , λm , E) für alle p ∈ {0} ∪ [1, ∞]. Im Falle nichtnegativer Funktionen erhalten wir die folgenden Form des Satzes von Fubini: Theorem 11.113 (Tonelli). Sei f ∈ L0 Rm+n , R+ . Dann gelten (i) f (x, ·) ∈ L0 Rn , R+ für λm -fast alle x ∈ Rm , (ii) f (·, y)R ∈ L0 Rm , R+ für λn -fast alle y ∈ Rn , (iii) x 7→ f (x, y) dy ist λm -messbar, RRn (iv) y 7→ f (x, y) dx ist λn -messbar und Rm 117 11.5. DER SATZ VON FUBINI (v) Z Z Z f= Z Z f (x, y) dy dx = Rm Rn Rm+n f (x, y) dx dy. Rn Rm Beweis. (i) Sei (fj )j∈N ⊂ EF(Rm+n , R+ ) eine Folge, die f monoton approximiert. Aus dem Satz über monotone Konvergenz erhalten wir Z Z (11.3) lim fj = f in R+ . j→∞ Rm+n Rm+n Nach Lemma 11.111 finden wir für jedes j ∈ N eine Menge MjSmit λm (Mj ) = 0 und fj (x, ·) ∈ EF(Rn , R+ ) für x ∈ {Mj . Wir setzen M := Mj . Somit gilt j∈N fj (x, ·) % f (x, ·) für x ∈ {M und wir erhalten f (x, ·) ∈ L0 Rn , R+ für diese x ∈ Rm . (ii) Folgt aus Symmetriegründen. (iii) Es folgt für x ∈ {M , wiederum aus dem Satz über monotone Konvergenz, Z Z (11.4) fj (x, y) dy % f (x, y) dy Rn Rn für j → ∞. Nach Lemma 11.111 sind die Funktionen x 7→ R fj (x, y) dy Rn insbesondere λm -messbar. Dies überträgt sich auf den punktweisen Limes R x 7→ f (x, y) dy (außerhalb der Ausnahmemenge M ). Rn (iv) Folgt aus Symmetriegründen. R (v) Nun kombinieren wir die Konvergenz der Integrale fj , (11.3), die dritte Aussage von Lemma 11.111 und die oben hergeleitete monotone Konvergenz der inneren Integrale (11.4) mit dem Satz über die monotone Konvergenz und erhalten Z Z Z Z Z Z f = lim fj = lim fj (x, y) dy dx = f (x, y) dy dx. Rm+n j→∞ Rm+n j→∞ Rm Rn Rm Rn Der Satz von Tonelli folgt. Korollar 11.114. Sei f ∈ L0 (Rm+n , E). Gelte f = 0 λm+n -fast überall. Dann gibt es eine λm -Nullmenge M , so dass f (x, ·) für x ∈ {M λn -fast überall verschwindet. Beweis. Nach dem Satz von Tonelli gilt Z Z Z kf (x, y)k dy dx = Rm Rn kf k = 0. Rm+n R kf (x, y)k dy, so sehen wir, siehe Bemerkung 11.67, dass g R außerhalb einer λm -Nullmenge M verschwindet. Es gilt also kf (x, y)k dy = 0 für Setzen wir g(x) := Rn Rn x ∈ {M . Nochmals aufgrund dieser Bemerkung gilt f (x, ·) = 0 λn -fast überall für x ∈ {M . Theorem 11.115 (Fubini). Sei f ∈ L1 (Rm+n , R). Dann gelten (i) f (x, ·) ∈ L1 (Rn , R) für λm -fast alle x ∈ Rm , (ii) f (·, y)R ∈ L1 (Rm , R) für λn -fast alle y ∈ Rn , (iii) x 7→ f (x, y) dy ist λm -integrierbar, RRn (iv) y 7→ f (x, y) dx ist λn -integrierbar und Rm 118 11. INTEGRATIONSTHEORIE (v) Z Z Z f= Rm+n Z Z f (x, y) dy dx = Rm Rn f (x, y) dx dy. Rn Rm Beweis. (a) Sei zunächst f ∈ L1 (Rm+n , R+ ). Wir benutzen Z L1 (Rm+n , R+ ) = f ∈ L0 (Rm+n , R+ ) : f <∞ , siehe Bemerkung Es gilt die letzte Behauptung R 11.67, und den Satz von Tonelli. R und es gilt f < ∞. Somit ist x 7→ f (x, y) dy λm -integrierbar (nach Rn Rm+n Tonelli bereits λm -messbar) und hat insbesondere für λm -fast alle x ∈ Rm einen endlichen Wert. Für diese x ∈ Rm (und falls x nicht in der Ausnahmemenge des Satzes von Tonelli liegt) folgt auch f (x, ·) ∈ L1 (Rn , R+ ) (nach Tonelli gilt bereits f (x, ·) ∈ L0 (Rn , R+ ) außerhalb einer λm -Nullmenge). Die anderen Behauptungen folgen aus Symmetriegründen. (b) Wir zerlegen f = f + − f − und benutzen nun den Satz für Funktionen mit Werten in R+ . Bemerkung 11.116. Integrieren wir eine Funktion f ∈ L1 (Rm , R), so erhalten wir per Induktion, dass wir die Reihenfolge, in der wir über die einzelnen m Variablen integrieren, beliebig vertauschen dürfen. Theorem 11.117 (Fubini-Tonelli). Seien A ∈ L(m + n) und f ∈ L0 (A, R). Wir bezeichnen mit f˜: Rm+n → R die triviale Fortsetzung von f durch Null. (i) Ist eines der Integrale Z Z Z Z Z ˜ ˜ |f | f (x, y) dx dy oder f (x, y) dy dx, Rn Rm Rm Rn A endlich, so haben alle drei einen endlichen Wert und stimmen überein. In diesem Falle gilt der Satz von Fubini für f˜ und es gilt f ∈ L1 (A, R). (ii) Ist die Menge πRm (A) ⊂ Rm λm -messbar (was nicht immer erfüllt ist, z. B. für Mengen der Form B × {0} mit nicht λ-messbarer Menge B), und ist f ∈ L1 (A, R), so gilt Z Z Z f= f (x, y) dy dx. A πRm (A) A[x] Beweis. (i) Es gilt f˜, f˜ ∈ L0 (Rm+n , R). Ist somit eines der Integrale endlich, so gilt dies nach dem Satz von Tonelli für alle drei. Nach Theorem 11.73 folgt aus der Endlichkeit des Integrals f˜ ∈ L1 (Rm+n , R) bzw. f ∈ L1 (A, R). Benutze nun des Satz von Fubini. (ii) Klar, da außerhalb von A[x] bzw. πRm (A) der jeweilige Integrand verschwindet. Den Satz von Fubini kann man mit deutlichem Zusatzaufwand auch für vektorwertige Funktionen zeigen. Theorem 11.118 (Fubini). Sei f ∈ L1 (Rm+n , E). Dann gelten (i) f (x, ·) ∈ L1 (Rn , E) für λm -fast alle x ∈ Rm , (ii) f (·, y)R ∈ L1 (Rm , E) für λn -fast alle y ∈ Rn , (iii) x 7→ f (x, y) dy ist λm -integrierbar, Rn 119 11.6. DIE FALTUNG (iv) y 7→ R f (x, y) dx ist λn -integrierbar und Rm (v) Z Z Z f= Rm+n Z Z f (x, y) dy dx = Rm Rn f (x, y) dx dy. Rn Rm Beweis. Siehe [1, Theorem X.6.16]. Korollar 11.119. Sei 1 ≤ p < ∞. Dann ist die Abbildung Lp (Rm+n , E) → Lp (Rm , Lp (Rn , E)) , f 7→ (x 7→ f (x, ·)) ein isometrischer Isomorphismus. Beweis. Siehe [1, Theorem X.6.22]. Danach folgt ein Gegenbeispiel im Fall p = ∞: Betrachte die charakteristische Funktion des oberen Dreieckes in [0, 1]2 . Das Problem dabei ist, dass die Abbildung nicht λ1 -fast überall separabelwertig ist. 11.6. Die Faltung. Bei der Faltung können wir auch einen der Zielräume durch einen Vektorraum E ersetzen. Definition 11.120 (Faltung). Seien f ∈ Lp (Rn , λn , R), p ∈ [1, ∞], und g ∈ L1 (Rn , λn , R). Dann definieren wir die Faltung f ∗ g von f und g durch Z (f ∗ g)(x) := f (x − y)g(y) dy. Rn Theorem 11.121. Seien f ∈ Lp (Rn , λn , R), p ∈ [1, ∞], und g ∈ L1 (Rn , λn , R). (i) Dann ist (f ∗g)(x) für fast alle x ∈ Rn wohldefiniert und es gilt die Youngsche Ungleichung kf ∗ gkLp ≤ kf kLp · kgkL1 . (ii) Es gilt f ∗ g = g ∗ f . Beweis. (a) Sei p ∈ [1, ∞). Die λn -Messbarkeit von y 7→ f (x − y)g(y) für festes x ∈ Rn ist klar. Der Nachweis der Messbarkeit von (x, y) 7→ f (x − y)g(y) ist eine Übung. Sei q der zu p konjugierte Exponent. Mit der Hölderschen Ungleichung erhalten wir Z Z |f (x − y)g(y)| dy = |f (x − y)| · |g(y)|1/p · |g(y)|1/q dy Z ≤ 1/p Z 1/q . |f (x − y)| · |g(y)| dy · |g(y)| dy {z } | p =kgk 1/q L1 Wir betrachten nun die p-te Potenz davon und integrieren bezüglich x. Mit Hilfe des Satzes von Tonelli vertauschen wir die Integrationsreihenfolge und erhalten p Z Z Z Z p/q |f (x − y)g(y)| dy dx ≤ kgkL1 · |f (x − y)|p |g(y)| dy dx Z Z p/q = kgkL1 · |f (x − y)|p dx |g(y)| dy 120 11. INTEGRATIONSTHEORIE p/q = kgkL1 · kf kpLp · kgkL1 . Wir erhalten also (1+1) kf ∗ gkLp ≤ kf kLp · kgkLq1 p . Dies ist äquivalent zur Youngschen Ungleichung. (b) Im Falle p = ∞ ist die Youngsche Ungleichung eine einfache Übungsaufgabe. (c) Da f ∗ g ∈ Lp für ein p ∈ [1, ∞] gilt, ist f ∗ g λn -fast überall wohldefiniert. (d) Ersetzen wir y durch x − y, so ändert sich der Wert des Integrals aufgrund des Transformationssatzes für Integrale, siehe Kapitel 11.7, nicht. 11.7. Der Transformationssatz. Seien X, Y ⊂ Rn in diesem Kapitel stets offen. (Sei E ein Banachraum.) In der folgenden Definition ist auf X zunächst noch kein Maß definiert. Diese Definition funktioniert auch für allgemeinere Mengen als für offene Teilmengen von Rn . Definition 11.122. Sei (X, A) ein messbarer Raum und (Y, B, ν) ein Maßraum. Sei f : X → Y bijektiv mit f (A) ⊂ B. Dann definiert f ∗ ν : A → [0, ∞], A 7→ ν(f (A)) ein Maß auf A. Bemerkung 11.123. ? Der spezielle Transformationssatz, Theorem 10.82, besagt mit dieser Notation also für lineare invertierbare Abbildungen Φ : Rn → Rn , dass Φ∗ λn = | det Φ| · λn gilt. Lemma 11.124. Sei Φ ∈ Diff 1 (X, Y ). Sei J ≡ [a, b) b X ein Intervall mit a, b ∈ Rn . Dann gilt Z λn (Φ(J)) ≤ | det DΦ|. J Beweis. (i) Wir betrachten zunächst den Fall, dass J = n Q xi0 − 2r , xi0 + 2r b X ein i=1 Würfel mit Mittelpunkt x0 ∈ X und Kantenlänge r > 0 ist. Wir betrachten Rn mit der Supremumsnorm k · k∞ und entsprechender Operatornorm und schreiben als Erinnerung Rn∞ . Wir definieren K := sup kDΦ(x)kL(Rn∞ ) . Aus x∈J dem Mittelwertsatz erhalten wir aufgrund der Sternförmigkeit des Würfels bezüglich x0 kΦ(x) − Φ(x0 )k∞ ≤ K · kx − x0 k∞ für alle x ∈ J. Daher ist Φ(J) in einem Würfel der Kantenlänge K · r/2 um Φ(x0 ) enthalten und wir erhalten die Abschätzung (11.5) λn (Φ(J)) ≤ (Kr)n = K n λn (J). (ii) Sei nun J = [a, b) b X wieder ein allgemeines Intervall. Sei ε > 0 beliebig. Wir definieren M := sup (DΦ(x))−1 L(Rn ) . Da DΦ auf J gleichmäßig stetig ∞ x∈J ist, gibt es δ > 0 mit kDΦ(x) − DΦ(y)kL(Rn∞ ) ≤ ε/M für alle x, y ∈ J mit kx − yk∞ < δ. Unterteile nun J in endlich viele disjunkte Würfel Jk , 1 ≤ k ≤ N , der Form [α, β) mit kα − βk∞ < δ. Wähle jeweils xk ∈ J k mit | det DΦ(xk )| = min | det DΦ(x)|. x∈J k 121 11.7. DER TRANSFORMATIONSSATZ Weiterhin definieren wir die lineare Abbildung Tk : Rn → Rn durch Tk := DΦ(xk ) und setzen Φk := Tk−1 ◦ Φ. Es gilt DΦk (y) = Tk−1 ◦ DΦ(y) = Tk−1 ◦ (DΦ(xk ) + (DΦ(y) − DΦ(xk ))) = 11 + (DΦ(xk ))−1 ◦ (DΦ(y) − DΦ(xk )). Wir benutzen nun die Schranke M an die Operatornorm und die Schranke ε/M aus der gleichmäßigen Stetigkeit und erhalten max kDΦk (y)kL(Rn∞ ) ≤ 1 + ε y∈J k für alle 1 ≤ k ≤ N . (iii) Da Φk nahe an der Identität ist, machen wir also keinen großen Fehler, wenn wir die recht grobe Abschätzung (11.5) auf Φk mit K = 1 + ε anwenden. Aufgrund des speziellen Transformationssatzes, Theorem 10.82, erhalten wir λn (Φ(Jk )) = λn Tk ◦ Tk−1 ◦ Φ(Jk ) = | det Tk | · λn (Φk (Jk )). Mit (11.5) erhalten wir also λn (Φ(Jk )) ≤ (1 + ε)n · | det Tk | · λn (Jk ) für alle 1 ≤ k ≤ N . (iv) Weil wir xk ∈ J k als einen Punkt mit minimalem | det DΦ| gewählt haben, folgt ! N N X [ λn (Φ(Jk )) λn (Φ(J)) = λn Φ(Jk ) ≤ k=1 k=1 ≤ (1 + ε)n · N X | det Tk | · λn (Jk ) ≤ (1 + ε)n · k=1 = (1 + ε)n · N Z X k=1J | det DΦ| k Z | det DΦ|, J wobei wir in der ersten Ungleichung sogar Gleichheit haben, da Φ ein Diffeomorphismus ist. Mit ε & 0 erhalten wir die Behauptung. Theorem 11.125. Sei Φ ∈ Diff 1 (X, Y ). Dann gilt für alle A ∈ L(n)|X ≡ {B ∩ X : B ∈ L(n)} Z Φ∗ λn (A) = λn (Φ(A)) = | det DΦ|. A Wir zeigen zunächst die Gültigkeit von Lemma 11.124 für weitere Mengen, dann mit zusätzlichen Funktionen im Integranden und schließlich benutzen wir, dass Φ ein Diffeomorphismus ist, um auf Gleichheit zu schließen. Beweis. (i) Die Abbildung Z µΦ : L(n)|X → [0, ∞], A 7→ | det DΦ| A definiert ein Maß. Da | det DΦ| > 0 gilt, ist dieses Maß vollständig. 122 11. INTEGRATIONSTHEORIE (ii) Sei U b XSoffen. Dann existieren disjunkte Intervall Jk ⊂ Rn der Form [a, b) mit U = Jk . Nach Lemma 11.124 und Definition von µΦ erhalten wir k∈N ! [ λn (Φ(U )) = λn Φ(Jk ) = k∈N X λn (Φ(Jk )) ≤ k∈N XZ k ! = X µΦ (Jk ) = µΦ k∈N [ | det DΦ| k∈NJ Jk Z | det DΦ|. = µΦ (U ) = k∈N U (iii) ? Sei nun U ⊂ X offen. Dann gibt es eine Ausschöpfung von U mit offenen S Mengen Uk ⊂ X, so dass Uk b Uk+1 und U = Uk gelten. Auf diese Mengen k∈N können wir unsere bisher hergeleitete Ungleichung anwenden und erhalten aufgrund der Stetigkeit der Maße von unten Z λn (Φ(U )) = lim λn (Φ(Uk )) ≤ lim µΦ (Uk ) = µΦ (U ) = | det DΦ|. k→∞ k→∞ U (iv) ? Sei nun A ∈ L(n)|X mit A b X. Nach T Korollar 10.63 gibt es offene beschränkte Mengen Uk ⊂ X mit G := Uk ⊃ A, G ist also eine Gδ -Menge, k∈N und λn (G) = λn (A). Mit dem bisher Gezeigten und der Stetigkeit der Maße von oben (man überprüft, dass die jeweils erste Menge der absteigenden Folge endliches Maß hat) erhalten wir k k \ \ λn (Φ(G)) = lim λn Φ Uj ≤ lim µΦ Uj k→∞ k→∞ j=0 j=0 Z | det DΦ|. = µΦ (G) = G Da A und G und auch ihre Bilder unter Φ bis auf eine Lebesgue-Nullmenge übereinstimmen, erhalten wir Z Z λn (Φ(A)) = λn (Φ(G)) ≤ | det DΦ| = | det DΦ|. G A (v) ? Sei schließlich A ∈ L(n)|X beliebig. Wir approximieren A durch Mengen Ak := A ∩ Bk (0) ∩ {x ∈ X : d(x, ∂X) > 1/k}. Aufgrund der bisher gezeigten Ungleichung und der Stetigkeit des Maßes von unten erhalten wir Z λn (Φ(A)) = lim λn (Φ(Ak )) ≤ lim µΦ (Ak ) = µΦ (A) = | det DΦ|. k→∞ k→∞ A Dies zeigt die eine der für die behauptete Gleichheit nötigen beiden Ungleichungen. k P (vi) Sei f ∈ EF(Y, λn , R+ ) mit der Normalform f = αj χAj . Dann erhalten wir j=0 aufgrund des letzten Schrittes Z k k X X f= αj · λn (Aj ) = αj · λn Φ Φ−1 (Aj ) j=0 Y ≤ k X j=0 j=0 Z Z | det DΦ| = αj Φ−1 (Aj ) (f ◦ Φ) · | det DΦ|. X 11.7. DER TRANSFORMATIONSSATZ 123 (vii) ? Wir verallgemeinern dies nun auf µ-messbare Funktionen. Sei X zusätzlich beschränkt und f ∈ L0 (Y, λn , R+ ). Sei (fk )k∈N ⊂ EF(Y, λn , R+ ) eine monoton wachsende Folge mit fk % f wie aus Theorem 11.19. Dann ist auch fk ◦ Φ eine einfache Funktion (die aufgrund der Beschränktheit von X nur auf einer Menge von endlichem Maß von Null verschieden ist) und wir erhalten wegen fk ◦ Φ % f ◦ Φ auch (f ◦ Φ) · | det DΦ| ∈ L0 (X, λn , R+ ). Mit dem bereits Gezeigten und dem Satz von der monotonen Konvergenz erhalten wir Z Z Z Z f = lim fk ≤ lim (fk ◦ Φ) · | det DΦ| = (f ◦ Φ) · | det DΦ|. k→∞ Y k→∞ Y X X 0 (viii) ? Sei nun X beliebig und f ∈ L (Y, λn , R+ ) Sei (Xk )k∈N eine aufsteigende S Folge relativ kompakter offener Teilmengen von X mit X = Xk . Wir k∈N S definieren Yk := Φ(Xk ) und erhalten Y = Yk . Wir definieren gk := χXk · k∈N (f ◦ Φ) · | det DΦ| ∈ L0 (X, λn , R+ ) und erhalten gk % (f ◦ Φ) · | det DΦ| ∈ L0 (X, λn , R+ ). Wir erhalten aufgrund des letzten Schrittes zunächst Z Z f ≤ (f ◦ Φ) · | det DΦ| Yk Xk und aus dem Satz über die monotone Konvergenz auch Z Z (11.6) f ≤ (f ◦ Φ) · | det DΦ|. Y X (ix) Sei A ∈ L(n)|X. Da Φ ein Diffeomorphismus ist, können wir in der zuletzt hergeleiteten Ungleichung die Rollen von X und Y vertauschen und erhalten mit dem Diffeomorphismus Φ−1 und der Abbildung (χΦ(A) ◦ Φ) · | det DΦ| ∈ L0 (X, λn , R+ ) Z Z (χΦ(A) ◦ Φ) · | det DΦ| ◦ Φ−1 det D Φ−1 (χΦ(A) ◦ Φ) ·| det DΦ| ≤ {z } | X Y =χA Z = χΦ(A) · det DΦ ◦ Φ−1 D Φ−1 . Y Das Argument der letzten Determinante ist nach Kettenregel die Ableitung von idY = Φ ◦ Φ−1 und somit gleich Eins. Wir erhalten also Z Z | det DΦ| ≤ χΦ(A) = λn (Φ(A)). A Y Dies zeigt die noch fehlende Ungleichung. Theorem 11.126 (Transformationssatz). Sei Φ ∈ Diff 1 (X, Y ). (i) Dann gilt für f ∈ L0 (Y, λn , R+ ) Z Z f = (f ◦ Φ) · | det DΦ|. Y X (ii) Eine Funktion f : Y → R ist genau dann integrierbar, wenn (f ◦Φ)·| det DΦ| ∈ L1 (X, λn , R) gilt. In diesem Falle gilt die obige Integraltransformationsformel. Beweis. 124 11. INTEGRATIONSTHEORIE (i) Die Funktion g := (f ◦ Φ) · | det DΦ| ist λn -messbar, siehe Korollar 10.71. Wenden wir auf idY = Φ ◦ Φ−1 an, so erhalten wir f = die Kettenregel −1 −1 g◦Φ · det DΦ . Wir wenden nun Gleichung (11.6) mit Y, Φ−1 , g statt (X, Φ, f ) an und erhalten Z Z (f ◦ Φ) · | det DΦ| ≤ f. X Y Die umgekehrte Ungleichung haben wir bereits in Gleichung (11.6) gezeigt. Somit folgt die Transformationsformel. (ii) ? Zerlege die Funktionen in positive und negative Anteile und verwende, dass eine L0 (X, λn , R)-Funktion genau dann in L1 (X, λn , R) ist, wenn es eine integrierbare Majorante für den positiven und den negativen Anteil gibt. Es gilt auch die folgende Variante: ◦ Lemma 11.127. Sei Φ ∈ C 1 (X, Rn ).Sei M ⊂ X λn -messbar, M \ Ṁ ≡ M \ M eine Nullmenge und Φ|Ṁ : Ṁ → Φ Ṁ ein Diffeomorphismus. Dann erhalten wir: (i) Für f ∈ L0 (Φ(M ), λn , R+ ) gilt Z Z f = (f ◦ Φ) · | det DΦ|. Φ(M ) M (ii) Es gilt (f : Φ(M ) → R) ∈ L1 (Φ(M ), λn , R) genau dann, wenn (f ◦ Φ) · | det DΦ| ∈ L1 (M, λn , R) ist. In diesem Fall gilt die obige Transformationsformel. Beweisidee. Benutze, dass Φ(M )\Φ Ṁ ⊂ Φ M \ Ṁ eine λn -Nullmenge ist. Die vektorwertige Variante des Transformationssatzes lautet Theorem 11.128 (Transformationssatz). ? Sei Φ ∈ Diff 1 (X, Y ) und f : Y → E eine Abbildung. Dann gilt f ∈ L1 (Y, λn , E) genau dann, wenn (f ◦ Φ) · | det DΦ| ∈ L1 (X, λn , E) ist. In diesem Falle gilt Z Z f = (f ◦ Φ) · | det DΦ|. Y X Beweis. Siehe [1, Theorem X.8.14, S. 211]. Ist Φ kein Diffeomorphismus, so erhält man noch eine Ungleichung. Bemerkung 11.129. Sei Φ ∈ C 1 (X, Y ) und sei f ∈ L0 (Y, λn , R+ ). Dann gilt Z Z f ≤ (f ◦ Φ) · | det DΦ|. Φ(X) X Ohne die Voraussetzung f ≥ 0 gibt es Gegenbeispiele bei einer nicht injektiven Abbildung Φ. Beweis. Übung. Hinweis: Wende den Transformationssatz auf Teilmengen an, in denen Φ ein Diffeomorphismus ist. Punkte mit det DΦ = 0 leisten auch keinen Beitrag zur linken Seite, da dann das Bild eines kleinen Würfels beinahe in einer Hyperebene enthalten ist. Theorem 11.130 (Polarkoordinaten). Seien 0 < r < R < ∞. Definiere den Annulus A := BR (0)\Br (0) (wobei es egal ist, ob die Ränder jeweils dazugehören). Sei g ∈ L0 (A, λn , R+ ) rotationssymmetrisch, d. h. gilt g(x) = G(|x|) für eine Funktion G : (r, R) → R+ . 125 11.8. ZERLEGUNG DER EINS (i) Dann gilt ZR Z g = nωn G(ρ)ρn−1 dρ r A mit ωn = λn (B1 (0)). (ii) Weiterhin gilt g ∈ L1 (A, λn , R) genau dann, wenn ρ 7→ G(ρ)ρn−1 ∈ L1 ((r, R), λ1 , R) gilt. Beweis. (i) Wir führen Polarkoordinaten ein. Die Abbildung Φ : R>0 × (0, 2π)n−1 → Rn , r, ϕ, ϑ1 , . . . , ϑn−2 7→ (x1 , x2 , . . . , xn ) mit x1 = r cos ϕ sin ϑ1 sin ϑ2 . . . sin ϑn−2 , x2 = r sin ϕ sin ϑ1 sin ϑ2 . . . sin ϑn−2 , x3 = r cos ϑ1 sin ϑ2 . . . sin ϑn−2 , .. . xn−1 = r cos ϑn−3 sin ϑn−2 , xn = r cos ϑn−2 ist ein Diffeomorphismus auf im Φ und Rn \ im Φ ist eine Nullmenge. Der Transformationssatz impliziert nun ZR Z2π Z g= ... r A Z2π 0 G(ρ) · | det DΦ| dρ dϕ dϑ1 . . . dϑn−2 0 ZR G(ρ) · ϕ(ρ) dρ, = r wobei wir mit Fubini im letzten Schritt zunächst G(ρ) aus den inneren n − 1 Integralen herausgezogen haben und dann das Ergebnis der inneren Integrale mit ϕ(ρ) bezeichnet haben. Die Berechnung von DΦ und der Determinante davon ist ein Induktionsbeweis, den wir vermeiden wollen. Stattdessen wählen wir g ≡ 1 und erhalten nωn R n−1 d d (ωn Rn − ωn rn ) = = dR dR Z BR (0)\Br (0) d 1= dR ZR ϕ(ρ) dρ = ϕ(R). r Der letzte Schritt ist gerechtfertigt, da DΦ für beschränkte Werte von r gleichmäßig stetig ist und somit ϕ eine stetige Funktion ist. Die Behauptung folgt. (ii) Klar. 126 11. INTEGRATIONSTHEORIE 11.8. Zerlegung der Eins. Als Vorbereitung benötigen wir zunächst Lemma 11.131. Es gibt η ∈ Cc∞ (Rn ) mit inf η > 0, η = 0 außerhalb von B2 (0) B1 (0) und 0 ≤ η. Beweis. Wir beweisen dieses Lemma nur für n = 1, also die Existenz einer Funktion η = η 1 . Falls η 1 ≡ 1 in B1 (0) gilt, siehe Lemma 11.133, dann erfüllt η n (x) = η 1 (|x|) in höheren Dimensionen die angegebenen Bedingungen. Die Differenzierbarkeit im Ursprung ist klar, da η 1 in der Nähe des Ursprungs konstant ist. Definiere ( exp − |x|1 2 , x > 0, f (x) := 0, x < 0. Es ist f ∈ C ∞ : Dies ist für x 6= 0 klar. Da für x > 0 sämtliche Ableiungen von f von der Form rationale Funktion mit |x|k , k ∈ N, im Nenner mal f geschrieben werden können, sind die Ableitungen bei x = 0 stetig. Setze nun η 1 (x) := f 23 − x · f x + 32 . Theorem 11.132 (Zerlegung der Eins). Seien Ui ⊂ Rn , i ∈ N, offenen Mengen, die den Rn überdecken. Dann gibt es eine untergeordnete lokal endliche Zerlegung der Eins, d. h. es gibt Funktionen ηj ∈ Cc∞ (Rn ), so dass 0 ≤ ηj ≤ 1, supp ηj b Ui(j) , ∞ X ηj = 1 j=1 und zu jeder kompakten Menge K b Rn ist supp ηj ∩ K 6= ∅ nur für endlich viele Indices j. Beweis. Sei x ∈ Rn . Dann gibt es 0 < r(x) ≤ 1 und i ∈ N, so dass B3r(x) (x) ⊂ Ui ist. Zu R ∈ N gibt es endlich viele solche Kugeln Br(x) (x), die B R (0) \ BR−2 (0) überdecken. Die Menge aller dieser Kugeln liefert eine untergeordnete lokal endliche Überdeckung des Rn . (Untergeordnet bedeutet dabei, dass jede solche Kugel in einer Menge Ui enthalten ist. Die lokale Endlichkeit besagt, dass jede kompakte Menge mit nur endlich vielen solchen Kugeln einen nichtleeren Schnitt besitzt. Beides folgt direkt aus der Konstruktion.) Sei η : Rn → R eine Funktion wie in Lemma 11.131 mit 0 ≤ η ≤ 1, inf η > 0, η|Rn \B2 (0) = 0, η ∈ C ∞ . Sei B = Bri (xi ) eine der oben B1 (0) gewählten Kugeln. Setze dann η̃i (x) := η ri−1 x . Es ist nun leicht zu sehen, dass η̃i (x) ηi (x) := P η̃i (x) i Funktionen sind, die die Bedingungen des Theorems erfüllen. Lemma 11.133. Es gibt η ∈ B2 (0) und 0 ≤ η ≤ 1. Cc∞ (Rn ) mit η = 1 in B1 (0), η = 0 außerhalb von Beweis. Überdecke Rn durch B2 (0) und Rn \ B 3/2 (0). Summiert man dann alle Funktionen ηi auf, die man in der Zerlegung der Eins konstruiert hat, deren Träger in B2 (0) enthalten sind, so erhält man die gewünschte Funktion. 11.9. Der Divergenzsatz. n Theorem 11.134 (Divergenzsatz). Sei Ω ⊂ R offen und beschränkt, ∂Ω (stück1 1 n weise) von der Klasse C , ξ ∈ C Ω, R . Sei ν die äußere Normale an Ω. Dann gilt Z Z hξ, νi. div ξ = Ω ∂Ω 11.9. DER DIVERGENZSATZ 127 Beweis. Siehe Funktionalanalysis. Literatur 1. Herbert Amann and Joachim Escher, Analysis. III, Grundstudium Mathematik, Birkhäuser Verlag, Basel, 2001. 2. Robert Denk, Mathematik für Physiker III, 2007, Skript zur Vorlesung. 3. Jean Dieudonné, Foundations of modern analysis, Academic Press, New York, 1969, Enlarged and corrected printing, Pure and Applied Mathematics, Vol. 10-I. 4. Michael Dreher, Mathematik für Physiker II, 2009, Skript zur Vorlesung. 5. Claus Gerhardt, Analysis. II, International Series in Analysis, International Press, Cambridge, MA, 2005. 6. Walter Rudin, Real and complex analysis, McGraw-Hill Book Co., New York, 1987. 7. Oliver C. Schnürer, Analysis I, 2015, Skript zur Vorlesung. 8. Oliver C. Schnürer, Analysis II, 2015, Skript zur Vorlesung. 9. Ralph E. Showalter, Hilbert space methods for partial differential equations. Electronic reprint of the 1977 original, Electronic Journal of Differential Equations. Monograph. 1. San Marcos, TX: Southwest Texas State University, iii, 242 p. , 1994. 10. Wolfgang Walter, Gewöhnliche Differentialgleichungen, fifth ed., Springer-Lehrbuch, SpringerVerlag, Berlin, 1993, Eine Einführung. 11. Wikipedia, http://www.wikipedia.org. Oliver C. Schnürer, Fachbereich Mathematik und Statistik, Universität Konstanz, 78457 Konstanz, Germany E-mail address: [email protected]
© Copyright 2024 ExpyDoc