Ralf Gerkmann Mathematisches Institut Ludwig-Maximilians-Universität München Funktionentheorie, Lebesguetheorie und Gewöhnliche Differentialgleichungen ( Mathematik IV für das gymnasiale Lehramt) (Version vom 9. Mai 2016) Inhaltsverzeichnis § 1. Wiederholungen und Ergänzungen zum Riemann-Integral § 2. Integration über Normalbereiche, Cavalierisches Prinzip § 3. Die mehrdimensionale Substitutionsregel § 4. Integralsätze § 5. Das Lebesgue-Integral Literaturverzeichnis ............ 3 ............. 15 ........................ 23 ............................................ 35 ...................................... 53 ............................................ 68 § 1. Wiederholungen und Ergänzungen zum Riemann-Integral Inhaltsübersicht - Zunächst wiederholen wir die wichtigsten im dritten Semester behandelten Konzepte zum Riemannschen Integral, den (Jordanschen) Nullmengen und dem Jordanschen Volumen. - Wir untersuchen das Verhalten des Volumens unter Translationen und Skalierungen, und beweisen die Erhaltung Jordanscher Nullmengen unter sogenannten Lipschitz-stetigen Abbildungen. - Bisher war das Riemann-Integral nur für Funktionen auf Quadern definiert. Wir verallgemeinern den Integralbegriff so, dass er auf Funktionen mit beliebigen Jordan-messbaren Mengen als Definitionsbereich angewendet werden kann. - Wir zeigen, dass sich wichtige, bereits bekannte Rechenregeln für das Riemann-Integral auf die neue Situation übertragen lassen. Wie und unter welchen Voraussetzungen sich die Integrale solcher Funktionen berechnen lassen, werden wir im nächsten Kapitel sehen. Wir beginnen mit der Wiederholung der wichtigsten Grundkonzepte zum Riemann-Integral. Aus Gründen der Übersichtlichkeit geben wir die Definitionen und Sätze nicht vollständig ausformuliert wieder. Die Kapitelangaben in Klammern ermöglichen es aber, die genaue Fassung im Skript des Wintersemesters nachzulesen. (i) Ein kompakter Quader im Rn ist eine Teilmenge der Form Q = [a1 , b1 ] × ... × [an , bn ] mit ak , bk ∈ R und ak < bk für 1 ≤ k ≤ n. Stehen in der Definition an Stelle von [ak , bk ] offene Intervalle, dann spricht man von einem offenen Quader (siehe §11). (ii) Eine Zerlegung eines offenen Quaders Q wie unter (i) ist ein Tupel Z = (Z1 , ..., Zn ), wobei Zk für 1 ≤ k ≤ n jeweils eine endliche Teilmenge von ak , bk bezeichnet. Jedem solchen Z kann eine Menge Q(Z ) von Quadern zugeordnet werden, deren Vereinigung Q ergibt, und die sich paarweise höchstens in den Seitenflächen schneiden, also keine gemeinsamen inneren Punkte besitzen (siehe §11). (iii) Für eine beschränkte Funktion f : Q → R hatten wir die Unter- bzw. Obersumme definiert durch S f− (Z ) = X − cK, f v(K) bzw. K∈Q(Z ) S f+ (Z ) = X + cK, v(K) f K∈Q(Z ) + − wobei cK, = inf{ f (x) | x ∈ K} und cK, = sup{ f (x) | x ∈ K} war. Das Supremum über alle Untersummen f f hatten wir das Unterintegral genannt und das Infimum über alle Obersummen als Oberintegral bezeichnet (siehe §12). (iv) Eine Funktion f wie unter (iii) ist Riemann-integrierbar, wenn ihr Unter- und Oberintegral übereinstimR men. Letzteres hatten wir in diesem Fall das Riemann-Integral genannt und mit der Notation Q f (x) d x bezeichnet (siehe §12). —– 3 —– (v) Das Integral eindimensionaler Funktionen lässt sich mit dem Hauptsatz der Differential- und Integralrechnung Rb ausrechnen (vgl. §13): Ist f : [a, b] → R stetig und F eine Stammfunktion von f , dann gilt a f (x) d x = F (b) − F (a). Für die Integration mehrdimensionale Funktionen verwendet man den Satz von Fubini (siehe §14): Sind P ⊆ Rm und Q ⊆ Rn Quader und ist f : P × Q → R eine stetige Funktion, dann gilt ! Z Z Z f (x, y) d(x, y) = P×Q f (x, y) d y P d x. Q Wiederholen wir nun das Wichtigste zu den Themen Nullmengen und Volumendefinition. (i) Eine Teilmenge N ⊆ Rn haben wir als Nullmenge bezeichnet, wenn für jedes " ∈ R+ eine abzählbare Familie P∞ S (Q m )m∈N von kompaktern Quadern mit m∈N Q m ⊇ N und m=1 v(Q m ) < " existiert. Findet man sogar eine endliche Familie von Quadern mit diesen beiden Eigenschaften, dann spricht man von einer Jordanschen Nullmenge (siehe §15). (ii) Nach dem Lebesgueschen Integrierbarkeitskriterium ist eine beschränkte Funktion f : Q → R auf einem Quader Q genau dann Riemann-Integrierbar, wenn die Menge ihrer Unstetigkeitsstellen eine Nullmenge ist (siehe §15). (iii) Eine Teilmenge A ⊆ Rn ist Jordan-messbar genau dann, wenn für jeden kompakten Quader Q ⊇ A die charakteristische Funktion χA : Q → {0, 1} von A Riemann-integrierbar ist. Auf Grund des Lebesgueschen Integrierbarkeitskriteriums ist dies äquivalent dazu, dass der Rand ∂ A eine Nullmenge ist. Ebenfalls äquivalent zur Jordan-Messbarkeit ist die Übereinstimmung des inneres Volumens v − (A) mit dem äußeren Volumen v + (A), das wir mit Hilfe von Ausschöpfungen bzw. Überdeckungen der Menge A durch Quader definiert hatten (siehe §16). (iv) Das Jordan-Volumen einer Jordan-messbaren Menge A ⊆ Rn wurde durch v(A) = R Q χA(x) d x definiert, wobei χA eine charakterische Funktion wie unter (iii) bezeichnet. Im Falle der Jordan-Messbarkeit gilt v(A) = v + (A) = v − (A). Für Jordan-messbare Mengen A, B ⊆ Rn gilt darüber hinaus die Rechenregel v(A ∪ B) = v(A) + v(B) − v(A ∩ B), und A ⊆ B impliziert v(A) ≤ v(B) (siehe §16). Zum Jordan-Volumen ergänzen wir noch einige Sätze und Rechenregeln, die sich im weiteren Verlauf als nützlich erweisen werden. Zunächst geben wir eine neue Charakterisierung der Jordanschen Nullmengen an. (1.1) Satz Eine Teilmenge A ⊆ Rn ist genau dann eine Jordansche Nullmenge, wenn A Jordanmessbar ist und v(A) = 0 gilt. Beweis: Zunächst bemerken wir, dass A unter beiden Voraussetzungen eine beschränkte Teilmenge von Rn ist. Diese Voraussetzung braucht also beim Beweis beider Implikationsrichtungen nicht mehr überprüft werden. —– 4 —– Sei " ∈ R+ vorgegeben. Weil A Jordansche Nullmenge ist, gibt es eine endliche Familie Q 1 , ..., Q m von komPm Sm Sm Sm pakten Quadern mit i=1 v(Q i ) < " und i=1 Q i ⊇ A. Weil i=1 Q i abgeschlossen ist, gilt i=1 Q i ⊇ ∂ A. Da " „⇒“ beliebig klein gewählt werden kann, folgt daraus, dass es sich bei ∂ A um eine Jordansche Nullmenge, erst recht also Sm um eine Nullmenge handelt. Daraus wiederum folgt, dass A Jordan-messbar ist. Die Inklusion i=1 Q i ⊇ A und die Pm Ungleichung i=1 v(Q i ) < " zeigen auch, dass v(A) = v + (A) < " für jedes " ∈ R+ gilt. Daraus folgt v(A) = 0. „⇐“ Sei " ∈ R+ vorgegeben. Auf Grund der Jordan-Messbarkeit von A und wegen v + (A) = v(A) = 0 gibt es eine Pm Sm endliche Familie Q 1 , ..., Q m von Quadern mit i=1 v(Q i ) < " und i=1 Q i ⊇ A. Daraus folgt direkt, dass es sich bei A um eine Jordansche Nullmenge handelt. Ist A ⊆ Rn eine beliebige Teilmenge, u ∈ Rn und r ∈ R+ , dann setzen wir u + A = {u + x | x ∈ A} und rA = {r x | x ∈ A}. Man sagt, dass die Menge u+A aus der Menge A durch Translation hervorgeht. Den Übergang von A zu rA bezeichnet man als Skalierung. Im Fall r > 1 handelt es sich genauer um eine Streckung, im Fall 0 < r < 1 um eine Stauchung. (1.2) Satz Sei A ⊆ Rn eine Jordan-messbare Teilmenge. (i) (Translationsinvarianz) Für jedes u ∈ Rn ist auch u + A Jordan-messbar, und es gilt v(u + A) = v(A). (ii) (Skalierungseigenschaft) Für jedes r ∈ R+ ist auch rA Jordan-messbar, und es gilt v(rA) = r n v(A). Beweis: Für den Beweis von (i) genügt es zu zeigen, dass inneres und äußeres Volumen von A und u + A über- einstimmen. Sei " ∈ R+ vorgegeben. Nach Definition des inneren Volumens gibt es eine endliche Familie disjunkter, Pp Sp kompakter Quader Q 1 , ..., Q p mit den Eigenschaften i=1 v(Q i ) > v − (A) − " und i=1 Q i ⊆ A. Definieren wir nun Sp Pp Q̃ i = u + Q i für 1 ≤ i ≤ p, dann gilt jeweils v(Q i ) = v(Q̃ i ). Es folgt i=1 Q̃ i ⊆ (u + A) und i=1 v(Q̃ i ) > v − (A) − ". Wir erhalten v − (u + A) ≥ v − (A) − ", und weil " ∈ R+ beliebig vorgegeben war, folgt daraus v − (u + A) ≥ v − (A). Durch Vertauschung der Rollen von A und u + A erhält man v − (A) ≥ v − (u + A), insgesamt also Gleichhheit. Die Übereinstimmung v + (A) = v + (u + A) beweist man nach demselben Schema. Ebenso kann die Aussage (ii) auf die Gleichung v(rQ) = r n v(Q) für kompakte Quader Q ⊆ Rn zurückgeführt werden. Bereits im ersten Semester war die Stetigkeits-Eigenschaft für Abbildungen zwischen metrischen Räumen definiert worden, und im dritten Semester kam der Begriff der gleichmäßigen Stetigkeit hinzu. Wir definieren nun einen weiteren, noch stärkeren Stetigkeitsbegriff. —– 5 —– (1.3) Definition Seien (X , dX ) und (Y, dY ) metrische Räume. Eine Abbildung f : X → Y heißt Lipschitz-stetig, wenn eine Konstante L ∈ R+ existiert, so dass dY ( f (p), f (q)) ≤ LdX (p, q) für alle p, q ∈ X erfüllt ist. Dabei bezeichnet man L als eine Lipschitz-Konstante von f . Gibt es für jeden Punkt p ∈ X jeweils eine Umgebung U mit der Eigenschaft, dass die Einschränkung f |U Lipschitz-stetig ist, dann spricht man von einer lokal Lipschitz-stetigen Abbildung. Jede Lipschitz-stetige Abbildung f : X → Y ist auch gleichmäßig stetig, und damit erst recht stetig. Sei nämlich " ∈ R+ vorgegeben und L ∈ R+ eine Lipschitz-Konstante von f . Setzen wir δ = "L , dann gilt für alle x, y ∈ X mit dX (p, q) < δ jeweils dY ( f (p), f (q)) ≤ LdX (p, q) < Lδ = L " L = " , womit die gleichmäßige Stetigkeit nachgewiesen ist. (1.4) Satz Jede stetig differenzierbare Abbildung f : U → Rm auf einer offenen Teilmenge U ⊆ Rn ist lokal Lipschitz-stetig. Beweis: Hier ist das wesentliche Hilfsmittel der Mittelwertsatz für Richtungsableitungen (Mathe III, §7), den wir auf die Komponentenfunktionen f k : U → R (1 ≤ k ≤ m) der Abbildung f und ihre totale Ableitungen f k0 (x) ∈ L (Rn , R) anwenden. Sei c ∈ U beliebig vorgegeben und K ⊆ U eine kompakte, konvexe Umgebung von c, zum Beispiel eine abgeschlossene Kreisscheibe. Außerdem sei k · k die Operatornorm auf L (Rn , R), wobei wir auf Rn die Maximums-Norm k · k∞ zu Grunde legen. Da die Funktionen x 7→ k f k0 (x)k auf Grund der stetigen Differenzierbarkeit von f auf K stetig sind, existiert nach dem Maximumsprinzip eine Konstante γ ∈ R+ mit k f k0 (x)k ≤ γ für alle x ∈ U und 1 ≤ k ≤ m. Seien nun a, b ∈ K vorgegeben. Auf Grund der Konvexität ist die Verbindungsstrecke [a, b] ganz in K enthalten. Nach dem Mittelwertsatz gibt es ein für 1 ≤ k ≤ m jeweils ein pk ∈ ]a, b[ mit f k0 (pk )(v) = ∂ v f k (pk ) = f k (b) − f k (a), wobei v = b − a ist. Es folgt | f k (b) − f k (a)| = | f k0 (pk )(v)| ≤ k f k0 (pk )kkvk∞ ≤ γkb − ak∞ . Nehmen wir das Maximum über 1 ≤ k ≤ m, so erhalten wir k f (b) − f (a)k∞ ≤ γkb − ak∞ . Also ist L = γ eine Lipschitz-Konstante von f |K . Damit ist die lokale Lipschitz-Stetigkeit nachgewiesen. Wir werden nun zeigen, dass Jordansche Nullmengen unter Lipschitz-stetigen Abbildungen erhalten bleiben. Dazu Qn müssen wir noch einige Vorbereitungen treffen. Einen kompakten Quader Q = k=1 [ak , bk ] im Rn bezeichnen wir als Würfel, wenn sämtliche Kantenlängen gleich sind, also b1 − a1 = b2 − a2 = ... = bn − an erfüllt ist. —– 6 —– (1.5) Lemma Sei Q ⊆ Rn ein kompakter Quader. Dann gibt es für jedes " ∈ R+ eine endliche Pm Familie W1 , ..., Wm von Würfeln, die Q überdecken, mit s=1 v(Ws ) < v(Q) + ". vbh Beweis: rk,N = Sei Q = N (b −a ) d k` k e. Qn k=1 [ak , bk ] und ` = min{bk − ak | 1 ≤ k ≤ n}. Für alle N ∈ N und 1 ≤ k ≤ n setzen wir Weiter sei SN = {s ∈ Zn | 0 ≤ sk < rk,N für 1 ≤ k ≤ n}, und für jedes s ∈ SN definieren wir den Würfel = Ws mit den Kantenlängen ` . N a 1 + s1 ` N , a1 + (s1 + 1) ` × ... N × an + sn ` N , an + (sn + 1) ` N Zunächst überprüfen wir, dass diese Würfel tatsächlich unseren Quader Q überdecken. Sei dazu ein x ∈ Q vorgegeben. Wir definieren sk = N (x k − ak ) für ` 1 ≤ k ≤ n. Wegen x k ≥ 0 gilt einerseits sk ≥ 0, aus x k ≤ bk folgt andererseits sk ≤ N (bk −ak ) ` ≤ rk,N , jeweils für 1 ≤ k ≤ n. Dies zeigt, dass s in SN enthalten ist. Nach Definition der unteren Gaußklammer gilt außerdem sk ≤ N (x k − ak ) ` < sk + 1 ⇒ sk ` N ≤ x k − ak < (sk + 1) ` N ⇒ ak + sk ` N ≤ x k < ak + (sk + 1) ` N für 1 ≤ k ≤ n. Also ist x im Würfel Ws enthalten. Nun schätzen wir noch das Gesamtvolumen der Würfel nach oben ab. In der k-ten Komponente addieren wir die Kantenlängen der rk,N Würfel zu einer Gesamtlänge von ` N (bk − ak ) ` ` rk,N · ≤ +1 · = bk − ak + . N ` N N Für N → ∞ läuft diese Zahl offenbar gegen den Wert bk − ak . Der von den |SN | Würfeln gebildete Quader hat also Qn Qn ein Gesamtvolumen von k=1 (bk − ak + N` ), das für N → ∞ gegen k=1 (bk − ak ) = v(Q) läuft. Wählen wir für P vorgegebenes " ∈ R+ unser N ∈ N also hinreiched groß, so kann immer erreicht werden, dass s∈SN v(Ws ) < v(Q)+" erfüllt ist. (1.6) Satz Sei N ⊆ Rn eine Jordansche Nullmenge und g : N → Rm eine Lipschitz-stetige Abbildung, wobei m ≥ n ist. Dann ist g(N ) eine Jordansche Nullmenge in Rm . Beweis: Sei " ∈ R+ vorgegeben und L ∈ R+ eine Lipschitz-Konstante von g bezüglich der Maximumsnormen k · k∞ auf Rn bzw. Rm . Nach Definition der Jordanschen Nullmengen gibt es eine endliche Familie Q 1 , ..., Q r von Sr Pr Quadern im Rn mit k=1 Q k ⊇ N und k=1 v(Q k ) < ". Auf Grund von (1.5) können die Quader durch eine endliche Ss Ps Familie W1 , ..., Ws von Würfeln ersetzt werden, so dass `=1 W` ⊇ N und `=1 v(W` ) < 2" erfüllt ist. An diesen Abschätzungen ändert sich auch nichts, wenn wir alle Würfel W` mit N ∩ W` = ∅ aus der Familie entfernen. Für jedes ` ∈ {1, ..., s} sei nun p` ein festgewählter Punkt in N ∩ W` und s` die Kantenlänge des Würfels. Durch Übergang zu kleineren Würfeln können wir s` < 1 voraussetzen. Es gilt jeweils v(W` ) = s`n , und für jeden weiteren —– 7 —– p Punkt q ∈ N ∩ W` ist der euklidische Abstand kq − p` k∞ durch den Wert s` n beschränkt. Es folgt kg(q) − g(p` )k∞ ≤ Lkq − p` k∞ p Ls` n ≤ p für alle q ∈ N ∩ W` . Dies zeigt, dass g(N ∩ W` ) in einer k · k∞ -Kugel vom Radius Ls` n enthalten ist, dies ist ein m-dimensionaler Würfel mit dem Volumen 2m L m nm/2 s`m . Die Menge g(N ) kann also durch Würfel mit einem Gesamtvolumen von s X `=1 2m L m nm/2 s`m ≤ 2m L m nm/2 s X `=1 s`n = 2m L m nm/2 n X sv(W` ) < 2m+1 L m nm/2 " `=1 überdeckt werden. Dies zeigt, dass es sich bei g(N ) um eine Jordansche Nullmenge handelt. Ohne die Voraussetzung m ≥ n funktioniert der Beweis nicht, weil die Abschätzung s`m ≤ s`n im letzten Beweisschritt ansonsten nicht gilt. Die Aussage des Satzes wird für m < n auch falsch: Beispielsweise überprüft man leicht, dass π : R2 → R, (x, y) 7→ x eine Lipschitz-stetige Abbildung mit Lipschitz-Konstante L = 1 ist, wenn wir auf R2 die k · k∞ -Norm zu Grunde legen. Die Menge N = [0, 1] × {0} ist eine Jordansche Nullmenge in R2 , aber π(N ) = [0, 1] ist keine Jordansche Nullmenge in R. Es gilt v(π(N )) = 1. (1.7) Folgerung Sei U ⊆ Rn offen und g : U → Rm stetig differenzierbar, wobei m ≥ n ist. Ist N ⊆ U eine kompakte Jordansche Nullmenge, dann ist g(N ) eine kompakte Jordansche Nullmenge in Rm . Beweis: Bereits aus dem ersten Semester ist bekannt, dass das Bild einer kompakten Menge unter einer stetigen Abbildung kompakt ist. Außerdem wissen wir aus (1.4), dass g zumindest lokal Lipschitz-stetig ist. Zu jedem Punkt x ∈ N gibt es also eine offene Umgebung U x , so dass g|U x Lipschitz-stetig mit einer Konstanten L x ist, bezüglich beliebig gewählter Normen auf Rn und Rm . Da N kompakt ist, finden wir eine endliche Familie x 1 , ..., x r von Punkten, so dass N bereits von U x 1 , ..., U x r überdeckt wird. Wegen (1.6) ist mit N ∩ U x k auch g(N ∩ U x k ) eine Jordansche Sr Nullmenge ist, für 1 ≤ k ≤ r. Also ist auch die endliche Vereinigung g(N ) = k=1 g(N ∩ U x k ) eine Jordansche Nullmenge. Bereits im letzten Semester hatten wir folgende Notation eingeführt: Sind A, B ⊆ Rn beliebige Teilmengen mit A ⊆ B und ist f : A → R eine Funktion, dann nennen wir die Funktion f B : B → R gegeben durch f B (x) = f (x) falls x ∈ A 0 falls x ∈ B \ A die Nullfortsetzung von f auf B. Außerdem erinnern wir daran, dass für einen kompakten Quader Q = Qn dessen Inneres k=1 ak , bk mit Q◦ bezeichnet hatten. —– 8 —– Qn k=1 [ak , bk ] (1.8) Definition Sei A ⊆ Rn eine Jordan-messbare Teilmenge. Wir bezeichnen eine Funktion f : A → R als Riemann-integrierbar, wenn ein kompakter Quader Q ⊆ Rn mit Q◦ ⊇ A existiert, so dass die Nullfortsetzung fQ : Q → R Riemann-integrierbar ist. In diesem Fall nennen wir R R f (x) d x das Riemann-Integral von f und bezeichnen es mit A f (x) d x. Q Q Wir müssen zeigen, dass das Integral R A f (x) d x unabhängig von der Wahl des Quaders Q ist. Aus dem Beweis wird sich zugleich ergeben, dass die Integrierbarkeitsbedingung ebenfalls unabhängig von Q unabhängig ist. (1.9) Lemma Seien Q, R ⊆ Rn kompakte Quader und A ⊆ Rn eine Jordan-messbare Teilmenge, so dass Q ⊆ R und Q◦ ⊇ A erfüllt ist. Sei ferner f : A → R eine beschränkte Funktion und Z , Z0 Zerlegungen von Q bzw. R, so dass Q(Z ) ⊆ Q(Z0 ) gilt. Dann gilt für die Unter- und Obersummen S f− (Z ) = S f− (Z0 ) Beweis: S f+ (Z ) = S f+ (Z0 ). und R Q Q R Wir beweisen die Gleichung lediglich für die Obersummen, da der Beweis für die Untersummen vollkom- + + men analog abläuft. Nach Definition der Nullfortsetzung gilt fR |Q = fQ . Daraus folgt cK, = cK, für alle K ∈ Q(Z ). f f Q R + Für alle K ∈ Q(Z0 ) \ Q(Z ) gilt dagegen fR |K = 0 und somit cK, = 0. Insgesamt erhalten wir damit fR X X X + + + S f+ (Z 0 ) = cK, v(K) = c v(K) + cK, v(K) = f K, f f R K∈Q(Z0 ) X K∈Q(Z ) R + cK, v(K) + f Q R K∈Q(Z ) X 0 · v(K) K∈Q(Z0 )\Q(Z ) K∈Q(Z0 )\Q(Z ) = S f+ (Z ). Q R (1.10) Satz Sei A ⊆ Rn eine Jordan-messbare Menge, und seien Q, R ⊆ Rn zwei kompakte Quader mit Q◦ ⊇ A und R◦ ⊇ A. Die Nullfortsetzung fQ ist genau dann über Q Riemann-integrierbar, R R wenn fR über R Riemann-integrierbar ist. Die Riemann-Integrale Q fQ (x) d x und R fR (x) d x stimmen in diesem Fall überein. Beweis: Zunächst führen wir den Beweis auf den Fall Q ⊆ R zurück. Nehmen wir an, dass die Aussage in dieser Situation bereits bewiesen. Dann können wir im allgemeinen Fall einen kompakten Quader S mit S ⊇ Q und S ⊇ R wählen. Auf Grund der Annahme ist die Riemann-Integrierbarkeit von fQ und fS bzw. von fR und fS äquivalent, also R R R auch die Integrierbarkeit von fQ und fR . Außerdem gilt Q fQ (x) d x = S fS (x) d x = R fR (x) d x. Wir können also Q ⊆ R annehmen. Setzen wir voraus, dass fQ Riemann-integrierbar ist, und sei " ∈ R+ beliebig vorgegeben. Für die Riemann-Integrierbarkeit von fR genügt es nach dem Kriterium (12.5) aus der Mathe III-Vorlesung —– 9 —– zu zeigen, dass Zerlegungen Z0 , Z00 von R mit S f+ (Z00 ) − S f− (Z0 ) < " existieren. Auf Grund unserere Voraussetzung R Q an fQ gibt es Zerlegungen Z , Z 0 von Q mit S f+ (Z 0 )−S f− (Z ) < ". Außerdem ist aus der Mathe III-Vorlesung bekannt, Q Q dass Zerlegungen Z0 , Z00 von R mit Q(Z ) ⊆ Q(Z0 ) und Q(Z 0 ) ⊆ Q(Z00 ) gebildet werden können. Wir können nun (1.9) anwenden und erhalten S f− (Z ) = S f− (Z0 ) sowie S f+ (Z 0 ) = S f+ (Z00 ). Es folgt S f+ (Z00 ) − S f+ (Z0 ) < " wie Q R Q R R R gewünscht. Also ist fR tatsächlich Riemann-integrierbar. Der Beweis der umgekehrten Implikation funktioniert auf ähnliche Weise. Sei " ∈ R+ vorgegeben. Setzen wir die Riemann-Integrierbarkeit von fR voraus, dann gibt es Zerlegungen Z0 , Z00 von R mit S f+ (Z00 ) − S f+ (Z0 ) < ". Diese R R Zerlegungen können so verfeinert werden, dass der Quader Q ⊆ R jeweils als Vereinigung von Quadern aus Q(Z0 ) bzw. Q(Z00 ) darstellbar ist. Es gibt dann Zerlegungen Z , Z 0 von Q mit Q(Z ) ⊆ Q(Z0 ) und Q(Z 0 ) ⊆ Q(Z00 ). Nach (12.2) aus der Mathe III-Vorlesung bleibt die Ungleichung S f+ (Z00 ) − S f− (Z0 ) < " bei der Verfeinerung von Z0 R R und Z00 erhalten, da der Wert S f+ (Z00 ) durch die Verfeinerung höchstens kleiner und der Wert S f− (Z0 ) höchstens R R größer wird. Durch erneute Anwendung von (1.9) erhalten wir S f+ (Z 0 ) − S f− (Z ) < ". Daraus folgt die RiemannQ Q Integrierbarkeit von fQ . Nun beweisen wir noch die Übereinstimmung der Integrale. Sei " ∈ R+ vorgegeben, und setzen wir voraus, dass die Riemann-Integrale von fQ und fR existieren. Wie wir gesehen haben, gibt es Zerlegungen Z , Z 0 von Q und Z0 , Z00 von R mit S f+ (Z 0 ) − S f− (Z ) < " und S f+ (Z00 ) − S f+ (Z0 ) < " und Q(Z ) ⊆ Q(Z0 ) sowie Q(Z 0 ) ⊆ Q(Z00 ). Nach Q Q R R Definition des Riemann-Integrals gilt nun einerseits Z S f− (Z ) Q fQ (x) d x ≤ ≤ Q S f+ (Z 0 ) Q auf Grund der Übereinstimmungen S f− (Z ) = S f− (Z0 ) und S f+ (Z 0 ) = S f+ (Z00 ) nach (1.9) aber andererseits auch Q S f− (Z ) Q R Q Z ≤ fR (x) d x R R ≤ S f+ (Z 0 ) Q Die Differenz von Ober- und Untersumme ist durch " beschränkt. Da " beliebig klein gewählt werden kann, stimmen R R die Integrale Q fQ (x) d x und R fR (x) d x also überein. Das Lebesguesche Integrabilitätskriterium bleibt auch für diese allgemeinere Definition des Riemann-Integrals gültig. (1.11) Satz Sei A ⊆ Rn eine Jordan-messbare Menge. Eine beschränkte Funktion f : A → R ist genau dann Riemann-integrierbar, wenn die Menge UA ⊆ A der Unstetigkeitsstellen von A eine Nullmenge in Rn ist. Beweis: Sei Q ⊆ Rn ein kompakter Quader mit Q◦ ⊇ A und fQ die entsprechende Nullfortsetzung von f . Nach dem Lebesgueschen Integrabilitätskriterium für Funktionen auf kompakten Quadern (Mathe III, (15.5)) genügt es —– 10 —– zu zeigen, dass UA genau dann eine Nullmenge ist, wenn die Menge UQ ⊆ Q der Unstetigkeitsstellen von fQ eine Nullmenge ist. Um dies zu sehen, beweisen wir die Inklusionen ⊆ UA UA ∪ (∂ A). ⊆ UQ Ist x ∈ UA, dann gibt es eine Folge (x m )m∈N in A mit limm x m = x und der Eigenschaft, dass ( f (x m ))m∈N nicht gegen f (x) konvergiert. Dies ist dann zugleich eine Folge in Q mit diesen beiden Eigenschaften, also liegt x auch in UQ . Damit ist die erste Inklusion bewiesen. Sei nun x ∈ UQ , und nehmen wir an, dass x kein Randpunkt von A ist. Dann liegt x entweder im Inneren von A im Inneren des Komplements Rn \ A. Wegen x ∈ UQ gibt es eine Folge (x m )m∈N in Q mit limm x m = x derart, dass ( fQ (x m ))m∈N nicht gegen fQ (x) konvergiert. Liegt x im Inneren von A, dann gibt es ein M ∈ N mit x m ∈ A für alle m ≥ M . Durch Streichung der ersten M − 1 Folgenglieder erhalten wir also eine Folge in A mit limm x m = x, für die ( f (x m ))m∈N nicht gegen f (x) konvergiert. In diesem Fall liegt x also in UA. Nehmen wir nun an, dass x im Inneren von Rn \A liegt. Dann gilt fQ (x) = 0; außerdem existiert ein M ∈ N mit x m ∈ / A für alle m ≥ M . Es folgt f (x m ) = 0 für alle m ≥ M und somit limm f (x m ) = 0 = fQ (x), im Widerspruch zur Voraussetzung an die Folge (x m )m∈N . Also kann dieser Fall nicht eintreten. Ist nun f Riemann-integrierbar, dann nach Definition auch die Nullfortsetzung fQ , und UQ ist eine Nullmenge in Rn . Wegen UA ⊆ UQ ist auch UA eine Nullmenge. Setzen wir umgekehrt voraus, dass UA eine Nullmenge ist. Wegen der Jordan-Messbarkeit von A gilt dasselbe für ∂ A (Mathe III, (16.6)) und somit auch für UA ∪ (∂ A) (Mathe III, (15.2)(iii)). Wegen UQ ⊆ UA ∪ (∂ A) ist nun auch UQ eine Jordansche Nullmenge. Also ist fQ Riemann-integrierbar und somit auch fA. Wie für Integrale über Quader gelten auch hier die Rechenregeln Z Z Z ( f + g)(x) d x = A f (x) d x + A Z und g(x) d x A (λ f )(x) d x = λ A Z f (x) d x. A für Riemann-integrierbare Funktionen f , g : A → R auf einer Jordan-messbaren Menge A und beliebige λ ∈ R. Gilt R f (x) ≤ g(x) für alle x ∈ A (was wir zukünftig durch die Schreibeweise f ≤ g abkürzen), dann folgt A f (x) d x ≤ R g(x) d x. Jede dieser Rechenregeln ergibt sich direkt aus der entsprechenden Rechenregel für Quader. Sind beiA spielsweise f , g : A → R zwei Riemann-integrierbare Funktionen auf der Jordan-messbaren Menge A ⊆ Rn und ist Q ⊆ Rn ein Quader mit Q◦ ⊇ A, dann ist die Nullfortsetzung von f + g : A → R gegeben durch ( f + g)Q = fQ + gQ . Denn für alle x ∈ A gilt fQ (x) + gQ (x) = f (x) + g(x) = ( f + g)(x) = ( f + g)Q (x), und für alle x ∈ Q \ A erhalten wir ebenso fQ (x) + gQ (x) = 0 + 0 = 0 = ( f + g)Q (x) nach Definition der Nullfortsetzung. Mit der Definition der Riemann-Integrale über A erhalten wir nun Z Z ( f + g)(x) d x = A ( f + g)Q (x) d x = Q Z Q fQ (x) d x + Z Z ( fQ + gQ )(x) d x Q gQ (x) d x = Q Z A —– 11 —– f (x) d x + Z g(x) d x. A = Der folgende Satz ist für eindimensionale Funktionen bereits bekannt. Sein mehrdimensionales Analogon lautet (1.12) Satz (Mittelwertsatz der Integralrechnung) Sei A ⊆ Rn eine nichtleere, Jordan-messbare Menge, f : A → R Riemann-integrierbar, außerdem m− = inf{ f (x) | x ∈ A} und m+ = sup{ f (x) | x ∈ A}. Dann gilt Z f (x) d x ≤ m− v(A) ≤ m+ v(A). A Sei Q ⊆ Rn ein kompakter Quader mit Q◦ ⊇ A. Wegen m− ≤ f (x) ≤ m+ für alle x ∈ A gilt auch Beweis: m− χA(x) ≤ fQ (x) ≤ m+ χA(x) für alle x ∈ A. Nach Definition des Jordan-Volumens folgt daraus m− v(A) = Z m− χA(x) d x = Z Q m− χA(x) d x Z ≤ Q Z m+ χA(x) d x ≤ fQ (x) d x Q = m+ v(A). Q Wegen R A f (x) d x = R f (x) Q Q d x folgt daraus unmittelbar die Behauptung. Ist f : B → R eine Riemann-integrierbare Funktion und A ⊆ B eine Jordansche Teilmenge, dann schreiben wir an R R Stelle von A( f |A)(x) d x auch einfach A f (x) d x, vorausgesetzt natürlich, dass das Integral definiert ist. Wie der folgende Satz zeigt, ist dies tatsächlich immer der Fall. (1.13) Satz Seien A, B ⊆ Rn Jordan-messbare Teilmengen. (i) Ist f : B → R Riemann-integrierbar und A ⊆ B, dann ist f |A Riemann-integrierbar. (ii) Sei f : A ∪ B → R eine Funktion mit der Eigenschaft, dass f |A und f |B auf ihren jeweiligen Definitionsbereichen A und B Riemann-integrierbar sind. Dann ist f Riemannintegrierbar, und es gilt Z f (x) d x A∪B = Z f (x) d x + Z A f (x) d x − B Z f (x) d x. A∩B (iii) Ist N ⊆ R eine Jordansche Nullmenge und f : N → R eine beschränkte Funktion, dann R ist f Riemann-integrierbar, und es gilt N f (x) d x = 0. Beweis: zu (i) Seien UB , UA die Mengen der Unstetigkeitsstellen von f bzw. f |A. Dann gilt UA ⊆ UB , und mit UB ist auch UA eine Jordansche Nullmenge. Die Riemann-Integrierbarkeit von f |A folgt somit aus (1.11). —– 12 —– zu (ii) Seien UA, UB , UC ⊆ A ∪ B die Unstetigkeitsstellen von f |A, f |B und f . Dann gilt UC ⊆ UA ∪ UB ∪ (∂ A) ∪ (∂ B). Sei nämlich x ∈ UC vorgegeben, und nehmen wir o.B.d.A. an, dass x in A liegt. Ist x kein Randpunkt von A, dann liegt eine Umgebung von x vollständig von A. Aus der Unstetigkeit von f in x folgt somit auch die Unstetigkeit von f |A in diesem Punkt, und wir erhalten x ∈ UA. Die soeben bewiesene Inklusion zeigt, dass UC eine Nullmenge ist, und damit ist f nach (1.11) eine Riemann-integrierbare Funktion. Für den Beweis der Integralgleichung wählen wir einen kompakten Quader Q mit Q◦ ⊇ A∪B und betrachten zunächst den Fall A ∩ B = ∅. Es gilt dann fQ = fQ χA + fQ χB , und daraus folgt Z f (x) d x + A Z Z f (x) d x Z = B fQ (x)χA(x) d x + Z Q fQ (x)χB (x) d x = Q fQ (x)χA(x) + fQ (x)χB (x) d x Z = Q fQ (x) d x Z = Q f (x) d x. A∪B Betrachten wir nun den Fall A ∩ B 6= ∅. In diesem Fall können wir A ∪ B disjunkt zerlegen in die Jordan-messbaren Mengen A \ B, B \ A und A ∩ B. Der bereits bewiesene Fall liefert Z Z Z f (x) d x = f (x) d x + A∪B A\B f (x) d x + Z B\A f (x) d x. A∩B Durch die Zerlegungen A = (A \ B) ∪ (A ∩ B) und B = (B \ A) ∪ (A ∩ B) erhalten wir aber auch Z Z Z Z Z Z f (x) d x = A f (x) d x + A\B f (x) d x = f (x) d x − A∪B A f (x) d x Z B\A f (x) d x − B f (x) d x + A zu (iii) + Z A∩B = f (x) d x + B Durch Einsetzen ergibt sich damit insgesamt Z Z Z f (x) d x f (x) d x = und A∩B Z f (x) d x + A∩B f (x) d x − B Z Z f (x) d x. A∩B Z f (x) d x A∩B f (x) d x. A∩B Die Riemann-Integrierbarkeit von f folgt direkt aus (1.11), denn die Menge der Unstetigkeitsstellen von f ist in N enthalten und damit eine Nullmenge. Die Aussage über das Integral erhält man durch (1.1) und (1.12). Ersterer liefert nämlich v(N ) = 0, und definiert man nämlich m− und m+ wie im Mittelwertsatz angegeben, dann erhält man 0 = m− v(N ) Z f (x) d x ≤ ≤ m+ v(N ) A∪B f (x) d x = = 0. N Einen wichtiger Spezialfall von (1.13) (ii) ist die Gleichung R n R f (x) d x + A R B f (x) d x für disjunkte Jordan-messbare Teilmengen A, B ⊆ R . Auch aus Teil (iii) des Satzes ziehen wir eine wichtige Konsequenz. —– 13 —– (1.14) Satz (Vernachlässigung Jordanscher Nullmengen) Sei A ⊆ Rn eine Jordan-messbare Menge, N ⊆ A eine Jordansche Nullmenge, und seien f , g : A → R beschränkte Funktionen, die auf A \ N übereinstimmen. Dann gilt (i) Die Funktion f ist genau dann Riemann-integrierbar, wenn g Riemann-integrierbar ist. Z Z f (x) d x = (ii) Sind f und g Riemann-integrierbar, dann gilt A Beweis: zu (i) g(x) d x. A Mit A und N ist auch B = A \ N Jordan-messbar. Ist f Riemann-integrierbar, dann gilt nach (1.13) (i) dasselbe für f |B = g|B . Nach Teil (iii) des gleichen Satzes ist g|N Riemann-integrierbar. Aus der RiemannIntegrierbarkeit von g|B und g|N ergibt nach Teil (ii) die Riemann-Integrierbarkeit von g auf A = B ∪ N . Damit ist insgesamt gezeigt, dass aus der Riemann-Integrierbarkeit von f dieselbe Eigenschaft für g folgt, und genauso beweist man die umgekehrte Implikation. zu (ii) Aus der disjunkten Zerlegung A = B ∪ N folgt mit Teil (ii) von (1.13) sofort Z Z Z Z Z f (x) d x A = f (x) d x + B f (x) d x = f (x) d x + 0 N Z g(x) d x + B = B Z g(x) d x = N Z g(x) d x. A —– 14 —– g(x) d x + 0 B = § 2. Integration über Normalbereiche, Cavalierisches Prinzip Inhaltsübersicht - Zunächst zeigen wir, dass der Graph Γ( f ) einer Riemann-integrierbaren Funktion f : A ⊆ R mit Jordanmessbarem Definitionsbereich A ⊆ Rn eine Nullmenge ist, und dass das Riemann-Integral im Fall f ≥ 0 als (n + 1)-dimensionales Volumen seiner Ordinatenmenge interpretiert werden kann. - Wir verallgemeinern den Satz von Fubini auf beliebige Jordan-messbare Definitionsbereiche. Als wichtigen Spezialfall behandeln wir die Integration über sog. Normalbereiche. - Aus dem (herkömmlichen) Satz von Fubini leiten wir das Cavalierische Prinzip an, welches besagt, dass jede n-dimensionale Volumenberechnung durch Integration auf (n − 1)-dimensionale Volumen zurückgeführt werden kann (für n ≥ 2). (2.1) Definition Sei A ⊆ Rn eine beliebige Teilmenge. Für jede Funktion f : A → R nennt man Γ( f ) = {(x, f (x)) ∈ Rn × R, x ∈ A} ⊆ Rn+1 den Graphen von f . Gilt außerdem f (x) ≥ 0 für alle x ∈ A, dann wird ¦ © Λ( f ) = (x, y) ∈ A × R 0 ≤ y ≤ f (x) ⊆ Rn+1 die Ordinatenmenge von f genannt. Zunächst zeigen wir nun, dass für integrierbare Funktionen der Graph Γ( f ) stets eine Jordansche Nullmenge ist. (2.2) Satz Sei A ⊆ Rn Jordan-messbar und f : A → R eine Riemann-integrierbare Funktion. Dann ist der Graph Γ( f ) eine Jordansche Nullmenge in Rn . Beweis: Sei Q ⊆ Rn ein kompakter Quader mit Q◦ ⊇ A. Nach Voraussetzung ist fQ Riemann-integrierbar, und wegen Γ( f ) ⊆ Γ( fQ ) genügt es zu zeigen, dass Γ( fQ ) eine Jordansche Nullmenge ist. Sei dafür " ∈ R+ vorgegeben. Auf Grund der Riemann-Integrierbarkeit von fQ gibt es eine Zerlegung Z von Q mit S f+ (Z ) − S f− (Z ) < ". Dabei ist Q Q + − der Graph Γ( fQ ) wegen cK, ≤ fQ (x) ≤ cK, für alle K ∈ Q(Z ) und x ∈ K in der Vereinigungsmenge fQ fQ [ − + V = K × [cK, , c ] f K, f Q K∈Q(Z ) enthalten. Das Jordansche Volumen dieser Menge beträgt P Q + K∈Q(Z ) (cK, fQ − − cK, )v(K) = S f+ (Z ) − S − (Z ). Die Werte f f Q Q Q + − cK, und cK, fallen möglicherweise zusammen, deshalb ist V im allgemeinen keine Vereinigungsmenge von komf f Q Q + − pakten Quadern. Wir können aber offenbar für jedes K ∈ Q(Z ) reelle Zahlen cK− ≤ cK, und cK+ ≥ cK, so wählen, dass f f —– 15 —– jeweils cK− < cK+ gilt und das Volumen von Ṽ = S K∈Q(Z ) K × [cK− , cK+ ] kleiner als " bleibt. Wegen Γ( fQ ) ⊆ V ⊆ Ṽ folgt daraus, dass Γ( fQ ) eine Jordansche Nullmenge ist. Seien m, n ∈ N, und seien A ⊆ Rm und B ⊆ Rn beschränkte Teilmengen. Ist A (2.3) Lemma eine Jordansche Nullmenge in Rm oder B eine Jordansche Nullmengen in Rn , dann ist A × B eine Jordansche Nullmenge in Rm × Rn = Rm+n . Beweis: Wir beschränken uns auf den Fall, dass A eine Jordansche Nullmenge ist. Sei Q ein kompakter Quader mit Q ⊇ B und " ∈ R+ vorgegeben. Auf Grund der Voraussetzung an A gibt es eine endliche Familie Q 1 , ..., Q r von Sr Pr Quadern in Rm mit k=1 Q k ⊇ A und k=1 v(Q k ) < ". Offenbar ist dann Q 1 ×Q, ..., Q r ×Q eine Familie von Quadern Sr in Rm+n mit k=1 (Q k × Q) ⊇ A × Q ⊇ A × B und r X v(Q k × Q) = k=1 r X v(Q k )v(Q) = v(Q) k=1 r X v(Q k ) = "v(Q). k=1 Da " beliebig klein gewählt werden kann, folgt daraus, dass A × B eine Jordansche Nullmenge ist. Im weiteren Verlauf dieses Kapitels werden wir es häufig mit der Berechnung von Volumina in Räumen unterschiedlicher Dimesion zu tun bekommen. Zur Verbesserung der Lesbarkeit bezeichnen wir das Jordansche Volumen einer Jordan-messbaren Teilmenge A des Rn von nun an statt mit v(A) auch mit vn (A). (2.4) Satz (Zusammenhang zwischen Jordan-Volumen und Riemannschem Integral) Sei A ⊆ Rn Jordan-messbar und f : A → R+ eine nicht-negative, Riemann-integrierbare Funktion. Dann ist die Ordinatenmenge Λ( f ) Jordan-messbar, und für ihr (n + 1)-dimensionales Jordansches Volumen gilt vn+1 (Λ( f )) = Z f (x) d x. A Beweis: Beweisen wir zunächst die Jordan-Messbarkeit von Λ( f ). Dazu müssen wir zeigen, dass ∂ Λ( f ) eine Nullmenge ist. Sei c = sup{ f (x) | x ∈ A} und Ā = A ∪ ∂ A der topologische Abschluss von A. Offenbar ist ∂ Λ( f ) in Ā× [0, c] enthalten. Ist nämlich (x, y) ∈ Rn × R mit x ∈ / Ā, dann ist U × R mit U = Rn \ Ā eine offene Umgebung von (x, y), die Ā × [0, c] nicht schneidet. Ist andererseits y ∈ / [0, c], dann erhalten wir durch Rn × V mit V = R \ [0, c] eine solche Umgebung. Wir zeigen nun weiter, dass der Rand von Λ( f ) in der Vereinigungsmenge N = Γ( f ) ∪ (∂ A ∪ UA) × [0, c] ∪ A × {0, c} enthalten ist. Liegt (x, y) in ∂ Λ( f ) und somit in Ā × [0, c], aber nicht in N , dann gilt x ∈ A◦ \ UA und y 6= 0, f (x), c. Insbesondere ist f in x stetig. Betrachten wir zunächst den Fall y < f (x). Setzen wir " = —– 16 —– 1 (f 2 (x) − y), dann gilt f (x) = y + 2". Auf Grund der Stetigkeit können wir eine Umgebung Uδ von x wählen, so dass Uδ ⊆ A und f (x 0 ) > y + " für alle x 0 ∈ Uδ gilt. Die Umgebung Uδ × 0, y + " von (x, y) ist dann vollständig in Λ( f ) enthalten, somit (x, y) kein Randpunkt dieser Menge. Im Fall y > f (x) setzen wir " = 21 ( y − f (x)). Die Stetigkeit liefert uns eine Umgebung Uδ von x mit Uδ ⊆ A und f (x 0 ) < y − " für alle x 0 ∈ Uδ . In diesem Fall ist Uδ × y − ", c vollständig im Komplement von Λ( f ) enthalten und (x, y) wiederum kein Randpunkt von Λ( f ). Damit ist der Beweis von ∂ Λ( f ) ⊆ N abgeschlossen. Nun ist Γ( f ) nach (2.2) eine Jordansche Nullmenge. Auf Grund der Jordan-Messbarkeit von A und der Riemann-Integrierbarkeit von f ist ∂ A ∪ UA ebenfalls ein Jordansche Nullmenge. Somit zeigt (2.3), dass auch (∂ A ∪ UA) × [0, c] und A × {0, c} Jordansche Nullmengen sind. Insgesamt ist also N und damit auch ∂ Λ( f ) eine Jordansche Nullmenge. Nun beweisen wir noch die angegebene Übereinstimmung zwischen Volumen und Integral. Sei Q ein kompakter Quader mit Q◦ ⊇ A und fQ : Q → R die Nullfortsetzung von f auf Q. Für jedes (x, y) ∈ Q × [0, c] gilt χΛ( f ) (x, y) = 1 genau dann, wenn x ∈ A und 0 ≤ y ≤ f (x) gilt, was wiederum zu y ∈ [0, fQ (x)] äquivalent ist. Nach Definition des Jordan-Volumens und dem Satz von Fubini gilt also Z vn+1 (Λ( f )) = χΛ( f ) (x, y)d(x, y) = Q×[0,c] Z Z fQ (x) 1 dy Q Q ! dx = Z 0 fQ (x) d x c Z Z = χΛ( f ) (x, y)d y dx = 0 Z Q f (x) d x. A Als Anwendungsbeispiel für den soeben bewiesenen Satz betrachten wir die obere Halbkugel im R3 gegeben durch H = ¦ © (x, y, z) ∈ R3 | z ≥ 0, x 2 + y 2 + z 2 ≤ 1 . p Für alle (x, y, z) ∈ R3 ist (x, y, z) ∈ H äquivalent zu x 2 + y 2 ≤ 1 und 0 ≤ z ≤ 1 − x 2 − y 2 . Für die Funktion f auf p dem Vollkreis K = {(x, y) ∈ R2 | x 2 + y 2 ≤ 1} gegeben durch f (x, y) = 1 − x 2 − y 2 gilt also Λ( f ) = H. Der Satz von oben ermöglicht es also, dass Volumen der Halbkugel durch ein zweidimensionales Integral auszudrücken, es gilt v3 (H) Z = f (x, y) d(x, y). K Um Integrale dieser Form problemlos ausrechnen zu können, müssen wir den Satz von Fubini auf eine allgemeinere Form bringen. Dazu führen die folgende Notation ein: Ist A eine Teilmenge von Rm × Rn mit m, n ∈ N, dann definieren wir für jedes x ∈ Rm die Menge A(x) ⊆ Rn durch A(x) = ¦ © y ∈ Rn (x, y) ∈ A . Wir bezeichnen die Menge A als Schnitt von A mit dem affinen Unterraum {x} × Rm . Man erhält A(x), indem man den mengentheoretischen Durchschnitt von A mit {x} × Rn mittels der Projektionsabbildung π : Rm × Rn → Rn , (x, y) 7→ y in den Rn projiziert. —– 17 —– Betrachten wir beispielsweise die Halbkugel H von oben als Teilmenge von R × R2 , dann gilt ist für alle x ∈ R mit |x| > 1 jeweils H(x) = ∅, denn die Ungleichung x 2 + y 2 + z 2 ≤ 1 ist für kein ( y, z) ∈ R2 erfüllt. Im Fall p |x| ≤ 1 ist H(x) ⊆ R2 gleich dem abgeschlossenen oberen Halbkreis mit Radius 1 − x 2 , denn für alle ( y, z) gilt die Äquivalenz ( y, z) ∈ H(x) ⇔ (x, y, z) ∈ H(x) ⇔ z ≥ 0 und x 2 + y 2 + z 2 ≤ 1 ⇔ z ≥ 0 und y 2 + z 2 ≤ 1 − x 2 . Ebenso können wir H als Teilmenge des kartesischen Produkts R2 × R betrachten. In diesem Fall ist H(x, y) für alle (x, y) ∈ R2 eine Teilmenge von R. Im Fall x 2 + y 2 > 1 ist diese leer, weil dann x 2 + y 2 + z 2 ≤ 1 nie erfüllt ist. Im p Fall x 2 + y 2 ≤ 1 gilt H(x, y) = [1, 1 − x 2 − y 2 ], wie die folgende Äquivalenzumformung zeigt. z ∈ H(x, y) ⇔ (x, y, z) ∈ H z ≥ 0 und z ≤ p z ≥ 0 und x 2 + y 2 + z 2 ≤ 1 ⇔ 1 − x2 − y2 z ∈ [0, ⇔ p ⇔ 1 − x 2 − y 2 ]. Wir können nun für den Satz von Fubini die folgende Verallgemeinerung formulieren. (2.5) Satz Seien m, n ∈ N und A ⊆ Rm × Rn eine Jordan-messbare Teilmenge derart, dass A(x) für jedes x ∈ Rm ebenfalls Jordan-messbar ist. Sei außerdem f : A → R eine stetige Funktion und Q ⊆ Rm ein Quader mit Q × Rn ⊇ A. Dann ist für jedes x ∈ Q die Funktion A(x) → R, y 7→ f (x, y) Riemann-integrierbar, und es gilt Z f (x, y) d(x, y) = A Beweis: Z Q ! Z f (x, y) d y d x. A(x) Mit f ist für jedes x ∈ Q auch die Funktion f x : A(x) → R, y 7→ f (x, y) stetig, damit auch Riemann- integrierbar. Sei R ⊆ Rn so gewählt, dass A in Q × R enthalten ist, und sei fQ×R die Nullfortsetzung von f auf Q × R. Für jedes x ∈ Q ist R → R, y 7→ fQ×R (x, y) die Nullfortsetzung von f x auf R. Mit Hilfe des herkömmlichen Satz von Fubini für Quader erhalten wir Z f (x, y) d(x, y) = Z A fQ×R (x, y) d(x, y) = Q×R = Z Q Z Z Q Z ! f (x, y) d y A(x) —– R 18 —– d x. fQ×R (x, y) d y dx Eine Teilmenge A ⊆ R2 heißt Normalbereich bezüglich der x-Achse, wenn (2.6) Definition es a, b ∈ R mit a < b und stetige Funktionen ψ1 , ψ2 : [a, b] → R mit ψ1 ≤ ψ2 gibt, so dass A = {(x, y) ∈ R2 | a ≤ x ≤ b , ψ1 (x) ≤ y ≤ ψ2 (x)} erfüllt ist. Hat A die Form {(x, y) ∈ R2 | a ≤ y ≤ b , ψ1 ( y) ≤ x ≤ ψ2 ( y)}, so spricht man von einem Normalbereich bezüglich der y-Achse. Jeder kompakte Quader Q der Form [a, b] × [c, d] ist ein Normalbereich. Dazu definiert man ψ1 , ψ2 : [a, b] → R durch ψ1 (x) = c und ψ2 (x) = d für alle x ∈ [a, b]. Auch die Kreisscheibe K r = {(x, y) ∈ R2 | x 2 + y 2 ≤ r 2 } ist für jedes r ∈ R+ ein Normalbereich. Hier definiert man auf dem Intervall [−r, r] die beiden Funktionen ψ1 , ψ2 durch p p r 2 − x 2 . Entsprechend lassen sich auch dreidimensionale Normalbereiche ψ1 (x) = − r 2 − x 2 und ψ2 (x) = definieren. Eine Teilmenge B ⊆ R3 heißt Normalbereich bezüglich der x y-Ebene, (2.7) Definition wenn es eine kompakte Jordan-messbare Teilmenge A ⊆ R2 und stetige Funktionen ψ1 , ψ2 : A → R mit ψ1 ≤ ψ2 gibt, so dass B = {(x, y, z) ∈ R3 | (x, y) ∈ A , ψ1 (x, y) ≤ z ≤ ψ2 (x, y)} erfüllt ist. Entsprechend definiert man Normalbereiche bezüglich der xz- und der yz-Ebene. Für Normalbereiche lässt sich der Satz von Fubini nun folgendermaßen formulieren. (2.8) Folgerung Sei A ⊆ R2 ein Normalbereich bezüglich der x-Achse mit definierenden Funktionen ψ1 , ψ2 : [a, b] → R und f : A → R eine weitere stetige Funktion. Dann gilt ! Z Z b Z ψ (x) 2 f (x, y) d(x, y) = Beweis: f (x, y) d y a A d x. ψ1 (x) Für alle x ∈ [a, b] gilt A(x) = [ψ1 (x), ψ2 (x)] auf Grund der Äquivalenz y ∈ A(x) ⇔ (x, y) ∈ A ⇔ ψ1 (x) ≤ y ≤ ψ2 (x) für alle y ∈ R. Also folgt die Aussage direkt aus (2.5). —– ⇔ y ∈ [ψ1 (x), ψ2 (x)] 19 —– Ebenso beweist man (2.9) Folgerung Sei B ⊆ R3 ein Normalbereich bezüglich der x y-Ebene mit definierenden Funktionen ψ1 , ψ2 : A → R auf einer geeigneten kompakten Jordan-messbaren Teilmenge A ⊆ R2 , und f : B → R eine weitere stetige Funktion. Dann gilt Z f (x, y, z) d(x, y, z) Z = A Z ψ2 (x, y) ! f (x, y, z) dz d(x, y). ψ1 (x, y) A Aus Platzgründen verzichten wir darauf, die entsprechenden Aussagen für Normalbereiche bezüglich der y-Achse und der xz- bzw. yz-Ebene auszuformulieren. Offenbar lässt sich das Konzept der Normalbereiche, das wir hier für Dimension 2 und 3 formuliert haben, problemlos auf Dimension n ≥ 4 übertragen, und es gelten zu (2.8) und (2.9) analoge Aussagen. Mit Hilfe von (2.8) können wir nun die Berechnung des Halbkugelvolumens v3 (H) von oben zu Ende führen. Aus Rr p der Mathe III-Vorlesung ist die Gleichung −r r 2 − x 2 d x = 21 πr 2 bekannt, für beliebiges r ∈ R+ (Flächeninhalt des Halbkreises vom Radius r). Weil die Kreisscheibe K von oben ein Normalbereich mit definierenden Funktionen p p ψ1 , ψ2 : [−1, 1] → R gegeben durch ψ1 (x) = − 1 − x 2 und ψ2 (x) = 1 − x 2 ist, erhalten wir p Z Z 1 Z 1−x 2 p v3 (H) = f (x, y) d(x, y) = 1 − x2 − y2 d y d x = p −1 K Z 1 −1 1 π(1 − 2 x 2) d x = 1 2 πx − 16 πx 3 1−x 2 − 1 = −1 wobei im dritten Schritt die angegebene Gleichung auf r = p 1 2 π − 16 π − − 21 π + 16 π = 2 π 3 1 − x 2 angewendet wurde. Mit dem Satz von Fubini kann die Berechung eines (n + 1)-dimensionalen Integrals auf n-dimensionale Integrale zurückgeführt werden. Weil es sich beim Volumen um das Integral über eine charakteristische Funktion handelt, kann auch die Berechnung von Volumina auf niedrigere Dimensionen zurückgeführt werden. (2.10) Satz (Cavalierisches Prinzip) Sei n ∈ N, A ⊆ R × Rn eine Jordan-messbare Menge, und seien a, b ∈ R mit a < b so gewählt, dass für jeden Punkt (x, y) ∈ A jeweils a ≤ x ≤ b erfüllt ist. Außerdem setzen wir voraus, dass A(x) für jedes x ∈ R eine Jordan-messbare Teilmenge von Rn ist. Dann gilt vn+1 (A) = b Z vn (A(x)) d x. a —– 20 —– Beweis: Sei Q ⊆ Rn so gewählt, dass A ⊆ [a, b] ×Q◦ erfüllt ist. Ist " ∈ R+ beliebig gewählt, dann liegt A im Inneren des Quaders R" = I" × Q, mit I" = [a − ", b + "]. Sei nun χA : R" → {0, 1} die charakteristische Funktion von A. Für alle (x, y) ∈ R" gilt χA(x, y) = χA(x) ( y) auf Grund der Äquivalenz χA(x, y) = 1 (x, y) ∈ A ⇔ ⇔ y ∈ A(x) χA(x) ( y) = 1. ⇔ Mit dem Satz von Fubini und der Definition des Jordanschen Volumens erhalten wir Z Z Z Z vn+1 (A) = χA(x, y) d(x, y) = χA(x, y) d(x, y) b+" Z = I" ×Q R" ! Z χA(x) ( y) d y b+" Z = Q a−" I" vn (A(x)) d x = χA(x, y) d y dx = Q b Z a−" ! vn (A(x)) d x , a wobei im letzten Schritt verwendet wurde, dass für alle x ∈ [a − ", b + "] \ [a, b] jeweils A(x) = ∅ und somit vn (A(x)) = 0 gilt. Als Anwendung des Cavalierischen Prinzips berechnen wir das Volumen eines Kegels der Höhe h > 0, dessen Grundfläche ein Kreis vom Radius r ist. Als Teilmenge vom R3 ist ein solcher Kegel zum Beispiel gegeben durch rz 2 3 2 2 K = (x, y, z) ∈ R 0 ≤ z ≤ h , x + y ≤ r − . h Für jedes z ∈ R setzen wir K(z) = {(x, y) ∈ R2 | (x, y, z) ∈ K}. Dies bedeutet eine geringfügige Abweichung von der in (2.10) verwendeten Notation, weil der Schnitt K(z) hier bezüglich der letzten und nicht wie in (2.10) bezüglich der ersten Koordinate gebildet wird. Da sich aber das Volumen durch Koordinatenvertauschung nicht ändert, stellt dies kein Problem dar. Für alle z ∈ R \ [0, h] gilt K(z) = ∅, denn in diesem Fall ist nach Definition (x, y, z) ∈ / K für alle (x, y) ∈ R2 . Ist dagegen z ∈ [0, h], dann gilt für alle (x, y) ∈ R2 die Äquivalenz (x, y) ∈ K(z) (x, y, z) ∈ K ⇔ x2 + y2 ≤ ⇔ r− rz 2 z 2 x2 + y2 ≤ r2 1 − h ⇔ h , also ist K(z) eine Kreisschreibe vom Radius r(z) = r(1 − hz ). Setzen wir den Flächeninhalt des Kreises als bekannt voraus, dann gilt also v2 (K(z)) = 2 πr(z) = πr 2 1− z 2 h z ∈ [0, h]. für alle Mit (2.10) erhalten wir nun v3 (K) = Z h v2 (K(z)) dz = πr 2 Z h 0 = 1− 0 πr 2 z− z2 h + z3 3h2 z 2 h dz = πr 2 Z h 1− 0 2z h h = πr 2 h − h + 31 h 0 —– 21 —– = 1 πhr 2 . 3 + z2 h2 dz Das in (2.10) zum Ausdruck kommmende Prinzip wurde bereits im frühen 17. Jahrhundert von seinem Namensgeber Bonaventura Cavalieri verwendet, um den Rauminhalt einer großen Zahl geometrischer Körper zu bestimmen. Dies waren die ersten Ergebnisse der Geometrie, die über das seit der Antike bekannte Wissen wesentlich hinausgingen. Da die Infinitesimalrechnung zu dieser Zeit noch nicht existierte (diese begann sich mit Newton und Leibniz erst gegen Ende des 17. Jahrhunderts zu entwickeln), konnte Cavalieri den in (2.10) vorhandenen Integralausdruck nicht symbolisch berechnen, sondern musste sich statt dessen mit Vergleichen behelfen. Beispielsweise leitete er aus dem bereits bekannten Kegel- und Zylindervolumen das Volumen der Kugel ab, in dem er neben eine Halbkugel H vom Radius r einen Zylinder Z mit Radius und Höhe r setzte. In diesem Zylinder wurde ein auf der Spitze stehender Kreisregel K mit Grundfläche und Höhe r untergebracht. Schneidet man die Halkugel nun auf Höhe h mit einer zur Grundfäche parallelen Ebene Eh , dann erhält man nach dem Satz des Pythagoras eine p Kreisschreibe vom Radius r 2 − h2 , deren Flächeninhalt π(r 2 −h2 ) beträgt. Schneidet man den Zylinder auf gleicher Höhe, so ergibt dies eine Kreisscheibe mit Flächeninhalt πr 2 , und der Schnitt von Eh mit de Kegel ergibt einen Kreis vom Flächeninhalt πh2 . Der Schnitt von Eh mit der Differenzmenge Z \ K beträgt also ebenfalls π(r 2 − h2 ), ist also genauso groß wie der Schnitt zwischen Eh und Halbkugel! Weil dies für alle h ∈ [0, r] der Fall ist, schloss Cavalieri, dass das Halbkugelvolumen gleich dem Volumen von Z \ K sein muss. Da v3 (Z) = πr 2 · r = πr 3 und v3 (K) = 31 πr 3 bereits bekannt war, erhielt er damit v3 (H) = v3 (Z \ K) = v3 (Z) − v3 (K) = πr 3 − 31 πr 3 = 2 πr 3 3 und schließlich das Volumen 43 πr 3 für die Vollkugel. Allerdings waren viele von Cavalieris Kollegen damals nicht bereit, seine Herleitung der Gleichung v3 (H) = v3 (Z \ K) zu akzeptieren. Scheinbar erforderte sie, die Körper H, Z und K in unendlich viele, unendlich dünne Scheiben zu zerlegen und deren unendlich kleine Volumina aufzuaddieren, was ihnen (zu Recht) suspekt erschien. Erst durch die Integralrechnung konnte Cavaleris Schluss im Nachhinein gerechtfertigt werden. Einen Einblick in die damalige Auseinandersetzung erhält man durch einen lesenswerten Spektrum-Artikel in der Ausgabe vom Oktober 2015. —– 22 —– § 3. Die mehrdimensionale Substitutionsregel Inhaltsübersicht - Übertragung der Substitutionsregel durch heuristische, elementargeometrische Überlegungen auf den mehrdimensionalen Fall - Anwendung dieser Regel auf Polar-, Zylinder und Kugelkoordinaten - Beweis der mehrdimensionalen Substitutionsregel durch vollständige Induktion über die Dimension Unser Ziel in diesem Abschnitt besteht darin, die aus der Mathe III bekannte Substitutionsregel für die Integration eindimensionaler Funktionen b Z 0 ( f ◦ ϕ)(x)ϕ (x) d x Z = ϕ(b) f (t) d t ϕ(a) a auf höhere Dimension zu übertragen. Bei dieser Verallgemeinerung wird die Determinante linearer Abbildungen eine wichtige Rolle spielen. Erinnern wir uns zunächst daran, wie in der Linearen Algebra die Definition der Determinantenfunktion det : Mn,K → K motiviert wurde. Gesucht war eine Funktion, die jeder Matrix A ∈ Mn,K das Volumen des Parallelotops P(A) ⊆ Rn zuordnet, das von den Spaltenvektoren der Matrix aufgespannt wird, zuzüglich eines Vorzeichens, das von der Reihenfolge der Vektoren abhing. Betrachten wir nun zur Matrix A die lineare Abbildung φA : R n → R n , v 7→ Av und wenden wir diese auf den Einheitswürfel Q = [0, 1]n an, dann erhalten wir φA(Q) = P(A) als Bildmenge, wie man mit Hilfe der Linearität von φA unmittelbar überprüft. Unter der Voraussetzung, dass | det(A)| tatsächlich mit dem Jordanschen Volumen von P(A) übereinstimmt, gilt also v(φA(Q)) = v(P(A)) = | det(A)| = | det(φA)|v(Q). (3.1) Aus der mehrdimensionalen Substitutionsregel wird sich ergeben, dass v(φ(B)) = | det(φ)|v(B) für beliebige lineare Endomorphismen φ von Rn und Jordan-messbare Teilmengen B ⊆ Rn gültig ist. Hier aber gehen wir zunächst umgekehrt vor und setzen diese Gleichung voraus, um durch heuristische Überlegungen eine naheliegende, mehrdimensionale Verallgemeinerung der Substitutionsregel zu finden. Sei G ⊆ Rn offen und D eine Jordan-messbare Teilmenge von Rn mit D̄ ⊆ G, wobei D̄ wie zuvor den topologischen Abschluss von D bezeichnet. Außerdem sei ϕ : G → Rn eine stetig differenzierbare Funktion. Diese Funktion wird die Rolle der Substitutionsfunktion von oben übernehmen. Der Einfachheit halber gehen wir zunächst davon aus, dass D ein kompakter Quader ist. Für jede Zerlegung Z von D schneiden sich die Quader K ∈ Q(Z ) nur in einer Jordanschen Nullmenge, und wegen (1.7) gilt dasselbe für die Mengen ϕ(K) in der Vereinigung [ ϕ(D) = ϕ(K). K∈Q(Z ) —– 23 —– Bezeichnet wir für jedes K ∈ Q(Z ) mit aK einen beliebig gewählten Punkt aus K. Wird die Zerlegung Z sehr fein gewählt, dann können wir davon ausgehen, dass die Funktion f in der Nähe des Punktes ϕ(aK ) nahezu konstant ist, also auf der gesamten Bildmenge ϕ(K) fast genau den Wert ( f ◦ ϕ)(aK ) annimmt. Dies liefert uns die Näherung Z Z X X ( f ◦ ϕ)(aK )v(ϕ(K)). (3.2) f (x) d x ≈ f (x) d x = ϕ(D) ϕ(K) K∈Q(Z ) K∈Q(Z ) Versuchen wir nun, dass Volumen von ϕ(K) zu approximieren. Weil ϕ (stetig) differenzierbar ist, kann es in einer Umgebung von aK durch eine affin-lineare Funktion angenähert werden: Für alle t ∈ Rn mit hinreichend kleiner Norm ktk∞ gilt ϕ(aK + t) ≈ ϕ(aK ) + ϕ 0 (aK )(t). Ist K (0) ⊆ Rn so gewählt, dass aK + K (0) = K gilt, dann haben bei hinreichend fein gewählter Zerlegung alle Punkte t ∈ K (0) eine kleine Norm, und wir erhalten v(ϕ(K)) ≈ v(ϕ(aK ) + ϕ 0 (aK )(K (0) )) = v(ϕ 0 (aK )(K (0) )) = | det ϕ 0 (aK )|v(K (0) ) = | det ϕ 0 (aK )|v(K) , wobei im zweiten Schritt die Translationsinvarianz (1.2) des Jordan-Volumens und im dritten Schritt (3.1) verwendet wurde. Setzen wir dies nun in (3.2) ein, so erhalten wir Z X f (x) d x ≈ ( f ◦ ϕ)(aK ))| det ϕ 0 (aK )|v(K) ϕ(D) Z ( f ◦ ϕ)(t)| det ϕ 0 (t)| d t. ≈ K∈Q(Z ) D Dies ist die gesuchte mehrdimensionale Verallgemeinerung der eindimensionalen Substitutionsregel. Da jede Jordanmessbare Teilmenge durch disjunkte Vereinigungen kompakter Quader beliebig angenähert werden kann, ist zu erwarten, dass auch in der Gleichung der kompakte Quader D durch eine beliebige kompakte Jordan-messbare Menge ersetzbar ist. (3.1) Satz (mehrdimensionale Substitutionsregel) Sei G ⊆ Rn ein Gebiet und ϕ : G → Rn eine injektive, stetig differenzierbare Abbildung, wobei wir det ϕ 0 (t) 6= 0 für alle t ∈ G voraussetzen. Sei T ⊆ G eine Jordan-messbare, kompakte Teilmenge und f : ϕ(T ) → R eine stetige Abbildung. Dann gilt (i) Die Bildmenge ϕ(T ) ⊆ Rn ist Jordan-messbar. (ii) Die Funktion f ist auf ϕ(T ), die Funktion f ◦ ϕ auf T Riemann-integrierbar. Z Z f (x) d x (iii) Es gilt ϕ(T ) Zusatz: ( f ◦ ϕ)(t)| det ϕ 0 (t)| d t. = (S) T Die Substitutionsregel ist auch dann noch gültig, wenn eine Jordansche Nullmenge N ⊆ T existiert, auf der die Funktion t 7→ det ϕ 0 (t) möglicherweise Null wird. Ebenso genügt es, dass ϕ auf T \ N injektiv ist. —– 24 —– In der speziellen Situation, dass n = 1, G ⊆ R ein offenes und T ⊆ G ein kompaktes Intervall ist, folgt dieser Satz direkt aus der eindimensionalen Substitutionsregel der Mathe III-Vorlesung. In diesem Fall gilt det ϕ 0 (t) = ϕ 0 (t) für alle t ∈ G. Sei T = [a, b] mit a, b ∈ R und a < b, und setzen wir zunächst voraus, dass ϕ 0 (t) > 0 für alle t ∈ G gilt. Dann ist die Funktion ϕ auf ihrem gesamten Definitionsbereich streng monoton wachsend, insbesondere gilt ϕ(a) < ϕ(b) und ϕ(T ) = [ϕ(a), ϕ(b)]. Mit Hilfe der eindimensionalen Substitutionsregel erhalten wir Z 0 ( f ◦ ϕ)(t)| det ϕ (t)| d t b Z = T 0 ( f ◦ ϕ)(t)ϕ (t) d t = Z ϕ(b) f (x) d x = ϕ(a) a Z f (x) d x. ϕ(T ) Im anderen Fall gilt ϕ 0 (t) < 0 für alle t ∈ G. Dann ist ϕ überall streng monoton fallend, es gilt ϕ(a) > ϕ(b) und ϕ(T ) = [ϕ(b), ϕ(a)]. Auch diesmal erhalten wir, wenn auch auf einem leicht veränderten Rechenweg, wegen | det ϕ 0 (t)| = |ϕ 0 (t)| = −ϕ 0 (t) das Resultat Z 0 ( f ◦ ϕ)(t)| det ϕ (t)| d t b Z = 0 ( f ◦ ϕ)(t)ϕ (t) d t − T = = ϕ(b) − f (x) d x ϕ(a) a Z Z ϕ(a) f (x) d x = Z ϕ(b) f (x) d x. ϕ(T ) Der Ausdurch det ϕ 0 (t) unter dem Integralzeichen in der Gleichung (S) wird die Funktionaldeterminante von ϕ genannt. Wendet man die Gleichung auf die konstante Funktion f (x) = 1 an, so erhält man unter den angegebenen Voraussetzungen an G, ϕ und T die Gleichung v(ϕ(T )) = Z | det ϕ 0 (t)| d t. T Ist ϕ darüber hinaus eine bijektive, lineare Abbildung, dann gilt ϕ 0 (t) = ϕ für alle t ∈ T , und wir erhalten die Gleichung v(ϕ(T )) = | det ϕ|v(T ) zurück, die oben der Ausgangspunkt unserer Überlegungen gewesen war. Auch im Fall det ϕ = 0 ist die Gleichung noch gültig, weil ϕ(T ) in diesem Fall in einer Hyperebene von Rn liegt und damit eine Nullmenge ist, wie es teilweise in den Übungen gezeigt wurde. Der Beweis von Satz (3.1) ist sehr aufwändig und wird an das Ende dieses Kapitels verschoben. Hier schauen wir uns vorher noch einige Beispiele für häufig verwendet Transformationsfunktionen ϕ an, die in der Geometrie und der Physik eine wichtige Rolle spielen. Integration in Polar-, Zylinder- und Kugelkoordinaten Im letzten Semester wurde die Polarkoordinaten-Abbildung ρpol : R+ × R2 → R gegeben durch ρpol (r, ϕ) = (r cos(ϕ), r sin(ϕ)) eingeführt. Die Ableitung dieser Funktion in einem beliebigen Punkt ist gegeben durch ! cos(ϕ) −r sin(ϕ) 0 ρpol (r, ϕ) = sin(ϕ) r cos(ϕ) —– 25 —– 0 (r, ϕ) = r. Schränkt man ρpol auf den Bereich U = R+ × ]0, 2π[ ein, so mit der Funktionaldeterminante det ρpol 0 erhält man eine injektive Abbildung mit det ρpol (r, ϕ) 6= 0 für alle (r, ϕ) ∈ U, deren Bildmenge durch R2 \ N mit N = R+ × {0} gegeben ist. Da N in einer Hyperebene enthalten ist, handelt es sich um eine Nullmenge (siehe Übungen). Für jede Jordan-messbare Teilmenge T ⊆ U und jede rellwertige, stetige und beschränkte Funktion f auf ρpol (T ) liefert uns (3.1) also die Gleichung Z f (x, y) d(x, y) Z = ρpol (T ) ( f ◦ ρpol )(r, ϕ) · r d(r, ϕ). T Als einfaches Anwendungsbeispiel für diese Formel berechnen wir das Volumen des Kegels K mit kreisförmiger Grundfläche vom Radius R und Höhe h. Als Teilmenge von R3 ist K gegeben durch o n 2 , 0≤z≤h . (x, y, z) ∈ R3 x 2 + y 2 ≤ R2 1 − hz = K Für alle (x, y, z) ∈ R3 mit x 2 + y 2 ≤ R2 und 0 ≤ z ≤ h gilt die Äquivalenz (x, y, z) ∈ K ⇔ 2 x 2 + y 2 ≤ r 2 1 − hz ⇔ p ⇔ x 2 + y 2 ≤ r(1 − hz ) ⇔ h r p x2 + y2 ≤ h − z 1p 2 z ≤h 1− x + y2 . R Definieren wir also eine Funktion f : B → R auf der Menge B = {(x, y) ∈ R2 | x 2 + y 2 ≤ R2 } durch f (x, y) = p h(1 − R1 x 2 + y 2 ), dann ist K gerade die Ordinatenmenge Λ( f ), und wir können (2.4) für die Berechnung von v(K) verwendet werden. Man stellt allerdings fest, dass die Integration von f über B in kartesischen Koordinaten schon eine recht komplizierte Angelegenheit ist. Durch die Verwendung von Polarkoordinaten wird die Berechnung erheblich vereinfacht, weil diese unter anderem den kreisförmigen Integrationsbereich in ein Rechteck überführen. Zunächst kann statt über B auch über B̃ = B \ N integriert werden, denn die beiden Integrale unterscheiden sich nur um eine Jordansche Nullmenge, und weil außerdem die Funktion f beschränkt ist, wird das Integral beim Übergang von B zu B̃ nach (1.14) nicht verändert. Für alle (r, ϕ) ∈ U mit (x, y) = ρpol (r, ϕ) gilt die Äquivalenz r ≤ R ⇔ x 2 + y 2 ≤ R2 ⇔ (x, y) ∈ B̃. Setzen wir also T = [0, R] × ]0, 2π[, dann gilt ρpol (T ) = B̃, außerdem ist ( f ◦ ρpol )(r, ϕ) = f (r cos(ϕ), r sin(ϕ)) für alle (r, ϕ) ∈ T . Insgesamt gilt nun Z v(K) = f (x, y) d(x, y) Z = B Z ( f ◦ ρpol )(r, ϕ) · r d(r, ϕ) Z = h 1− T r− 2πh 0 f (x, y) d(x, y) Z = r2 R r R r d(r, ϕ) dr = 2πh = Z R f (x, y) d(x, y) − —– 1 3 r3 R 26 Z 2π r− h 0 1 2 r 2 r h 1− R = = ρpol (T ) B̃ T Z R 1p h 1− (r cos(ϕ))2 + (r sin(ϕ))2 R = 0 r2 ! R dϕ dr R = 0 —– 2πh 1 2 R2 − 13 R2 = 1 πR2 h. 3 = In Analogie zu den Polarkoordinaten verwendet man zur Berechnung dreidimensionaler Integrale die sogenannten Zylinderkoordinaten ρzyl : R+ × R2 → R3 (r, h, ϕ) 7→ r cos(ϕ), r sin(ϕ), h , und ebenso die Kugelkoordinaten gegeben durch ρkug : R+ × R2 → R3 , (r, ϑ, ϕ) 7→ r cos(ϑ) cos(ϕ), r cos(ϑ) sin(ϕ), r sin(ϑ) , 0 0 (r, ϑ, ϕ) = −r 2 cos(ϑ) annehmen. Auch (r, h, ϕ) = r bzw. det ρkug deren Funktionaldeterminanten die Werte det ρzyl hier gibt es jeweils eine Nullmenge N ⊆ R3 , außerhalb der die Abbildung injektiv ist und die Funktionaldeterminanten nicht verschwindet. Für jede Menge Jordan-messbare Menge T im Komplement von N und jede stetige Funktion auf dem Bild von T liefert die mehrdimensionale Substitutionsregel hier die Gleichungen Z Z f (x, y, z) d(x, y, z) = ( f ◦ ρzyl )(r, h, ϕ) · r d(r, h, ϕ) ρzyl (T ) bzw. Z T f (x, y, z) d(x, y, z) = ρkug (T ) Z ( f ◦ ρkug )(r, ϑ, ϕ) · r 2 cos(ϑ) d(r, ϑ, ϕ). T Beweis der mehrdimensionalen Substitutionsregel Im Wesentlichen erfolgt der Beweis von (3.1) durch vollständige Induktion über die Dimension n. Für den Induktionsschritt benötigen wir einen Satz aus der mehrdimensionalen Differentialrechnung, den wir hier aus Zeitgründen leider nicht beweisen können. Wir erinnern daran, dass eine stetig differenzierbare Abbildung auch als C 1 -Abbildung bezeichnet wird. (3.2) Satz (Satz über die lokale Umkehrbarkeit) Sei n ∈ N, U ⊆ Rn offen und g : U → Rn eine C 1 -Abbildung. Dann gibt es für jeden Punkt a ∈ U mit det g 0 (a) 6= 0 eine offene Umgebung W ⊆ U und eine Abbildung h : g(W ) → W derart, dass g(W ) ⊆ Rn offen und die Gleichungen h ◦ g|W = idW (g|W ) ◦ h = id g(W ) und erfüllt sind. (3.3) Folgerung Sei n ∈ N, U ⊆ Rn offen und g : U → Rn eine C 1 -Abbildung. Dann ist auch die Bildmenge g(U) offen. Beweis: Es genügt zu zeigen, dass für jedes a ∈ U eine offene Umgebung von g(a) in g(U) enthalten ist. Tatsächlich gibt es wegen nach (3.2) eine offene Umgebung W ⊆ U von a mit der Eigenschaft, dass g(W ) ⊆ g(U) in Rn ebenfalls offen ist. —– 27 —– (3.4) Lemma Sei U ⊆ Rn offen und Q ⊆ U ein kompakter Quader. Dann gibt es einen offenen Quader Q̃ mit Q ⊆ Q̃ ⊆ U. Sei Q = Qn bk ] mit ak , bk ∈ R, ak < bk für 1 ≤ k ≤ n, und nehmen wir an, dass ein Quader Q̃ wie Qn angegeben nicht existiert. Setzen wir für jedes " ∈ R+ jeweils Q " = k=1 ak − ", ak + " , dann gilt also Q " 6⊆ U Beweis: k=1 [ak , für alle " ∈ R+ . Insbesondere gibt es eine Folge (x m )m∈N von Punkten im Rn mit der Eigenschaft x m ∈ Q 1/m \ U für alle m ∈ N. Nun ist die gesamte Folge in der kompakten Menge Q̄ 1 enthalten. Nach dem Satz von BolzanoWeierstrass gibt diese eine konsatnte Teilfolge. Bezeichnen wir den Grenzwert dieser Folge mit x, dann ist x einerseits S in Q = m∈N Q 1/m , andererseits auf Grund der Abgeschlossenheit von Rn \ U auch im Komplement von U enthalten. Aber dies steht zu Q ⊆ U im Widerspruch. Für die Ausführung des Induktionsschritts im Beweis von (3.1) ist nun die folgende Aussage entscheidend. (3.5) Proposition (Zerlegungssatz) Sei n ≥ 2, U ⊆ Rn offen und ϕ : U → Rn eine stetig differenzierbare Funktion mit der Eigenschaft, dass det ϕ 0 (x) 6= 0 für alle x ∈ U gilt. Dann gibt es für jeden Punkt a ∈ U nach eventueller Umnummerierung der Koordinaten eine offene Umgebung W ⊆ U und Funktionen % : W → Rn , ψ : %(W ) → Rn , so dass folgende Bedingungen erfüllt sind. (i) Die Bildmenge %(W ) ist offen in Rn . (ii) Die Abbildungen % und ψ sind beide injektiv und stetig differenzierbar. (iii) Es gilt ϕ(x) = (ψ ◦ %)(x) für alle x ∈ Rn . (iv) Die Abbildung ψ lässt die ersten n−1, die Abbildung % die letzte Koordinate unverändert, d.h. für alle x ∈ W und y ∈ %(W ) gilt %(x) = (%1 (x), ..., %n−1 (x), x n ) Beweis: und ψ( y) = ( y1 , ..., yn−1 , ψn ( y)). Wegen det ϕ 0 (a) 6= 0 ist die Ableitungsmatrix ϕ 0 (a) vom Rang n. Streichen wir die letzte Zeile, so ist die verbleibende Matrix vom Rang n − 1. Mindestens eine Spalte dieser Matrix kann gestrichen werden, ohne dass sich der Rang dadurch weiter verringert. Nach eventueller Umnummerierung der Koordinaten können wir davon ausgehen, dass dies auf die letzte Spalte zutrifft. Die linke obere (n − 1) × (n − 1)-Teilmatrix von ϕ 0 (a) ist dann vom Rang n − 1 und somit invertierbar. Sei nun %̃ : U → Rn definiert durch %̃(x) = (ϕ1 (x), ..., ϕn−1 (x), x n ) für alle x ∈ U. Dann stimmt die linke obere (n−1)×(n−1)-Teilmatrix von %̃ 0 (a) mit der von ϕ 0 (a) überein. Die letzte Zeile und Spalte von %̃ 0 (a) hat als einzigen Eintrag ungleich Null eine 1 in der letzten Komponente. Insgesamt folgt daraus det %̃ 0 (a) 6= 0. Wir können somit (3.2) anwenden und erhalten eine offene Umgebung W ⊆ U von a, so dass V = %(W ) offen in Rn (also Bedingung (i) erfüllt) ist und eine Umkehrabbildung ϕ : V → W von % = %̃|W existiert. Insbesondere gilt ϕ j (%(x)) = x j für 1 ≤ j ≤ n, für alle x ∈ W . —– 28 —– Nun definieren wir ψ : V → Rn für alle y ∈ V durch ψ( y) = ( y1 , ..., yn−1 , g n (ϕ1 ( y), ..., ϕn−1 ( y), yn )). Offenbar ist auch die Abbildung ψ auf ihrem gesamten Definitionsbereich stetig differenzierbar (da alle ihre Komponentenfunktionen stetig differenzierbar sind). Für alle x ∈ W gilt (ψ ◦ %)(x) = (%1 (x), ..., %n−1 (x), g n (ϕ1 (%(x)), ..., ϕn−1 (%(x)), %n (x))) (ϕ1 (x), ..., ϕn−1 (x), ϕn (x 1 , ..., x n−1 , x n )) = (ϕ1 (x), ..., ϕn−1 (x), ϕn (x)) = = ϕ(x). Dies zeigt, dass Bedingung (iii) erfüllt ist, und Bedingung (iv) ist auf Grund der Definition von % und ψ offensichtlich. Auf Grund der Injektivität von ϕ|W und der Gleichung ψ ◦ % = ϕ|W müssen auch % und ψ injektiv sein. Also ist auch Bedingung (ii) gültig. Der Übersichtlichkeit halber teilen wir den Beweis von (3.1) in eine Reihe von Einzelschritten auf. 1 Beweis der Teilaussagen (i) und (ii) 2 Rückführung des Beweises von (S) auf den Fall, dass G → R, t 7→ det ϕ 0 (t) beschränkt ist 3 Für jeden Quader Q ⊇ T gibt es eine Zerlegung Z , so dass K ⊆ G oder K ∩ T = ∅ für alle K ∈ Q(Z ). 4 Rückführung auf den Fall, dass T ein kompakter Quader und G ein offener Quader ist 5 Beweis von (S) für Dimension n = 1 6 Beweis von (S) für den Fall, dass die Substitutionsfunktion die spezielle Form ϕ(t, t n ) = (t, ψ(t, t n )) besitzt, mit einer Funktion ψ : G → R 7 Gilt (3.1) in Dimension n − 1, dann ist (S) auch in Dimension n gültig (wobei n ∈ N, n ≥ 2 ist). 8 Beweis des Zusatzes Wir arbeiten diese Einzelschritte nun der Reihe nach ab. 1 Unter den in (3.1) angegebenen Voraussetzungen gelten die dort genannten Aussagen (i) und (ii). Beweis: Da T Jordan-messbar ist, handelt es sich bei ∂ T um eine Nullmenge. Die Menge T̄ ist beschränkt und abgeschlossen, also kompakt. Als abgeschlossene Teilmenge von T̄ ist damit auch ∂ T kompakt. Aus der Mathe III ist bekannt, dass eine kompakte Nullmenge zugleich eine Jordansche Nullmenge ist. Auf Grund der stetigen Differenzierbarkeit von ϕ ist nach (1.7) auch ϕ(∂ T ) eine Jordansche Nullmenge. Da es sich bei ϕ wegen (3.2) um einen Homöomorphismus von G auf ϕ(G) handelt, gilt außerdem ϕ(∂ T ) = ∂ ϕ(T ). Dies zeigt, dass auch ∂ ϕ(T ) eine Jordansche Nullmenge und ϕ(T ) somit Jordan-messbar ist. Als stetige Funktion auf der Jordan-messbaren Menge ϕ(T ) ist f Riemann-integrierbar. Die Abbildung f ◦ ϕ ist auf T stetig und somit ebenfalls Riemann-integrierbar. —– 29 —– 2 Ist die Gleichung (S) immer dann erfüllt, wenn die Funktion t 7→ det ϕ 0 (t) auf G beschränkt ist, dann gilt sie auch im allgemeinen Fall. Beweis: Für jedes x ∈ Rn und r ∈ R+ bezeichnen wir mit Wr (x) den offenen Ball vom Radius r bezüglich der k·k∞ Norm; dabei handelt es sich um einen Würfel der Kantenlänge 2r. Für jedes x ∈ G sei "(x) ∈ R+ so gewählt, dass W"(x) (x) ⊆ G gilt. Dann bilden auch die Würfel W"(x)/3 (x) ⊆ G mit x ∈ T bereits eine offene Überdeckung von T . Weil T kompakt ist, gibt es eine endliche Menge x 1 , ..., x m ∈ T , so dass T bereits von den Würfeln Wk = W"(x k )/3 (x k ) überdeckt wird. Darüber hinaus gilt ⊆ T m [ Wk ⊆ k=1 m [ W̄k ⊆ G , k=1 Sm wobei W̄k jeweils den Abschluss von Wk bezeichnet. Weil die Menge V = k=1 W̄k kompakt ist, ist die Abbildung t 7→ Sm det ϕ 0 (t) auf V beschränkt, somit erst recht auf G̃ = k=1 Wk . Wegen T ⊆ G̃ ⊆ G können wir in der Gleichung (S) die Funktion ϕ durch die Einschränkung ϕ|G̃ ersetzen, ohne dass sich die Integrale auf beiden Seiten der Gleichung ändern. 3 Für jeden Quader Q ⊇ T gibt es eine Zerlegung Z , so dass K ⊆ G oder K ∩ T = ∅ für alle K ∈ Q(Z ). Beweis: Seien die Würfel Wk = W"(x k )/3 (x) wie im Beweis von Schritt 2 gewählt und rk = "(x k ) für 1 ≤ k ≤ m. Mit Vk bezeichnen wir jeweils den Würfel mit demselben Mittelpunkt x k ∈ T wie Wk vom Radius rk , außerdem setzen wir r = min{r1 , ..., rm }. Nach Konstruktion gilt T ⊆ m [ Wk ⊆ m [ Vk ⊆ G. k=1 k=1 Wir zeigen nun: Ist W ein kompakter Würfel vom k · k∞ -Radius ≤ 61 r, der mindestens einen Punkt x 0 ∈ T enthält, dann folgt W ⊆ G. Weil T von den Würfeln W1 , ..., Wm überdeckt wird, können wir x 0 ∈ Wk annehmen. Sei nun x̃ der Mittelpunkt von W und x ∈ W beliegt. Zu zeigen ist x ∈ G. Es gilt kx − x k k∞ ≤ kx − x̃k∞ + kx̃ − x 0 k∞ + kx 0 − x k k∞ ≤ 1 r 6 + 16 r + 31 rk ≤ 2 r 3 k < rk , also x ∈ Vk und somit x ∈ G. Sei nun Q ⊆ Rn ein kompakter Würfel mit Q ⊆ T und Z eine Zerlegung von Q bestehend aus Würfeln vom k · k∞ -Radius ≤ 16 r. Wie soeben gezeigt, ist dann jeder Würfel R ∈ Q(Z ) entweder zu T disjunkt oder vollständig in G enthalten. —– 30 —– 4 Setzt man die Gültigkeit von (3.1) in der speziellen Situation voraus, dass G ein offener und T ein kompakter Quader im Rn ist, dann gilt (3.1) auch im allgemeinen Fall. Beweis: Sei " ∈ R+ vorgegeben und Q ⊆ Rn ein kompakter Quader mit Q◦ ⊇ T . Nach Schritt 3 gibt es eine Zerlegung Z von Q, so dass für alle R ∈ Q(Z ) entweder R ∩ T = ∅ oder R ⊆ G gilt. Wir definieren nun die Quadermengen und setzen A = S R∈A A = {R ∈ Q(Z ) | R ∩ ∂ T 6= ∅} und B = {R ∈ Q(Z ) | R ⊆ T ◦ } S R sowie B = R∈B R. Da ∂ T auf Grund der Jordan-Messbarkeit von T eine Nullmenge, wegen der Kompaktheit von ∂ T sogar eine Jordansche Nullmenge ist, können wir nach eventueller Verfeinerung von Z voraussetzen, dass v(A) < " gilt. Jeder Punkt x ∈ T ist in einem Quader R ∈ Q(Z ) enthalten. Dieser liegt entweder im Inneren von T , oder er scheidet ∂ T ; somit gilt x ∈ A ∪ B. Aus T ⊆ A ∪ B folgt T \ B ⊆ A und v(T \ B) ≤ v(A) < ". Nach (1.4) ist ϕ auf jedem Quader R ∈ A Lipschitz-stetig, mit Lipschitz-Konstante L = sup t∈G kϕ 0 (t)k, wobei k·k die Operatornorm auf L (Rn ) bezüglich der Maximumsnorm auf Rn bezeichnet. Wie im Beweis von (1.6) folgt daraus v(ϕ(A)) < λ" mit einer nur von ϕ abhängigen Konstanten λ ∈ R+ . Aus ϕ(T ) ⊆ ϕ(A)∪ϕ(B) folgt ϕ(T )\ϕ(B) ⊆ ϕ(A) und v(ϕ(T ) \ ϕ(B)) ≤ v(ϕ(A)) < λ". Zur Abkürzung setzen wir F (t) = ( f ◦ ϕ)(t)| det ϕ 0 (t)|. Es gilt ϕ(B) = S R∈B ϕ(R), und die Mengen ϕ(R) schneiden sich nach (1.6) höchstens in Nullmengen. Für jedes R ∈ B gibt es wegen R ⊆ T ◦ nach (3.4) einen offenen Quader R̃ ⊇ R, der ebenfalls in T ◦ enthalten ist. Wir können unsere Voraussetzung auf die Quader R, R̃ anwenden und erhalten die Gleichung Z f (x) d x = ϕ(B) Nach (1.13) gilt außerdem Z Z f (x) d x − F (t) d t ϕ(T ) T X R∈B = ≤ Z f (x) d x ϕ(R) = X R∈B Z F (t) d t R = Z F (t) d t. B Z Z Z Z f (x) d x + f (x) d x − F (t) d t − F (t) d t ϕ(T )\ϕ(B) ϕ(B) B T \B Z Z f (x) d x + F (t) d t . ϕ(T )\ϕ(B) T \B Sei γ = sup{ | f (x)| | x ∈ ϕ(T )} ∪ { |F (t)| | t ∈ T }. Dann gilt also Z Z f (x) d x − F (t) d t ≤ γv(ϕ(T ) \ ϕ(B)) + γv(T \ B) ϕ(T ) T < Da " ∈ R+ beliebig klein gewählt werden kann, folgt daraus die Behauptung. —– 31 —– γλ" + γ" = γ"(λ + 1). 5 Die mehrdimensionale Substiutionsregel (3.1) gilt für Dimension n = 1. Beweis: Die Aussagen (i) und (ii) wurden bereits in Schritt 1 gezeigt. Direkt im Anschluss an die Formulierung von (3.1) haben wir festgestellt, dass auch die Gleichung (S) gültig ist, falls es sich bei Q̃ um ein offenes und bei Q um ein kompaktes (eindimensionales) Intervall handelt. Somit folgt die Behauptung unmittelbar aus Schritt . 4 6 Gibt es eine Funktion ψ : G → R mit ϕ(t, t n ) = (t, ψ(t, t n )) für alle (t, t n ) ∈ G, dann ist (S) erfüllt. Beweis: Nach Schritt 4 können wir voraussetzen, dass G ein offener und T ein kompakter Quader ist. Es gibt dann einen offenen Quader Q̃, ein offenes Intervall Ĩ, einen kompakten Quader Q und ein kompaktes Intervall I = [an , bn ] mit an , bn ∈ R, an < bn , so dass Q̃ ⊇ Q, Ĩ ⊇ I, G = Q̃ × Ĩ und T = Q × I erfüllt ist. Da G zusammenhängend, die Funktion G → R, (t, t n ) 7→ det ϕ 0 (t, t n ) stetig und det ϕ 0 (t, t n ) 6= 0 für alle (t, t n ) ∈ G ist, gilt entweder überall det ϕ 0 (t, t n ) > 0 oder det ϕ 0 (t, t n ) < 0. Wir betrachten zunächst den Fall, dass det ϕ 0 (t, t n ) überall positiv ist. Wegen ϕ(t, t n ) = (t, ψ(t, t n )) hat die Ableitungsmatrix vn ϕ die Form 1 .. . ϕ 0 (t, t n ) = 1 ∂1 ψ(t, t n ) · · · ∂n−1 ψ(t, t n ) ∂n ψ(t, t n ) Definiert man für jedes t ∈ Q̃ eine Funktion τ t : Ĩ → R, t n 7→ ψ(t, t n ), dann gilt τ0t (t n ) = ∂n ψ(t, t n ) = det ϕ 0 (t, t n ) > 0. Die Funktion τ t ist also für jedes t ∈ Q̃ auf Ĩ streng monoton wachsend. Insbesondere gilt ψ(t, an ) = τ t (an ) ≤ τ t (t n ) ≤ τ t (bn ) = ψ(t, bn ) und somit τ t (I) ⊆ [ψ(t, an ), ψ(t, bn )] für alle t ∈ Q̃. Auf Grund der Stetigkeit von τ t folgt aus dem Zwischenwertsatz sogar τ t (I) = [ψ(t, an ), ψ(t, bn )], somit ϕ({t} × I) = {t} × ψ({t} × I) = {t} × τ t (I) = {t} × [ψ(t, an ), ψ(t, bn )] für alle t ∈ Q̃ und schließlich ϕ(T ) = ϕ(Q × I) = [ ϕ({t} × I) = t∈Q = [ {t} × [ψ(t, an ), ψ(t, bn )] t∈Q {(t, v) ∈ Q × R | ψ(t, an ) ≤ v ≤ ψ(t, bn )}. Die Menge ϕ(T ) ist also ein Normalbereich. Wir beweisen nun die Gleichun (S) durch Rückführung auf den Fall n = 1, der durch Schritt 5 bereits abgedeckt ist. Für jedes t ∈ Q̃ sei dazu die Funktion f t : Ĩ → R definiert durch f t (t n ) = f (t, t n ) für alle t n ∈ Ĩ. Durch Anwendung der (2.8) entsprechenden Gleichung für Normalbereiche in —– 32 —– Dimension n + 1 erhalten wir Z f (x) d x Z Z = ϕ(T ) ! f (t, t n ) d t n ( f t ◦ τ t )(t n )|τ0t (t n )| = dt d tn f Q Q ( f ◦ ϕ)(t, t n )| det ϕ (t, t n )| d t n = τ t (I) (t, ψ(t, t n ))|τ0t (t n )| Z = dt (∗) dt d tn = dt I 0 f t (t n ) d t n Z Z I Z Z = dt ! Z Q Z Z Z ψ(t,an ) Q Q ψ(t,bn ) I ( f ◦ ϕ)(t, t n )| det ϕ 0 (t, t n )| d(t, t n ) Q×I Z = ( f ◦ ϕ)(t, t n )| det ϕ 0 (t, t n )| d(t, t n ) T wobei an der Stelle (*) die Formel (S) für n = 1 angewendet wurde. Nun betrachten wir noch den Fall, dass det ϕ 0 (t, t n ) < 0 für alle (t, t n ) ∈ G gilt. In diesem Fall ist τ0t (t n ) < 0 für alle (t, t n ) ∈ T̃ , die Funktion τ t ist also für alle t ∈ Q̃ streng monoton fallend. Wir erhalten ϕ(T ) = {(t, v) ∈ Q × R | ψ(t, b p ) ≤ v ≤ ψ(t, a p )} und somit entsprechend Z f (x) d x Z = ϕ(T ) = Z Z Q ψ(t,an ) ! f (t, t n ) d t n ( f ◦ ϕ)(t, t n ) det ϕ (t, t n ) d(t, t n ) Z = T 7 = Z − Q 0 − dt ψ(t,bn ) Z ! f t (t n ) d t n dt τ t (I) ( f ◦ ϕ)(t, t n )| det ϕ 0 (t, t n )| d(t, t n ). T Sei n ∈ N mit n ≥ 2, und setzen wir voraus, dass (3.1) in Dimension n − 1 gültig ist. Dann gilt die Gleichung (S) auch in Dimension n. Beweis: Wiederum können wir nach Schritt 4 annehmen, dass G ein offener Quader und T ein kompakter Quader ist. Wie zuvor schreiben wir G = Q̃ × Ĩ und T = Q × I mit geeigneten Quadern Q ⊆ Q̃ ⊆ Rn−1 und geeigneten Intervallen I ⊆ Ĩ ⊆ R, wobei Ĩ, Q̃ offen und I, Q kompakt sind. Auf Grund des Zerlegungssatzes (3.5) gibt es Funktionen % : G → Rn und ψ : %(G) → Rn der Form %(t) = (ϕ1 (t), ..., ϕn−1 (t), t n ) ψ(t) = (t 1 , ..., t n−1 , ψn (t)) und mit ϕ = ψ ◦ %, wobei %(G) in Rn offen ist. Für jedes t n ∈ Ĩ definieren wir eine Funktion h t n : Q̃ → Rn−1 durch h t n (t) = (ϕ1 (t, t n ), ..., ϕn−1 (t, t n )). Dann gilt %(t, t n ) = (h t n (t), t n ) und somit det h0t n (t) = det % 0 (t, t n ) 6= 0 für alle t ∈ Q̃ und t n ∈ Ĩ. Nach (3.3) ist h t n (Q̃) jeweils in Rn−1 offen. Auf Grund der Injektivität von % ist h t n injektiv auf Q̃, für jedes t n ∈ Ĩ. Darüber hinaus gilt für jedes t n ∈ Ĩ und jede stetige Funktion F : h t n (Q̃) → R nach Induktionsvoraussetzung Z F (t) d t = h t n (Q) Z Q —– (F ◦ h t n )(t)| det h0t n (t)| d t. 33 —– Definieren wir nun F : %(G) → R durch F (s) = ( f ◦ ψ)(s)| det ψ0 (s)|, dann kann die linke Seite der Gleichung (S) in der Form Z f (x) d x = Z ϕ(T ) f (x) d x Z (∗) = ψ(%(T )) 0 ( f ◦ ψ)(s)| det ψ (s)| ds Z = %(T ) F (s) ds %(T ) dargestellt werden, wobei an der Stelle (*) das Ergebnis aus Schritt 6 verwendet wurde. Für jedes t n ∈ Ĩ ist %(T )(t n ) = h t n (Q), denn für alle u ∈ Rn−1 gilt die Äquivalenz u ∈ %(T )(t n ) ⇔ (u, t n ) ∈ %(T ) %(t, t n ) = (u, t n ) für ein t ∈ Q ⇔ (h t n (t), t n ) = (u, t n ) für ein t ∈ Q ⇔ ⇔ u ∈ h t n (Q). Für alle (t, t n ) ∈ %(G) sei F t n (t) = F (t, t n ). Wir können nun (2.5) anwenden und erhalten ! Z Z Z Z f (x) d x = F (s) ds ϕ(T ) Z = F (t, t n ) d t %(T ) Z I h t n (Q) I ! F t n (t) d t Z = d tn Z = T ! Z I = d tn %(T )(t n ) Q (F t n ◦ h t n )(t)| det h0t n (t)| dt d tn F (h t n (t), t n )| det h0t n (t)| d(t, t n ). Wir betrachten nun die rechte Seite der Gleichung (S). Für alle (t, t n ) ∈ Q × I gilt det ϕ 0 (t, t n ) = det(ψ ◦ %)0 (t, t n ) = det ψ0 (%(t, t n )) · det % 0 (t, t n ) det = ψ0 (h t n (t), t n ) det h0t n (t) und somit ( f ◦ ϕ)(t, t n )| det(ϕ 0 (t, t n ))| = ( f ◦ ψ ◦ %)(t, t n )| det ϕ 0 (t, t n )| ( f ◦ ψ)(h t n (t), t n )| det ψ0 (h t n (t), t n )|| det h0t n (t)| Damit erhalten wir Z ( f ◦ ϕ)(t, t n )| det ϕ 0 (t, t n )| d(t, t n ) T = Z T = = F (h t n (t), t n )| det h0t n (t)|. F (h t n (t), t n )| det h0t n (t)| d(t, t n ) = Z f (x) d x. ϕ(T ) Nach diesen Vorbereitungen erhält man nun Satz (3.1) durch vollständige Induktion über n, wobei Schritt 5 für den Induktionsanfang und Schritt 7 für den Induktionsschritt verwendet wird. 8 Beweis des Zusatzes Sei N ⊆ T eine Jordansche Nullmenge mit der Eigenschaft, dass t 7→ det ϕ 0 (t) auf T ⊆ N nicht verschwindet und ϕ auf T \ N injektiv ist. Für beliebig vorgegebenes " ∈ R+ können wir offene Quader Q 1 , ..., Q m wählen, so dass Pm Sm k=1 v(Q k ) < " ist und N vollständig in der Vereinigungsmenge R = j=1 Q j liegt. Die Menge S = T \R ist beschränkt und abgeschlossen, also ebenfalls kompakt, und auf Grund des bisher Bewiesenen ist die Substitutionsregel für S an Stelle von R gültig. Es gilt v(T \ S) ≤ v(N ) < ", und wie im Beweis von Schritt 4 zeigt man, dass v(ϕ(T \ S)) < λ" mit einer nur von ϕ abhängigen Konstanten λ ∈ R+ gilt. Wie in 4 folgert man nun, dass die Gleichung (S) auch für T erfüllt ist. —– 34 —– § 4. Integralsätze Inhaltsübersicht - Wir verallgemeinern den bisherigen Integralbegriff ein weiteres Mal, indem wir Integrale über Kurven und parametrisierte Flächen im Rn zulassen. - Es wird der Begriff des Vektorfeldes eingeführt, der vor allem in physikalischen Anwendungen eine wichtige Rolle spielt (Kraftfelder, Geschwindigkeitsfelder etc.). - Wir definieren Rechenoperationen auf Funktionen und Vektorfeldern (Gradient, Divergenz, Rotation). - Der Greensche Integralsatz stellt einen Zusammenhang zwischen Kurven- und Flächenintegralen im R2 her und kann als Verallgemeinerung des Hauptsatzes der Differential- und Integralrechnung im R1 angesehen werden. - Ebenso liefert der Stokesche Integralsatz einen Zusammenhang zwischen Raumkurven und Flächenintegralen im R3 . Durch den Gaußschen Integralsatz wird ein Zusammenhang zwischen Raum- und Flächenintegralen im R3 hergestellt. Bereits in der Analysis mehrerer Variablen wurde der Begriff des Weges in einer Teilmenge T ⊆ Rn definiert. Dabei handelte es sich um eine stetige Abbildung γ : [a, b] → T , wobei a, b reelle Zahlen mit a < b bezeichnen. Man nennt γ(a) den Start- und γ(b) den Endpunkt des Weges; fallen diese beiden Punkte zusammen, so spricht man von einem geschlossenen Weg. Wir nennen einen Weg eine C 1 -Kurve in T , wenn die Abbildung γ|]a,b[ stetig differenzierbar ist. Als Kurve bezeichnen wir einen Weg, wenn er stückweise stetig differenzierbar ist. Dies bedeutet, dass eine Zerlegung Z = {x 1 , ..., x n−1 } existiert, so dass γ|] x k−1 ,x k [ für 1 ≤ k ≤ n jeweils stetig differenzierbar ist (wobei wie immer x 0 = a und x n = b gesetzt wird. Kommen wir nun zur Definition der Kurvenintegrale. Aus der Analysis einer Variablen ist bekannt, dass das RiemannIntegral f : [a, b] → R durch sog. Riemannsche Summen approximiert werden kann. Ist Z = {x 1 , ..., x n } eine hinreichend feine Zerlegung des Intervalls [a, b] und sind zk ∈ x k−1 , x k geeignet gewählte Stützstellen, dann gilt b Z f (x) d x ≈ a n X f (zk )|x k − x k−1 |. k=1 Ist nun U ⊆ Rd offen, γ : [a, b] → U eine Kurve und f : U → R eine stetige Funktion, dann liegt es nahe, ein Kurvenintegral in der Form Z f ds γ ≈ n X ( f ◦ γ)(zk )kγ(x k ) − γ(x k−1 )k k=1 anzusetzen, wobei k · k die euklidische Norm auf dem Rd bezeichnet. Die Kurve wird also durch den Polygonzug angenähert, der von den Punkten γ(x k ) mit 0 ≤ k ≤ n gebildet wird, die jeweils den Abstand kγ(x k ) − γ(x k−1 )k —– 35 —– Pn k=1 kγ(x k ) − γ(x k−1 )k. voneinander haben. Die Gesamtlänge des Polygonzugs beträgt also Um aus diesem Nähe- rungsausdrücken wieder Integrale zu gewinnen, erinnern wir daran, dass die differenzierbare Abbildung γ in der unmittelbaren Umgebung der Stützstellen zk durch die affin-lineare Funktion γ(t) γ(zk ) + (t − zk )γ0 (zk ) ≈ approximiert wird. Bei hinreichend feiner Zerlegung gilt γ(x k−1 ) ≈ γ(zk ) + (x k−1 − zk )γ0 (zk ) und γ(x k ) ≈ γ(zk ) + (x k − zk )γ0 (zk ). Durch Bildung der Differenz erhalten wir also γ(x k ) − γ(x k−1 ) ≈ (x k − x k−1 )γ0 (zk ) und somit n X ( f ◦ γ)(zk )kγ0 (zk )k(x k − x k−1 ) b Z ( f ◦ γ)0 (t)kγ0 (t)k d t. ≈ a k=1 Für die Kurvenlänge L (γ) erhalten wir den Näherungsausdruck L (γ) n X ≈ b Z kγ(x k ) − γ(x k−1 )k kγ0 (t)k d t. ≈ a k=1 Diese Überlegungen motivieren die folgende Definition. (4.1) Definition Sei U ⊆ Rd eine beliebige Teilmenge, γ : [a, b] → U eine Kurve in U und f : U → R eine stetige Funktion. Dann bezeichnet man Z f ds = b Z γ ( f ◦ γ)(t)kγ0 (t)k d t a als das Kurvenintegral von f über γ. Die Zahl L (γ) = R 1 ds = γ Rb a kγ0 (t)k d t bezeichnen wir als die Länge der Kurve γ. Wir illustrieren die Definition der Kurvenlänge an einem Beispiel. Die Kurve γ gegeben durch γ : [0, 2π] −→ R2 t 7→ (r cos(t), r sin(t)) , durchläuft den Kreis vom Radius r um den Koordinatenursprung in der Ebene, und zwar entgegen dem Uhrzeigersinn. Für alle t ∈ ]0, 2π[ gilt γ0 (t) = (−r sin(t), r cos(t)) und somit kγ0 (t)k2 = r 2 sin(t)2 + r 2 cos(t)2 = r 2 , also kγ0 (t)k = r. Die Kurvenlänge ist also gegeben durch L (γ) = Z 2π 0 kγ (t)k d t = Z 0 2π r dt = 2πr. 0 Bekanntlich ist dies laut Schulmathematik der Umfang eines Kreises vom Radius r. —– 36 —– Für Kurven stehen eine Reihe von Rechenoperationen zur Verfügung, die sich in den Anwendungen als hilfreich herausstellen werden. Zunächst kann jede Kurve γ : [a, b] → Rd auf natürliche Weise eine Kurve γ0 mit Definitionsbereich [0, 1] zugeordnet werden. Dazu definiert man u : [0, 1] → R durch u(t) = (1 − t)a + t b = a + t(b − a) und setzt γ0 = γ ◦ u. Wir bezeichnen den Übergang von γ zu γ0 als Normierung und eine Kurve mit Definitionsbereich [0, 1] als normiert. Integrale über γ ändern sich durch die Normierung nicht. Auf Grund der Kettenregel gilt nämlich γ00 (t) = (γ ◦ u)0 (t) = γ0 (u(t))u0 (t) für alle t ∈ ]a, b[. Wir erhalten Z Z = f ds γ0 1 (f ◦ γ0 )(t)kγ00 (t)k dt = 0 Z 1 Z ( f ◦ γ ◦ u)(t)kγ0 (u(t))u0 (t)k d t = 0 1 0 0 ( f ◦ γ ◦ u)(t)kγ (u(t))ku (t) d t Z = 0 u(1) ( f ◦ γ)(t)kγ0 (t)k d t = u(0) b Z 0 ( f ◦ γ)(t)kγ (t)k d t Z = , f ds γ a wobei im vierten Schritt die Substitutionsregel aus der Analysis einer Variablen angewendet wurde. Auërdem ist zu beachten, dass u0 (t) = b − a > 0 für alle t ∈ ]a, b[ gilt, weshalb die Betragsstriche um u0 (t) im dritten Schritt weggelassen werden können. Wir definieren noch zwei weitere Rechenoperationen für Kurven. (4.2) Definition Sei U ⊆ Rd offen, und seien γ, δ : [0, 1] → U zwei normierte Kurven, wobei γ(1) = δ(0) ist. Dies bedeutet, dass der Endpunkt von γ mit dem Startpunkt von δ übereinstimmt. Wir definieren zwei neue Kurven γ− und δ ∗ γ durch γ− (t) = γ(1 − t) und (δ ∗ γ)(t) = γ(t) falls 0 ≤ t ≤ 1 δ(t − 1) falls 1 ≤ t ≤ 2 und bezeichnen γ− als die Umkehrung von γ und δ∗γ als die Konkatenation der beiden Kurven γ und δ. Sind γ und δ nicht normiert, dann setzen wir δ ∗ γ = δ0 ∗ γ0 , wobei γ0 , δ0 die Normierungen von γ, δ bezeichnen. Wir untersuchen, wie sich die Kurvenintegrale unter Umkehrung und Konkatenation verhalten. (4.3) Proposition Sei U ⊆ Rd offen, γ, δ : [0, 1] → U zwei normierte Kurven mit γ(1) = δ(0) und f : U → R eine stetige Funktion. Dann gilt Z Z Z f ds γ− = f ds und f ds γ δ∗γ —– 37 —– = Z γ f ds + Z f ds. δ Beweis: Nach Definition gilt γ− = γ ◦ u mit u(t) = 1 − t und u0 (t) = −1. Die Anwendung der mehrdimensionalen Kettenregel liefert (γ− )0 (t) = γ0 (u(t))u0 (t). Wir erhalten Z = f ds 1 Z γ− − − 0 ( f ◦ γ )(t)k(γ ) (t)k d t = 0 Z Z ( f ◦ γ ◦ u)(t)kγ0 (u(t))u0 (t)k d t = 0 1 0 0 ( f ◦ γ ◦ u)(t)kγ (u(t))ku (t) d t − 1 = Z u(1) ( f ◦ γ)(t)kγ0 (t)k d t − 0 = u(0) Z 0 0 ( f ◦ γ)(t)kγ (t)k d t − 1 Z = 1 0 ( f ◦ γ)(t)kγ (t)k d t Z = f ds. γ 0 Beweisen wir nun die Rechenregel für die Konkatenation. Hier gilt Z f ds = δ∗γ Z Z 2 ( f ◦ (δ ∗ γ))(t) d tk(δ ∗ γ)0 (t)k d t = 0 1 0 ( f ◦ (δ ∗ γ))(t) d tk(δ ∗ γ) (t)k d t + 0 Z 2 ( f ◦ (δ ∗ γ))(t) d tk(δ ∗ γ)0 (t)k d t = 1 Z 1 0 ( f ◦ γ)(t) d tkγ (t)k d t + 0 Z Z 2 ( f ◦ δ)(t − 1) d tkδ0 (t − 1)k d t = 1 1 0 ( f ◦ γ)(t) d tkγ (t)k d t + 0 Z 1 0 ( f ◦ δ)(t) d tkδ (t)k d t = Z f ds + γ 0 Z f ds. δ Bei dieser Rechnung wurde im vorletzten Schritt die eindimensionale Substitutionsregel auf die Substitutionsfunktion t 7→ t − 1 angewendet. Als nächstes werden wir nun Integrale über Flächen im R3 definieren. Hierzu benötigen wird das bereits aus der Schulmathematik bekannte Kreuzprodukt zweier Vektoren. (4.4) Definition Das Kreuzprodukt zweier Vektoren v = (v1 , v2 , v3 ) und w = (w1 , w2 , w3 ) im R3 ist definiert durch v×w = v1 w1 v2 × w2 v3 w3 = —– —– 38 v w − v w 3 2 2 3 v3 w1 − v1 w3 . v1 w2 − v2 w1 Wie man unmittelbar nachrechnet, steht v × w immer senkrecht auf den Vektoren v und w, es gilt also = 〈v, v × w〉 0 〈w, v × w〉 = 0. und Für die folgende Anwendung des Kreuzprodukts ist auch die Interpretation der Länge kv × wk des Kreuzprodukts interessant. Sei n der Vektor, den man durch Normierung von v × w erhält, also n = kv × wk−1 (v × w). Sei außerdem A ∈ M3,R die Matrix mit den Spaltenvektoren v, w und n. Dann hat die Matrix t AA die Einträge t 〈v, v〉 〈w, v〉 〈n, v〉 = AA 〈v, n〉 〈w, n〉 〈n, n〉 〈v, w〉 〈w, w〉 〈n, w〉 = 〈v, v〉 〈w, v〉 0 〈v, w〉 〈w, w〉 0 0 0 1 Wie wir in §3 gesehen haben, kann | det(A)| als das Volumen des von v, w und n aufgespannten Parallelotops interpretiert werden. Weil n Länge 1 hat und senkrecht auf v und w steht, stimmt der Flächeninhalt des von v und w aufgespannten Parallelogramms ebenfalls mit | det(A)| überein. Nun gilt einerseits kv × wk2 (v2 w3 − v3 w2 )2 + (v3 w1 − v1 w3 )2 + (v1 w2 − v2 w1 )2 = = v22 w32 − 2v2 v3 w2 w3 + v32 w22 + v32 w12 − 2v1 v3 w1 w3 + v12 w32 + v12 w22 − 2v1 v2 w1 w2 + v22 w12 , andererseits aber auch det(A)2 = = det( t AA) = (v12 + v22 + v32 )(w12 + w22 + w32 ) − (v1 w1 + v2 w2 + v3 w3 )2 = 〈v, v〉〈w, w〉 − 〈v, w〉2 v12 w12 + v12 w22 + v12 w32 + v22 w12 + v22 w22 + v22 w32 + v32 w12 + v32 w22 + v32 w32 − v12 w12 + v22 w22 + v32 w32 + 2v1 v2 w1 w2 + 2v1 v3 w1 w3 + 2v2 v3 w2 w3 = v22 w32 − 2v2 v3 w2 w3 + v32 w22 + v32 w12 − 2v1 v3 w1 w3 + v12 w32 + v12 w22 − 2v1 v2 w1 w2 + v22 w12 woraus kv×wk = | det(A)| geschlossen werden kann. Die euklidische Länge von v×w ist also genau der Flächeninhalt des von v und w aufgespannten Parallelogramms. (4.5) Definition Eine parametrisierte Fläche im R3 ist ein Paar (B, φ) bestehend aus einer kompakten, Jordan-messbaren Teilmenge B ⊆ R2 und einer C 1 -Abbildung φ : G → R3 , wobei der Definitionsbereich G von φ eine offene Teilmenge von R2 mit G ⊇ B ist. Sei (B, ϕ) eine solche parametrisierte Fläche und f : φ(B) → R eine stetige Funktion. Wie bei den Kurven soll f R auf naheliegende Weise ein Integral (B,φ) f dA zugeordnet werden. Der Einfachheit halber nehmen wir an, dass es sich bei B um einen kompakten Quader handelt, und betrachten eine feine Zerlegung Z von B. In Analogie zu den Kurven sollte Z f dA (B,φ) X ≈ ( f ◦ φ)(aK )v2 (φ(K)) K∈Q(Z ) —– 39 —– gelten, wobei aK jeweils einen beliebig gewählten Punkt des Teilquaders K und v2 (φ(K)) den Inhalt des Flächenstücks φ(K) im R3 bezeichnet. Weil φ stetig differenzierbar ist, gilt φ(aK + t 1 e1 + t 2 e2 ) ≈ φ(aK ) + φ 0 (aK )(t 1 e1 + t 2 e2 ) = φ(aK ) + t 1 φ 0 (aK )(e1 ) + t 2 φ 0 (aK )(e2 ) für betragsmäßig kleine t 1 , t 2 ∈ R. Bei geeigneter Wahl von aK können wir annehmen, dass K = aK + [0, u] × [0, v] mit geeigneten u, v ∈ R+ ist. Dann ist φ(K) in guter Näherung das Bild von [0, u] × [0, v] unter der Abbildung (t 1 , t 2 ) 7→ φ(aK ) + t 1 φ 0 (aK )(e1 ) + t 2 φ 0 (aK )(e2 ). Dabei handelt es sich um das Parallelogramm aufgespannt von den Vektoren uφ 0 (aK )(e1 ) und vφ 0 (aK )(e2 ). Weil der Flächeninhalt des Parallelogramms durch die Länge des Kreuzprodukts dieser Vektoren gegeben ist, erhalten wir v2 (φ(K)) = ≈ kuφ 0 (aK )(e1 ) × vφ 0 (aK )(e2 )k uvkφ 0 (aK )(e1 ) × φ 0 (aK )(e2 )k Durch Einsetzen erhalten wir Z X ≈ f dA (B,φ) = kφ 0 (aK )(e1 ) × φ 0 (aK )(e2 )kv2 (K). ( f ◦ φ)(aK )kφ 0 (aK )(e1 ) × φ 0 (aK )(e2 )kv2 (K) K∈Q(Z ) Z ( f ◦ φ)(x, y)kφ 0 (x, y)(e1 ) × φ 0 (x, y)(e2 )k d(x, y). ≈ B Dies motiviert die folgende Definition. (4.6) Definition Sei (B, φ) eine parametrisierte Fläche im R3 und f : φ(B) → R eine stetige Funktion. Dann ist das Flächenintegral von f über (B, φ) definiert durch Z Z f dA (B,φ) ( f ◦ φ)(x, y)kφ 0 (x, y)(e1 ) × φ 0 (x, y)(e2 )k d(x, y). = B Das Integral der konstanten Funktion 1 über (B, φ) bezeichnen wir als Inhalt der parametrisierten Fläche. Als Anwendungsbeispiel berechnen wir die Oberfläche der Kugel vom Radius r. Diese wird parametrisiert durch φ : [− π2 , π2 ] × [0, 2π] −→ R3 , (ϑ, ϕ) 7→ (r cos(ϑ) cos(ϕ), r cos(ϑ) sin(ϕ), r sin(ϑ)). In jedem Punkt (ϑ, ϕ) des Definitionsbereichs ist die Ableitungsmatrix gegeben durch −r sin(ϑ) cos(ϕ) −r cos(ϑ) sin(ϕ) φ 0 (ϑ, ϕ) = −r sin(ϑ) sin(ϕ) r cos(ϑ) cos(ϕ) , r cos(ϑ) 0 —– 40 —– die beiden Ableitungsvektoren sind also −r sin(ϑ) cos(ϕ) φ 0 (ϑ, ϕ)(e1 ) = −r sin(ϑ) sin(ϕ) r cos(ϑ) −r cos(ϑ) sin(ϕ) φ 0 (ϑ, ϕ)(e2 ) = r cos(ϑ) cos(ϕ) 0 und mit dem Kreuzprodukt φ 0 (ϑ, ϕ)(e1 ) × φ 0 (ϑ, ϕ)(e2 ) = 2 − cos(ϑ) cos(ϕ) r 2 cos(ϑ)2 sin(ϕ) . − cos(ϑ) sin(ϑ) Es gilt kφ 0 (ϑ, ϕ)(e1 ) × φ 0 (ϑ, ϕ)(e2 )k2 = r 4 cos(ϑ)4 cos(ϕ)2 + cos(ϑ)4 sin(ϕ)2 + cos(ϑ)2 sin(ϑ)2 = r 4 cos(ϑ)4 + cos(ϑ)2 sin(ϑ)2 r 4 cos(ϑ)2 cos(ϑ)2 + sin(ϑ)2 = r 4 cos(ϑ)2 = und somit kφ 0 (ϑ, ϕ)(e1 ) × φ 0 (ϑ, ϕ)(e2 )k = r 2 cos(ϑ). Setzen wir Q = [− π2 , π2 ] × [0, 2π], dann ist φ(Q) die Kugeloberfläche, und wir erhalten Z 1 dA = Z (Q,φ) = Z π/2 −π/2 Z φ 0 (ϑ, ϕ)(e ) × φ 0 (ϑ, ϕ)(e ) d(ϑ, ϕ) 1 2 Q 2π r 2 cos(ϑ) d(ϑ, ϕ) Q ! r 2 cos(ϑ) dϕ = Z dϑ = 2πr 2 Z π/2 cos(ϑ) dϑ −π/2 0 = ϑ=π/2 2πr 2 [ sin(ϑ) ]ϑ=−π/2 = 4πr 2 . Im zweiten Teil dieses Abschnitts werden wir nun die soeben definierten Integrale verwenden, um damit die Grundlagen für die sogenannte Vektoranalysis zu schaffen, die besonders in der theoretischen Physik wichtige Anwendungen hat. (4.7) Definition Ein Vektorfeld auf einer Teilmenge U ⊆ Rn ist eine Abbildung f : U → Rn . Ist diese Abbildung stetig, dann spricht man von einem stetigen Vektorfeld. Ist U offen und f auf U sogar differenzierbar oder stetig differenzierbar, dann bezeichnet man f als differenzierbares bzw. als C 1 -Vektorfeld. Ein wichtiges Beispiel für Vektorfelder haben wir bereits in der Mathe III-Vorlesung kennengelernt: Ist U ⊆ Rn offen und f : U → R eine differenzierbare Funktion, dann erhält man durch ∂1 f (x) . (∇ f )(x) = .. ∂n f (x) —– 41 —– ein Vektorfeld auf U, den sogenannten Gradienten von f . Wie wir damals bereits festgestellt haben, zeigt (∇ f )(x) immer in die Richtung des stärksten Anstiegs der Funktion f im Punkt x. Ist f darüber eine C 1 -Funktion, dann handelt es sich bei ∇ f um ein stetiges Vektorfeld. (4.8) Definition Sei U ⊆ Rn offen und f : U → Rn ein differenzierbares Vektorfeld. (i) Die Divergenz von f ist die reellwertige Funktion div f : U → R gegeben durch div f (x 1 , ..., x n ) = n X ∂ fk k=1 ∂ xk (x 1 , ..., x n ). (ii) Im Fall n = 3 ist die Rotation von f ein Vektorfeld rot f : U → R3 , das in dem Punkt (x, y, z) ∈ U definiert ist durch rot f (x, y, z) = ∂ f3 (x, y, z) − ∂ y ∂ f1 ∂ z (x, y, z) − ∂ f 2 (x, y, z) − ∂x ∂ f2 (x, y, z) (x, y, z) . ∂x ∂ f1 (x, y, z) ∂y ∂z ∂ f3 Eine einfache Merkregel für die Rotation lautet „rot f = ∇× f “, wobei ∇ den Operator bezeichnet, der jeder skalaren Funktion ihren Gradienten zuordnet. Man erhält dann die Rotation durch die symbolische Rechnung ∂ ∂ f3 − ∂∂z f2 f1 f1 ∂ y ∂ x ∂ ∂ ∂ rot f = ∇ × f2 = ∂ y × f2 = ∂ z f1 − ∂ x f3 ∂ ∂ ∂ f2 − ∂ y f1 f3 f 3 ∂ x ∂z Unter einem Normalbereich im R2 verstehen wir im folgenden eine Teilmenge B ⊆ R2 , die Normalbereich sowohl bezüglich der x-Achse als auch der y-Achse im Sinne von §2 ist, wobei die Begrenzungsfunktionen für diese Normalbereiche außerdem stückweise stetig differenzierbar sein sollen. Es gibt also a, b, c, d ∈ R mit a < b und c < d und stückweise C 1 -Funktionen ϕ1 , ϕ2 : [a, b] → R und ψ1 , ψ2 : [c, d] → R, so dass B = {(x, y) ∈ [a, b] × R | ϕ1 (x) ≤ y ≤ ϕ2 (x)} = {(x, y) ∈ R × [c, d] | ψ1 ( y) ≤ x ≤ ψ2 ( y)} gilt. Eine Kurve γ : [u, v] → R2 bezeichnen wir als Randkurve von B, wenn sie geschlossen (γ(u) = γ(v)) und auf ]u, v[ injektiv ist und außerdem γ([u, v]) = ∂ B gilt, die Kurve γ also genau die Punkte des topologischen Rands ∂ B von B durchläuft. Bezeichnet f : ∂ B → R eine stetige Funktion, die in allen bis auf endlich vielen Punkten von ∂ B definiert ist, dann setzen wir Z f ds = ∂B Z f ds. γ —– 42 —– Man kann zeigen, dass diese Definition von der Wahl der Randkurve unabhängig ist, worauf wir aber aus Zeitgründen verzichten (siehe [He], §180). Für unsere Anwendungen weiter unten arbeiten wir vor allem mit den beiden speziellen zusammengesetzten Randkurven δ− ∗ γ− ∗ β ∗ α und δ̃− ∗ γ̃ ∗ β̃ ∗ α̃− , deren Teilstücke (bzw. deren Umkehrungen) folgendermaßen definiert sind. α : [a, b] → R2 , t 7→ (t, ϕ1 (t)) β : [0, 1] → R2 , t 7→ (1 − t)(b, ϕ1 (b)) + t(b, ϕ2 (b)) γ : [a, b] → R2 , t 7→ (t, ϕ2 (t)) δ : [0, 1] → R2 , t 7→ (1 − t)(a, ϕ1 (a)) + t(a, ϕ2 (a)) α̃ : [c, d] → R2 , t 7→ (ψ1 (t), t) β̃ : [0, 1] → R2 , t 7→ (1 − t)(ψ1 (c), c) + t(ψ2 (c), c) γ̃ : [c, d] → R2 , t 7→ (ψ2 (t), t) δ̃ : [0, 1] → R2 , t 7→ (1 − t)(ψ1 (d), d) + t(ψ2 (d), d) Man überprüft leicht, dass das Bild dieser beiden Kurven tatsächlich jeweils der Rand ∂ B ist, und dass auch alle übrigen Bedingungen erfüllt sind. (4.9) Definition Sei B ⊆ R2 ein Normalbereich wie oben angegeben. Ein Punkt p ∈ ∂ B wird regulärer Randpunkt genannt, wenn eine offene Umgebung U von p und eine C 1 -Funktion q : U → R existieren, so dass U ∩ B = {x ∈ U | q(x) ≤ 0} und q0 (p) 6= 0 erfüllt ist. Ansonsten nennen wir p einen singulären Randpunkt. Offenbar besitzt jeder Normalbereich nur endlich viele singuläre Randpunkte, nämlich die vier „Ecken“ (a, ϕ1 (a)), (b, ϕ1 (b)), (b, ϕ2 (b)) und (a, ϕ2 (a)) sowie die endlich vielen Punkte (t, ϕ1 (t)) bzw. (t, ϕ2 (t)), bei denen ϕ1 bzw. ϕ2 in t nicht stetig differenzierbar ist. Ist p ein regulärer Randpunkt und q : U → R eine C 1 -Funktion wie in der Definition, dann bezeichnet man n(p) = 1 k(∇q)(p)k (∇q)(p) als äußeren Einheitsnormalenvektor von B im Randpunkt p. Diese Bezeichnung ist gerechtfertigt, da n(p) stets vom Normalbereich B nach außen weist. Der Vektor −n(p) ist entsprechend auf das Innere von B gerichtet. Ist γ : [a, b] → R2 eine Kurve mit γ([a, b]) ⊆ ∂ B, c ∈ ]a, b[ und p = γ(c), dann gilt stets eine der beiden Gleichungen ! 1 γ02 (c) n(p) = ± ṽ(p) mit ṽ(p) = . kṽ(p)k −γ01 (c) Dabei ist der Vektor ṽ(p) so definiert, dass er relativ zum Tangentialvektor γ0 (c) = (γ01 (c), γ02 (c)) stets orthogonal nach rechts weist. Zum Beweis der Gleichung schränken wir γ auf ein offenes Intervall I ⊆ [a, b] mit c ∈ I ein, so dass —– 43 —– γ(I) ⊆ U erfüllt ist. Wegen γ(I) ⊆ ∂ B gilt dann (q ◦ γ)(t) = 0 und somit nach der Kettelregel auch q0 (γ(t)) · γ0 (t) = 0 für alle t ∈ I. Insbesondere gilt 〈(∂ q)(γ(c)), γ0 (c)〉 = 0. Dies zeigt, dass nicht nur ṽ(p), sondern auch n(p) auf γ0 (c) senkrecht steht; die Vektoren sind sind also skalare Vielfache voneinander. Folglich sind die normierten Vektoren ṽ(p)/kṽ(p)k und n(p) entweder entweder gleich oder entgegengesetzt. (4.10) Definition Man bezeichnet eine Kurve γ : [a, b] → R2 von B mit γ([a, b]) ⊆ ∂ B als positiv orientiert, wenn für alle bis auf endlich viele t ∈ ]a, b[ die Gleichung ! 1 γ02 (t) n(γ(t)) = erfüllt ist. kγ0 (t)k −γ01 (t) Ist γ positiv orientiert, dann ist die entgegengesetzte Kurven γ− negativ orientiert, d.h. es gilt dann jeweils die Gleichung n(γ− (t)) = 1/k(γ− )0 (t)k(−(γ− )02 (t), (γ− )01 (t)). Die oben definierte Kurve α : [a, b] → R2 ist positiv orientiert. Sei nämlich t ∈ ]a, b[ und q : [a, b]× R → R definiert durch q(x, y) = ϕ1 (x) − y. Für eine hinreichend kleine Umgebung U von α(t) = (t, ϕ1 (t)) gilt dann die Gleichung U ∩ B = {(x, y) ∈ B | q(x, y) ≤ 0}. Die Vektoren (∂ q)(t, ϕ1 (t)) = (ϕ10 (t), −1) und (α02 (t), −α01 (t)) = (ϕ10 (t), −1) stimmen überein, also gilt dasselbe auch für die normierten Vektoren. Ebenso ist β : [0, 1] → R2 positiv orientiert. Zum Beweis sei t ∈ ]0, 1[ und q : R2 → R definiert durch q(x, y) = ϕ1 (x) − y. Wieder kann eine kleine Umgebung U von p = β(t) = (1 − t)(b, ϕ1 (b)) + t(b, ϕ2 (b)) gewählt werden mit U ∩ B = {(x, y) ∈ B | q(x, y) ≤ 0}. Die Vektoren (∂ q)(p) = (1, 0) und (β20 (t), −β10 (t)) = (ϕ2 (b) − ϕ1 (b), 0) unterscheiden sich nur um ein positives Vielfaches, also stimmen auch hier die entsprechenden normierten Vektoren überein. Genauso zeigt man, dass auch die Kurven γ− , δ− , α̃− , β̃, γ̃ und δ̃− positiv orientiert sind. Insgesamt handelt es sich also bei den beiden oben angegebenen Randkurven von B um positiv orientierte Kurven. Wir kommen nun zum ersten wichtigen Satz der Vektoranalysis. (4.11) Satz (Greenscher Integralsatz) 2 Sei U ⊆ R offen, f : U → R2 ein C 1 -Vektorfeld und B ⊆ U ein Normalbereich wie oben angegeben. Dann gilt Z (div f )(x, y) d(x, y) = Z 〈 f , n〉 ds , ∂B B wobei das Kurvenintegral rechts über die Funktion gebildet wird, die jedem regulären Randpunkt p ∈ ∂ B, in dem die gewählte Randkurve stetig differenzierbar ist, den Wert 〈 f (p), n(p)〉 zuordnet. —– 44 —– Beweis: Wir behalten die zuvor eingeführten Bezeichnungen bei, insbesondere die Definition der Kurven α, β, ..., δ̃. Für jede dieser Kurven ρ sei Iρ ⊆ R jeweils das Intervall, auf dem ρ definiert ist, beispielsweise Iα = [a, b] und Iβ = [0, 1]. Nach Definition gilt Z (div f )(x, y) d(x, y) = B und R ∂B 〈 f , n〉 ds = ∂ f1 Z B R ds + f n ∂B 1 1 R f n ∂B 2 2 (x, y) d(x, y) + ∂x ∂ f2 Z ∂y B (x, y) d(x, y) ds, wobei n1 , n2 die beiden Komponenten der R2 -wertigen Funktion n bezeichnen. Unser Ziel ist der Beweis der beiden Gleichungen Z Z ∂ f1 d(x, y) = f1 n1 ds und ∂x ∂B B Auf Grund der Rechenregeln (4.3) für Kurvenintegrale ist ∂ f2 Z ∂x B R = d(x, y) Z f2 n2 ds. ∂B ds die Summe der Integrale über die Kurven α, f n ∂B 2 2 β, γ und δ . Für jedes ρ ∈ {α, β, γ , δ } erhalten wir wegen n(ρ(t)) = 1/kρ 0 (t)k(ρ20 (t), −ρ10 (t)) die Gleichung − − − Z bρ Z = f2 n2 ds ρ − 0 ( f2 ◦ ρ)(t)(n2 ◦ ρ)(t)kρ (t)k d t bρ Z = ( f2 ◦ ρ)(t)ρ10 (t) d t. − aρ aρ Ersetzt man ρ durch die negativ orientierte Kurve ρ − , dann erhält man auf Grund der veränderten Gleichung R R bρ n(ρ(t)) = 1/kρ 0 (t)k(−ρ20 (t), ρ10 (t)) entsprechend ρ f2 n2 ds = a ( f2 ◦ ρ)(t)ρ10 (t) d t. Es gilt nun ρ Z f2 n2 ds + Z = f2 n2 ds α Z γ− α = f2 n2 ds f2 (t, ϕ2 (t)) · 1 d t − ( f2 ◦ γ)(t)γ01 (t) f2 (t, ϕ1 (t)) · 1 d t = b ϕ2 (x) Z ϕ1 (x) a ( f2 ◦ α)(t)α01 (t) d t dt − a b Z = a Z b Z a b Z a b Z γ b Z = f2 n2 ds + Z f2 (x, ϕ2 (x)) − f2 (x, ϕ1 (x)) d x a ∂ f2 ∂y ! (x, y) d y = dx ∂ f2 Z B ∂y (x, y) d(x, y) , wobei im vorletzten Schritte der Haupsatz der Differential- und Integralrechnung angewendet wurde, und Z f2 n2 ds + Z β Z = f2 n2 ds δ− f2 n2 ds + Z β = Z f2 n2 ds δ 1 ( f2 ◦ δ)(t) · 0 d t − R f n ∂B 2 2 ds = R Z 1 ( f2 ◦ δ)(t)δ10 (t) d t − 0 Z Z 1 ( f2 ◦ β)(t)β10 (t) 0 1 ( f2 ◦ β)(t) · 0 d t = 0 , 0 0 insgesamt also = ∂ f2 (x, B ∂y y) d(x, y). Kommen wir nun zum Beweis der zweiten Gleichung. Das Kurvenintegral R f n ∂B 1 1 ds ist die Summe über die wir positiv orientierten Kurven α̃− , β̃, γ̃ und δ̃− . Bezeichnet ρ̃ einen dieser Wege, dann erhalten wir, wiederum auf Grund der Gleichung n(ρ(t)) = 1/kρ 0 (t)k(ρ20 (t), −ρ10 (t)) für den Einheitsnormalenvektor, jeweils Z f1 n1 ds ρ̃ = Z bρ ( f1 ◦ ρ̃)(t)(n1 ◦ ρ̃)(t)kρ 0 (t)k d t aρ = Z bρ ( f1 ◦ ρ̃)(t)ρ̃20 (t) d t aρ —– 45 —– und für den negativ orientierten Weg entsprechend Z f1 n1 ds + Z f1 n1 ds α̃− Z = γ̃ = f1 n1 ds + f1 (ψ2 (t), t) · 1 d t − d Z ψ1 (x) c β̃ Z f1 n1 ds Z = δ̃− ∂ f1 ∂x β̃ = c f1 n1 ds = Insgesamt gilt also (x, y) d x = ∂B B = dy Z Z = f1 n1 ds δ̃ ∂ f1 Z ∂x (x, y) d(x, y) 1 ( f1 ◦ β̃)(t)β̃20 (t) Z Z 1 dt − 0 ( f1 ◦ β̃)(t) · 0 d t − ∂x f1 (ψ2 ( y), y) − f1 (ψ1 ( y), y) d y b 1 ∂ f1 Z d Z ! 0 Z ( f1 ◦ α̃)(t)α̃02 (t) d t dt − c f1 n1 ds + Z d Z c f1 (ψ1 (t), t) · 1 d t ψ2 (x) Z ( f1 ◦ ρ̃)(t)ρ̃20 (t) d t. Wir erhalten ( f1 ◦ γ̃)(t)γ̃02 (t) d Z aρ d Z = f1 n1 ds R bρ c = f1 n1 ds + f1 n1 ds = − γ̃ c und Z ρ̃ − Z α̃ d Z R ( f1 ◦ δ̃)(t)δ̃20 (t) d t 0 1 ( f1 ◦ δ̃)(t) · 0 d t = 0. 0 (x, y) d(x, y). (4.12) Definition Sei γ : [a, b] → Rn eine Kurve. Ein Vektorfeld τ : γ([a, b]) → Rn wird Einheitstangentialfeld von γ genannt, wenn für alle bis auf endlich viele t ∈ ]a, b[ die Gleichung (τ ◦ γ)(t) 1 = kγ0 (t)k γ0 (t) erfüllt ist.. (4.13) Definition Sei (B, φ) eine parametrisierte Fläche im R3 . Ein Vektorfeld ν : φ(B) → R3 heißt Einheitsnormalenfeld von (B, φ), wenn für alle (u, v) ∈ B die Gleichung (ν ◦ φ)(u, v) = 1 kφ 0 (u, v)(e1 ) × φ 0 (u, v)(e2 )k φ 0 (u, v)(e1 ) × φ 0 (u, v)(e2 ) gilt. Bevor wir den Stokeschen Integralsatz formulieren und beweisen, führen wir noch zwei Vereinfachungen ein. Ist (B, φ) eine parametrisierte Fläche, dann verwenden wir für die Integration die abkürzende Notation d y ∧ dz = dz ∧ d x = dx ∧ d y = ∂1 φ2 (u, v) · ∂2 φ3 (u, v) − ∂1 φ3 (u, v) · ∂2 φ2 (u, v) d(u, v) ∂1 φ3 (u, v) · ∂2 φ1 (u, v) − ∂1 φ1 (u, v) · ∂2 φ3 (u, v) d(u, v) ∂1 φ1 (u, v) · ∂2 φ2 (u, v) − ∂1 φ2 (u, v) · ∂2 φ1 (u, v) d(u, v). —– 46 —– Für uns sind die Ausdrücke d y ∧ dz usw. eine rein formal, die ebenso wie d(u, v) für sich allein stehend keine Bedeutung haben. Sie besitzen eine mathematische Interpretation als sog. Differentialformen auf der Fläche (B, φ), deren Einführung allerdings über den Rahmen dieser Vorlesung hinausgehen würde. Außerdem ist noch zu beachten, dass die Gleichung im Greenschen Integralsatz auch ohne Verwendung des Einheitsnormalenfelds n dargestellt werden kann: Ist γ : [a, b] → R2 eine positiv orientierte Kurve, die ∂ B durchläuft, dann gilt wegen (n ◦ γ)(t) = 1/kγ0 (t)k · (γ02 (t), −γ01 (t)) die Gleichung Z (div f )(x, y) d(x, y) = Z 〈 f , n〉 ds = ( f1 ◦ γ)(t)γ02 (t) − ( f2 ◦ γ)(t)γ01 (t) d t. a ∂B B b Z Diese Gleichung werden wir beim Beweis des folgenden Satzes mehrfach verwenden. (4.14) Satz (Stokescher Integralsatz) Sei G ⊆ R ein Gebiet, φ : G → R2 eine C 2 -Abbildung und B ⊆ G ein Normalbereich. Sei 2 U ⊆ R3 offen mit U ⊇ φ(B) und f : U → R3 ein C 1 -Vektorfeld. Schließlich sei γ eine positiv orientierte Kurve, die ∂ B durchläuft, τ ein Einheitstagentialfeld der Kurve φ ◦ γ im R3 und ν ein Einheitsnormalenfeld der parametrisierten Fläche (B, φ). Dann gilt Z Z 〈 f , τ〉 ds = 〈rot f , ν〉 dA. φ◦γ Beweis: (B,φ) Zunächst betrachten wir die rechte Seite der Gleichung. Es gilt Z Z 〈rot f , ν〉 dA 〈(rot f ◦ φ)(u, v), (ν ◦ φ)(u, v)〉kφ 0 (u, v)(e1 ) × φ 0 (u, v)(e2 )k d(u, v) = (B,φ) B Z = 〈(rot f ◦ φ)(u, v), φ 0 (u, v)(e1 ) × φ 0 (u, v)(e2 )〉 d(u, v). B Für alle (u, v) ∈ B gilt φ 0 (u, v)(e1 ) × φ 0 (u, v)(e2 ) = ∂ φ (u, v) ∂ φ (u, v) 1 1 2 1 ∂1 φ2 (u, v) × ∂2 φ2 (u, v) ∂1 φ3 (u, v) ∂2 φ3 (u, v) = ∂ φ (u, v) · ∂ φ (u, v) − ∂ φ (u, v) · ∂ φ (u, v) 1 2 2 3 1 3 2 2 ∂1 φ3 (u, v) · ∂2 φ1 (u, v) − ∂1 φ1 (u, v) · ∂2 φ3 (u, v) ∂1 φ1 (u, v) · ∂2 φ2 (u, v) − ∂1 φ2 (u, v) · ∂2 φ1 (u, v) —– 47 —– (4.1) und Einsetzen liefert Z 〈rot f , ν〉 dA Z = (B,φ) (rot f ◦ φ)1 (u, v) d y ∧ dz + B Z (rot f ◦ φ)2 (u, v) dz ∧ d x + Z B (rot f ◦ φ)3 (u, v) d x ∧ d y B (4.2) wobei (rot f ◦ φ)1 (u, v) = (∂2 f3 − ∂3 f2 ) ◦ φ (u, v) (rot f ◦ φ)2 (u, v) = (∂3 f1 − ∂1 f3 ) ◦ φ (u, v) (rot f ◦ φ)3 (u, v) = (∂1 f2 − ∂2 f1 ) ◦ φ (u, v). Wir zeigen nun, dass (4.2) mit der linken Seite der Stokeschen Integralgleichung übereinstimmt. Zur Abkürzung setzen wir g = f ◦ φ. Es gilt dann Z 〈 f , τ〉 ds b Z = φ◦γ 0 〈(g ◦ γ)(t), (τ ◦ φ ◦ γ)(t)〉k(φ ◦ γ) (t)k d t = a b Z 〈(g ◦ γ)(t), (φ ◦ γ)0 (t)〉 d t a w X = b Z k=1 (g k ◦ γ)(t)(φk ◦ γ)0 (t) d t. a Setzen wir für k = 1, 2, 3 jeweils (k) F1 (u, v) (k) F2 (u, v) = g k (u, v)φk0 (u, v)(e2 ) = −g k (u, v)φk0 (u, v)(e1 ) = g k (u, v)∂2 φk (u, v) = −g k (u, v)∂1 φk (u, v) so erhalten wir mit Hilfe der Greenschen Integralformel b Z 0 (g k ◦ γ)(t)(φk ◦ γ) (t) d t = a b Z (g k ◦ γ)(t) · φk0 (γ(t)) ◦ γ0 (t) d t a = b Z (g k ◦ γ)(t) · φk0 (γ(t))(e1 ) · γ01 (t) + φk0 (γ(t))(e2 ) · γ02 (t) d t a = Z b (k) (k) (F1 ◦ γ)(t) · γ02 (t) − (F2 ◦ γ)(t)γ01 (t) d t a = Z div F (k) (u, v) d(u, v) = Z (k) (k) ∂1 F1 (u, v) + ∂2 F2 (u, v) d(u, v). B B (k) (k) Die partiellen Ableitungen von F1 und F2 sind gegeben durch (k) = ∂1 g k (u, v) · ∂2 φk (u, v) − g k (u, v) · ∂12 φk (u, v) (k) = −∂2 g k (u, v) · ∂1 φk (u, v) − g k (u, v) · ∂21 φk (u, v). ∂1 F1 (u, v) ∂2 F2 (u, v) Weil φ nach Voraussetzung zweimal stetig differenzierbar ist, gilt ∂12 φk = ∂21 φk nach dem Lemma von Schwarz. Daraus folgt (k) (k) ∂1 F1 (u, v) + ∂2 F2 (u, v) = ∂1 g k (u, v)∂2 φk (u, v) − ∂2 g k (u, v)∂1 φk (u, v). —– 48 —– Auf Grund der mehrdimensionalen Kettenregel gilt g k0 (u, v) = ( f k ◦φ)0 (u, v) = f k0 (φ(u, v))·φ 0 (u, v). Für die partiellen Ableitungen von g k erhalten wir so die Ausdrücke ∂1 g k (u, v) = ∂1 f k (φ(u, v)) · ∂1 φ1 (u, v) + ∂2 f k (φ(u, v)) · ∂1 φ2 (u, v) + ∂3 f k (φ(u, v)) · ∂1 φ3 (u, v) ∂2 g k (u, v) = ∂1 f k (φ(u, v)) · ∂2 φ1 (u, v) + ∂2 f k (φ(u, v)) · ∂2 φ2 (u, v) + ∂3 f k (φ(u, v)) · ∂2 φ3 (u, v) Daraus folgt nun für k = 1 die Gleichung (1) (1) ∂1 F1 (u, v) + ∂2 F2 (u, v) = ∂1 g1 (u, v) · ∂2 φ1 (u, v) − ∂2 g1 (u, v) · ∂1 φ1 (u, v) = ∂1 f1 (φ(u, v)) · ∂1 φ1 (u, v) · ∂2 φ1 (u, v) + ∂2 f1 (φ(u, v)) · ∂1 φ2 (u, v) · ∂2 φ1 (u, v) + ∂3 f1 (φ(u, v)) · ∂1 φ3 (u, v) · ∂2 φ1 (u, v) −∂1 f1 (φ(u, v)) · ∂2 φ1 (u, v) · ∂1 φ1 (u, v) − ∂2 f1 (φ(u, v)) · ∂2 φ2 (u, v) · ∂1 φ1 (u, v) − ∂3 f1 (φ(u, v)) · ∂2 φ3 (u, v) · ∂1 φ1 (u, v) = ∂2 f1 (φ(u, v)) · ∂1 φ2 (u, v) · ∂2 φ1 (u, v) − ∂1 φ1 (u, v)∂2 φ2 (u, v) +∂3 f1 (φ(u, v)) · ∂1 φ3 (u, v) · ∂2 φ1 (u, v) − ∂2 φ3 (u, v)∂1 φ1 (u, v) = ∂3 f1 (φ(u, v)) · dz ∧ d x − ∂2 f1 (φ(u, v)) · d x ∧ d y. Durch analoge Rechnungen erhält man für k = 2, 3 entsprechend (2) (2) = ∂1 f2 (φ(u, v)) · d x ∧ d y − ∂3 f2 (φ(u, v)) · d y ∧ dz (3) (3) = ∂2 f3 (φ(u, v)) · d y ∧ dz − ∂1 f3 (φ(u, v)) · dz ∧ d x. 3 X Z (k) (k) ∂1 F1 (u, v) + ∂2 F2 (u, v) d(u, v) ∂1 F1 (u, v) + ∂2 F2 (u, v) ∂1 F1 (u, v) + ∂2 F2 (u, v) Setzen wir dies ein, so erhalten wir Z 〈rot f , ν〉 dA = (B,φ) Z ((∂2 f3 − ∂3 f2 ) ◦ φ)(u, v) d y ∧ dz + B k=1 Z ((∂3 f1 − ∂1 f3 ) ◦ φ)(u, v) dz ∧ d x + Z B = Z (rot f ◦ φ)1 (u, v) d y ∧ dz + B = B ((∂1 f2 − ∂2 f1 ) ◦ φ)(u, v) d x ∧ d y B Z (rot f ◦ φ)2 (u, v) dz ∧ d x + B Z (rot f ◦ φ)3 (u, v) d x ∧ d y , B was mit unserem Ergebnis für die linke Seite übereinstimmt. Der Stokesche Integralsatz ermöglicht die folgende anschauliche Interpretation der Rotation eines Vektorfelds. Sei f : U → R3 ein C 1 -Vektorfeld auf einer offenen Teilmenge U ⊆ R3 und p ∈ U ein beliebiger Punkt. Weiter sei n ∈ R3 ein normierter Vektor und E ⊆ R3 die eindeutig bestimmte affine Ebene durch p, die auf dem Vektor n senkrecht steht. Sind v, w ∈ R3 normierte, zueinander orthogonale Vektoren mit v × w = n, dann gilt E = φ(R2 ), wobei φ : R2 → R3 durch φ(s, t) = p + sv + t w definiert ist. Für jedes r ∈ R+ sei B r ⊆ R2 die abgeschlossene Kreisscheibe vom Radius r um den Koordinatenursprung. Für hinreichend kleines r ist K r = φ(B r ) der Kreis vom Radius r mit Mittelpunkt p auf der Ebene E. Der Rand ∂ B r —– 49 —– wird durch die positiv orientierte Kurve γ r : [0, 2π] → R2 , t 7→ (r cos(t), r sin(t)) durchlaufen. Die Kurve φ ◦ γ r besitzt ein Einheitstangentialfeld, das in jedem Punkt p + r cos(t)v + r sin(t)w von φ(∂ B r ) mit t ∈ [0, 2π] durch τ r (p) = − sin(t)v + cos(t)w gegeben ist. Dass τ r tatsächlich ein Einheitstangentialfeld ist, erkennt man daran, dass es sich bei [0, 2π] → R3 , t 7→ −r sin(t)v + r cos(t)w und die Ableitung von (φ ◦ γ r )(t) = φ(r cos(t), r sin(t)) = p + r cos(t)v + r sin(t)w handelt; nach (4.12) kommt das Einheitstangentialfeld durch Normierung von (φ ◦ γ r )0 (t) zu Stande. (4.15) Satz Mit den soeben eingeführten Bezeichungen gilt Z 1 〈rot f (p), n〉 = lim 〈 f , τ r 〉 ds. r→0 πr 2 φ◦γ r Beweis: Für jedes r ∈ R+ mit φ(B r ) ⊆ U sei m− (r) das Minimum und m+ (r) das Maximum der Funktion x 7→ 〈rot f (x), n〉 auf der Kreisscheibe K r . Man rechnet unmittelbar nach, dass die parametrisierte Fläche (K r , φ) den Flächeninhalt πr 2 besitzt. Auf Grund der Monotonie des Riemann-Integrals folgt daraus die Abschätzung R πr 2 m− (r) ≤ (B ,φ) 〈rot f , n〉 dA ≤ πr 2 m+ (r). Mit dem Stokeschen Integralsatz, angewendet auf das konstante Einr heitsnormalenfeld ν : E → R3 gegeben durch ν(x) = n, folgt Z 2 − 2 πr m (r) ≤ + 〈 f , τ r 〉 ds ≤ πr m (r) − m (r) ≤ ⇔ φ◦γ r 1 πr 2 Z 〈 f , τ r 〉 ds ≤ m+ (r). φ◦γ r Auf Grund der stetigen Differenzierbarkeit von f sind rot f und auch die Funktion x 7→ 〈rot f (x), n〉 stetig. Daraus folgt lim m− (r) = lim m+ (r) = 〈rot f (p), n〉. Durch Einsetzen in die Ungleichungen von oben erhalten wir das r→0 r→0 gewünschte Ergebnis. Der soeben bewiesene Satz ermöglicht es, die Rotation eines Vektorfelds als „Wirbelstärke“ zu interpretieren: Ist das Vektorfeld in der Nähe des Punktes p mit dem Einheitstangentialfeld τ r der Kurve φ ◦γ r gleichgerichtet, dann nimmt die Funktion x 7→ 〈 f (x), τ r (x)〉 und somit auch das Integral hinter dem Limes positive Werte an. Die Gleichrichtung zeigt einen „Wirbel“ des Vektorfelds um den Punkt p herum an. Der Greensche Integralsatz lässt sich auf Normalbereiche im R3 und dreidimensionale Vektorfelder übertragen; man bezeichnet diese Aussage dann als Gaußschen Integralsatz. Allerdings ist die allgemeine Formulierung hier schon recht kompliziert (siehe [He], §210). Eine einfache und elegante Formulierung erhält man, wenn man Normalbereiche durch sog. glatt berandete Teilmengen des Rn ersetzt, was aber zur Vorbereitung mit einem hohen technischen Aufwand verbunden ist. Aus diesen Gründen beschränken wir uns darauf, den Gaußschen Integralsatz für Quader herzuleiten. Seien a, b, c, d, r, s reelle Zahlen mit a < b, c < d und r < s, und sei Q ⊆ R3 der Quader gegeben durch Q = [a, b] × [c, d] × [r, s]. Die sechs Seitenflächen S1 , ..., S6 von Q lassen sich durch folgende Parametrisierungen beschreiben. —– 50 —– Für 1 ≤ i ≤ 6 definieren wir φi : R2 → R3 durch φ1 (u, v) = (a, u, v) φ2 (u, v) = (b, u, v) φ3 (u, v) = (u, c, v) φ4 (u, v) = (u, d, v) φ5 (u, v) = (u, v, r) φ6 (u, v) = (u, v, s) und Teilmengen Bi ⊆ R2 durch B1 = [c, d] × [r, s] B2 = [c, d] × [r, s] B3 = [a, b] × [r, s] B4 = [a, b] × [r, s] B5 = [a, b] × [c, d] B6 = [a, b] × [c, d] Für jede Seitenfläche Si = φ(Bi ) unsere Quaders gibt es einen eindeutig bestimmten normierten Vektor ni ∈ R3 , der auf Si senkrecht steht und aus dem Quader Q herauszeigt, nämlich n1 = (−1, 0, 0) n2 = (1, 0, 0) n3 = (0, −1, 0) n4 = (0, 1, 0) n5 = (0, 0, −1) n6 = (0, 0, 1). Sei ν : ∂ Q → R3 ein Vektorfeld mit der folgenden Eigenschaft: Für 1 ≤ i ≤ 6 gibt es jeweils eine Jordansche Nullmenge Ni ⊆ Bi , so dass für alle (u, v) ∈ Bi \ Ni jeweils (ν ◦ φ)(u, v) = ni erfüllt ist. Wir bezeichnen ein solches Vektorfeld als äußeres Einheitsnormalenfeld auf Q. (Diese Definition ist notwendig, da ∂ Q nicht als parametrisierte Fläche dargestellt und Def. (4.13) somit nicht anwendbar ist.) Ist g : ∂ Q → R eine stetige Funktion, dann setzen wir Z g dA 6 X = ∂Q i=1 Z g dA. (Bi ,φi ) Ein Analogon für (4.11) in drei Dimensionen kann nun folgendermaßen ausgesprochen werden. (4.16) Satz (Gaußscher Integralsatz) 3 Sei U ⊇ R offen, f : U → R3 ein Vektorfeld, Q ⊆ U ein Quader wie oben angegeben und ν : ∂ Q → R3 ein Einheitsnormalenfeld. Dann gilt Z Z 〈 f , n〉 dA = ∂Q Beweis: div f (x, y, z) d(x, y, z). Q Ähnlich wie beim Greenschen Integralsatz wenden wir den Hauptsatz der Differential- und Integralrech- nung an, um die sechs Summanden, aus denen der Term auf der linken Seite gebildet wird, geeignet umzuformen. Für alle (u, v) ∈ B1 gilt φ10 (u, v)(e1 ) = (0, 1, 0) und φ10 (u, v)(e2 ) = (0, 0, 1), also φ10 (u, v)(e1 ) × φ10 (u, v)(e2 ) = —– 51 —– (0, 1, 0) × (0, 0, 1) = (1, 0, 0) und kφ10 (u, v)(e1 ) × φ10 (u, v)(e2 )k = k(1, 0, 0)k = 1. Damit erhalten wir Z Z = 〈 f , n〉 dA (B1 ,φ1 ) 〈( f ◦ φ1 )(u, v), n1 〉kφ10 (u, v)(e1 ) × φ10 (u, v)(e2 )k d(u, v) Z *( f1 ◦ φ1 )(u, v) −1+ ( f2 ◦ φ1 )(u, v) , 0 d(u, v) B1 ( f3 ◦ φ1 )(u, v) 0 Z 〈 f , n〉 dA = Ebenso zeigt man Z (B2 ,φ2 ) Z Z = ( f1 ◦ φ1 )(u, v) d(u, v) − = Z f1 (a, u, v) d(u, v). − B1 B1 f2 (b, u, v) d(u, v). Insgesamt erhalten wir dann B2 〈 f , n〉 dA + Z Z = 〈 f , n〉 dA (B1 ,φ1 ) Z = B1 (B2 ,φ2 ) f2 (b, u, v) d(u, v) − Z B2 f1 (b, u, v) − f1 (a, u, v) d(u, v) Z = [c,d]×[r,s] ! b Z f1 (a, u, v) d(u, v) ∂1 f1 (x, u, v) d x dx Z = a [c,d]×[r,s] = B1 ∂1 f1 (x, y, z) d(x, y, z) Q wobei im vorletzten Schritt der Hauptsatz der Differential- und Integralrechnung und im letzten Schritt der Satz von Fubini angewendet wurde. Genau nach demselben Muster beweist man die beiden Gleichungen Z Z Z 〈 f , n〉 dA + (B3 ,φ3 ) Z = 〈 f , n〉 dA (B4 ,φ4 ) 〈 f , n〉 dA + (B5 ,φ5 ) ∂2 f2 (x, y, z) d(x, y, z) Q Z = 〈 f , n〉 dA (B6 ,φ6 ) Z ∂3 f3 (x, y, z) d(x, y, z). Q Addiert man nun diese drei Gleichungen auf, so erhält man Z 〈 f , n〉 dA = ∂Q Z ∂1 f1 (x, y, z) d(x, y, z) + Q Z 6 X i=1 ∂2 f2 (x, y, z) d(x, y, z) + Q Z Z 〈 f , n〉 dA = (Bi ,φi ) ∂3 f3 (x, y, z) d(x, y, z) Q = Z (div f )(x, y, z) d(x, y, z) Q wie gewünscht. Der Gaußsche Integralsatz ermöglicht eine „physikalische“ Interpretation der Divergenz eines Vektorfelds f . Betrachtet man f als Geschwindigkeitsfeld einer strömenden Flüssigkeit, dann ist das Integral über div f ein Maß für die Flüssigkeitsmenge, die pro Zeiteinheit aus dem Quader Q „herausströmt“. Sind nämlich auf der linken Seite der Gleichung f und n durchweg gleichgerichtet, dann wird links über eine positive Funktion 〈 f , n〉 integriert, und das Integral auf beiden Seiten der Gleichung ist ebenfalls positiv. Dabei fällt der positive Wert um so höher aus, je größer das nach außen gerichtete Geschwindigkeitsfeld f betragsmäßig ist. Sind f und n aber entgegengesetzt gerichtet, dann zeigt f eine Strömungs ins Innere des Quaders an. Der Wert 〈 f , n〉 ist in diesem Fall negativ. —– 52 —– § 5. Das Lebesgue-Integral Inhaltsübersicht - Das Riemann-Integral, mit dem wir bisher gearbeitet haben, weist eine Reihe von Nachteilen auf. Zum Beispiel ist es nur auf Funktionen mit beschränktem Definitions- und Wertebereich anwendbar, und es ist mit Grenzübergängen nur schlecht verträglich. - Basierend auf dem Raum Cc (Rn ) der stetigen Funktionen mit kompaktem Träger definieren wir einen Funktionenraum L˜(Rn ) ausgestattet mit einer Halbnorm k · kL . - Indem wir in diesem Raum den topologischen Abschluss von Cc (Rn ) bilden, erhalten wir dem Raum L (Rn ) der Lebesgue-integrierbaren Funktionen, die eine echte Erweiterung der Riemann-integrierbaren Funktionen darstellen. - Die Lebesgue-integrierbaren Funktionen sind mit Grenzübergängen, insbesondere der punktweisen Konvergenz, wesentlich besser verträglich als die Riemann-integrierbaren. Aus diesem Grund lassen sich auch Vertauschbarkeitssätze, zum Beispiel die Differenzierbarkeit unter dem Integralzeichen, hier wesentlich einfacher herleiten. In diesem Abschnitt werden wir neben einer Erweiterung des Integralbegriffs auch das Verhalten von Funktionen bei Grenzübergängen betrachten. Dabei unterscheidet man grundsätzlich zwei verschiedene Arten von Konvergenz. Für jede Funktion f : X → R auf einem metrischen Raum X setzen wir = k f k∞ ¦ © sup | f (x)| x ∈ X ∈ R+ ∪ {+∞}. Die Funktion f ist also genau dann beschränkt, wenn k f k∞ ∈ R+ gilt. Man sagt, eine Folge ( f n )n∈N von Funktionen f n : X → R konvergiert punktweise gegen eine Funktion f : X → R, wenn lim f n (x) n→∞ = f (x) für alle x ∈ X erfüllt ist. Gilt sogar limn k f n − f k∞ = 0, dann spricht man von gleichmäßiger Konvergenz. Das Riemann-Integral, das wir bisher betrachtet haben, weist zwei gravierende Mängel auf. Zum einen ist es nur für Funktionen mit beschränktem Definitionsbereich definiert, einer Funktion wie zum Beispiel f : [1, +∞[ → R, x 7→ 1 x2 kann bereits kein Riemann-Inegral mehr zugeordnet werden. Für jedes a ∈ R, a > 1 gilt allerdings Z a f (x) d x = − 1 1 x=a x x=1 = 1− 1 a so dass im Prinzip nichts dagegen sprechen würde, dieser Funktion das Integral Z Za 1 f (x) d x = lim f (x) d x = lim 1 − = a→+∞ a→+∞ a [1,+∞[ 1 —– 53 —– 1 zuzuordnen. Allerdings ist diese indirekte Definition über Grenzwerte besonders im Mehrdimensionalen sehr unhandlich. Beispielsweise muss man sicherstellen, dass die vielen verschiedenen Möglichkeiten, einen Grenzübergang durchzuführen, alle denselben Grenzwert liefern. Ein weiterer Nachteil des Riemann-Integrals besteht darin, dass es nur unter sehr starken Voraussetzungen mit Grenzübergängen vertauschbar ist, die in den Anwendungen nur selten vorliegen. Als Beispiel betrachten wir die Dirichlet-Funktion χ : [0, 1] → R gegeben durch χ(x) = 1 0 falls x ∈ Q sonst. die, wie wir bereits gesehen haben, nicht Riemann-integrierbar ist. Sei nun (x n )n∈N eine Folge, die alle Elemente aus N = [0, 1] ∩ Q durchläuft. Definieren wir eine Funktionenfolge (χn )n∈N durch χn (x) 1 0 = falls x ∈ {x 1 , ..., x n } , sonst dann konvergiert die Folge (χn )n∈N punktweise gegen χ, außerdem stimmt χ mit allen χn außerhalb der Nullmenge N überein. Deshalb wäre es nur natürlich, der Funktion χ das Integral Z 1 χ(x) d x = 0 Z 1 χn (x) d x lim n→∞ = 0 zuzuordnen. 0 Wir werden nun sehen, wie die Klasse der integrierbaren Funktionen auf solche Fälle ausgedehnt werden kann. Für jede Funktion f : Rn → R bezeichnen wir den Abschluss der Menge {x ∈ Rn | f (x) 6= 0} als den Träger supp( f ) von f . Die Menge der stetigen Funktionen f : Rn → R mit kompaktem Träger bezeichnen wir mit Cc (Rn ). Für jede Funktion f ∈ Cc (Rn ) wählen wir einen kompakten Quader Q mit Q ⊇ supp( f ) und setzen Z Z I( f ) f (x) d x := f (x) d x. := Rn Q Wie wir bereits gesehen haben, ist der Wert I( f ) ∈ R unabhängig von der Wahl dieses Quaders. Die Zuordnung I : Cc (Rn ) → R ist linear, es gilt also I( f + g) = I( f ) + I(g) und I(λ f ) = λI( f ) für alle f , g ∈ C (Rn ) und λ ∈ R , insbesondere sind mit f und g auch f + g und λ f in Cc (Rn ) enthalten. Außerdem ist I monoton, d.h. aus f ≤ g folgt I( f ) ≤ I(g), für alle f , g ∈ Cc (Rn ). Im weiteren Verlauf werden wir des öfteren verwenden, dass mit f , g ∈ Cc (Rn ) auch die Funktionen | f |, f ∨ g = max{ f , g} und f ∧ g = min{ f , g} in Cc (Rn ) liegen. Die Teilmenge aller Funktionen f ∈ Cc (Rn ) mit f (x) ≥ 0 für alle x ∈ Rn bezeichnen wir mit Cc+ (Rn ). —– 54 —– (5.1) Definition Eine Reihe P∞ k=1 φk von Funktionen φk ∈ Cc+ (Rn ) bezeichnet man als Majo- rante einer Funktion f : Rn → R, wenn | f (x)| ≤ ∞ X ∞ X φk (x) und k=1 I(φk ) < +∞ gilt. k=1 Die Menge aller Funktionen f , die eine Majorante besitzen, bezeichnen wir mit L˜(Rn ). Eine P∞ Summe der Form k=1 I(φk ) wird dann eine Obersumme von f genannt, und wir setzen ( k f kL = inf ∞ X k=1 ) ∞ X I(φk ) φk ist Majorante von f . k=1 Wir werden nun zunächst die Eigenschaften des Funktionenraums L˜(Rn ) untersuchen. (5.2) Proposition Sei (g k )k∈N eine Folge in L˜(Rn ) mit P∞ k=1 kg k kL < +∞ und f : Rn → R eine Funktion mit der Eigenschaft | f (x)| ≤ ∞ X |g k (x)| für alle x ∈ Rn . k=1 Dann liegt auch f in L˜(Rn ), und es gilt k f kL ≤ ∞ X kg k kL . k=1 Beweis: Sei " ∈ R+ vorgegeben. Nach Voraussetzung existiert für jedes k ∈ N eine Majorante P∞ (k) −k j=1 I(φ j ) < kg k kL + 2 ". Es gilt dann | f (x)| ∞ X ≤ |g k (x)| ≤ ∞ X ∞ X (k) j=1 φ j P∞ mit (k) φ j (x) für alle x ∈ Rn . k=1 j=1 k=1 Also hat auch die Funktion f eine Majorante, und es folgt f ∈ L˜(Rn ). Außerdem gilt ∞ X ∞ X (k) I(φ j ) ≤ k=1 j=1 Nach Definition von k · kL folgt k f kL ≤ P∞ k=1 kg k kL . (5.3) Definition ∞ X kg k kL + 2−k " k=1 P∞ k=1 kg k kL ≤ ∞ X kg k kL + ". k=1 + ". Da " ∈ R+ beliebig vorgegeben war, erhalten wir k f kL ≤ Eine Abbildung k · k : V → R+ auf einem R-Vektorraum V wird Halbnorm genannt, wenn kλvk = |λ|kvk und kv + wk ≤ kvk + kwk für alle v, w ∈ V . —– 55 —– Für den Nullvektor 0V gilt bei einer Halbnorm k · k weiterhin k0V k = k0 · 0V k = |0|k0V k = 0. Die einzige Bedingung, die gegenüber einer Norm im allgemeinen nicht erfüllt ist, ist die Implikation kvk = 0 ⇒ v = 0V für alle v ∈ V . (5.4) Proposition (i) Ist f ∈ L˜(Rn ) und g : Rn → R beschränkt, dann liegt auch f g in L˜(Rn ), und es gilt k f gkL ≤ k f kL kgk∞ . (ii) Die Menge L˜(Rn ) ist ein R-Vektorraum, und k · kL ist eine Halbnorm auf L˜(Rn ). P∞ P∞ zu (i) Sei " ∈ R+ vorgegeben. Dann gibt es eine Majorante k=1 φk von f mit k=1 I(φk ) < k f kL + ". P∞ Wegen | f g| ≤ kgk∞ | f | ist dann k=1 kgk∞ φk eine Majorante von f g, und aus I(kgk∞ φk ) = kgk∞ I(φk ) folgt Beweis: k f gkL ≤ ∞ X I(kgk∞ φk ) = kgk∞ k=1 ∞ X I(φk ) < k f kL kgk∞ + "kgk∞ . k=1 Weil " ∈ R+ beliebig vorgegeben war, erhalten wir k f gkL ≤ k f kL kgk∞ . Zunächst zeigen wir, dass L˜(Rn ) ein Untervektorraum des R-Vektorraums aller Funktionen f : Rn → R P∞ Pn ist. Sind f , g ∈ L˜(Rn ) und λ ∈ R vorgegeben und k=1 φk und k=1 ψk Majoranten von f bzw. g, dann ist P∞ P∞ k=1 (φk + ψk ) offenbar eine Majorante von f + g und k=1 |λ|φk eine Majorante von λ f . Also sind f + g und λ f n in L˜(R ) enthalten. zu (ii) Die Dreiecksungleichung k f + gkL ≤ k f kL + kgkL ist ein Spezialfall von (5.2), und aus Teil (i) angewendet auf die konstante Funktion g(x) = λ folgt kλ f kL ≤ |λ|k f kL . Außerdem gilt k f kL = k λ1 · λ · f kL ≤ 1 kλ f |λ| kL und somit |λ|k f kL ≤ kλ f kL . Insgesamt erhalten wir kλ f kL = |λ| · k f kL . (5.5) Definition Eine Funktion f ∈ L˜(Rn ) wird Lebesgue-integrierbar genannt, wenn eine Folge ( f n )n∈N in Cc (Rn ) mit lim k f − f n kL n→∞ = 0 existiert. Die Teilmenge der Lebesgue-integrierbaren Funktionen in L˜(Rn ) bezeichnen wir mit L (Rn ). Eine Funktion f : B → R auf einer Teilmenge B ⊆ Rn bezeichnen wir als Lebesgue-integrierbar, wenn ihre Nullfortsetzung auf Rn Lebesgue-integrierbar ist. Weiter unten werden wir zeigen, dass jede Riemann-integrierbare Funktion auch Lebesgue-integrierbar ist, ebenso die beiden in der Einleitung beschriebenen Funktionen. Offenbar ist L (Rn ) ein Untervektorraum des R-Vektorraums —– 56 —– L˜(Rn ). Sind nämlich λ ∈ R und f , g ∈ L (Rn ) vorgegeben und ( f n )n∈N und (g n )n∈N Funktionenfolgen wie in der Definition angegeben, dann sind auch ( f n + g n )n∈N und (λ f n )n∈N Folgen in Cc (Rn ). Aus k( f n + g n ) − ( f + g)kL ≤ 0 k f n − f kL + kg n − gkL ≤ und limn k f n − f kL = limn kg n − gkL = 0 folgt limn k( f n + g n ) − ( f + g)kL = 0, außerdem gilt = |λ| · 0 = 0. lim kλ f n kL = |λ| · lim k f n kL n→∞ n→∞ Als nächstes werden wir nun den Lebesgue-integrierbaren Funktionen ein Integral zuordnen. Dazu benötigen wir ein wenig technische Vorbereitung. Für eine beliebige Teilmenge K ⊆ Rn sei die Funktion dK : Rn → R+ definiert durch dK (x) inf{ kx − yk∞ y ∈ K } = , wobei k·k∞ die Maximumsnorm auf Rn bezeichnet. Diese Funktion gibt also den k·k∞ -Abstand zwischen dem Punkt x und der Menge K an. Für jedes " ∈ R+ und jede Menge K definieren wir eine Funktion χK," : Rn → [0, 1] durch χK," (x) = 1 1 − " dK (x) falls dK (x) ≤ " falls dK (x) ≥ ". 0 Es ist leicht zu zeigen, dass dK und damit auch die Funktionen χK," stetig sind. Wir haben damit der (in aller Regel unstetigen) charakteristischen Funktion χK eine Familie von stetigen Funktionen zugeordnet, die sich von χK nur auf einem „kleinen“ Bereich unterscheiden. Ist K ⊆ Rn beschränkt, dann ist χK," darüber hinaus in Cc+ (Rn ) enthalten. Insbesondere ist der Träger von χK," nur geringfügig größer als der Träger von χK . Ist beispielsweise K ein Quader der Form [a1 , b1 ] × ... × [an , bn ], dann gilt supp(χK," ) = [a1 − ", b1 + "] × ... × [an − ", bn + "]. (5.6) Proposition Sei K ⊆ Rn kompakt und (φk )k∈N eine Folge in Cc (Rn ) mit supp(φk ) ⊆ K und limk kφk k∞ = 0. Dann folgt lim I(φk ) = 0. k→∞ Beweis: Für jedes " ∈ R+ gelten jeweils die Ungleichungen −kφk k∞ · χK," ≤ −kφk k∞ · χK ≤ φk ≤ kφk k∞ · χK ≤ kφk k∞ · χK," Auf Grund der Monotonie der Funktion I folgt daraus −kφk k∞ I(χK," ) ≤ I(φk ) ≤ kφk k∞ I(χK," ). Aus der Voraussetzung kφk k∞ → 0 folgt also I(φk ) → 0. —– 57 —– (5.7) Satz (Satz von Dini) Sei X ein kompakter metrischer Raum und ( f k )k∈N eine punktweise monoton wachsende Folge stetiger Funktionen f k : X → R (es gelte also f k (x) ≤ f k+1 (x) für alle x ∈ X und k ∈ N). Sei f : X → R eine stetige Funktion mit der Eigenschaft, dass ( f k )k∈N punktweise gegen f konvergiert. Dann konvergiert ( f k )k∈N auch gleichmäßig gegen f . Beweis: Für vorgegebenes " ∈ R+ und k ∈ N sei jeweils Uk = {x ∈ X | f (x) − f k (x) < "}. Auf Grund der Stetigkeit von f k und f ist jedes Uk offen. Auf Grund der punktweisen Konvergenz bilden sie außerdem eine Überdeckung von X , denn für jedes x ∈ X gibt es ein k ∈ N mit f (x) − f k (x) < ", und es folgt dann x ∈ Uk . Wegen f (x) − f k+1 ≤ f (x) − f k (x) gilt jeweils Uk ⊆ Uk+1 . Weil X kompakt ist, existiert eine endliche Teilüberdeckung von (Uk )k∈N und wegen Uk ⊆ Uk+1 für alle k somit ein ` ∈ N mit U` = X . Für alle k ≥ ` und x ∈ X gilt also f (x) − f` (x) < ". Damit ist die gleichmäßige Konvergenz bewiesen. (5.8) Proposition Für jedes φ ∈ Cc (Rn ) gilt |I(φ)| ≤ I(|φ|) = kφkL . Beweis: Aus φ ≤ |φ| folgt I(φ) ≤ I(|φ|), und wegen I(|φ|) ≥ 0 erhalten wir |I(φ)| ≤ I(|φ|). Weil |φ| eine Majorante von φ ist, gilt außerdem kφkL ≤ I(|φ|) nach Definition der Halbnorm k·kL . Zum Beweis der Ungleichung P∞ I(|φ|) ≤ kφkL sei k=1 φk eine beliebige Majorante von |φ|. Für jedes m ∈ N sei ψm = |φ| ∧ m X ! φk ∈ Cc+ (Rn ). k=1 Offenbar gilt supp(ψm ) ⊆ supp |φ| für alle m ∈ N. Außerdem konvergiert (ψm )m∈N punktweise wegen |φ|, denn Pm für jedes x ∈ X gibt es ein m ∈ N mit k=1 φk (x) ≥ |φ(x)|. Weil die Träger von |φ| und ψm kompakt sind und die Folge (ψm )m∈N außerdem monoton wachsend ist, können wir den Satz von Dini anwenden. Demnach konvergiert die Folge (ψm )m∈N gleichmäßig gegen |φ|, es gilt also lim kψm − |φ|k∞ m→∞ = Nach (5.6) folgt daraus limm I(ψm ) = I(|φ|). Außerdem gilt ψm ≤ I(ψm ) ≤ m X I(φk ) ≤ k=1 und |I(ψm )| ≤ P∞ k=1 0. Pm k=1 φk ∞ X für alle m ∈ N, damit I(φk ) k=1 I(φk ) für alle m ∈ N. Wegen I(ψm ) → I(|φ|) folgt daraus |I(φ)| ≤ Majorante beliebig vorgegeben war, erhalten wir |I(φ)| ≤ kφkL wie gewünscht. —– 58 —– P∞ k=1 I(φk ). Weil die (5.9) Definition Sei f ∈ L (Rn ) und ( f k )k∈N eine Folge in Cc (Rn ) mit limk k f k − f kL = 0. Dann ist L Z f (x) d x = lim I( f k ) = k→∞ Rn Z f k (x) d x lim k→∞ Rn das Lebesgue-Integral der Funktion f . Jede Lebesgue-integrierbaren Funktion f : B → R auf einer Teilmenge B ⊆ Rn ordnen wir das Lebesgue-Integral der Nullfortsetzung zu. Um zu zeigen, dass der angebene Grenzwert existiert, weisen wir nach, dass die Zahlen I( f k ) = R f (x) Rn k + d x eine Cauchyfolge bilden. Nach Voraussetzung existiert für beliebig vorgegebenes " ∈ R ein N ∈ N, so dass k f k − f kL < 1 " 2 für alle k ≥ N gilt. Nach (5.8) folgt für alle k, ` ≥ N dann |I( f k ) − I( f` )| = |I( f k − f l )| ≤ k f k − f ` kL k f k − f kL + k f ` − f kL ≤ 1 " 2 < + 12 " = ". Wir müssen noch zeigen, dass das Lebesgue-Integral von f ∈ L (Rn ) unabhängig von der Wahl der Folge ( f k )k∈N ist. Sei (g k )k∈N eine weitere Folge mit den in der Definition angegebenen Eigenschaften. Wegen = k f k − g k kL k( f k − f ) + ( f − g k )kL ≤ k f k − f kL + kg k − f kL gilt limk k f k − g k kL = 0. Nach (5.8) gilt |I( f k − g k )| ≤ k f k − g k kL , also folgt lim |I( f k ) − I(g k )| = k→∞ lim |I( f k − g k )| k→∞ = 0 und somit limk I( f k ) = limk I(g k ). Ist f : Rn → R eine stetige Funktion mit kompaktem Träger, dann kann als Folge ( f k )k∈N in Cc (Rn ) die konstante Folge f k = f gewählt werden. In diesem Fall stimmen Riemann- und Lebesgue-Integral also überein. Weiter unten werden wir zeigen, dass dies auch für beliebige Riemann-integrierbare Funktionen gilt. (5.10) Proposition Sind f , g ∈ L (Rn ) und λ ∈ R, dann gilt L Z ( f + g)(x) d x = Rn L Z f (x) d x + Rn Z L Z L (λ f )(x) d x = λ und g(x) d x Rn Rn Z L f (x) d x. Rn Wir führen diese Eigenschaften des Lebesgue-Integrals auf I(·) zurück. Nach Voraussetzung gibt es Folgen Beweis: ( f k )k∈N und (g k )k∈N in Cc (Rn ) mit limk k f k − f kL = 0 und limk kg k − gkL = 0. Für jedes k ∈ N gilt k( f k + g k ) − ( f + g)kL ≤ k f k − f kL + kg k − gkL und k(λ f k ) − (λ f )kL = |λ| · k f k − f kL . Daraus folgt limk k( f k + g k ) − ( f + g)kL = 0 und limk k(λ f k ) − (λ f )kL = 0. Nach Definition des Lebesgue-Integrals gilt damit ZL ( f + g)(x) d x Rn Z = lim I( f k + g k ) k→∞ = lim I( f k ) + lim I(g k ) k→∞ L und ebenso Rn (λ f )(x) d x = lim I(λ f k ) = λ lim I( f k ) = λ k→∞ k→∞ k→∞ Z 59 L Rn f (x) d x + Z L g(x) d x Rn L f (x) d x. Rn —– = Z —– (5.11) Proposition (i) Ist f Lebesgue-integrierbar, dann auch | f |. (ii) Sind f , g ∈ L (Rn ), dann auch die Funktionen f ∧ g und f ∨ g. (iii) Sei f ∈ L (Rn ) und g : Rn → R beschränkt. Ist g zusätzlich stetig oder g ∈ L (Rn ), dann folgt f g ∈ L (Rn ). Beweis: zu (i) Die Funktion | f | ist jedenfalls in L˜(Rn ) enthalten, weil mit f auch | f | eine Majorante besitzt. Sei nun ( f k )k∈N eine Folge in Cc (Rn ) mit limk k f k − f kL = 0. Wegen || f | − | f k || ≤ | f − f k | gilt dann auch limk k| f k | − | f |kL = 0. Weil die Funktionen | f k | in Cc (Rn ) liegen, folgt daraus die Behauptung. zu (ii) Dies folgt direkt aus den Gleichungen f ∧ g = 21 ( f + g − | f − g|) und f ∨ g = 21 ( f + g − | f − g|) sowie der Tatsache, dass die Lebesgue-integrierbaren Funktionen einen Untervektorraum von C˜(Rn ) bilden. zu (iii) Sei ( f k )k∈N wiederum eine Folge in Cc (Rn ) mit limk k f k − f kL = 0. Nach (5.4) gilt k f g − f k gkL ≤ kgk∞ k f k − f kL für alle k ∈ N. Ist g stetig, dann liegen die Funktionen f k g alle in Cc (Rn ), und aus limk k f g − f k gkL = 0 folgt die Lebesgue-Integrierbarkeit von f g. Ist g statt dessen ein Element aus L (Rn ), dann wählen wir für jedes k ∈ N ein g k ∈ Cc (Rn ) mit kg k − gkL 1 ≤ kk f k k∞ falls f k 6= 0 und setzen ansonsten g k = 0. Dann folgt k f k g − f k g k kL ≤ k f k k∞ kg k − gkL ≤ 1 k für alle k ∈ N. Zusammen mit der Abschätzung k f k g k − f gkL ≤ k f k g k − f k gkL + k f k g − f gk ≤ k f k g k − f k gkL + kgk∞ k f k − f kL erhalten wir limk k f k g k − f gkL = 0 und somit f g ∈ L (Rn ). Zur Vereinfachung der Notation lassen wir das „L “ über dem Integralzeichen von nun an weg. Sollte einmal das Riemann-Integral an Stelle des Lebesgue-Integrals gemeint sein, wird ausdrücklich darauf hingewiesen. —– 60 —– (5.12) Proposition (Rechenregeln für das Lebesgue-Integral) (i) Für alle f ∈ L (Rn ) gilt Z f (x) d x Rn Z | f (x)| d x ≤ = k f kL . Rn (ii) Ist f ∈ L (Rn ) und ( f k )k∈N eine Folge in L (Rn ) mit limk k f k − f kL = 0, dann gilt Z Z f k (x) d x lim k→∞ (iii) Aus f ≥ 0 folgt R Rn = f (x) d x. Rn Rn f (x) d x ≥ 0. (iv) Sei f ∈ L (Rn ) und g : Rn → R beschränkt und außerdem stetig oder in L (Rn ) enthalten. Dann gilt Z f (x)g(x) d x Rn Beweis: Z ≤ | f (x)| d x. kgk∞ Rn zu (i) Wir führen die Aussage auf die Ungleichungen |I( f )| ≤ I(| f |) ≤ k f kL für f ∈ Cc (Rn ) aus (5.8) zurück. Sei also f ∈ L (Rn ) und ( f k )k∈N eine Folge in Cc (Rn ) mit limk k f k − f kL = 0. Nach Definition des LebesgueR Integrals gilt limk I( f k ) = Rn f (x) d x. Wegen || f k | − | f || ≤ | f k − f | gilt k| f k | − | f |kL ≤ k f k − f kL für alle k ∈ N und R damit limk I(| f k |) = Rn | f (x)| d x. Nun gilt Z f (x) d x Rn ≤ ≤ Z Z Z f (x) d x − f k (x) d x + f k (x) d x Rn Rn Rn Z Z Z f (x) d x − f k (x) d x + | f k (x)| d x. Rn n R Rn Für k → ∞ läuft der erste Summand auf der rechten Seite gegen Null und der zweite gegen folgt die erste behauptete Ungleichung. Für die Gleichung betrachten wir Z Z Z | f (x)| d x Rn = | f k (x)| d x + Rn = k f k kL + | f (x)| d x − Rn Z | f (x)| d x − Rn R Rn Z | f k (x)| d x Rn Z | f k (x)| d x . Rn Für k → ∞ konvergiert der erste Summand gegen k f kL und der zweite gegen Null. zu (ii) Dies folgt direkt aus Teil (i), denn für alle k ∈ N gilt Z Z Z f (x) d x − f (x) d x ≤ | f k (x) − f (x)| d x Rn k Rn Rn Läuft der Ausdruck rechts gegen Null, dann also auch der linke. —– 61 —– ≤ k f − f k kL . | f (x)| d x. Daraus zu (iii) Dies erhält man durch R Rn f (x) d x = R Rn | f (x)| d x = k f kL ≥ 0. zu (iv) Nach (5.11) ist f g jedenfalls Lebesgue-integrierbar. Außerdem gilt Z Z | f (x)g(x)| d x = f (x)g(x) d x ≤ Rn Rn ≤ kgk∞ · k f kL = Z kgk∞ · k f gkL | f (x)| d x. Rn Eine Teilmenge B ⊆ Rn heißt Lebesgue-messbar, wenn die charakteristi- (5.13) Definition sche Funktion χB Lebesgue-integrierbar ist. In diesem Fall nennt man Z vL (B) = χB (x) d x das Lebesgue-Maß von B. Rn Die Menge B wird Lebesguesche Nullmenge genannt, wenn kχB kL = 0 gilt. Unmittelbar aus der Definition folgt, dass jede Teilmenge M einer Lebesgueschen Nullmenge N wiederum eine Lebesguesche Nullmenge ist. Aus M ⊆ N folgt χ M ≤ χN und damit 0 ≤ kχ M kL ≤ kχN kL = 0. Man sagt üblicherweise, dass eine Funktion f : Rn → R eine Eigenschaft fast überall besitzt, wenn die Teilmenge N ⊆ Rn , auf der diese Eigenschaft nicht gilt, eine Lebesguesche Nullmenge ist. (5.14) Proposition (i) Eine Teilmenge N ⊆ Rn ist genau dann eine Lebesguesche Nullmenge, wenn sie Lebesgue-messbar ist und vL (N ) = 0 gilt. (ii) Jede Nullmenge ist eine Lebesguesche Nullmenge. Beweis: zu (i) „⇒“ Ist kχN kL = 0, dann hat die Folge ( f k )k∈N in Cc (Rn ) gegeben durch f k = 0 für alle k ∈ N die Eigenschaft limk k f k − χN kL = 0. Dies zeigt, dass χN Lebesgue-integrierbar ist. Außerdem gilt Z Z vL (N ) = χN (x) d x = Rn f k (x) d x lim k→∞ = 0 Rn nach Definition des Lebesgue-Integrals. „⇐“ Aus χN ∈ L (Rn ) und R Rn χN (x) d x = 0 folgt kχN kL = —– 62 R Rn —– |χN (x)| d x = R Rn χN (x) d x = 0 nach (5.8). zu (ii) Sei " ∈ R+ vorgegeben. Nach Definition der Nullmengen gibt es eine Familie (Q k )k∈N von Quadern mit S∞ P∞ N ⊆ k=1 Q k und k=1 v(Q k ) < ε. Für jedes k ∈ N können wir ein "k ∈ R+ wählen, so dass I(χQ k ,"k ) < v(Q k ) + "2−k P∞ gilt. Es ist dann k=1 χQ k ,"k eine Majorante von χN , und es gilt n X I(χQ k ,"k ) n X ≤ k=1 v(Q k ) + k=1 n X "2−k ≤ "+" = 2". k=1 Weil " beliebig vorgegeben war, folgt daraus kχN kL = 0. Umgekehrt kann man zeigen, dass jede Lebesguesche Nullmenge eine Nullmenge ist, die beiden Begriffe sind also äquivalent. Wir werden dieses Resultat aber nicht verwenden. Genau wie für die Riemann-integrierbaren Funktionen gilt auch hier (5.15) Proposition Seien f ∈ L (Rn ), N ⊆ Rn eine Nullmenge und f˜ : Rn → R eine Funktion mit f˜(x) = f (x) für alle x ∈ / N . Dann ist auch f˜ Lebesgue-integrierbar, und die LebesgueIntegrale von f und f˜ stimmen überein. Pn Nach Voraussetzung gilt | f˜ − f | ≤ k=1 χN , und wegen kχN kL = 0 folgt daraus k f˜ − f kL = 0 nach (5.2). Dies zeigt, dass f˜ − f eine Lebesgue-integrierbare Funktion mit Lebesgue-Integral Null ist. Daraus wiederum folgt auch die Lebesgue-Integrierbarkeit von f˜ = ( f˜ − f ) + f sowie die Gleichheit der Integrale. Beweis: Für die spätere Anwendung bemerken wir noch, dass (5.2) gültig bleibt, wenn die Ungleichung | f (x)| ≤ P∞ k=1 g k (x) n nur fast überall erfüllt ist. Sei nämlich N ⊆ R die Nullmenge, auf der die Ungleichung nicht gilt und f N die Funktion gegeben durch f N (x) = 0 für alle x ∈ N und f N (x) = f (x) für alle x ∈ Rn \ N . Nach (5.2) liegt f N in L˜(Rn ), und es gilt k f N kL ≤ ∞ X kg k kL . k=1 Die Funktion | f − f N | stimmt fast überall mit der Nullfunktion überein und ist somit nach (5.15) Lebesgue-integrierbar, R mit k f − f N kL = Rn | f − f N |(x) d x = 0. Daraus folgt k f kL ≤ k f N kL + k f − f N kL = k f N kL . —– 63 —– (5.16) Satz (Satz von Beppo Levi) P Sei (g k ) eine Folge in L˜(Rn ) mit k=1 kg k kL < +∞. Dann gilt (i) Die Reihe P∞ k=1 |g k (x)| konvergiert fast überall. (ii) Sei g : Rn → R eine Funktion mit der Eigenschaft, dass fast überall die Gleichung g(x) = P∞ ˜ n k=1 g k (x) erfüllt ist. Dann liegt g in L (R ), und es gilt m X lim g − g k (x) = 0. m→∞ k=1 L (iii) Gilt g k ∈ L (R ) für alle k ∈ N, dann folgt g ∈ L (Rn ) und n Z g(x) d x = Rn ∞ X k=1 Z g k (x) d x. Rn P∞ Sei D ⊆ Rn die Menge der Punkte, in denen die Reihe k=1 |g k (x)| divergiert. Dann gilt χ D ≤ P∞ P∞ k=m+1 |g k | für alle m ∈ N. Nach (5.2) gilt kχ D kL ≤ k=m+1 kg k kL für alle m ∈ N, und wegen limm k=m+1 kg k kL = Beweis: P∞ zu (i) 0 folgt daraus kχ D kL = 0. Also ist D eine Lebesguesche Nullmenge. zu (ii) Nach Voraussetzung gilt |g(x)| ≤ P∞ k=1 |g k (x)| fast überall. Auf Grund der Vorbemerkung können wir (5.2) P∞ Pm auch in dieser Situation anwenden und erhalten g ∈ L˜(Rn ). Wegen limm k=m+1 kg k kL = 0 und kg − k=1 g k kL ≤ P∞ k=m+1 kg k kL gilt auch die zweite Aussage. Pm g k in L (Rn ) erhalten, es gibt deshalb ein f m ∈ Cc (Rn ) mit k=1 g k − f m L < m1 . P∞ Ist nun " ∈ R+ vorgegeben, dann können wir m ∈ N so wählen, dass sowohl m1 < 12 " als auch k=m+1 kg k kL < 12 " zu (iii) Für jedes m ∈ N ist Pm k=1 gilt. Es folgt dann kg − f m kL ≤ ∞ X kg k kL k=m+1 m X + gk − fm k=1 1 " 2 < + 12 " m→∞ ". L Daraus folgt sowohl die Lebesgue-Integrierbarkeit von g als auch die Gleichung Z Z m Z X g(x) d x = lim f m (x) d x = lim g k (x) d x. Rn = m→∞ Rn —– 64 —– k=1 Rn (5.17) Folgerung (Satz über die monotone Konvergenz) Sei ( f k )k∈N eine fast überall monoton wachsende Folge in L (Rn ) mit der Eigenschaft, dass die R Folge der Integrale Rn f k (x) d x beschränkt ist. Dann gibt es ein f ∈ L (Rn ), so dass ( f k ) fast überall gegen die Funktion f konvergiert mit Z f k (x) d x lim k→∞ Beweis: Z = Rn f (x) d x. Rn Sei die Folge (g k )k∈N definiert durch g1 = f1 und g k = f k − f k−1 für k ≥ 2. Dann gilt für alle m ∈ N die Abschätzung m X = kg k kL k f 1 kL + k=1 k f 1 kL + P∞ k=1 kg k kL Z Z Z f m (x) d x − f k − f k−1 (x) d x = Rn k=2 Rn Die Reihe m X f1 (x) d x ≤ 2k f1 kL + c. Rn Pm ist also konvergent, außerdem gilt f m = k=1 g k für alle m ∈ N nach Definition der Folge (g k )k∈N . Wir können somit den Satz von Beppo Levi anwenden und erhalten die beiden gewünschten Aussagen. Das Beispiel der Folge (χk )k∈N vom Anfang des Kapitels zeigt, dass ein entsprechender Satz für Riemann-integrierbare Funktionen falsch ist. Der Satz über die monotone Konvergenz gilt auch für monoton fallende Folgen Lebesgueintegrierbarer Funktionen: Man erhält ihn dadurch, dass man den ursprünglichen Satz auf die Folge (− f k )k∈N anwendet. Hierbei muss man dann natürlich fordern, dass die Folge der Integrale nach unten beschränkt ist. (5.18) Satz (Satz von Lebesgue über die majorisierte Konvergenz) Sei ( f k )k∈N eine Folge in L (Rn ), die fast überall gegen eine Funktion f : Rn → R konvergiert. Sei ferner g eine nicht-negative, Lebesgue-integrierbare Funktion mit | f k | ≤ g für alle k ∈ N. Dann ist auch f Lebesgue-integrierbar, und es gilt Z f (x) d x = Rn Beweis: Z lim k→∞ f k (x) d x. Rn Nach Abänderung der Funktionen f k , f und g auf einer Nullmenge können wir davon ausgehen, dass ( f k )k∈N überall gegen f konvergiert. Nun definieren wir für alle k, ν ∈ N die Funktion g k,ν = max{ f k , f k+1 , ..., f k+ν }. Mit den f k sind auch die g k,ν integrierbar. Definieren wir g k (x) = limν g k,ν (x) für alle x ∈ Rn , dann gilt g k = sup{ f i | i ≥ k} für alle k ∈ N. Die Funktionenfolge (g k,ν )ν∈N konvergiert also monoton wachsend gegen g k , und die Folge R der Integrale ist durch Rn g(x) d x beschränkt. Aus dem Satz über die monotone Konvergenz folgt nun, dass alle g k —– 65 —– Lebesgue-integrierbar sind, und dass jeweils Z g k (x) d x Z = g k,ν (x) d x lim ν→∞ Rn gilt. Rn Die Folge (g k )k∈N konvergiert monoton fallend gegen f und ist betragsmäßig ebenfalls durch das Integral über g beschränkt. Wir können den Satz über die monotone Konvergenz also erneut anwenden und erhalten sowohl f ∈ L (Rn ) als auch die Gleichung Z f (x) d x Z = g k (x) d x. lim k→∞ Rn Rn Sei schließlich für jedes k ∈ N die Funktion hk definiert durch hk (x) = inf { f i (x) | i ≥ k}. Genau wie zuvor zeigt R R man, dass die hk alle Lebesgue-integrierbar sind und Rn f (x) d x = limk Rn hk (x) d x gilt. Wenden wir nun das Lebesgue-Integral auf die Ungleichungen hk ≤ f k ≤ g k an und betrachten den Grenzübergang k → ∞, dann erhalten R R wir insgesamt die gewünschte Gleichung Rn f (x) d x = limk Rn f k (x) d x. Wir leiten aus dem Satz über die majorisierte Konvergenz noch zwei wichtige Folgerungen ab: Die Stetigkeit parameterabhängiger Integrale und die Vertauschbarkeit von Lebesguescher Integration mit partieller Differentiation. Beide Ergebnisse sind für Riemann-Integrale nur sehr mühsam unter stärkeren Voraussetzungen erzielbar. (5.19) Satz Sei X ein metrischer Raum, x 0 ∈ X und f : Rm × X → R eine Funktion mit folgenden Eigenschaften. (i) Die Funktion Rm → R, t 7→ f (t, x) ist Lebesgue-integrierbar für alle x ∈ X . (ii) Es gibt eine nicht-negative, Lebesgue-integrierbare Funktion g auf Rm , so dass für alle x ∈ X jeweils | f (t, x)| ≤ g(t) erfüllt ist, für fast alle t ∈ Rm . (iii) Die Abbildung X → R, x 7→ f (t, x) ist für fast alle t ∈ Rm stetig in x 0 . Z Dann ist die Funktion F (x) = f (t, x) d t stetig in x 0 . Rm Beweis: Sei (x k )k∈N eine Folge in X mit limk x k = x 0 . Wir definieren eine Folge ( f k )k∈N reellwertiger Funktionen durch f k (t) = f (t, x k ) für alle t ∈ Rm und k ∈ N. Außerdem sei f0 (t) = f (t, x 0 ). Auf Grund der Voraussetzung (iii) konvergiert ( f k )k∈N fast überall punktweise gegen f . Wegen (i) ist die Folge in L (Rn ) enthalten, und wegen (ii) gilt f k ≤ g fast überall, für jedes k ∈ N. Nach dem Satz über die majorisierte Konvergenz gilt somit Z Z Z lim F (x k ) k→∞ = f (t, x k ) d t lim k→∞ = Rm = Z f k (t) d t lim k→∞ f (t, x 0 ) d t Rm = = f0 (t) d t lim k→∞ Rm F (x 0 ). Rm Damit ist die Stetigkeit von F in x 0 bewiesen. —– 66 —– Für den folgenden Satz legen wir die folgende Notation fest: Ist V ⊆ Rn eine offene Teilmenge und f : Rm × V → R eine Funktion, dann bezeichnen wir für jeden Punkt (t, x) = (t 1 , ..., t m , x 1 , ..., x n ) und jedes j mit 1 ≤ j ≤ n durch ∂ j f (t, x) die partielle Ableitung von f nach der Variablen x j , sofern diese existiert. (5.20) Satz Sei V ⊆ Rn offen und f : Rm × V → R eine Funktion. Wir setzen voraus, dass f für ein j ∈ {1, ..., n} die folgenden Eigenschaften besitzt. (i) Für alle x ∈ V ist die Funktion Rm → R, t 7→ f (t, x) Lebesgue-integrierbar. (ii) Es gibt eine Nullmenge N ⊆ Rm und eine nicht-negative, Lebesgue-integrierbare Funktion g auf Rm , so dass ∂ j f (t, x) für alle t ∈ Rm \ N und alle x ∈ V existiert und die Abschätzung |∂ j f (t, x)| ≤ g(t) erfüllt ist. Z Dann ist die Funktion F (x) = f (t, x) d t nach x j partiell differenzierbar, und es gilt Rm ∂F ∂ xj (x) = Z ∂ j f (t, x) d t für alle x ∈ V. Rm Sei x 0 ∈ V und r ∈ R+ so gewählt, dass die offene Kugel vom Radius r um x 0 bezüglich der Maximums- Beweis: norm ganz in V enthalten ist. Sei (hk )k∈N eine Folge reeller Zahlen mit 0 < |hk | < r für alle k ∈ N und limk hk = 0. Für jedes k ∈ N definieren wir eine reellwertige Funktion f k auf Rm durch f k (t) = 1 hk f (t, x 0 + hk e j ) − f (t, x 0 ) , wobei e j ∈ Rn den j-ten Einheitsvektor bezeichnet. Wegen (i) ist jedes f k in L (Rm ) enthalten. Nach Definition der partiellen Ableitung ∂ j f und auf Grund der Voraussetzung (ii) konvergiert f k (t) außerdem für alle t ∈ Rm \ N gegen ∂ j f (t, x 0 ). Nach dem Mittelwertsatz der Differentialrechnung existiert für alle t ∈ Rm \ N jeweils ein θ t,k ∈ R mit 0 < θ t,k < 1 und f k (t) = ∂ j f (t, x 0 + θ t,k hk e j ). Daraus folgt | f k (t)| ≤ g(t) für alle t ∈ Rm \ N . Ingesamt ist damit der Satz über die majorisierte Konvergenz anwendbar. Demnach ist die Funktion t 7→ ∂ j f (t, x 0 ) in L (Rm ) enthalten, außerdem gilt Z ∂ j f (t, x 0 ) d t = Rm = Z f k (t) d t lim k→∞ lim = Rm k→∞ 1 hk lim k→∞ 1 Z hk F (x 0 + hk e j ) − F (x 0 ) —– 67 —– f (t, x 0 + hk e j ) d t − Rm = Z Rm ∂F ∂ xj (x 0 ). f (t, x 0 ) d t Literaturverzeichnis [Ba] M. Barner, F. Flor, Analysis II. de Gruyter Lehrbuch. [Fo] O. Forster, Analysis 3. vieweg studium - Grundkurs Mathematik. [He] H. Heuser, Lehrbuch der Analysis, Teil 2. Teubner-Verlag. [Kö] K. Königsberger, Analysis 2. Springer-Verlag.
© Copyright 2024 ExpyDoc