Ralf Gerkmann Mathematisches Institut Ludwig-Maximilians-Universität München Lebesguetheorie, Funktionentheorie und Gewöhnliche Differentialgleichungen (Version vom 25. Juli 2015) Inhaltsverzeichnis .................. 3 ................... 13 § 1. Integration auf Jordan-messbaren Mengen § 2. Die mehrdimensionale Substitutionsregel ................. 22 ..................... 31 § 5. Das Lebesgue-Integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 § 6. Reelle und komplexe Differenzierbarkeit .................... 56 § 7. Komplexe Potenzreihen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 § 8. Komplexe Kurvenintegrale und Cauchyscher Integralsatz ........ 67 .......................... 77 § 3. Kurvenintegrale und Greenscher Integralsatz § 4. Die Integralsätze von Gauß und Stokes § 9. Die Cauchysche Integralformel ............... 82 ................................ 90 .................................... 97 § 10. Anwendungen der Cauchyschen Integralformel § 11. Isolierte Singularitäten § 12. Der Residuensatz § 13. Der Existenz- und Eindeutigkeitssatz für gewöhnliche DGL . . . . . . . 103 § 14. Elementare Lösungsmethoden . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 § 15. Systeme linearer Differentialgleichungen . . . . . . . . . . . . . . . . . . . . 116 Literatur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131 § 1. Integration auf Jordan-messbaren Mengen Bevor wir die Integrationstheorie fortsetzen, wiederholen wir zunächst einige Bezeichnungen und Grundlagen aus dem vorherigen Semester. Sei Q ⊆ Rn ein kompakter Quader und f : Q → R eine beschränkte Funktion. Jeder Zerlegung Z des Quaders Q haben wir eine Menge Q(Z ) von kompakten Teilquadern K ⊆ Q zugeordnet, die sich gegenseitig höchstens in den Seitenflächen schneiden. Für jedes K ∈ Q(Z ) sei c K−, f = inf{ f (x) | x ∈ K } und c K+, f = sup{ f (x) | x ∈ K }. Dann haben wir S f− (Z ) = X K ∈Q(Z ) c K−, f v(K ) S f+ (Z ) = bzw. X K ∈Q(Z ) c K+, f v(K ) die Unter- bzw. Obersumme von f bezüglich Z genannt. Das Supremum über alle Untersummen (bezüglich beliebiger Zerlegungen) ist das Unterintegral von f . Das Infimum über alle Obersummen haben wir als Oberintegral von f bezeichnet. Die Funktion f haben wir Riemann-integrierbar genannt, wenn Unterund Oberintegral übereinistmmen, und das Riemann-Integral in diesem Fall durch Z Z F Z f (x) d x Q = f (x) d x QF f (x) d x = definiert. Q Wir haben gezeigt, dass eine Funktion f : Q → R genau dann Riemann-integrierbar ist, wenn ihre Unstetigkeitsstellen in Q eine Nullmenge (s.u.) bilden. Insbesondere ist also jede stetige Funktion Riemannintegrierbar. Im eindimensionalen Fall lassen sich Riemann-Integrale am einfachsten mit Hilfe des Hauptsatzes der Differential- und Integralrechnung, also durch die Bildung von Stammfunktionen, bestimmen. Im Mehrdimensionalen Fall ist das wichtigste Hilfsmittel der Satz von Fubini. Dieser besagt: Sind P ⊆ Rm und Q ⊆ Rn kompakte Quader, und ist f : P ×Q → R eine Riemann-integrierbare Funktion auf P ×Q ⊆ Rm+n , dann gilt ¶ Z Z µZ f (x, y) d (x, y) = f (x, y) d y d x. P ×Q QF P Darin eingeschlossen ist die Aussage, dass es sich bei x 7→ bare Funktion handelt. R QF f (x, y) d y um eine auf P Riemann-integrier- Eine Teilmenge N ⊆ Rn haben wir als Nullmenge bezeichnet, wenn für jedes ε ∈ R+ eine abzählbare FamiP S lie (Q m )m∈N von kompaktern Quadern mit m∈N Q m ⊇ N und ∞ m=1 v(Q m ) < ε existiert. Findet man sogar eine endliche Familie von Quadern mit diesen beiden Eigenschafte, dann spricht man von einer Jordanschen Nullmenge. Beide Definitionen bleiben unverändert, wenn man die kompakten Quader durch offene Quader ersetzt. Sei A eine beschränkte Teilmenge von Rn und Q ein kompakter Quader mit Q ⊇ A. Wir haben A als Jordanmessbar bezeichnet, wenn die charakterische Funktion χ A : Q → {0, 1} von A auf Q Riemann-integrierbar R ist. Das Integral v(A) = Q χ A (x) d x wurde in diesem Fall das Jordansche Volumen von A genannt. Sowohl —– 3 —– § 1. Integration auf Jordan-messbaren Mengen die Jordan-Messbarkeit als auch der Wert v(A) sind von der Wahl des Quaders Q unabhängig. Für Jordanmessbare Teilmengen A, B ⊆ Rn haben wir die Implikation A ⊆ B ⇒ v(A) ≤ v(B ) und die Gleichung v(A ∪ B ) = v(A) + v(B ) − v(A ∩ B ) hergeleitet. Wir erinnern außerdem an den Satz 1.1 Für eine beschränkte Teilmenge A ⊆ Rn sind folgende Aussagen äquivalent. (i) Die Menge A ist Jordan-messbar. (ii) Inneres und äußeres Volumen von A stimmen überein. (iii) Der Rand ∂A von A ist eine Nullmenge in Rn . Sind diese Bedinungen erfüllt, dann ist v(A) gleich dem inneren (oder äußeren) Volumen von A. Dabei wurde das äußere Volumen dadurch definiert, dass man A durch endliche Vereinigungen kompakter Quader überdeckt und das innere Volumen dadurch, dass man A durch endliche Vereinigungen disjunkter (!) kompakter Quader ausschöpft. Wir notieren noch zwei weitere wichtige Eigenschaften des Jordanschen Volumens. Ist A ⊆ Rn eine beliebige Teilmenge, u ∈ Rn und r ∈ R+ , dann setzen wir u + A = {u + x | x ∈ A} und rA = {r x | x ∈ A}. Satz 1.2 Sei A ⊆ Rn eine Jordan-messbare Teilmenge. (i) (Translationsinvarianz) Für jedes u ∈ Rn ist auch u + A Jordan-messbar, und es gilt v(u + A) = v(A). (ii) (Skalierungseigenschaft) Für jedes r ∈ R+ ist auch r A Jordan-messbar, und es gilt v(r A) = r n v(A). Beweis: Für den Beweis von (i) genügt es wegen Satz (1.1) zu zeigen, dass inneres und äußeres Volumen von A und u + A übereinstimmen. Sei ε ∈ R+ vorgegeben. Nach Definition des inneren Volumens gibt es Pp eine endliche Familie disjunkter, kompakter Quader Q 1 , ...,Q p mit den Eigenschaften i =1 v(Q i ) > v − (A)−ε Sp und i =1 Q i ⊆ A. Definieren wir nun Q̃ i = u + Q i für 1 ≤ i ≤ p, dann gilt jeweils v(Q i ) = v(Q̃ i ). Es folgt Pp Sp Q̃ ⊆ (u + A) und i =1 v(Q̃ i ) > v − (A) − ε. Wir erhalten v − (u + A) ≥ v − (A) − ε, und weil ε ∈ R+ beliebig i =1 i vorgegeben war, folgt daraus v − (u + A) ≥ v − (A). Durch Vertauschung der Rollen von A und u + A erhält man v − (A) ≥ v − (u + A), insgesamt also Gleichhheit. Die Übereinstimmung v + (A) = v + (u + A) beweist man nach demselben Schema. Ebenso kann die Aussage (ii) auf die Gleichung v(r Q) = r n v(Q) für kompakte Quader Q ⊆ Rn zurückgeführt werden. ä —– 4 —– § 1. Integration auf Jordan-messbaren Mengen Satz 1.3 Eine Teilmenge A ⊆ Rn ist genau dann eine Jordansche Nullmenge, wenn A Jordan-messbar und v(A) = 0 ist. Beweis: „⇒“ Setzen wir voraus, dass A eine Jordansche Nullmenge ist, und beweisen wir zunächst die Jordan-Messbarkeit von A. Dazu zeigen wir, dass es sich beim Rand ∂A von A um eine Nullmenge handelt. Ist ε ∈ R+ vorgegeben, dann existiert auf Grund der Voraussetzung ein p ∈ N und eine Familie Q 1 , ...,Q p Pp Sp Sp von kompakten Quadern mit i =1 Q i ⊇ A und i =1 v(Q i ) < ε. Weil die Menge B = i =1 Q i abgeschlossen ist, ist ∂A vollständig in B enthalten. Denn für jedes x ∈ ∂A existiert nach Definition eines in A liegende Folge (x n )n∈N mit limn x n = x. Diese ist dann auch in B enthalten, und auf Grund der Abgeschlossenheit Pp gilt dasselbe für ihren Grenzwert x. Aus ∂A ⊆ B und i =1 v(Q i ) < ε folgt, dass ∂A sogar eine Jordansche Nullmenge ist. Beweisen wir nun die Gleichung v(A) = 0. Auf Grund der Jordan-Messbarkeit existiert ein kompakter Quader Q ⊆ Rn mit Q ⊆ A. Nach Definition des Jordan-Volumens gilt Z v(A) = χ A (x) d x. Q Sei wiederum ε ∈ R+ vorgegeben und Q 1 , ...,Q p eine Folge kompakter Quader mit den beiden Eigenschaften Pp Sp Q ⊇ A und i =1 v(Q i ) < ε. Nach eventueller Vergrößerung von Q können wir Q i ⊆ Q für 1 ≤ i ≤ p i =1 i voraussetzen. Sei nun eine Zerlegung Z von Q so gewählt, dass jeder der Quader Q i als Vereinigung der Quader aus Q(Z ) dargestellt werden kann. Setzen wir K = {K ∈ Q(Z ) | K ∩ Q i 6= ∅ für ein i }, dann gilt c K+,χ ∈ {0, 1} für alle K ∈ Q(Z ), und c K+,χ = 1 ist nur für K ∈ K möglich. Schätzen wir nun das Integral von A A χ A durch die Obersumme bezüglich Z ab, so erhalten wir v(A) X ≤ K ∈Q(Z ) c K+,χ A v(K ) = X v(K ) ≤ K ∈K p X v(Q i ) < ε. i =1 Dabei wurde im vorletzten Schritt verwendet, dass jedes K ∈ K in einem der Quader Q i enthalten ist. Da ε beliebig vorgeben war, folgt aus der Ungleichung insgesamt v(A) = 0. „⇐“ Sei Q ein kompakter Quader mit Q ⊇ A und ε ∈ R+ beliebig vorgegeben. Nach Voraussetzung gilt Z F Q χ A (x) d x Z = Q χ A (x) d x = v(A) = 0. P Nach Definition des Oberintegrals existiert eine Zerlegung Z von Q mit K ∈Q(Z ) c K+,χ v(K ) < ε. Setzen A S wir K = {K ∈ Q(Z ) | K ∩ A 6= ∅}, dann gilt K ∈K K ⊇ A. Außerdem ist c K+,χ = 1 jeweils äquivalent zu A P P K ∈ K , und somit gilt K ∈K v(K ) = K ∈Q(Z ) c K+,χ v(K ) < ε. Damit ist bewiesen, dass es sich bei A um eine A Jordansche Nullmenge handelt. ä Wir verallgemeinern nun den Begriff der Riemann-Integrierbarkeit auf Funktionen, deren Definitionsbereiche keine Quader sind. —– 5 —– § 1. Integration auf Jordan-messbaren Mengen Definition 1.4 Sei A ⊆ Rn eine Jordan-messbare Menge und Q ⊆ Rn ein kompakter Quader mit Q ◦ ⊇ A. Eine Funktion f : A → R wird Riemann-integrierbar auf A genannt, wenn durch f (x) falls x ∈ A fQ : Q −→ R , x 7→ 0 falls x ∈ Q \ A eine Riemann-integrierbare Funktion auf Q definiert ist. In diesem Fall ist das RiemannR R Integral von f auf A definiert durch A f (x) d x = Q fQ (x) d x. Wie bei den Jordan-messbaren Mengen zeigt man, dass sowohl die Integrierbarkeitseigenschaft als auch das Integral unabhängig von der Wahl des Quaders Q sind. Ebenso wie für Funktionen auf Quadern gilt auch hier Satz 1.5 Sei A ⊆ Rn Jordan-messbar. Eine beschränkte Funktion f : A → R ist genau dann Riemann-integrierbar, wenn die Unstetigkeitsstellen von f eine Nullmenge in A bilden. Beweis: Sei Q ein kompakter Quader im Rn mit Q ◦ ⊇ A, und sei fQ wie in Def. (1.4). Nach Definition ist f genau dann Riemann-integrierbar, wenn die Unstetigkeitsstellen von fQ eine Nullmenge in Q bilden. Sei U A ⊆ A die Menge der Unstetigkeitsstellen von f und UQ ⊆ Q die Menge der Unstetigkeitsstellen von fQ . Wir müssen zeigen, dass U A genau dann eine Nullmenge ist, wenn dies für UQ zutrifft. Die Inklusion U A ⊆ UQ ist offensichtlich; wir zeigen, dass außerdem UQ ⊆ U A ∪ (∂A) gilt. Nehmen wir dazu an, dass a eine Unstetigkeitsstelle von fQ ist, der Punkt a aber andererseits nicht in U A liegt. Dann gilt entweder a ∉ A, oder es gilt a ∈ A und die Funktion f ist in a stetig. Im ersten Fall ist a ein Randpunkt von A, denn ansonsten wäre fQ in einer Umgebung von A konstant 0 und damit in a stetig. Auch im zweiten Fall muss a ein Randpunkt sein, denn sonst würden fQ und f A in einer Umgebung von a übereinstimmen, und auch daraus würde sich die Stetigkeit von fQ in a ergeben. Nun beweisen wir die im ersten Absatz formulierte Äquivalenz. Auf Grund der Jordan-Messbarkeit von A ist ∂A eine Nullmenge. Ist nun U A eine Nullmenge, dann gilt dasselbe für U A ∪ (∂A) und somit auch für UQ . Ist umgekehrt UQ eine Nullmenge, dann muss dies wegen U A ⊆ UQ auch für U A gelten. ä —– 6 —– § 1. Integration auf Jordan-messbaren Mengen (Mittelwertsatz der Integralrechnung) Satz 1.6 Sei A ⊆ Rn eine nichtleere, Jordan-messbare Menge, f : A → R Riemann-integrierbar, außerdem m − = inf{ f (x) | x ∈ A} und m + = sup{ f (x) | x ∈ A}. Dann gilt Z m − v(A) ≤ f (x) d x ≤ m + v(A). A Beweis: Sei Q ⊆ Rn ein kompakter Quader mit Q ⊇ A. Wegen m − ≤ f (x) ≤ m + für alle x ∈ A gilt auch m − χ A (x) ≤ fQ (x) ≤ m + χ A (x) für alle x ∈ A. Nach Definition des Jordan-Volumens folgt daraus Z m − v(A) = m− Q χ A (x) d x Z ≤ Wegen R A f (x) d x = R Q f Q (x) d x Q Z = m + χ A (x) d x Q m − χ A (x) d x Z ≤ Q fQ (x) d x m + v(A). = folgt daraus unmittelbar die Behauptung. ä Ist f : B → R eine Riemann-integrierbare Funktion und A ⊆ B eine Jordansche Teilmenge, dann schreiben R R wir an Stelle von A ( f | A )(x) d x auch einfach A f (x) d x, vorausgesetzt natürlich, dass das Integral definiert ist. Wie der folgende Satz zeigt, ist dies tatsächlich immer der Fall. Satz 1.7 (Rechenregeln für Riemann-integrierbare Funktionen) Seien A, B ⊆ Rn Jordan-messbare Teilmengen. (i) Ist f : B → R Riemann-integrierbar und A ⊆ B , dann ist f | A Riemann-integrierbar. (ii) Sei f : A ∪ B → R eine Funktion mit der Eigenschaft, dass f | A und f |B auf ihren jeweiligen Definitionsbereichen A und B Riemann-integrierbar sind. Dann ist f Riemann-integrierbar, und es gilt Z Z Z Z f (x) d x = f (x) d x + f (x) d x − f (x) d x. A∪B A B A∩B (iii) Ist N ⊆ R eine Jordansche Nullmenge und f : N → R eine beschränkte Funktion, R dann ist f Riemann-integrierbar, und es gilt N f (x) d x = 0. Beweis: zu (i) Seien UB ,U A die Mengen der Unstetigkeitsstellen von f bzw. f | A . Dann gilt U A ⊆ UB , und mit UB ist auch U A eine Jordansche Nullmenge. zu (ii) Seien U A ,UB ,UC ⊆ A ∪B die Unstetigkeitsstellen von f | A , f |B und f . Dann gilt UC ⊆ U A ∪UB ∪(∂A)∪ (∂B ). Sei nämlich x ∈ UC vorgegeben, und nehmen wir o.B.d.A. an, dass x in A liegt. Ist x kein Randpunkt —– 7 —– § 1. Integration auf Jordan-messbaren Mengen von A, dann liegt eine Umgebung von x vollständig von A, und aus der Unstetigkeit von f folgt x ∈ U A . Die Inklusion zeigt, dass UC eine Nullmenge ist, und damit ist f nach Satz (1.5) eine Riemann-integrierbare Funktion. Für den Beweis der Integralgleichung wählen wir einen kompakten Quader Q mit Q ⊇ A ∪ B und betrachten zunächst den Fall A ∩ B = ∅. Es gilt dann fQ = fQ χ A + fQ χB , und daraus folgt Z Z Z Z f (x) d x + f (x) d x = fQ (x)χ A (x) d x + fQ (x)χB (x) d x = A Z Q B ¡ Q Q Z ¢ fQ (x)χ A (x) + fQ (x)χB (x) d x = Z Q fQ (x) d x f (x) d x. = A∪B Betrachten wir nun den Fall A ∩ B 6= ∅. In diesem Fall können wir A ∪ B disjunkt zerlegen in die Jordanmessbaren Mengen A \ B , B \ A und A ∩ B . Der bereits bewiesene Fall liefert Z Z Z Z f (x) d x = f (x) d x + f (x) d x + f (x) d x. A∪B A\B B \A A∩B Durch die Zerlegungen A = (A \ B ) ∪ (A ∩ B ) und B = (B \ A) ∪ (A ∩ B ) erhalten wir aber auch Z Z Z Z Z Z f (x) d x = f (x) d x + f (x) d x und f (x) d x = f (x) d x + f (x) d x. A A\B A∩B B B \A Durch Einsetzen ergibt sich damit insgesamt µZ ¶ µZ Z Z Z f (x) d x = f (x) d x − f (x) d x + f (x) d x − A∪B A A∩B B Z = Z A f (x) d x + B A∩B ¶ Z f (x) d x + A∩B f (x) d x A∩B Z f (x) d x − f (x) d x. A∩B zu (iii) Die Riemann-Integrierbarkeit von f folgt direkt aus Satz (1.5). Die Aussage über das Integral erhält man durch Satz (1.3) und Satz (1.6). Ersterer liefert nämlich v(N ) = 0, und definiert man nämlich m − und m + wie im Mittelwertsatz angegeben, dann erhält man Z 0 = m − v(N ) ≤ f (x) d x ≤ m + v(N ) = 0. ä N R R R Einen wichtiger Spezialfall von Satz (1.7) (ii) ist die Gleichung A∪B f (x) d x = A f (x) d x + B f (x) d x für disjunkte Jordan-messbare Teilmengen A, B ⊆ Rn . Auch aus Teil (iii) des Satzes ziehen wir eine wichtige Konsequenz. Satz 1.8 (Vernachlässigung Jordanscher Nullmengen) Sei B ⊆ Rn eine Jordan-messbare Menge und g : B → R eine Riemann-integrierbare Funktion. Sei N ⊆ B eine Jordansche Nullmenge und N = B \ A. Sei f : B → R eine beschränkte Funktion mit f | A = g | A . Dann ist f auf B Riemann-integrierbar, und es gilt Z Z f (x) d x = g (x) d x. B B —– 8 —– § 1. Integration auf Jordan-messbaren Mengen Beweis: Wegen f | A = g | A und Satz (1.7) (i) ist f | A Riemann-integrierbar, und aus Teil (iii) folgt die RiemannIntegrierbarkeit von f |N . Wegen B = A ∪ N und Teil (ii) ist f damit auf B Riemann-integrierbar. Die Gleichheit der Integrale ergibt sich aus der Rechnung Z Z Z Z Z f (x) d x = f (x) d x + f (x) d x = f (x) d x = g (x) d x B A N Z = A Z A g (x) d x + A Z g (x) d x = N g (x) d x. B ä Sei A ⊆ Rn eine beliebige Teilmenge. Für jede Funktion f : A → R nennt man Γ( f ) = {(x, f (x)) ∈ A × R} ⊆ Rn+1 den Graphen von f . Gilt außerdem f (x) ≥ 0 für alle x ∈ A, dann wird © ª Λ( f ) = (x, y) ∈ A × R | 0 ≤ y ≤ f (x) ⊆ Rn+1 die Ordinatenmenge von f genannt. Proposition 1.9 Sei A ⊆ Rn Jordan-messbar und f : A → R eine Riemann-integrierbare Funktion. Dann ist der Graph Γ( f ) eine Jordansche Nullmenge in Rn . Beweis: Sei Q ⊆ Rn ein kompakter Quader mit Q ◦ ⊇ A. Nach Voraussetzung ist fQ Riemann-integrierbar, und wegen Γ( f ) ⊆ Γ( fQ ) genügt es zu zeigen, dass Γ( fQ ) eine Jordansche Nullmenge ist. Sei dafür ε ∈ R+ vorgegeben. Auf Grund der Riemann-Integrierbarkeit von fQ gibt es eine Zerlegung Z von Q mit v = S f+ (Z ) − S f− (Z ) < ε. Dabei ist der Graph Γ( fQ ) wegen c K−, f ≤ fQ (x) ≤ c K+, f für alle K ∈ Q(Z ) und x ∈ K in Q Q der Vereinigungsmenge ´ [ ³ V = K × [c K−, fQ , c K+, fQ ] K ∈Q(Z ) vom Volumen v enthalten. Die Werte c K−, f und c K+, f fallen möglicherweise zusammen, deshalb ist V im Q Q allgemeinen keine Vereinigungsmenge von kompakten Quadern. Wir können aber reelle Zahlen c K− ≤ c K−, f ¡ ¢ S und c K+ ≥ c K+, f so wählen, dass c K− < c K+ ist und das Volumen von Ṽ = K ∈Q(Z ) K × [c K− , c K+ ] weiterhin kleiner als ε ist. Wegen Γ( fQ ) ⊆ Ṽ folgt daraus, dass Γ( fQ ) eine Jordansche Nullmenge ist. Satz 1.10 (Zusammenhang zwischen Jordan-Volumen und Riemannschem Integral) Sei A ⊆ Rn Jordan-messbar und f : A → R+ eine nicht-negative, Riemann-integrierbare Funktion. Dann ist die Ordinatenmenge Λ( f ) Jordan-messbar, und es gilt Z v(Λ( f )) = f (x) d x. A —– 9 —– ä § 1. Integration auf Jordan-messbaren Mengen Beweis: Beweisen wir zunächst die Jordan-Messbarkeit von Λ( f ). Dazu müssen wir zeigen, dass ∂Λ( f ) eine Nullmenge ist. Sei Q ein kompakter Quader mit Q ⊇ A ∪ (∂A), U A die Menge der Unstetigkeitsstellen von f und c = sup{ f (x) | x ∈ A}. Wir zeigen zunächst, dass (x, y) ∈ Rn × R in den folgenden beiden Fällen kein Randpunkt von Λ( f ) ist. (i) x ∉ A ∪ (∂A) © ª (ii) x ∈ A \ ((∂A) ∪U A ) und y ∉ 0, f (x) (iii) y ∉ [0, c] ¤ £ Im Fall (i) gibt es eine Umgebung U von x mit U ∩ A = ;, und folglich ist U × y − ε, y + ε für beliebiges ε ∈ R+ eine Umgebung von (x, y), die Λ( f ) nicht schneidet. Im Fall (ii) verwenden wir, dass f im Punkt x stetig ist. Ist y > f (x) und m = 21 (y − f (x)), so existiert nach dem ε-δ-Kriterium eine Umgebung U von x mit ¤ £ f (x 0 ) < y − m für alle x 0 ∈ U , und somit ist U × y − m, y + m eine Umgebung von (x, y), die mit Λ( f ) leeren Durchschnitt hat. Im Fall 0 < y < f (x) setzen wir m = 21 min{|y|, f (x) − y} und erhalten eine Umgebung U ¤ £ von x, so dass f (x 0 ) > y + m für alle x 0 ∈ U gilt und U × y − m, y + m somit vollständig in Λ( f ) enthalten ¤ £ ist. Ist schließlich y < 0, dann können wir eine beliebige Umgebung U von x wählen, und U × 2y, 0 hat mit Λ( f ) leeren Schnitt. Genauso behandelt man auch den Fall (iii). Insgesamt erhalten wir damit die Inklusion ∂Λ( f ) ⊆ M ∪N ∪P ∪Γ( f ), wobei die Teilmengen auf der rechten Seite folgendermaßen definiert sind. M N P = {(x, y) | x ∈ ∂A, 0 ≤ y ≤ c} = A × {0} = {(x, y) | x ∈ U A , 0 ≤ y ≤ c} Sei nämlich (x, y) ∈ ∂Λ( f ) vorgegeben. Nach (i) gilt dann x ∈ A ∪ (∂A). Ist x ∈ A \U A , dann folgt y ∈ {0, f (x)} nach (ii) und somit (x, y) ∈ N oder (x, y) ∈ Γ( f ). Im Fall x ∈ U A erhalten wir y ∈ [0, c] nach (iii) und somit (x, y) ∈ P . Ist schließlich x ∈ ∂A, dann gilt ebenfalls y ∈ [0, c] und somit (x, y) ∈ M . Es genügt also zu zeigen, dass jede der Mengen M , N , P und Γ( f ) eine Nullmenge ist. Für Γ( f ) wurde dies in Prop. (1.9) gezeigt. Nach dem Lebesgueschen Integrabilitätskriterium ist U A eine Nullmenge in Rn , und da A Jordan-messbar ist, gilt dasselbe für ∂A. Für M und P folgt die Nullmengen-Eigenschaft nun aus der allgemeinen Beobachtung, dass B × [0, c] eine Nullmenge in Rn+1 ist, wenn B eine Nullmenge in Rn S ist. Ist nämlich ε ∈ R+ vorgegeben, dann existiert eine Familie (Q m )m∈N von Quadern mit ∞ m=1 Q m ⊇ B P S∞ ε . Setzen wir Q̃ = Q × [0, c] für alle m ∈ N , dann folgt Q̃ ⊇ B × [0, c] und und ∞ µ(Q ) < m m m m=1 m c P∞ m=1 + m=1 µ(Q̃ m ) < ε. Schließlich ist auch N eine Nullmenge, denn für jedes ε ∈ R ist Q̃ = Q ×[−ε, ε] ein Quader mit µ(Q̃) = 2εµ(Q), der N überdeckt. Damit ist der Nachweis der Jordan-Messbarkeit von Λ( f ) abgeschlossen. —– 10 —– § 1. Integration auf Jordan-messbaren Mengen Nun beweisen wir noch die angegebene Übereinstimmung zwischen Volumen und Integral. Für jedes x, y ∈ Q × [0, c] gilt χΛ( f ) (x, y) = 1 genau dann, wenn x ∈ A und 0 ≤ y ≤ f (x) gilt, was wiederum zu y ∈ [0, fQ (x)] äquivalent ist. Nach Definition des Jordan-Volumens und dem Satz von Fubini gilt also ¶ Z Z µZ c v(Λ( f )) = χΛ( f ) (x, y)d (x, y) = χΛ( f ) (x, y)d y d x = Q×[0,c] fQ (x) Z µZ Q Q ¶ 1 dy dx 0 0 Z = Q Z fQ (x) d x f (x) d x. = A ä Als Anwendungsbeispiel für den soeben bewiesenen Satz betrachten wir die obere Halbkugel im R3 gegeben durch © ª H = (x, y, z) ∈ R3 | z ≥ 0, x 2 + y 2 + z 2 ≤ 1 . p Für alle (x, y, z) ∈ R3 ist (x, y, z) ∈ H äquivalent zu x 2 + y 2 ≤ 1 und 0 ≤ z ≤ 1 − x 2 − y 2 . Für die Funktion p f auf dem Vollkreis K = {(x, y) ∈ R2 | x 2 + y 2 ≤ 1} gegeben durch f (x, y) = 1 − x 2 − y 2 gilt also Λ( f ) = H . Der Satz von oben ermöglicht es also, dass Volumen der Halbkugel durch ein zweidimensionales Integral auszudrücken: Z v(H ) = f (x, y) d (x, y) K Wir formulieren noch eine weitere Möglichkeit, das Volumen von zwei- oder mehrdimensionalen Objekten zu berechnen. Zur besseren Unterscheidung bezeichnen wir für jedes n ∈ N das Jordansche Volumen einer Jordan-messbaren Teilmenge A ⊆ Rn+1 mit v n (A). (Cavalierisches Prinzip) Satz 1.11 Sei n ∈ N, außerdem A ⊆ Rn+1 eine Jordan-messbare Menge, und seien a, b ∈ R mit a < b so gewählt, dass für die erste Koordinate x 1 jedes Punktes x ∈ A jeweils a ≤ x 1 ≤ b gilt. © ª Für jedes x 1 ∈ [a, b] bezeichnen wir A(x 1 ) = y ∈ Rn | (x 1 , y) ∈ A als vertikalen Schnitt durch A. Ist diese Menge A(x 1 ) Jordan-messbar für jedes x 1 ∈ [a, b], dann gilt Z v n+1 (A) = b a v n (A(x 1 )) d x 1 . Beweis: Sei Q ⊆ Rn so gewählt, dass A ⊆ [a, b] × Q gilt. Dann gilt insbesondere A(x 1 ) ⊆ Q für jedes x 1 ∈ [a, b]. Für jeden Punkt x = (x 1 , ..., x n+1 ) ∈ Rn+1 gilt χ A (x) = χ A(x1 ) (x 2 , ..., x n+1 ), denn x ∈ A ist äquivalent zu (x 2 , ..., x n+1 ) ∈ A(x 1 ). Mit dem Satz von Fubini und auf Grund der Definition des Jordanschen Volumens erhalten wir ¶ Z Z b µZ v n+1 (A) = χ A (x) d x = χ A (x 1 , ..., x n+1 ) d (x 2 , ..., x n+1 ) d x 1 [a,b]×Q Z b µZ = a Q a Q ¶ χ A(x1 ) (x 2 , ..., x n+1 ) d (x 2 , ..., x n+1 ) d x 1 —– 11 —– Z = b a v n (A(x 1 )) d x 1 . ä § 1. Integration auf Jordan-messbaren Mengen Wenden wir das Cavalierische Prinzip an, um ein weiteres Mal das Volumen der Einheitskugel B © = (x, y, z) ∈ R3 | x 2 + y 2 + z 2 ≤ 1 ª zu bestimmen. Für z ∉ [−1, 1] gilt B (z) = ∅ und folglich v 2 (B (z)) = 0. Für beliebige z ∈ ]−1, 1[ und (x, y) ∈ R2 gilt die Äquivalenz (x, y) ∈ B (z) ⇔ (x, y, z) ∈ B ⇔ x2 + y 2 + z2 ≤ 1 ⇔ x 2 + y 2 ≤ 1 − z 2. ⇔ K p1−z 2 , also B (z) = K p1−z 2 , wobei K r ⊆ R2 jeweils den Vollkreis vom Radius r um den Nullpunkt (0, 0) bezeichnet. Ebenso leicht zeigt man B (−1) = B (1) = { (0, 0) }. Wir setzen als bekannt voraus, dass die Vollkugel Jordanmessbar ist und ebenso, dass v 2 ( {p} ) = 0 für alle p ∈ R2 und v 2 (K r ) = πr 2 für alle r ∈ R+ gilt. Durch das Cavalierischen Prinzip erhalten wir dann Z v 3 (B ) = 1 −1 Z v 2 (B (z)) d z = 1 −1 π(1 − z 2 ) d z = £ ¤ 1 π(z − 13 z 3 ) −1 = 2 2 3 π − (− 3 )π = 4 3 π. Mit Satz (1.2) erhält man darüber hinaus das Jordansche Volumen 43 πr 3 für jede Vollkugel vom Radius r im dreidimensionalen Raum. —– 12 —– § 2. Die mehrdimensionale Substitutionsregel Wir beginnen mit der Wiederholung der Substitutionsregel aus der Integrationstheorie einer Variablen. Sei J ⊆ R ein offenes Intervall und u : J → R eine stetig differenzierbare Funktion. Seien a, b ∈ J mit a < b und f : u([a, b]) → R eine stetige Funktion. Dann besagt die eindimensionale Substitutionsregel, dass Z b a Z ( f ◦ u)(t )u 0 (t ) d t u(b) f (x) d x = gilt. u(a) Wir übertragen diese Regel in eine Form, die sich leichter verallgemeinern lässt und beschränken uns dafür auf den Fall, dass u 0 (t ) 6= 0 für alle t ∈ ]a, b[ gilt. Auf Grund des Zwischenwertsatzes nimmt die stetige Ableitung u 0 auf dem offenen Intervall ]a, b[ dann entweder nur positive oder nur negative Wert an. Setzen wir u 0 (t ) > 0 für a < t < b voraus, dann gilt nach dem Mittelwertsatz u(a) < u(b), nach dem Zwischenwertsatz außerdem u([a, b]) = [u(a), u(b)] und somit ingesamt Z Z 0 f (x) d x. (1) ( f ◦ u)(t )|u (t )| d t = u([a,b]) [a,b] Im Fall u 0 (t ) < 0 für a < t < b gilt entsprechend u(a) > u(b), außerdem u([a, b]) = [u(b), u(a)], also insgesamt Z Z b Z a ( f ◦ u)(t )|u 0 (t )| d t = f (u(t ))(−u 0 (t )) d t = f (u(t ))u 0 (t ) d t = a [a,b] Z b u(a) Z f (x) d x f (x) d x. = u(b) u([a,b]) Also ist die Gleichung (1) in jedem Fall erfüllt. Diese Form werden wir nun auf höhere Dimension übertragen. Hierbei wird die Determinante linearer Abbildungen eine wichtige Rolle spielen. Erinnern wir uns zunächst daran, wie in der Linearen Algebra die Definition der Determinantenfunktion det : Mn,K −→ K motiviert wurde. Gesucht war eine Funktion, die jeder Matrix A ∈ Mn,K das Volumen des Parallelotops P (A) ⊆ Rn zuordnet, das von den Spaltenvektoren der Matrix aufgespannt wird, zuzüglich eines Vorzeichens, das von der Reihenfolge der Vektoren abhing. Betrachten wir nun zur Matrix A die lineare Abbildung φ A : Rn → Rn , v 7→ Av und wenden wir diese auf den Einheitswürfel Q = [0, 1]n an, dann erhalten wir φ A (Q) = P (A) als Bildmenge, wie man mit Hilfe der Linearität von φ A unmittelbar überprüft. Unter der Voraussetzung, dass | det(A)| tatsächlich mit dem Jordanschen Volumen von P (A) übereinstimmt, gilt also v(φ A (Q)) = v(P (A)) = | det(A)| —– 13 —– = | det(φ A )|v(Q). (2) § 2. Die mehrdimensionale Substitutionsregel Aus der mehrdimensionalen Substitutionsregel wird sich ergeben, dass v(φ(B )) = | det(φ)|v(B ) für beliebige lineare Endomorphismen φ von Rn und Jordan-messbare Teilmengen B ⊆ Rn gültig ist. Hier aber setzen wir diese Gleichung voraus, um durch heuristische Überlegungen eine naheliegende, mehrdimensionale Verallgemeinerung der Substitutionsregel zu finden. Für jede Teilmenge D ⊆ Rn bezeichnen wir D̄ = D∪(∂D) als den Abschluss von D. Sei nun U ⊆ Rn offen und D eine Jordan-messbare Teilmenge von Rn mit D̄ ⊆ U . Außerdem sei u : U → Rn eine stetig differenzierbare Funktion. Diese Funktion wird die Rolle der Substitutionsfunktion von oben übernehmen. Der Einfachheit halber gehen wir zunächst davon aus, dass D ein kompakter Quader ist. Fur jede Zerlegung Z von D gilt dann [ u(D) = u(K ). K ∈Q(Z ) Sei nun f : u(D) → R eine stetige und beschränkte Funktion. Für jeden Quader K ∈ Q(Z ) in der Zerlegung sei a K ∈ K so gewählt, dass K = a K + K (0) mit K (0) = [0, `(1) ] × ... × [0, `(n) ] gilt, wobei `(1) , ..., `(n) ∈ R+ die K K K Seitenlängen des Quaders bezeichnen. Im zweidimensionalen Fall ist a K also die „linke untere Ecke“ des Rechtecks K . Auf Grund der Stetigkeit von f ist f auf den kleinen Mengen der Form u(K ) nahezu konstant. Bei hinreichend feiner Zerlegung erhalten wir also Z X f (x) d x ≈ f (u(a K ))v(u(K )). (3) u(D) K ∈Q(Z ) Versuchen wir nun, dass Volumen von u(K ) zu approximieren. Weil u (stetig) differenzierbar ist, kann es in einer Umgebung von a K durch eine affin-lineare Funktion angenähert werden: Für alle (t 1 , ..., t n ) ∈ K (0) gilt u(a K + (t 1 , ..., t n )) ≈ u(a K ) + u 0 (a K )(t 1 , ..., t n ). Für das Volumen von u(K ) erhalten wir also ¡ ¢ ¡ ¢ v (u(K )) ≈ v u(a K ) + u 0 (a K )(K (0) ) = v u 0 (a K )(K (0) ) = | det u 0 (a K )|v(K ) , wobei im letzten Schritt (2) verwendet wurde. Setzen wir dies nun in (3) ein, so erhalten wir Z Z X f (x) d x ≈ f (u(a K ))| det u 0 (a K )|v(K ) ≈ ( f ◦ u)(t )| det u 0 (t )| d t . u(D) D K ∈Q(Z ) Dies ist die gesuchte mehrdimensionale Verallgemeinerung von (1). Da jede Jordan-messbare Teilmenge durch disjunkte Vereinigungen kompakter Quader beliebig angenähert werden kann, ist zu erwarten, dass auch in der Gleichung der kompakte Quader D durch eine beliebige Jordan-messbare Menge ersetzbar ist. Satz 2.1 (mehrdimensionale Substitutionsregel) Sei U ⊆ Rn offen und u : U → Rn eine stetig differenzierbare Funktion. Sei D eine Jordan-messbare Menge mit D̄ ⊆ U , so dass u|D injektiv ist und det u 0 (t ) 6= 0 für alle t ∈ D gilt. Dann ist auch u(D) ⊆ Rn Jordan-messbar, und für jede stetige, beschränkte Funktion f : u(D) → R gilt Z Z f (x) d x = ( f ◦ u)(t )| det u 0 (t )| d t . u(D) D —– 14 —– § 2. Die mehrdimensionale Substitutionsregel Der Ausdurch det u 0 (t ) unter dem Integralzeichen wird üblicherweise die Funktionaldeterminante von u genannt. Wendet man die Gleichung auf die konstante Funktion f (x) = 1 an, so erhält man unter den angegebenen Voraussetzungen an U , u und D die Gleichung Z v(u(D)) = | det u 0 (t )| d t . D Ist u darüber hinaus eine bijektive, lineare Abbildung, dann gilt u 0 (t ) = u für alle t ∈ D, und wir erhalten die Gleichung v(u(D)) = | det u|v(D) zurück, die oben der Ausgangspunkt unserer Überlegungen gewesen war. Auch im Fall det u = 0 ist die Gleichung noch gültig, weil u(D) in diesem Fall in einer Hyperebene von Rn liegt und damit eine Nullmenge ist (siehe Übungen). Bevor wir nun Satz (2.1) beweisen, schauen wir uns einige Beispiele für häufig verwendet Transformationsfunktionen u an, die in der Geometrie und der Physik eine wichtige Rolle spielen. Integration in Polar-, Zylinder- und Kugelkoordinaten Im letzten Semester wurde die Polarkoordinaten-Abbildung ρ pol : R+ × R2 → R gegeben durch ρ pol (r, ϕ) = (r cos(ϕ), r sin(ϕ)) eingeführt. Die Ableitung dieser Funktion in einem beliebigen Punkt ist gegeben durch à ! cos(ϕ) −r sin(ϕ) 0 ρ pol (r, ϕ) = sin(ϕ) r cos(ϕ) mit der Funktionaldeterminante det ρ 0pol (r, ϕ) = r . Schränkt man ρ pol auf den Bereich U = R+ × ]0, 2π[ ein, so erhält man eine injektive Abbildung mit det ρ 0pol (r, ϕ) 6= 0 für alle (r, ϕ) ∈ U , deren Bildmenge durch R2 \N mit N = R+ × {0} gegeben ist. Da N in einer Hyperebene enthalten ist, handelt es sich um eine Nullmenge (siehe Übungen). Für jede Jordan-messbare Teilmenge D ⊆ U und jede rellwertige, stetige und beschränkte Funktion f auf ρ pol (D) liefert uns Satz (2.1) also die Gleichung Z Z f (x, y) d (x, y) = ( f ◦ ρ pol )(r, ϕ) · r d (r, ϕ). ρ pol (D) D Als einfaches Anwendungsbeispiel für diese Formel berechnen wir das Volumen des Kegels K mit kreisförmiger Grundfläche vom Radius R und Höhe h. Als Teilmenge von R3 ist K gegeben durch n o ¡ ¢2 K = (x, y, z) ∈ R3 | x 2 + y 2 ≤ R 2 1 − hz , 0 ≤ z ≤ h . Für alle (x, y, z) ∈ R3 mit x 2 + y 2 ≤ R 2 und 0 ≤ z ≤ h gilt die Äquivalenz q ¡ ¢2 (x, y, z) ∈ K ⇔ x 2 + y 2 ≤ r 2 1 − hz ⇔ x 2 + y 2 ≤ r (1 − hz ) ⇔ ⇔ h r q x2 + y 2 ≤ h − z µ ¶ q 1 z ≤ h 1− x2 + y 2 . R Definieren wir also eine Funktion f : B → R auf der Menge B = {(x, y) ∈ R2 | x 2 + y 2 ≤ R 2 } durch f (x, y) = p h(1 − R1 x 2 + y 2 ), dann ist K gerade die Ordinatenmenge Λ( f ), und wir können Satz (1.10) für die Berechnung von v(K ) verwendet werden. —– 15 —– § 2. Die mehrdimensionale Substitutionsregel Man stellt allerdings fest, dass die Integration von f über B in kartesischen Koordinaten schon eine recht komplizierte Angelegenheit ist. Durch die Verwendung von Polarkoordinaten wird die Berechnung erheblich vereinfacht, weil diese unter anderem den kreisförmigen Integrationsbereich in ein Rechteck überführen. Zunächst kann statt über B auch über B̃ = B \ N integriert werden, denn die beiden Integrale unterscheiden sich nur um eine Jordansche Nullmenge, und weil außerdem die Funktion f beschränkt ist, wird das Integral beim Übergang von B zu B̃ nach Satz (1.8) nicht verändert. Für alle (r, ϕ) ∈ U mit (x, y) = ρ pol (r, ϕ) gilt die Äquivalenz r ≤R x2 + y 2 ≤ R2 ⇔ (x, y) ∈ B̃ . ⇔ Setzen wir also D = [0, R] × ]0, 2π[, dann gilt ρ pol (D) = B̃ , außerdem ist ( f ◦ ρ pol )(r, ϕ) f (r cos(ϕ), r sin(ϕ)) = für alle (r, ϕ) ∈ D. Insgesamt gilt nun Z v(K ) = f (x, y) d (x, y) Z D ( f ◦ ρ pol )(r, ϕ) · r d (r, ϕ) Rµ Z 2πh 0 r− ¶ r2 dr R = B̃ ³ r´ h 1− r d (r, ϕ) R D ρ pol (D) Z = · 2πh = = ³ r´ h 1− R Z f (x, y) d (x, y) = B Z µ ¶ q 1 h 1− (r cos(ϕ))2 + (r sin(ϕ))2 R = 1 2 1 2r − 3 r3 R h ¸R = 0 2πh = ¶ ¶ r2 r− dϕ dr R R µZ 2π µ Z = f (x, y) d (x, y) 0 0 ¡1 2R 2 − 13 R 2 ¢ = = 2 1 3 πR h. Neben den Polarkoordinaten wurden in der Analysis mehrerer Variablen auch die Zylinderkoordinaten ρ zyl : R+ × R2 → R3 , ¡ ¢ (r, h, ϕ) 7→ r cos(ϕ), r sin(ϕ), h und die Kugelkoordinaten ρ kug : R+ × R2 → R3 , ¡ ¢ (r, ϑ, ϕ) 7→ r cos(ϑ) cos(ϕ), r cos(ϑ) sin(ϕ), r sin(ϑ) definiert, deren Funktionaldeterminanten durch det ρ 0zyl (r, h, ϕ) = r bzw. det ρ 0kug (r, ϑ, ϕ) = −r 2 cos(ϑ) gegeben sind. Auch hier gibt es jeweils eine Nullmenge N ⊆ R3 , außerhalb der die Abbildung injektiv ist und die Funktionaldeterminanten nicht verschwindet. Für jede Menge Jordan-messbare Menge D im Komplement von N und jede stetige Funktion auf dem Bild von D liefert die mehrdimensionale Substitutionsregel hier Z Z f (x, y, z) d (x, y, z) = ( f ◦ ρ zyl )(r, h, ϕ) · r d (r, h, ϕ) ρ zyl (D) bzw. D Z Z f (x, y, z) d (x, y, z) ρ kug (D) = ( f ◦ ρ kug )(r, ϑ, ϕ) · r 2 cos(ϑ) d (r, ϑ, ϕ). D Beispiele zur Integration mit diesen Koordinaten behandeln wir in den Übungen. Kommen wir nun zum Beweis der mehrdimensionalen Substitutionsregel. —– 16 —– § 2. Die mehrdimensionale Substitutionsregel Lemma 2.2 Sei u : U → V ein Diffeomorphismus zwischen offenen Teilmengen U ,V ⊆ Rn und K ⊆ U eine kompakte Teilmenge. Dann gilt (i) Eine Teilmenge N ⊆ K ist genau dann eine (Jordansche) Nullmenge, wenn u(N ) ⊆ u(K ) eine (Jordansche) Nullmenge ist. (ii) Eine Teilmenge A ⊆ K ist genau dann Jordan-messbar, wenn u(A) ⊆ u(K ) Jordanmessbar ist. Darüber hinaus existiert eine nur von K und u abhängige Konstante γ ∈ R+ mit der Eigenschaft, dass v(u(A)) ≤ γv(A) für alle Jordan-messbaren Teilmengen A von K gilt. Beweis: Aus Zeitgründen können wir den Beweis zur skizzieren. Weil K kompakt und die Ableitung u 0 stetig auf K ist, kann der Schrankensatz aus der mehrdimensionalen Differentialrechnung angewendet werden. Nach dem Schrankensatz existiert eine nur von K und u abhängige Konstante γ0 mit der Eigenschaft, dass die Bildmenge u(Q) eines Quaders Q stets in einem Quader Q 0 enthalten ist, für den die Abschätzung v(Q 0 ) ≤ γ0 v(Q) gilt. Ist nun N eine Jordansche Nullmenge, dann kann N durch eine endliche Familie von Quadern mit einem sehr kleinen Gesamtvolumen überdeckt werden. Auf Grund der soeben getroffenen Feststellung gilt dasselbe dann auch für die Bildmenge v(N ). Das Argument für beliebige (statt Jordanscher) Nullmengen läuft analog. Für die Aussage (ii) verwendet man dann, dass eine Menge genau dann Jordanmessbar ist, wenn der Rand eine Nullmenge ist, und dass u die Menge ∂A auf den Rand von u(A) abbildet. Für die Zusatzaussage am Schluss kann wieder mit der Konstanten γ0 von oben argumentiert werden. ä Lemma 2.3 Die Aussagen von Satz (2.1) gelten für kompakte Quader D mit D̄ ⊆ U und Abbildungen der Form u(t ) = (t 1 , ..., t i −1 , u i (t ), t i +1 , ..., t n ) , wobei i ∈ {1, ..., n} ist und u i : U → R eine stetig differenzierbare Funktion bezeichnet. Beweis: Der Übersichtlichkeit halber nehmen wir an, dass i = n ist. Man überprüft problemlos, dass sich die gesamte folgende Rechnung an Stelle der n-ten auch mit einer beliebigen i -ten Komponente durchführen lässt. Die Ableitungsmatrix u 0 (t ) von u ist an jeder Stelle t ∈ U mit Ausnahme der letzten Zeile eine Diagonalmatrix mit Einsen auf der Diagonalen, die letzte Zeile enthält die partiellen Ableitungen von u n . Daraus folgt det u 0 (t ) = ∂n u n (t ) für alle t ∈ U . Gehen wir davon aus, dass D = [a 1 , b 1 ] × ... × [a n , b n ] ist, und bezeichnen wir das Produkt der ersten n − 1 Intervalle mit D̃, dann gilt u(D) = [ {t̃ } × u n ({t̃ } × [a n , b n ]). t̃ ∈D̃ —– 17 —– § 2. Die mehrdimensionale Substitutionsregel Der Satz von Fubini und die oben ausformulierte, eindimensionale Substitutionsregel angewendet auf das innerste Integral liefern uns dann Z ( f ◦ u)(t ) · | det u 0 (t )| d t = D Z b1 µ a1 Z b1 µ a1 µZ ··· bn an ¶ f (t 1 , ..., t n−1 , u n (t 1 , ..., t n )) · |∂n u n (t 1 , ..., t n )| d t n · · · d t 1 µZ ··· ¶ u n ({(t 1 ,...,t n−1 )}×[a n ,b n ]) ¶ ¶ f (t 1 , ..., t n , x n ) d x n · · · d t 1 = Z = f (x) d x. u(D) ä Lemma 2.4 Die Aussage von Satz (2.1) gelten für kompakte Quader D mit D̄ ⊆ U und beliebige Abbildungen u wie im Satz angegeben. Beweis: Wir führen den Beweis durch vollständige Induktion über n. Für n = 1 ist die Gültigkeit der Substitutionsregel bereits bekannt, denn wir haben sie zu Anfang des Abschnitts aus der Fassung der Analysis einer Variablen hergeleitet. Sei nun n > 1, und setzen wir die Aussage für kleine Dimensionen als gültig voraus. Es genügt zu zeigen, dass für jedes a ∈ d eine offene Umgebung U a existiert, so dass die Aussage von Satz (2.1) für kompakte Quader Q mit Q ⊆ U a erfüllt ist. Durchläuft a nämlich die kompakte Menge D, dann bilden die Mengen U a eine offene Überdeckung von D. Von dieser kann einen endliche Teilüberdeckung U a1 , ...,U an gewählt werden. Man bildet nun eine hinreichend feine Zerlegung Z von D derart, dass jeder Quader K ∈ Q(Z ) in einer Menge U ai enthalten ist. Weil die Aussage der Substitutionsregel laut Annahme für jeden Quader K erfüllt ist, erhält man die Aussage über den Quader D durch Aufsummierung über sämtliche K ∈ Q(Z ). Sei also a ∈ D vorgegeben. Weil u ein Diffeomorphismus ist, gilt rg u 0 (a) = n. Daraus folgt, dass die Matrix ∂1 u 1 . . . ∂1 u n−1 ··· ··· ∂n u 1 .. . ∂n u n−1 an der Stelle a vom Rang n − 1 ist. Wir können somit eine Spalte dieser Matrix streichen, ohne den Rang zu verändern. Nach eventueller Umbenennung der Variablen können wir davon ausgehen, dass dies für die n-te Spalte möglich ist. Somit ist also die obere (n − 1) × (n − 1)-Teilmatrix von u 0 (a) vom Rang n − 1. Wir betrachten nun in einer Umgebung von a die Abbildung v gegeben durch v(t 1 , ..., t n ) = (u 1 (t ), ..., u n−1 (t ), t n ). —– 18 —– § 2. Die mehrdimensionale Substitutionsregel Die Jacobi-Matrix von v an der Stelle a ist gegeben durch ∂1 u 1 (a) ··· . .. ∂1 u n−1 (a) · · · 0 ··· ∂n−1 u 1 (a) 0 .. .. . . ∂n−1 u n−1 (a) 0 0 1 Insbesondere ist sie vom Rang n und somit det v 0 (a) 6= 0. Nach dem Satz über die lokale Umkehrbarkeit aus dem vorherigen Semester gibt es eine offene Umgebung U a von a, so dass v(U a ) ⊆ Rn offen ist und v einen Diffeomorphismus zwischen U a und v(U a ) definiert. Sei h : v(U a ) → U a die Umkehrabbildung von u|Ua . Für die n-te Komponente h n von h gilt offenbar h n (x) = x n , für alle x ∈ U a . Definieren wir nun eine Abbildung w auf v(U a ) durch w(x) = (x 1 , ..., x n−1 , u n (h 1 (x), ..., h n−1 (x), h n (x))) = (x 1 , ..., x n−1 , u n (h 1 (x), ..., h n−1 (x), x n )) , dann gilt für alle t = (t 1 , ..., t n ) ∈ U a jeweils (w ◦ v)(t ) w(u 1 (t ), ..., u n−1 (t ), t n ) = = (u 1 (t ), ..., u n−1 (t ), u n ((h ◦ v)(t ))) (u 1 (t ), ..., u n−1 (t ), u n (h 1 (v(t )), ..., h n (v(t )))) = (u 1 (t ), ..., u n−1 (t ), u n (t )) = u(t ). = Die wesentliche Idee besteht nun darin, die Substitutionsregel nacheinander auf v und auf w anzuwenden. Auf Grund der besonderen Form kann sie für v auf den (n − 1)-dimensionalen Fall zurückgeführt werden, und für w ist sie nach Lemma (2.3) bereits bekannt. Außerdem wenden wir die Kettenregel aus der mehrdimensionalen Differentialrechnung an: Für alle t ∈ U a gilt u 0 (t ) = (w ◦ v)0 (t ) = w 0 (v(t )) ◦ v 0 (t ) und somit insbesondere | det u 0 (t )| = | det w 0 (v(t ))| · | det v 0 (t )|. Um die Rechnung übersichtlicher darstellen zu können, führen wir noch folgende Notation ein: Für jedes t ∈ Rn bezeichnet t̃ den Teilvektor bestehend aus den ersten n − 1 Komponenten, also t̃ = (t 1 , ..., t n−1 ). Definieren wir nun für jedes feste t n ∈ R eine Funktion ṽ (tn ) durch ṽ (tn ) (t̃ ) = (u 1 (t ), ..., u n−1 (t )), für alle t̃ mit der Eigenschaft, dass t = (t̃ , t n ) = (t 1 , ..., t n ) in U a liegt. Dann gilt jeweils v(t ) = (ṽ (tn ) (t̃ ), t n ). Setzen wir 0 x̃ = ṽ (tn ) (t̃ ), dann gilt also v(t ) = (ṽ (tn ) (t̃ ), t n ) = (x̃, t n ) und det ṽ (tn ) (t̃ ) = det v 0 (t ) für die Ableitungen. Sei Q = [a 1 , b 1 ] × ... × [a n , b n ] ein kompakter Quader in U a und Q (n−1) ⊆ Rn−1 das kartesische Produkt gebildet aus den ersten n−1 Intervallen [a i , b i ]. Auf Grund des nach Induktionsannahme gültigen (n−1)-dimensionalen Falls erhalten wir Z ( f ◦ w)(x̃, t n ) · | det w 0 (x̃, t n )| d x̃ = ṽ (tn ) (Q (n−1) ) Z 0 Q̃ (n−1) ( f ◦ w)(ṽ (tn ) (t̃ ), t n ) · | det w 0 (v (tn ) (t̃ ), t n )| · | det ṽ (tn ) (t̃ )| d t̃ Z Q̃ (n−1) ( f ◦ w ◦ v)(t̃ , t n ) · | det w 0 (v(t̃ , t n ))| · | det v 0 (t̃ , t n )| d t̃ Z Q (n−1) ( f ◦ u)(t̃ , t n ) · | det u 0 (t̃ , t n )| d t̃ —– 19 —– , = = § 2. Die mehrdimensionale Substitutionsregel wobei im letzten Schritt die Gleichung u = w ◦ v und die Kettenregel angewendet wurden. Mit Q ist auch v(Q) kompakt, und damit sind die Bildmengen v (tn ) (Q (n−1) ) in einem hinreichend großen, (n − 1)-dimensionalen Quader R enthalten. Wegen v(Q) (ṽ (tn ) (Q (n−1) ) × {t n } ⊆ R × [a n , b n ] [ = t n ∈[a n ,b n ] liefert uns der Satz von Fubini Z ( f ◦ w)(x) · | det w 0 (x)| d x v(Q) Z bn µZ an bn Z = µZ ṽ (tn ) (Q (n−1) ) an ( 0 ( f ◦ w)(x̃, t n ) · | det w (x̃, t n )| d x̃ d t n ¶ 0 ¶ Z Q n − 1)( f ◦ u)(t̃ , t n ) · | det u (t̃ , t n )| d t̃ d t n = Q ( f ◦ u)(t )| det u 0 (t )| d t = , wobei im vorletzten Schritt die bereits bewiesene Gleichung auf das innere Integral angewendet wurde. Nach Lemma (2.3) gilt außerdem Z Z Z ( f ◦ w)(t ) · | det w 0 (x)| d x = f (y) d y = f (y) d y. v(Q) w(v(Q)) u(Q) Beide Gleichungen zusammen liefern das gewünschte Resultat. ä Beweis von Satz (2.1): Nach Voraussetzung ist D eine Jordan-messbare Menge, und nach Lemma (2.4) gilt die Substitutionsregel für beliebige Quader Q mit Q̄ ⊆ U . Sei nun ε ∈ R+ beliebig vorgegeben. Weil D̄ beschränkt und abgeschlossen ist, handelt es sich um eine kompakte Teilmenge von Rn . Auf Grund der Stetigkeit von u ist auch u(D̄) kompakt. Daraus folgt, dass sowohl die Funktion t 7→ ( f ◦ u)(t )| det u 0 (t )| auf D als auch die Funktion f auf u(D) durch eine betragsmäßig durch gemeinsame Konstante m ∈ R+ beschränkt werden. Auf Grund der Jordan-Messbarkeit stimmt v(D) mit dem inneren Maß von D überein. Es gibt deshalb eine disjunkte Vereinigung K ⊆ D von kompakten Quadern mit v(D \ K ) < ε. Wenden wir Lemma (2.4) auf die Quader Q 1 , ...,Q r in der Vereinigung K an, so erhalten wir Z Z ( f ◦ u)(t ) · | det u 0 (t )| d t = f (x) d x. K u(K ) Außerdem gilt ¯Z ¯ Z ¯ ¯ ¯ ( f ◦ u)(t ) · | det u 0 (t )| d t − ( f ◦ u)(t ) · | det u 0 (t )| d t ¯ ¯ ¯ D K ≤ mv(D \ K ) < = ¯Z ¯ ¯ ¯ ¯ ¯ ( f ◦ u)(t ) · | det u (t )| d t ¯¯ 0 D\K mε. Nach Lemma (2.2) gilt v(u(D \ K )) < γε für eine nur von D und u abhängige Konstante γ ∈ R+ . Damit erhalten wir ¯Z ¯ ¯Z ¯ Z ¯ ¯ ¯ ¯ ¯ f (x) d x − f (x) d x ¯¯ = ¯¯ f (x) d x ¯¯ ≤ mv(u(D \ K )) = mγε. ¯ u(D) u(K ) u(D\K ) —– 20 —– § 2. Die mehrdimensionale Substitutionsregel Mit Hilfe der Dreiecksungleichung und der Gleichung für K folgt dann insgesamt ¯ ¯Z Z ¯ ¯ ¯ ( f ◦ u)(t ) · | det u 0 (t )| d t − f (x) d x ¯¯ = ¯ γ(D) D ¯Z Z Z ¯ ¯ ( f ◦ u)(t ) · | det u 0 (t )| d t − ( f ◦ u)(t ) · | det u 0 (t )| d t + ¯ D K γ(K ) ¯ ¯Z ¯Z Z ¯ ¯ ¯ ¯ ( f ◦ u)(t ) · | det u 0 (t )| d t − ( f ◦ u)(t ) · | det u 0 (t )| d t ¯ + ¯ ¯ ¯ ¯ D K ≤ mε + mγε = ¯ ¯ f (x) d x ¯¯ Z f (x) d x − γ(D) Z γ(K ) f (x) d x − γ(D) ≤ ¯ ¯ f (x) d x ¯¯ m(γ + 1)ε. Da ε ∈ R+ beliebig vorgegeben war, erhalten wir insgesamt die gewünschte Gleichung. —– 21 —– ä § 3. Kurvenintegrale und Greenscher Integralsatz In der Analysis einer Variablen wurde der Hauptsatz der Differential- und Integralrechnung behandelt, welcher besagt, dass man das Integral einer stetigen Funktion f : [a, b] → R mit Hilfe einer beliebigen Stammfunktion F berechnen kann, und zwar mit Hilfe der Formel Z b f (x) d x a = F (b) − F (a). Man erhält das Integral von f also, indem man eine f zugeordnete Funktion F in den Randpunkten a, b des Definitionsbereichs von f auswertet. Unser Ziel in den folgenden beiden Abschnitten besteht darin, dieses Prinzip auf höhere Dimension fortzusetzen. Sei Q = [a, b]×[c, d ] ein kompakter Quader, U ⊇ Q eine offene Teilmenge im R2 , und seien g , h : U → R zwei stetige Funktionen. Auf Grund des (eindimensionalen) Hauptsatzes der Differential- und Integralrechnung gilt Z Q ∂h (x, y) d (x, y) ∂x ¶ Z d £ ¤x=b ∂h (x, y) d x d y = h(x, y) x=a d y c a ∂x c Z d Z d h(a, y) d y. h(b, y) d y − = = Ebenso erhalten wir Z ∂g (x, y) d (x, y) Q ∂y d Z µZ b c c ¶ Z b £ ¤ y=d ∂g (x, y) d y d x = g (x, y) y=c d x a c ∂y a Z b Z b g (x, d ) d x − g (x, c) d x. b µZ d Z = = a a Insgesamt gilt also Z µ Q ¶ ∂h ∂g (x, y) − (x, y) d (x, y) ∂x ∂y Z = b a d Z g (x, c) d x + c Z h(b, y) d y − b a Z g (x, d ) d x − d h(a, y) d y. (1) c Wir werden nun zunächst für die rechte Seite dieser Gleichung eine geometrische Interpretation finden, die dann auch auf allgemeinere Situationen angewendet werden kann. Bereits in der Analysis mehrerer Variablen wurde der Begriff des Weges in einer Teilmenge T ⊆ Rn definiert. Dabei handelte es sich um eine stetige Abbildung γ : [a, b] → T , wobei a, b reelle Zahlen mit a < b bezeichnen. Man nennt γ(a) den Start- und γ(b) den Endpunkt des Weges; fallen diese beiden Punkte zusammen, so spricht man von einem geschlossenen Weg. Wir nennen einen Weg eine C 1 -Kurve in T , wenn die Abbildung γ|]a,b[ stetig differenzierbar ist. Als Kurve bezeichnen wir einen Weg, wenn er stückweise stetig differenzierbar ist. Dies bedeutet, dass eine Zerlegung Z = {x 1 , ..., x n−1 } existiert, so dass γ|]xk−1 ,xk [ für 1 ≤ k ≤ n jeweils stetig differenzierbar ist (wobei wie immer x 0 = a und x n = b gesetzt wird. —– 22 —– § 3. Kurvenintegrale und Greenscher Integralsatz Kommen wir nun zur Definition der Kurvenintegrale. Aus der Analysis einer Variablen ist bekannt, dass das Riemann-Integral f : [a, b] → R durch sog. Riemannsche Summen approximiert werden kann. Ist Z = {x 1 , ..., x n } eine hinreichend feine Zerlegung des Intervalls [a, b] und sind z k ∈ ]x k−1 , x k [ geeignet gewählte Stützstellen, dann gilt Z b n X f (x) d x ≈ f (z k )|x k − x k−1 |. a k=1 Ist nun U ⊆ Rd offen, γ : [a, b] → U eine Kurve und f : U → R eine stetige Funktion, dann liegt es nahe, ein Kurvenintegral in der Form Z γ f ds ≈ n X ( f ◦ γ)(z k )kγ(x k ) − γ(x k−1 )k k=1 anzusetzen, wobei k · k die euklidische Norm auf dem Rd bezeichnet. Die Kurve wird also durch den Polygonzug angenähert, der von den Punkten γ(x k ) mit 0 ≤ k ≤ n gebildet wird, die jeweils den Abstand kγ(x k ) − γ(x k−1 )k voneinander haben. Die Gesamtlänge des Polygonzugs beträgt also n X kγ(x k ) − γ(x k−1 )k. k=1 Um aus diesem Näherungsausdruck wieder ein Integral zu gewinnen, erinnern wir daran, dass die differenzierbare Abbildung γ in der unmittelbaren Umgebung der Stützstellen z k durch die affin-lineare Funktion γ(t ) ≈ γ(z k ) + (t − z k )γ0 (z k ) approximiert wird. Bei hinreichend feiner Zerlegung gilt γ(x k−1 ) ≈ γ(z k ) + (x k−1 − z k )γ0 (z k ) und γ(x k ) ≈ γ(z k−1 ) + (x k − z k )γ0 (z k ). Durch Bildung der Differenz erhalten wir also γ(x k ) − γ(x k−1 ) ≈ (x k − x k−1 )γ0 (z k ) und somit Z b n X 0 ( f ◦ γ)(z k )kγ (z k )k(x k−1 − x − k) ≈ ( f ◦ γ)0 (t )kγ0 (t )k d t . a k=1 Für die Kurvenlänge L (γ) erhalten wir den Näherungsausdruck L (γ) n X ≈ kγ(x k ) − γ(x k−1 )k k=1 Z ≈ b a kγ0 (t )k d t . Diese Überlegungen motivieren die folgende Definition. Definition 3.1 Sei U ⊆ Rd offen, γ : [a, b] → U eine Kurve in U und f : U → R eine stetige Funktion. Dann bezeichnet man Z Z γ f ds = b a ( f ◦ γ)(t )kγ0 (t )k d t als das Kurvenintegral 1. Art von f über γ. Die Zahl L (γ) = die Länge der Kurve γ. —– 23 —– R γ1 d s bezeichnen wir als § 3. Kurvenintegrale und Greenscher Integralsatz Wir illustrieren die Definition der Kurvenlänge an einem Beispiel. Die Kurve γ gegeben durch γ : [0, 2π] −→ R2 , t 7→ (r cos(t ), r sin(t )) durchläuft den Kreis vom Radius r um den Koordinatenursprung in der Ebene, und zwar entgegen dem Uhrzeigersinn. Für alle t ∈ ]0, 2π[ gilt γ0 (t ) = (−r sin(t ), r cos(t )) und somit kγ0 (t )k2 = r 2 sin(t )2 + r 2 cos(t )2 also kγ0 (t )k = r . Die Kurvenlänge ist also gegeben durch Z 2π L (γ) = kγ0 (t )k d t = Z , 2π r dt 0 r2 = 0 = 2πr. Bekanntlich ist dies laut Schulmathematik der Umfang eines Kreises vom Radius r . Für Kurven stehen eine Reihe von Rechenoperationen zur Verfügung, die sich in den Anwendungen als hilfreich herausstellen werden. Zunächst kann jede Kurve γ : [a, b] → Rd auf natürliche Weise eine Kurve γ0 mit Definitionsbereich [0, 1] zugeordnet werden. Dazu definiert man u : [0, 1] → R durch u(t ) = (1− t )a + t b = a + t (b − a) und setzt γ0 = γ ◦ u. Wir bezeichnen den Übergang von γ zu γ0 als Normierung und eine Kurve mit Definitionsbereich [0, 1] als normiert. Integrale über γ ändern sich durch die Normierung nicht. Es gilt nämlich u 0 (t ) = b−a, γ00 (t ) = γ00 (u(t ))u 0 (t ) = (b − a)γ00 (t ) und somit Z 1 Z Z 1 ( f ◦ γ ◦ u)(t )kγ0 (u(t ))u 0 (t )k d t = ( f ◦ γ0 )(t )kγ00 (t )k d t = f ds = γ0 0 0 1 Z 0 0 0 ( f ◦ γ ◦ u)(t )kγ (u(t ))k|u (t )| d t Z b a 0 u(1) Z = ( f ◦ γ)(t )kγ (t )k d t u(0) ( f ◦ γ)(t )kγ0 (t )k d t = Z = γ f d s. wobei im vierten Schritt die Substitutionsregel aus der Analysis einer Variablen angewendet wurde. Wir definieren zwei weitere Rechenoperationen für Kurven. Definition 3.2 Sei U ⊆ Rd offen, und seien γ, δ : [0, 1] → U zwei normierte Kurven, wobei γ(1) = δ(0) ist. Dies bedeutet, dass der Endpunkt von γ mit dem Startpunkt von δ übereinstimmt. Wir definieren zwei neue Kurven γ− und δ ∗ γ durch γ(t ) falls 0 ≤ t ≤ 1 − γ (t ) = γ(1 − t ) und (δ ∗ γ)(t ) = δ(t − 1) falls 1 ≤ t ≤ 2 und bezeichnen γ− als die Umkehrung von γ und δ∗γ als die Konkatenation der beiden Kurven γ und δ. —– 24 —– § 3. Kurvenintegrale und Greenscher Integralsatz Wir untersuchen, wie sich die Kurvenintegrale unter diesen Operationen verhalten. Proposition 3.3 Sei U ⊆ Rd offen, γ, δ : [0, 1] → U zwei normierte Kurven mit γ(1) = δ(0) und f : U → R eine stetige Funktion. Dann gilt Z Z Z Z Z f ds = f ds und f ds = f d s + f d s. γ− γ δ∗γ γ δ Beweis: Nach Definition gilt γ− = γ ◦ u mit u(t ) = 1 − t und u 0 (t ) = −1. Die Anwendung der mehrdimensionalen Kettenregel liefert (γ− )0 (t ) = γ0 (u(t ))u 0 (t ). Wir erhalten Z γ− 1 Z f ds = 1 Z − ( f ◦ γ ◦ u)(t )kγ0 (u(t ))ku 0 (t ) d t = 0 0 0 Z − 1 ( f ◦ γ)(t )kγ (t )k d t 0 ( f ◦ γ ◦ u)(t )kγ0 (u(t ))u 0 (t )k d t Z 1 Z 0 1 Z ( f ◦ γ− )(t )k(γ− )0 (t )k d t = = 0 − u(1) u(0) ( f ◦ γ)(t )kγ0 (t )k d t 0 ( f ◦ γ)(t )kγ (t )k d t = = Z = γ f d s. Beweisen wir nun die Rechenregel für die Konkatenation. Hier gilt Z δ∗γ 1 Z 0 2 Z f ds = 0 ( f ◦ (δ ∗ γ))(t ) d t k(δ ∗ γ)0 (t )k d t ( f ◦ (δ ∗ γ))(t ) d t k(δ ∗ γ)0 (t )k d t + Z 0 Z 0 1 1 0 ( f ◦ γ)(t ) d t kγ (t )k d t + ( f ◦ γ)(t ) d t kγ0 (t )k d t + Z 0 1 2 Z 1 Z 1 2 = ( f ◦ (δ ∗ γ))(t ) d t k(δ ∗ γ)0 (t )k d t ( f ◦ δ)(t − 1) d t kδ0 (t − 1)k d t ( f ◦ δ)(t ) d t kδ0 (t )k d t = Z = = Z γ f ds + δ f d s. Bei dieser Rechnung wurde im vorletzten Schritt die eindimensionale Substitutionsregel auf die Substitutionsfunktion t 7→ t − 1 angewendet. ä Leider sind die bisher eingeführten Kurvenintegrale nicht geeignet, um die rechte Seite der Gleichung (1) zu beschreiben. Hierzu müssen wir statt dessen Integrale über Vektorfeldern betrachten. Definition 3.4 Sei U ⊆ R2 offen. Ein Vektorfeld auf U ist eine Abbildung f : U → R2 . Wir bezeichnen es als stetiges (bzw. differenzierbares oder C 1 -)Vektorfeld, wenn die Abbildung f stetig (bzw. differenzierbar oder stetig differenzierbar) ist. —– 25 —– § 3. Kurvenintegrale und Greenscher Integralsatz Definition 3.5 Sei f : U → R2 ein stetiges Vektorfeld und γ : [a, b] → U eine Kurve in U . Dann bezeichnen wir Z Z b 〈 f , d s〉 = 〈( f ◦ γ)(t ), γ0 (t )〉 d t γ a als das Kurvenintegral 2. Art von f über γ. Hierbei steht 〈·, ·〉 für das euklidische Standard-Skalarprodukt auf dem R2 . Bekanntlich ist das euklidische Standard-Skalarprodukt auf dem R2 gegeben durch 〈(v 1 , v 2 ), (w 1 , w 2 )〉 = v 1 w 1 + v 2 w 2 . Dies ermöglicht es, das Kurvenintegral 2. Art stets als Summe von zwei Termen darzustellen. Seien γ1 , γ2 : [a, b] → R die beiden Komponentenfunktionen von γ und f 1 , f 2 : U → R die beiden Komponenten von f . Setzen wir Z Z b Z Z b 0 〈 f , d x〉 = ( f 1 ◦ γ)(t )γ1 (t ) d t und 〈 f , d y〉 = ( f 2 ◦ γ)(t )γ02 (t ) d t γ γ a a dann gilt Z b Z γ 〈 f , d s〉 Z = = b a a 0 〈( f ◦ γ)(t ), γ (t )〉 d t ( f 1 ◦ γ)(t )γ01 (t ) d t Z + b a Z = b a ! à !+ *à ( f 1 ◦ γ)(t ) γ01 (t ) , 0 dt ( f 2 ◦ γ)(t ) γ2 (t ) Z ( f 2 ◦ γ)γ02 (t ) d t = γ Z 〈 f , d x〉 + γ 〈 f , d y〉. Auch Kurvenintegrale 2. Art können normiert werden, ohne dass sich das Integral dadurch ändert, und bezüglich Konkatenation verhalten sie sich wie die Integrale 1. Art. Einen wichtigen Unterschied gibt es bei der Umkehrung von Kurven, denn das Integral 2. Art ändert im Gegensatz zur 1. Art sein Vorzeichen. Zum Beweis sei u : [0, 1] → U definiert durch u(t ) = 1 − t , und wie zuvor sei γ− = γ ◦ u. Dann gilt Z Z 1 Z 1 − − 0 〈 f , d x〉 = ( f ◦ γ1 )(t )(γ1 ) (t ) d t = ( f ◦ γ1 ◦ u)(t )γ01 (u(t ))u 0 (t ) d t = γ− Z u(1) u(0) 0 ( f ◦ γ1 )(t )γ01 (t ) d t und ebenso erhält man R 0 0 Z = 1 ( f ◦ γ1 )(t )γ01 (t ) d t 1 Z = − 0 ( f ◦ γ1 )(t )γ01 (t ) d t Z = − γ 〈 f , d x〉 , R γ− 〈 f , d y〉 = − γ 〈 f , d y〉. Insgesamt gilt damit also Z Z γ− 〈 f , d s〉 = − γ 〈 f , d s〉 wie behauptet. Mit Hilfe dieser Integrale können wir nun die rechten Seite von (1) geeignet darstellen. Dazu definieren wir die Kurven γ1 (t ) = (1 − t )(a, c) + t (b, c) γ2 (t ) = (1 − t )(b, c) + t (b, d ) γ3 (t ) = (1 − t )(b, d ) + t (a, d ) γ4 (t ) = (1 − t )(a, d ) + t (a, c) —– 26 —– § 3. Kurvenintegrale und Greenscher Integralsatz und setzen ∂Q = γ4 ∗ γ3 ∗ γ2 ∗ γ1 . Die Bezeichnung ∂Q ist dadurch gerechtfertigt, dass diese Kurve genau die Randpunkte des Quaders Q durchläuft (in positiver Richtung, also entgegen dem Uhrzeigersinn). Die Ableitungen der Kurven sind gegeben durch à ! à ! à ! à ! 1 0 1 0 0 0 0 0 γ1 (t ) = (b − a) , γ2 (t ) = (d − c) , γ3 (t ) = (a − b) und γ4 (t ) = (c − d ) . 0 1 0 1 Sei nun f : U → R2 die Funktion mit den Komponenten f 1 = g und f 2 = h aus (1). Mit der Hilfsfunktion u(t ) = (1 − t )a + t b gilt dann ! à !+ Z Z 1 Z 1 *à 1 (g ◦ γ1 )(t ) 0 dt = 〈 f , d s〉 = 〈( f ◦ γ1 )(t ), γ1 (t )〉 d t = , (b − a) 0 (h ◦ γ1 )(t ) γ1 0 0 1 Z (g ◦ γ1 )(t ) d t = g (u(t ), c)u 0 (t ) d t = (b − a) 1 Z 0 0 1 Z (b − a) Z g ((1 − t )a + t b, c) d t 0 u(1) b Z g (t , c) d t u(0) = g (t , c) d t . = a Mit der Funktion v(t ) = (1 − t )c + t d erhält man ebenso Z γ2 1 Z 〈 f , d s〉 = 〈( f 0 Z (d − c) Z 1 0 Z 1 *à ◦ γ2 )(t ), γ02 (t )〉 d t (h ◦ γ2 )(t ) d t 1 0 0 Z = (d − c) Z h(b, v(t ))v (t ) d t 0 = = ! à !+ (g ◦ γ2 )(t ) 0 , (d − c) dt (h ◦ γ2 )(t )〉 1 = 1 0 h(b, (1 − t )c + t d ) d t v(1) Z h(b, t ) d t v(0) = d h(b, t ) d t . = c Durch ähnliche Rechnungen beweist man die Gleichungen Z γ3 Z 〈 f , d s〉 = − b Z g (t , d ) d t und a Z γ4 Insgesamt verwandelt sich (1) damit in den Ausdruck ¶ Z µ ∂ f2 ∂ f1 (x, y) − (x, y) d (x, y) ∂y Q ∂x 〈 f , d s〉 = − d h(a, t ) d t . c Z = ∂Q 〈 f , d s〉. (2) Wir werden (2) später noch so umschreiben, dass sich auch der linke Seite eine intuitiv-geometrische Bedeutung geben lässt. Zunächst aber werden wir die Gleichung von Quadraten auf allgemeinere Integrationsbereiche ausdehnen. —– 27 —– § 3. Kurvenintegrale und Greenscher Integralsatz Definition 3.6 Eine Teilmenge B ⊆ R2 heißt (i) Normalbereich bezüglich der x-Achse, wenn ein Intervall [a, b] ⊆ R und stetige Funktionen ϕ− , ϕ+ : [a, b] → R existieren, so dass B = © ª (x, y) ∈ R2 | x ∈ [a, b] , ϕ− (x) ≤ y ≤ ϕ+ (x) gilt, (ii) Normalbereich bezüglich der y-Achse, wenn es ein Intervall [a, b] ⊆ R und stetige Funktionen ψ− , ψ+ : [c, d ] → R gibt, so dass B = © (x, y) ∈ R2 | y ∈ [c, d ] , ψ− (y) ≤ x ≤ ψ+ (y) ª gilt, (iii) Normalbereich schlechthin, wenn es sich um einen Normalbereich sowohl bezüglich der x als auch der y-Achse handelt. Sind die Funktionen ϕ− , ϕ+ , ψ− , ψ+ zudem auf ]a, b[ bzw. ]c, d [ stetig differenzierbar, dann nennt man B einen C 1 -Normalbereich. Beispiele für C 1 -Normalbereiche sind abgeschlossene Kreisscheiben oder kompakte Quader im R2 . Ist B ein C 1 -Normalbereich und sind ϕ− , ϕ+ Funktionen wie unter (i) angegeben, dann können wir folgendermaßen eine Kurve konstruieren, die B in positiver Richtung umläuft. Es sei γ1 : [a, b] → R2 , t 7→ (t , ϕ− (t )) γ2 : [0, 1] → R2 , t 7→ (1 − t )(b, ϕ− (b)) + t (b, ϕ+ (b)) γ− 3 : [a, b] → R2 , t 7→ (t , ϕ+ (t )) γ− 4 : [0, 1] → R2 , t 7→ (1 − t )(a, ϕ− (a)) + t (a, ϕ+ (a) , − − − außerdem γ3 = (γ− 3 ) und γ4 = (γ4 ) und ∂B = γ4 ∗ γ3 ∗ γ2 ∗ γ1 . Damit können wir nun die folgende Verallgemeinerung von (2) formulieren. Satz 3.7 (Greenscher Integralsatz, 1. Version) Sei U ⊆ R2 offen, f : U → R2 ein C 1 -Vektorfeld und B ⊆ U ein C 1 -Normalbereich. Dann gilt ¶ Z µ Z ∂ f2 ∂ f1 (x, y) − (x, y) d (x, y) = 〈 f , d s〉. ∂y B ∂x ∂B —– 28 —– § 3. Kurvenintegrale und Greenscher Integralsatz Beweis: Der zweite Term auf der linken Seite der Gleichung kann mit dem Satz von Fubini und dem Hauptsatz der Differential- und Integralrechnung umgeschrieben werden zu ! Z Z b ÃZ ϕ+ (x) ∂ f1 ∂ f1 (x, y) d (x, y) = (x, y) d y d x = B ∂y a ϕ− (x) ∂y Z b¡ a Z b * (f a ◦ γ− 3 )(x) , ¢ f 1 (x, ϕ+ (x)) − f 1 (x, ϕ− (x)) d x à !+ à !+ Z b* 1 1 dx dx − ( f ◦ γ1 )(x) , 0 0 a = Z = − γ1 Z 〈 f , d x〉 − γ3 〈 f , d x〉. Weil die Ableitungen γ02 und γ04 in der ersten Komponente konstant gleich Null sind, gilt Z Z 〈 f , d x〉 + 〈 f , d x〉 = 0. γ2 γ4 Insgesamt erhalten wir also die Gleichung Z Z Z Z Z ∂ f1 (x, y) d (x, y) = 〈 f , d x〉 + 〈 f , d x〉 + 〈 f , d x〉 + 〈 f , d x〉 − γ1 γ2 γ3 γ4 B ∂y Z = ∂B 〈 f , d x〉. Verwendet man auf analoge Weise, dass B auch ein Normalbereich bezüglich der y-Achse ist, erhält man durch eine ähnliche Rechnung die Gleichung Z Z ∂ f2 (x, y) d (x, y) = 〈 f , d y〉. B ∂x ∂B R R R Wegen ∂B 〈 f , d x〉 + ∂B 〈 f , d y〉 = ∂B 〈 f , d s〉 erhalten wir insgesamt das gewünschte Resultat. ä Wir geben dem Greenschen Integralsatz eine noch „geometrischere“ Form. Definition 3.8 Sei U ⊆ R2 offen. Die Divergenz eines differenzierbaren Vektorfelds f : U → R2 ist die reellwertige Funktion div F gegeben durch div F (x, y) = ∂ f1 ∂ f2 (x, y) + (x, y). ∂x ∂y Sei γ : [a, b] → R2 eine Kurve und t ∈ ]a, b[ ein Punkt, in dem die Ableitung γ0 (t ) existiert und ungleich Null ist. Dann nennt man γ0 (t ) = (γ01 (t ), γ02 (t )) den Tangentialvektor und ! à 1 γ02 (t ) n γ (t ) = ¯ 0 ¯ ¯γ (t )¯ −γ0 (t ) 1 den äußeren Einheitsnormalenvektor der Kurve an der Stelle t . Der Vektor n γ (t ) ist eindeutig bestimmt durch die Eigenschaften 〈γ0 (t ), n γ (t )〉 = 0 , kn γ (t )k = 1 und —– 29 —– det A(t ) > 0 , § 3. Kurvenintegrale und Greenscher Integralsatz wobei A(t ) die 2 × 2-Matrix mit den Spaltenvektoren n γ (t ), γ0 (t ) bezeichnet. Ist γ eine Kurve, die einen C 1 Normalbereich B in positiver Richtung durchläuft, dann ist durch die Bedingung det A(t ) > 0 festgelegt, dass der Vektor n γ (t ) aus dem Bereich B herauszeigt. Sei beispielsweise γ : [0, 2π] → R2 , t 7→ (r cos(t ), r sin(t )) die Kurve, die den Kreis vom Radius r um den Ursprung (0, 0) in positiver Richtung durchläuft. Dann sind Tangentialvektor und äußerer Einheitsnormalenvektor im Punkt t ∈ ]0, 2π[ gegeben durch à ! à ! −r sin(t ) cos(t ) γ0 (t ) = und n γ (t ) = . r cos(t ) sin(t ) Satz 3.9 (Greenscher Integralsatz, endgültige Version) Sei U ⊆ R2 offen, f : U → R2 ein C 1 -Vektorfeld und B ⊆ U ein C 1 -Normalbereich. Dann gilt Z Z div f (x, y) d (x, y) = 〈 f , n γ 〉 d s. ∂B B Beweis: Sei f˜ : U → R2 das Vektorfeld mit den Komponenten f˜1 = − f 2 und f˜2 = f 1 . Auf Grund der ursprünglichen Version des Greenschen Integralsatzes gilt dann ¶ Z µ ˜ ∂ f˜1 ∂ f2 (x, y) − (x, y) d (x, y) ∂y B ∂x Z = ∂B 〈 f˜, d s〉 , Der Ausdruck auf der linken Seite der Gleichung unter dem Integralzeichen kann umgeschrieben werden zu ∂ f˜1 ∂ f1 ∂ f2 ∂ f˜2 (x, y) − (x, y) = (x, y) + (x, y) = div f (x, y). ∂x ∂y ∂x ∂y Nach Definition des äußeren Einheitsnormalenvektors gilt *à ! à !+ ( f 1 ◦ γ)(t ) γ02 (t ) 0 〈( f ◦ γ)(t ), n γ (t )〉kγ (t )k = , ( f 2 ◦ γ)(t ) −γ01 (t ) ( f 1 ◦ γ)(t )γ02 (t ) − ( f 2 ◦ γ)(t )γ01 (t ). = Für den Ausdruck auf der rechten Seite gilt somit Z ∂B 〈 f˜, d s〉 Z = ∂B 〈 f˜, d x〉 + Z = Z = b a − Z ∂B b a 〈 f˜, d y〉 b Z = a ( f 2 ◦ γ)(t )γ01 (t ) d t ( f˜1 ◦ γ)(t )γ01 (t ) d t + b Z + a 〈( f ◦ γ)(t ), n γ (t )〉kγ0 (t )k d t —– 30 —– b Z a ( f˜2 ◦ γ)(t )γ02 (t ) d t ( f 1 ◦ γ)(t )γ02 (t ) d t Z = γ 〈 f , n γ 〉 d s. ä § 4. Die Integralsätze von Gauß und Stokes In diesem Kapitel übertragen wir den Greenschen Integralsatz auf den dreidimensionalen Raum, d.h. wir formulieren eine Gleichung, die einen Zusammenhang herstellt zwischen einem Integral auf einem Raumbereich B ⊆ R3 und einem Integral auf dessen zweidimensionalen Rand. Dazu verallgemeinern wir die im letzten Abschnitt eingeführten Kurvenintegrale zu Integralen auf d -dimensionale Teilmengen vom Rn , wobei d ≤ n ist. Dabei sind wir in erster Linie am Fall d = 2 und n = 3 interessiert. Sei (v 1 , ..., v d ) ein System bestehend aus d linear unabhängigen Vektoren im Rn . Das von diesem System aufgespannte d -dimensionale Parallelotop ist gegeben durch ) ( d X λk v k |λ1 , ..., λd ∈ [0, 1] . P (v 1 , ..., v d ) = k=1 Wir überlegen uns zunächst, wie dieser Menge auf sinnvolle Weise ein d -dimensionales Volumen zugeordnet werden kann. Im Fall d = n wissen wir bereits, dass v n (P (v 1 , ..., v n )) = | det(A)| gilt, wobei A ∈ Mn,R die Matrix mit den Vektoren v 1 , ..., v n als Spalten bezeichnet. Wir formulieren dieses Ergebnis so um, dass es sich auf den Fall d < n verallgemeinern lässt. Im folgenden sei A ∈ Mn×d ,R die Matrix mit den Spalten v 1 , ..., v d . Dann bezeichnet man G(v 1 , ..., v d ) = (t A)A ∈ Md ,R die Gramsche Matrix des Tupels (v 1 , ..., v d ). Die Einträge g i j dieser Matrix sind gegeben durch g i j = 〈v i , v j 〉 für 1 ≤ i , j ≤ d , wobei 〈 , 〉 wie zuvor das euklidische Skalarprodukt bezeichnet. Im Fall n = d gilt dann p v n (P (v 1 , ..., v n )) = | det(A)| = detG(v 1 , ..., v n ). Es liegt nun nahe, das d -dimensionale Volumen des Parallelotops P (v 1 , ..., v d ) durch die Formel p v d (P (v 1 , ..., v d )) = detG(v 1 , ..., v d ) zu definieren. Dass dies auch geometrisch eine sinnvolle Definition ist, lässt sich auf die folgende Beobachtung in niedriger Dimension zurückzuführen: Sind S, T ⊆ R zwei Jordan-messbare Teilmengen und fassen wir S × T als Teilmenge von R2 auf, dann gilt v 2 (S × T ) = v 1 (S)v 1 (T ). Sind S ⊆ R2 und T ⊆ R Jordan-messbar, dann gilt v 3 (S ×T ) = v 2 (S)v 1 (T ). Entscheidend dabei ist, dass die Mengen S ×{a} und {b}×T im R3 für beliebige a ∈ R und b ∈ R2 senkrecht zueinander stehen. Sind nun v 1 , ..., v d ∈ Rn vorgegeben, dann können wir den erzeugten Untervektorraum U = 〈v 1 , ..., v d 〉R definieren und eine ON-Basis v d +1 , ..., v n des zu U orthogonal stehenden Untervektorraums U ⊥ definieren. Für die Gram-Matrizen gilt dann à ! G(v 1 , ..., v d ) 0 G(v 1 , ..., v n ) = 0 I(n−d ) , —– 31 —– § 4. Die Integralsätze von Gauß und Stokes wobei I(n−d ) die Einheitsmatrix in Mn−d ,R bezeichnet. Weil das Parallelotop P (v d +1 , ..., v n ) von einer ONBasis aufgespannt wird, ist es naheliegend, ihm das (n − d )-dimensionale Volumen 1 zuzuordnen. Wegen P (v 1 , ..., v d ) ⊆ U und P (v d +1 , ..., v n ) ⊆ U ⊥ stehen die Parallelotope P (v 1 , ..., v d ) und P (v d +1 , ..., v n ) außerdem senkrecht aufeinander. Auf Grund der oben formulierten Überlegung sollte das d -dimensionale Volumen von P (v 1 , ..., v d ) also so gewählt werden, dass v n (P (v 1 , ..., v n )) = v d (P (v 1 , ..., v d )) · v n−d (P (v d +1 , ..., v n )) = v d (P (v 1 , ..., v d )) · 1 gilt. Setzen wir dies voraus, dann folgt v d (P (v 1 , ..., v d )) = v n (P (v 1 , ..., v n )) = p detG(v 1 , ..., v n ) = p detG(v 1 , ..., v d ). Als nächstes werden wir unsere Überlegungen von Parallelotopen auf allgemeinere „d -dimensionale Gebilde“ ausweiten. Intuitiv ist ein d -dimensionales Gebilde eine Teilmenge von Rn , die durch die Punkte eines d -dimensionalen Quaders oder einer offenen Teilmenge des Rd parametrisiert werden. Ist zum Beispiel Q ⊆ Rd ein kompakter Quader und φ : Q → Rn eine stetig differenzierbare Abbildung, dann würde man φ(Q) als d -dimensionales Gebilde im Rn betrachten. Unser Ziel besteht nun darin, einer stetigen, reellwertigen Funktion f auf φ(Q) ein Integral zuzuordnen. Wie in den früheren Situationen betrachten wir dazu feine Zerlegung Z von Q. Für jeden Teilquader K ∈ Q(Z ) seien der Punkt a K ∈ K und `1(K ) , ..., `d(K ) ∈ R+ so gewählt, dass K = a K + K (0) ) (K ) mit K (0) = [0, `(K 1 ] × ... × [0, `d ]. gilt. Da sich die Funktion f auf der kleinen Menge φ(K ) nur wenig ändert, sollte das Integral von f über φ(K ) ungefähr den Wert ( f ◦ φ)(a K )v d (φ(K )) annehmen. Weil φ stetig differenzierbar ist, kann φ in einer ) Umgebung von a K durch eine affin-lineare Funktion approximiert werden: Für alle t 1 , ..., t d mit t k ∈ [0, `(K ] k für 1 ≤ k ≤ d gilt à ! d d X X φ aK + tk e k ≈ φ(a K ) + t k φ0 (a K )(e k ). , k=1 k=1 Die Bildmenge φ(K ) stimmt also in guter Näherung mit dem Parallelotop φ(a K ) + φ0 (a K )(K (0) ) überein. Bezeichnen wir mit G φ (a K ) die Gramsche Determiante des Tupels (φ0 (a K )(e 1 ), ..., φ0 (a K )(e d )), dann ist das d -dimensionale Volumen des von diesem Tupel aufgespannten Parallelotops, wie oben ausgeführt, gleich ) 0 (detG φ (a K ))1/2 . Für das Volumen des Parallelotops φ0 (a K )(K (0) ), das von den Vektoren `(K φ (a K )(e k ) aufk Qd (K ) (0) gespannt wird, muss entsprechend mit dem Faktor k=1 `k = v d (K ) = v d (K ) multipliziert werden. Ingesamt erhalten wir also für das d -dimensionale Volumen von φ(K ) die Näherung q v d (φ(K )) ≈ detG φ (a K )v d (K ). Für ein sinnvoll definiertes, d -dimensionales Integral über die Menge φ(Q) sollte also gelten Z X Z X f d vd = f (x) d x ≈ ( f ◦ φ)(a K )v d (φ(K )) ≈ φ(Q) K ∈Q(Z ) φ(K ) K ∈Q(Z ) q X ( f ◦ φ)(a K ) detG φ (a K )v d (K ) Z ≈ K ∈Q(Z ) Diese Überlegungen motivieren die folgenden Definitionen. —– 32 —– Q q ( f ◦ φ)(x) detG φ (x) d x. § 4. Die Integralsätze von Gauß und Stokes Definition 4.1 Seien d , n ∈ N mit d < n. Ein kompaktes d -dimensionales, C 1 parametrisiertes Flächenstück ist eine stetig differenzierbare Abbildung φ : B → Rn auf einer kompakten Teilmenge B ⊆ Rd mit der Eigenschaft, dass φ außerhalb einer Jordanschen Nullmenge N ⊆ B injektiv und die Spaltenvektoren von φ0 (x) für alle x ∈ B \ N linear unabhängig sind. Definition 4.2 Sei φ : B → Rn ein kompaktes d -dimensionales, C 1 -parametrisiertes Flächenstück. Sei außerdem U ⊆ Rn eine offene Menge mit U ⊇ φ(B ) und f : U → R eine stetige Abbildung. Dann definiert man Z Z q f d vd = ( f ◦ φ)(x) detG φ (x) d x , φ(B ) B wobei G φ (x) für jedes x ∈ B jeweils die Gramsche Matrix des Tupels bezeichnet, das von den Vektoren φ0 (x)(e k ) ∈ R2 mit 1 ≤ k ≤ d gebildet wird. Man kann zeigen, dass das Integral nur von der Bildmenge φ(B ), nicht aber von der Parametrisierung φ abhängt. Das Integral über die konstante Funktion 1 nennt wir das d -dimensionale Volumen von φ(B ) und bezeichnen es mit Vd (φ(B )). Wir illustrieren diese Definition durch die Berechnung der Mantelfläche eines Kreiskegels. Bezogen auf einen Kegel mit Grundfläche πR 2 und Höhe h wird diese parametrisiert durch die Funktion φ : [0, h] × [0, 2π] −→ R , (r, ϕ) 7→ (R(1 − hr ) cos(ϕ), R(1 − hr ) sin(ϕ), r ). Die Ableitung von φ ist in jedem Punkt des Definitionsbereichs gegeben durch R − h cos(ϕ) R( hr − 1) sin(ϕ) φ0 (r, ϕ) = − Rh sin(ϕ) R(1 − hr ) cos(ϕ) . 1 0 Die zugehörige Gramsche Matrix ist gegeben durch − Rh cos(ϕ) R( hr − 1) sin(ϕ) − Rh cos(ϕ) − Rh sin(ϕ) 1 − Rh sin(ϕ) R(1 − hr ) cos(ϕ) r r R( h − 1) sin(ϕ) R(1 − h ) cos(ϕ) 0 1 0 à ! 0 ( Rh )2 + 1 = 2 0 R (1 − hr )2 G φ (r, ϕ) = mit der Determinante R 2 (1− hr )2 (( Rh )2 +1). Setzen wir Q = [0, h]×[0, 2π], dann ist die Mantelfläche des Kegels die Menge φ(Q) ⊆ R3 , und wir erhalten —– 33 —– § 4. Die Integralsätze von Gauß und Stokes V2 (φ(Q)) Z = h µZ 2π Z 0 2πR φ(Q) 0 1 d v2 R(1 − hr ) q £ ¤ 1 2 r =h ( Rh )2 + 1 r − 2h r r =0 = Z q detG φ (r, ϕ) d (r, ϕ) = Q ¶ q ( Rh )2 + 1 d ϕ d r = Z 2πR = 2πR Q R(1 − hr ) q ( Rh )2 + 1 d (r, ϕ) Z h q ( Rh )2 + 1 (1 − hr ) d r q ¡ ¢ ( Rh )2 + 1 h − 12 h = 0 = πRh q ( Rh )2 + 1 = πR = p R 2 + h2. Rechnet man die Grundfläche dazu, dann erhält man für die gesamte Oberfläche des Kreiskegels also den p Wert πR 2 + πR R 2 + h 2 . Häufig ist man auch am d -dimensionalen Volumen von Teilmengen interessiert, die sich nicht durch eine einzige stetig differenzierbare Abbildung parametrisieren lassen. Man bezeichnet F ⊆ Rn als stückweise C 1 -parametrisierbare d -dimensionale Fläche, wenn es kompakte d -dimensionale C 1 -parametrisierte S Flächen φi : B i → Rn gibt, so dass F = di=1 φi (B i ) gilt und außerdem für jedes Paar (i , j ) mit i 6= j und 1 ≤ i , j ≤ m die Menge © ª Bi j = p ∈ B i | φi (p) = φ j (q) für ein q ∈ B j eine Jordansche Nullmenge in Rd ist. Das d -dimensionale Integral einer Funktion f über eine solche Menge wird dann definiert durch Z m Z X f d v2 = f d v2. F i =1 φi (B i ) 3 Im folgenden konzentrieren wir uns auf den Fall d = 2 und n = 3. Sei also φ : B → qR ein 2-dimensionales, 1 3 C -parametrisiertes Flächenstück im R . In diesem Fall lässt sich für den Faktor detG φ (x) eine einfachere Beschreibung geben. Definition 4.3 Das Kreuzprodukt zweier Vektoren v = (v 1 , v 2 , v 3 ) und w = (w 1 , w 2 , w 3 ) im R3 ist definiert durch v1 w1 v2 w3 − v3 w2 v × w = v 2 × w 2 = v 3 w 1 − v 1 w 3 . v3 w3 v1 w2 − v2 w1 Das Kreuzprodukt v ×w steht immer senkrecht auf v und w, es gilt also 〈v, v ×w〉 = 〈w, v ×w〉 = 0. Außerdem stimmt das Quadrat kv × wk2 der euklidischen Norm mit der Determiante der Gramschen Matrix G(v, w) überein. Ersteres ist nämlich gegeben durch kv × wk2 = (v 2 w 3 − v 3 w 2 )2 + (v 3 w 1 − v 1 w 3 )2 + (v 1 w 2 − v 2 w 1 )2 —– 34 —– , § 4. Die Integralsätze von Gauß und Stokes letztere durch à 〈v, v〉 〈v, w〉 det 〈v, w〉 〈w, w〉 ! = 〈v, v〉〈w, w〉 − 〈v, w〉2 = (v 12 + v 22 + v 32 )(w 12 + w 22 + w 32 ) − (v 1 w 1 + v 2 w 2 + v 3 w 3 )2 . Wie man sich leicht überzeugt, stimmen die beiden Ausdrücke überein. Die Länge kv ×wk des Vektors v ×w stimmt also mit dem Flächeninhalt des Parallelogramms überein, das von v und w aufgespannt wird! Somit kann also das zweidimensionale Oberflächenintegral auch in der Form Z Z ° ° f d vd = ( f ◦ φ)(x, y) °φ0 (x, y)(e 1 ) × φ0 (x, y)(e 2 )° d (x, y) φ(B ) B Z = ° ° ° ° ∂φ ∂φ ° (x, y)° ( f ◦ φ)(x, y) ° (x, y) × ° d (x, y) ∂x ∂y B dargestellt werden. Als weiteres Anwendungsbeispiel berechnen wir die Oberfläche der Kugel vom Radius r . Diese wird parametrisiert durch φ : [− π2 , π2 ] × [0, 2π] −→ R3 , (ϑ, ϕ) 7→ (r cos(ϑ) cos(ϕ), r cos(ϑ) sin(ϕ), r sin(ϑ)). In jedem Punkt (ϑ, ϕ) des Definitionsbereichs ist die Ableitungsmatrix gegeben durch φ0 (ϑ, ϕ) = −r sin(ϑ) cos(ϕ) −r cos(ϑ) sin(ϕ) −r sin(ϑ) sin(ϕ) r cos(ϑ) cos(ϕ) r cos(ϑ) 0 , die beiden Ableitungsvektoren sind also −r sin(ϑ) cos(ϕ) φ0 (ϑ, ϕ)(e 1 ) = −r sin(ϑ) sin(ϕ) r cos(ϑ) und −r cos(ϑ) sin(ϕ) φ0 (ϑ, ϕ)(e 2 ) = r cos(ϑ) cos(ϕ) 0 mit dem Kreuzprodukt − cos(ϑ)2 cos(ϕ) r 2 cos(ϑ)2 sin(ϕ) . − cos(ϑ) sin(ϑ) φ0 (ϑ, ϕ)(e 1 ) × φ0 (ϑ, ϕ)(e 2 ) = Es gilt kφ0 (ϑ, ϕ)(e 1 ) × φ0 (ϑ, ϕ)(e 2 )k2 = ¡ ¢ ¡ ¢ r 4 cos(ϑ)4 cos(ϕ)2 + cos(ϑ)4 sin(ϕ)2 + cos(ϑ)2 sin(ϑ)2 = r 4 cos(ϑ)4 + cos(ϑ)2 sin(ϑ)2 ¡ ¢ r 4 cos(ϑ)2 cos(ϑ)2 + sin(ϑ)2 = r 4 cos(ϑ)2 —– 35 —– = § 4. Die Integralsätze von Gauß und Stokes und somit kφ0 (ϑ, ϕ)(e 1 ) × φ0 (ϑ, ϕ)(e 2 )k = r 2 cos(ϑ). Setzen wir Q = [− π2 , π2 ] × [0, 2π], dann ist φ(Q) die Kugeloberfläche, und wir erhalten Z Z ° ° 0 0 ° ° r 2 cos(ϑ) d (ϑ, ϕ) φ (ϑ, ϕ)(e 1 ) × φ (ϑ, ϕ)(e 2 ) d (ϑ, ϕ) = V2 (φ(Q)) = Q Q Z = π/2 µZ −π/2 0 2π ¶ r 2 cos(ϑ) d ϕ d ϑ = 2πr 2 Z π/2 −π/2 cos(ϑ) d ϑ = 2πr 2 [ sin(ϑ) ]ϑ=π/2 ϑ=−π/2 = 4πr 2 . Wie im zweidimensionalen Fall können auch in Dimension 3 Integrale über Vektorfelder definiert werden. Sei U ⊆ R3 eine offene Teilmenge. Ein Vektorfeld auf U ist eine Abbildung f : U → R3 . Wie zuvor sprechen wir von einem stetigen bzw. einem C 1 -Vektorfeld, wenn f als Abbildung stetig bzw. stetig differenzierbar ist. Definition 4.4 Sei U ⊆ R3 offen, f : U → R3 ein stetiges Vektorfeld und φ : B → R3 ein kompaktes C 1 -parametrisiertes Flächenstück mit φ(B ) ⊆ U . Dann nennt man Z Z 〈 f , d A〉 = 〈( f ◦ φ)(x, y), φ0 (x, y)(e 1 ) × φ0 (x, y)(e 2 )〉 d (x, y) φ(B ) B das Flächenintegral von f über φ(B ). (Das Symbol d A steht für area, also „Fläche“.) Das Flächenintegral für Vektorfelder lässt sich auch mit Hilfe des zuvor definierten 2-dimensionalen Integrals für skalare Funktionen ausdrücken. Ist φ : B → R3 ein kompaktes C 1 -parametrisiertes Flächenstück wie in der Definition, dann nennt man für (x, y) ∈ B den Vektor n φ (x, y) = 1 φ0 (x, y)(e 1 ) × φ0 (x, y)(e 2 ) kφ0 (x, y)(e 1 ) × φ0 (x, y)(e 2 )k den Einheitsnormalenvektor des Flächenstücks im Punkt φ(x, y). Auf Grund der Bilinearität von 〈·, ·〉 gilt offenbar 〈( f ◦ φ)(x, y), φ0 (x, y)(e 1 ) × φ0 (x, y)(e 2 )〉 = = 〈( f ◦ φ)(x, y), n φ (x, y)〉kφ0 (x, y)(e 1 ) × φ0 (x, y)(e 2 )k 〈( f ◦ φ)(x, y), n φ (x, y)〉 q detG φ (x, y) für alle (x, y) ∈ B . Deshalb kann das Flächenintegral über f auch in der Form Z Z 〈 f , d A〉 = 〈 f , nφ 〉 d v 2 dargestellt werden. φ(B ) φ(B ) Für stückweise C 1 -parametrisierbare Flächen F mit Parametrisierungen φ1 , ..., φm definiert man das Flächenintegral wie beim Integral skalarer Funktionen durch Z m Z X 〈 f , d A〉 = 〈 f , d A〉. F i =1 φi (B i ) —– 36 —– § 4. Die Integralsätze von Gauß und Stokes In Analogie zum zweidimensionalen Fall ist die Divergenz eines Vektorfelds f : U → R3 definiert durch div f (x, y, z) = ∂ f1 ∂ f2 ∂ f3 (x, y, z) + (x, y, z) + (x, y, z). ∂x ∂y ∂z Der folgende Satz stellt einen Zusammenhang zwischen 2- und 3-dimensionaler Integration her. Es handelt sich um das natürliche Analogon von Satz (3.9). Einen Beweis für dreidimensionale Normalbereiche (deren Definition hier nicht angegeben wurde), findet man in [Wa], Abschnitt 8.6. Satz 4.5 (Gaußscher Integralsatz) Sei G ⊆ R3 eine beschränkte, offene, zusammenhängende Teilmenge mit der Eigenschaft, dass der Rand ∂G eine stückweise C 1 -parametrisierbare Fläche ist, wobei die Parametrisierung so gewählt ist, dass der Einheitsnormalenvektor stets auf das Äußere von G gerichtet ist. Sei U ⊆ R3 offen mit U ⊇ Ḡ und f : U → R3 ein C 1 -Vektorfeld auf U . Dann gilt Z Z div f (x, y, z) d (x, y, z) G = ∂G 〈 f , d A〉. Die Bedingung zur Ausrichtung des Einheitsnormalenvektors genauer auszuführen, wäre mit einem recht hohen technischen Aufwand verbunden, weshalb wir hier darauf verzichten. In Spezialfällen (z.B. dem Fall eines Quaders oder eine Kugel) lässt sich die Bedingung aber leicht konkretisieren. Der Gaußsche Integralsatz ermöglicht eine anschauliche Interpretation der Divergenz eines C 1 -Vektorfelds f : U → R3 . Sei p ∈ U und r ∈ R+ so gewählt, dass die Kugel K r vom Radius r um den Punkt p ganz in U liegt. Sei S r = ∂K r die zugehörige Sphäre. Man kann leicht zeigen, dass S r eine zweidimensionale, stückweise C 1 parametrisierbare Fläche ist. Seien m r− bzw. m r+ das Minimum bzw. Maximum von div f auf K r . Nach Satz (1.6) gilt Z m r− v 3 (K r ) ≤ div f (x, y, z) d (x, y, z) Kr auf Grund des Gaußschen Integralsatzes also auch Z m r− v 3 (K r ) ≤ 〈 f , d A〉 Sr ≤ ≤ m r+ v 3 (K r ) , m r+ v 3 (K r ). Für r → 0 laufen m r− und m r+ auf Grund der Stetigkeit von div f gegen den Wert div f (p). Teilt man die Ungleichung also durch v 3 (K r ) und lässt r gegen Null laufen, so erhält man Z 1 〈 f , d A〉. div f (p) = lim r →0 v 3 (K r ) S r Interpretiert man das Vektorfeld f als das Geschwindigkeitsfeld einer Strömung, dann ist das FlächeninteR gral S r 〈 f , d A〉 ein Maß für die Stoffmenge, die pro Zeiteinheit durch den Randbereich S r hindurchströmt, —– 37 —– § 4. Die Integralsätze von Gauß und Stokes den Volumenbereich K r also verlässt. Ein positiver Wert für div f (p) bedeutet also, dass aus dem Punkt p Materie herausströmt, es sich beim Punkt p also um eine Quelle des Strömungsfeldes handelt. Einen Punkt p mit div f (p) < 0 nennt man entsprechend eine Senke des Feldes. Der Gaußsche Integralsatz kann verwendet werden, um das Volumen eines Raumbereichs durch ein Flächenintegral auszudrücken. Ist nämlich f : U → R3 ein Vektorfeld mit konstanter Divergenz 1, dann gilt Z Z v 3 (G) = 1 d (x, y, z) = 〈 f , d A〉. ∂G G Als Anwendungsbeispiel betrachten wir die Halbkugel vom Radius 1 gegeben durch G = {(x, y, z) ∈ R3 | z ≥ 0 , x 2 + y 2 + z 2 ≤ 1}. sowie das Vektorfeld f : R3 → R3 gegeben durch f (x, y, z) = (x, 0, 0). Die Randfläche ∂G wird parametrisiert durch die Abbildungen φ1 : K → B , (x, y) 7→ (−x, y, 0) und φ2 : K −→ B (x, y) 7→ (x, y, , q 1 − x 2 − y 2) , wobei K = {(x, y) ∈ R2 | x 2 + y 2 ≤ 1} die Kreisscheibe vom Radius 1 bezeichnet. Dabei entspricht φ1 der flachen Unterseite und φ2 der gewölbten Oberseite der Halbkugel. Die Ableitungen von φ1 und φ2 sind gegeben durch φ01 (x, y) = −1 0 0 1 0 0 φ02 (x, y) und = 1 0 0 1 x 1−x 2 −y 2 −p . y −p 1−x 2 −y 2 Für φ1 ist der nach außen (oder unten) gerichtet Einheitsnormalenvektor jeweils n φ1 (x, y) = 1 φ0 (x, y)(e 1 ) × φ01 (x, y)(e 2 ) kφ01 (x, y)(e 1 ) × φ01 (x, y)(e 2 )k 1 = Es folgt 〈( f ◦ φ)(x, y), n φ1 (x, y)〉 = 〈(x, 0, 0), (0, 0, −1)〉 = 0, also ist das Integral die Oberseite erhalten wir φ02 (x, y)(e 1 ) × φ02 (x, y)(e 2 ) = 1 0 x 1−x 2 −y 2 −p × 0 1 y −p −1 0 0 × 1 0 0 R φ1 (K ) 〈 f , d A〉 = 1−x 2 −y 2 = 0 0 . −1 gleich Null. Für x 1−x 2 −y 2 y p p 2 2 1−x −y 1 und somit 〈( f ◦ φ2 )(x, y), φ02 (x, y)(e 1 ) × φ02 (x, y)(e 2 )〉 = * x 0 0 —– 38 —– x + 1−x 2 −y 2 y p , p 2 2 1−x −y 1 = x2 p 1 − x2 − y 2 . § 4. Die Integralsätze von Gauß und Stokes Wir können nun das zweidimensionale Flächenintegral von f über die Oberseite berechnen. Für die Auswertung des zweidimensionalen Integrals verwenden wir Substitutionsregel mit der Polarkoordinaten-AbR bildung (siehe 2) sowie das unbestimmte Integral cos(x)2 d x = 21 (x + sin(x) cos(x)). Insgesamt erhalten wir Z Z v 3 (G) = 〈 f , d A〉 = 〈 f , d A〉 = ∂G Z K 〈( f ◦ φ2 )(x, y), φ02 (x, y)(e 1 ) × φ02 (x, y)(e 2 )〉 d (x, y) Z 1 Z 0 φ2 (K ) r cos(ϕ)2 d (r, ϕ) p [0,1]×[0,2π] 1−r2 1 Z = 0 r3 p 1−r2 x2 d (x, y) p K 1 − x2 − y 2 µZ 2π ¶ 2 cos(ϕ) d ϕ d r = Z = = 0 Z 1 2 Z 1 ¤ϕ=2π r3 £ r (2r ) πr 3 ϕ + sin(ϕ) cos(ϕ) ϕ=0 d r = d r = 12 π dr p p p 0 0 1−r2 1−r2 1−r2 Z 1 Z 1 Z 1 Z 1 s 1−s −1/2 1 1 1 1 s ds − 2π s 1/2 d s = ds = 2π p p ds = 2π 2π s 0 0 0 0 1−s £ 1/2 ¤1 1 £ 2 3/2 ¤1 1 = π − 13 π = 32 π. 0 − 2π 3s 2 π 2s 0 = Eine physikalische Anwendung (Elektromagnetismus) Sei Q eine elektrische Ladung im Koordinatenursprung (0, 0, 0) des R3 . Nach dem Coulombschen Gesetz wird auf eine Probeladung q im Punkt ~ r ∈ R3 die Kraft ~ (~ F r) = 1 qQ ~ r 4πε0 r 3 ausgeübt, wobei r = k~ r k ist und ε0 die sog. Dielektrizitätskonstante bezeichnet. Die Ladung Q erzeugt damit in jedem Raumpunkt ~ r ∈ R3 ein elektrisches Feld ~ (~ E r) = ~ F q = 1 Q ~ r. 4πε0 r 3 R ~ , d A〉 als den Ist φ : B → R3 ein kompaktes parametrisiertes Flächenstück, dann bezeichnet man φ(B ) 〈E + elektrischen Fluss durch die Fläche φ(B ). Sei K r für jedes r ∈ R die Kugel vom Radius r um den Koordinatenursprung und φ eine Parametrisierung von ∂K r wie im Gaußschen Integralsatz. Für jeden Punkt (x, y) ∈ B mit ~ r = φ(x, y) ∈ K r gilt dann À ¿ 1 Q 1 2 1 Q 1 Q 1 ~ (φ(x, y)), n φ (x, y)〉 = ~ ~ 〈E r , r = · ·r = . 3 3 4πε0 r r 4πε0 r r 4πε0 r 2 ~ (φ(x, y)), n φ (x, y)〉 ist auf B also konstant. Weil ∂K r den Flächeninhalt 4πr 2 besitzt, Die Funktion (x, y) 7→ 〈E erhalten wir Z 1 Q ~ , d A〉 = 4πr 2 · 〈E = ε−1 (1) 0 Q. 2 4πε r ∂K r 0 —– 39 —– § 4. Die Integralsätze von Gauß und Stokes Man kann nachrechnen, dass der Wert für den elektrischen Fluss auch dann den Wert ε−1 0 Q annimmt, wenn ~ nicht nur durch einen, sondern durch mehrere Ladungsträger innerhalb der Kugel das elektrische Feld E K r mit Gesamtladung Q erzeugt wird, wobei es auch gleichgültig ist, wo innerhalb von K r sich die Ladungsträger befinden. Auch wenn ρ eine beliebige kontinuierliche Ladungsverteilung (man sagt auch Ladungsdichte) in K r ist, beträgt der elektrische Fluss durch ∂K r genau ε−1 0 Q, solange nur für die Gesamtladung Z ρ(x, y, z) d (x, y, z) = Q gilt. Kr Allgemein gilt für Kugeln K r vom Radius r um beliebige Punkte p ∈ R3 also Z Z ~ , d A〉 ρ(x, y, z) d (x, y, z) = ε0 〈E ∂K r Kr Durch Anwendung des Gaußschen Integralsatzes erhalten wir Z Z ~ (x, y, z) d (x, y, z). ρ(x, y, z) d (x, y, z) = ε0 div E Kr Kr Dividieren wir nun beide Seiten durch das Volumen v 3 (K r ) = 43 πr 3 und lassen r anschließend gegen Null laufen, dann folgt nach dem Mittelwertsatz der Integralrechnung ρ(p) = ~ (p). ε0 · div E Dies ist eine der vier Maxwellschen Gleichungen. Zum Abschluss formulieren wir noch den Integralsatz von Stokes. Dieser stellt einen Zusammenhang her zwischen Kurven- und Flächenintegralen im R3 . Definition 4.6 Sei U ⊆ R3 offen und f : U → R3 ein C 1 -Vektorfeld. Dann ist die Rotation von f in jedem Punkt (x, y, z) ∈ U definiert durch ∂ f3 ∂ f2 (x, y, z) − (x, y, z) ∂y ∂z ∂f ∂ f3 1 (x, y, z) − (x, y, z) . ∂z ∂x ∂ f2 ∂ f1 (x, y, z) − (x, y, z) ∂x ∂y rot f (x, y, z) = Eine einfache Merkregel für die Rotation lautet „rot f = ∇ × ³ f “, wobei ∇´den Operator bezeichnet, der jeder ∂f ∂f ∂f skalaren Funktion ihren Gradienten zuordnet, also ∇( f ) = ∂x ∂y ∂z (siehe Vorlesung letztes Semester). Man erhält dann die Rotation durch die symbolische Rechnung ∂ ∂ ∂ f − f f1 f 3 2 1 ∂y ∂z ∂x ∂ ∂ ∂ f − f rot f = ∇ × = × = f2 ∂y f 2 ∂z 1 ∂x 3 ∂ ∂ ∂ f − f f3 f 3 ∂x 2 ∂y 1 ∂z —– 40 —– § 4. Die Integralsätze von Gauß und Stokes Außerdem benötigen wir für den Integralsatz noch Kurvenintegrale über Vektorfelder im R3 . Diese sind genau wie im zweidimensionalen Fall definiert: Ist f : U → R3 ein stetiges Vektorfeld auf einer offenen Menge U ⊆ R3 und γ : [a, b] → R3 eine Kurve in U , dann setzt man Z γ Z 〈 f , d s〉 = b a 〈( f ◦ γ)(t ), γ0 (t )〉 d t , wobei 〈·, ·〉 das euklidische Skalarprodukt auf dem R3 bezeichnet. Satz 4.7 (Stokescher Integralsatz) Sei φ : B → G eine kompaktes, C 1 -parametrisiertes Flächenstück und γ eine Kurve, die den Rand von φ(B ) in positiver Richtung durchläuft. Sei U eine offene Teilmenge von R3 mit U ⊇ φ(B ) und f : U → R3 ein C 1 -Vektorfeld. Dann gilt Z Z 〈 f , d s〉 = 〈rot f , d A〉. γ φ(B ) Auch die Bedingung an die Kurve γ wird aus Zeitgründen nicht genauer ausgeführt. Ist B ein Normalbereich in R2 im Sinne von Def. (3.6) und ∂B : [0, 1] → B die dort definierte Randkurve, dann erfüllt zum Beispiel die Kurve φ ◦ ∂B : [0, 1] → R3 die Bedingung des Stokesschen Integralsatzes. —– 41 —– § 5. Das Lebesgue-Integral In diesem Abschnitt werden wir neben einer Erweiterung des Integralbegriffs auch das Verhalten von Funktionen bei Grenzübergängen betrachten. Dabei unterscheidet man grundsätzlich zwei verschiedene Arten von Konvergenz. Für jede Funktion f : X → R auf einem metrischen Raum X setzen wir k f k∞ = © ª sup | f (x)| | x ∈ X ∈ R+ ∪ {+∞}. Die Funktion f ist also genau dann beschränkt, wenn k f k∞ ∈ R+ gilt. Man sagt, eine Folge ( f n )n∈N von Funktionen f n : X → R konvergiert punktweise gegen eine Funktion f : X → R, wenn lim f n (x) n→∞ = f (x) für alle x ∈ X erfüllt ist. Gilt sogar limn k f n − f k∞ = 0, dann spricht man von gleichmäßiger Konvergenz. Das Riemann-Integral, das wir bisher betrachtet haben, weist zwei gravierende Mängel auf. Zum einen ist es nur für Funktionen mit beschränktem Definitionsbereich definiert, einer Funktion wie zum Beispiel f : [1, +∞[ → R, x 7→ x12 kann bereits kein Riemann-Inegral mehr zugeordnet werden. Für jedes a ∈ R, a > 1 gilt allerdings · ¸ Z a 1 x=a 1 f (x) d x = − = 1− x x=1 a 1 so dass im Prinzip nichts dagegen sprechen würde, dieser Funktion das Integral ¶ µ Z Z a 1 = 1 f (x) d x = lim f (x) d x = lim 1 − a→+∞ 1 a→+∞ a [1,+∞[ zuzuordnen. Allerdings ist diese indirekte Definition über Grenzwerte besonders im Mehrdimensionalen sehr unhandlich. Beispielsweise muss man sicherstellen, dass die vielen verschiedenen Möglichkeiten, einen Grenzübergang durchzuführen, alle denselben Grenzwert liefern. Ein weiterer Nachteil des Riemann-Integrals besteht darin, dass es nur unter sehr starken Voraussetzungen mit Grenzübergängen vertauschbar ist, die in den Anwendungen nur selten vorliegen. Als Beispiel betrachten wir die Dirichlet-Funktion χ : [0, 1] → R gegeben durch 1 falls x ∈ Q χ(x) = 0 sonst. die, wie wir bereits gesehen haben, nicht Riemann-integrierbar ist. Sei nun (x n )n∈N eine Folge, die alle Elemente aus N = [0, 1] ∩ Q durchläuft. Definieren wir eine Funktionenfolge (χn )n∈N durch 1 falls x ∈ {x , ..., x } 1 n χn (x) = , 0 sonst —– 42 —– § 5. Das Lebesgue-Integral dann konvergiert die Folge (χn )n∈N punktweise gegen χ, außerdem stimmt χ mit allen χn außerhalb der Nullmenge N überein. Deshalb wäre es nur natürlich, der Funktion χ das Integral 1 Z 0 Z χ(x) d x lim = n→∞ 0 1 χn (x) d x zuzuordnen. Wir werden nun sehen, wie die Klasse der integrierbaren Funktionen auf solche Fälle ausgedehnt werden kann. Für jede Funktion f : Rn → R bezeichnen wir den Abschluss der Menge {x ∈ Rn | f (x) 6= 0} als den Träger supp( f ) von f . Die Menge der stetigen Funktionen f : Rn → R mit kompaktem Träger bezeichnen wir mit C c (Rn ). Für jede Funktion f ∈ C c (Rn ) wählen wir einen kompakten Quader Q mit Q ⊇ supp( f ) und setzen Z Z I ( f ) := f (x) d x := f (x) d x. Rn Q Wie wir bereits gesehen haben, ist der Wert I ( f ) ∈ R unabhängig von der Wahl dieses Quaders. Die Zuordnung I : C c (Rn ) → R ist linear, es gilt also I ( f + g ) = I ( f ) + I (g ) und für alle f , g ∈ C (Rn ) und λ ∈ R , I (λ f ) = λI ( f ) insbesondere sind mit f und g auch f + g und λ f in C c (Rn ) enthalten. Außerdem ist I monoton, d.h. aus f ≤ g folgt I ( f ) ≤ I (g ), für alle f , g ∈ C c (Rn ). Im weiteren Verlauf werden wir des öfteren verwenden, dass mit f , g ∈ C c (Rn ) auch die Funktionen | f |, f ∨ g = max{ f , g } und f ∧ g = min{ f , g } in C c (Rn ) liegen. Die Teilmenge aller Funktionen f ∈ C c (Rn ) mit f (x) ≥ 0 für alle x ∈ Rn bezeichnen wir mit C c+ (Rn ). P φ von Funktionen φk ∈ C c+ (Rn ) bezeichnet man als Definition 5.1 Eine Reihe ∞ k=1 k n Majorante einer Funktion f : R → R, wenn | f (x)| ≤ ∞ X φk (x) und k=1 ∞ X I (φk ) < +∞ gilt. k=1 Die Menge aller Funktionen f , die eine Majorante besitzen, bezeichnen wir mit L̃ (Rn ). P Eine Summe der Form ∞ I (φk ) wird dann eine Obersumme von f genannt, und wir k=1 setzen ( ) ¯ X ∞ ∞ X ¯ I (φk ) ¯ φk ist Majorante von f . k f kL = inf k=1 k=1 Wir werden nun zunächst die Eigenschaften des Funktionenraums L̃ (Rn ) untersuchen. —– 43 —– § 5. Das Lebesgue-Integral Proposition 5.2 Sei (g k )k∈N eine Folge in L̃ (Rn ) mit eine Funktion mit der Eigenschaft | f (x)| ∞ X ≤ P∞ k=1 kg k kL < +∞ und f : Rn → R für alle x ∈ Rn . |g k (x)| k=1 Dann liegt auch f in L̃ (Rn ), und es gilt k f kL ≤ ∞ X kg k kL . k=1 Beweis: Sei ε ∈ R+ vorgegeben. Nach Voraussetzung existiert für jedes k ∈ N eine Majorante P∞ (k) −k j =1 I (φ j ) < kg k kL + 2 ε. Es gilt dann | f (x)| ≤ ∞ X |g k (x)| ≤ ∞ X ∞ X k=1 j =1 k=1 (k) j =1 φ j P∞ mit φ(k) (x) für alle x ∈ Rn . j Also hat auch die Funktion f eine Majorante, und es folgt f ∈ L̃ (Rn ). Außerdem gilt ∞ X ∞ X k=1 j =1 I (φ(k) ) j ∞ ³ X ≤ Nach Definition von k · kL folgt k f kL ≤ P kg k kL . k f kL ≤ ∞ k=1 kg k kL + 2−k ε ´ ∞ X ≤ k=1 P∞ k=1 kg k kL + ε. k=1 kg k kL + ε. Da ε ∈ R+ beliebig vorgegeben war, erhalten wir ä Definition 5.3 Eine Abbildung k · k : V → R+ auf einem R-Vektorraum V wird Halbnorm genannt, wenn kλvk = |λ|kvk und kv + wk ≤ kvk + kwk für alle v, w ∈ V . Für den Nullvektor 0V gilt bei einer Halbnorm k · k weiterhin k0V k = k0 · 0V k = |0|k0V k = 0. Die einzige Bedingung, die gegenüber einer Norm im allgemeinen nicht erfüllt ist, ist die Implikation kvk = 0 ⇒ v = 0V für alle v ∈ V . Proposition 5.4 (i) Ist f ∈ L̃ (Rn ) und g : Rn → R beschränkt, dann liegt auch f g in L̃ (Rn ), und es gilt k f g kL ≤ k f kL kg k∞ . (ii) Die Menge L̃ (Rn ) ist ein R-Vektorraum, und k·kL ist eine Halbnorm auf L̃ (Rn ). P P Beweis: zu (i) Sei ε ∈ R+ vorgegeben. Dann gibt es eine Majorante ∞ φk von f mit ∞ I (φk ) < k f kL + k=1 k=1 P∞ ε. Wegen f g ≤ kg k∞ f ist dann k=1 kg k∞ φk eine Majorante von f g , und aus I (kg k∞ φk ) = kg k∞ I (φk ) folgt k f g kL ≤ ∞ X k=1 I (kg k∞ φk ) = kg k∞ ∞ X I (φk ) k=1 —– 44 —– < k f kL kg k∞ + εkg k∞ . § 5. Das Lebesgue-Integral Weil ε ∈ R+ beliebig vorgegeben war, erhalten wir k f g kL ≤ k f kL kg k∞ . zu (ii) Zunächst zeigen wir, dass L̃ (Rn ) ein Untervektorraum des R-Vektorraums aller Funktionen f : P P Rn → R ist. Sind f , g ∈ L̃ (Rn ) und λ ∈ R vorgegeben und ∞ φk und nk=1 ψk Majoranten von f bzw. g , k=1 P∞ P∞ dann ist k=1 (φk +ψk ) offenbar eine Majorante von f + g und k=1 |λ|φk eine Majorante von λ f . Also sind f + g und λ f in L̃ (Rn ) enthalten. Die Dreiecksungleichung k f + g kL ≤ k f kL + kg kL ist ein Spezialfall von Prop. (5.2), und aus Teil (i) angewendet auf die konstante Funktion g (x) = λ folgt kλ f kL ≤ |λ|k f kL . Außerdem gilt k f kL = k λ1 · λ · f kL ≤ 1 |λ| kλ f kL und somit |λ|k f kL ≤ kλ f kL . Insgesamt erhalten wir kλ f kL = |λ| · k f kL . ä Definition 5.5 Eine Funktion f ∈ L̃ (Rn ) wird Lebesgue-integrierbar genannt, wenn eine Folge ( f n )n∈N in C c (Rn ) mit lim k f − f n kL n→∞ = 0 existiert. Die Teilmenge der Lebesgue-integrierbaren Funktionen in L̃ (Rn ) bezeichnen wir mit L (Rn ). Eine Funktion f : B → R auf einer Teilmenge B ⊆ Rn bezeichnen wir als Lebesgue-integrierbar, wenn ihre Nullfortsetzung auf Rn Lebesgue-integrierbar ist. Weiter unten werden wir zeigen, dass jede Riemann-integrierbare Funktion auch Lebesgue-integrierbar ist, ebenso die beiden in der Einleitung beschriebenen Funktionen. Offenbar ist L (Rn ) ein Untervektorraum des R-Vektorraums L̃ (Rn ). Sind nämlich λ ∈ R und f , g ∈ L (Rn ) vorgegeben und ( f n )n∈N und (g n )n∈N Funktionenfolgen wie in der Definition angegeben, dann sind auch ( f n + g n )n∈N und (λ f n )n∈N Folgen in C c (Rn ). Aus 0 ≤ k( f n + g n ) − ( f + g )kL ≤ k f n − f kL + kg n − g kL und limn k f n − f kL = limn kg n − g kL = 0 folgt limn k( f n + g n ) − ( f + g )kL = 0, außerdem gilt ³ ´ lim kλ f n kL = |λ| · lim k f n kL = |λ| · 0 = 0. n→∞ n→∞ Als nächstes werden wir nun den Lebesgue-integrierbaren Funktionen ein Integral zuordnen. Dazu benötigen wir ein wenig technische Vorbereitung. Für eine beliebige Teilmenge K ⊆ Rn sei die Funktion d K : Rn → R+ definiert durch d K (x) = inf{ kx − yk∞ | y ∈ K } , wobei k · k∞ die Maximumsnorm auf Rn bezeichnet. Diese Funktion gibt also den k · k∞ -Abstand zwischen dem Punkt x und der Menge K an. —– 45 —– § 5. Das Lebesgue-Integral Für jedes ε ∈ R+ und jede Menge K definieren wir eine Funktion χK ,ε : Rn → [0, 1] durch 1 − 1ε d K (x) falls d K (x) ≤ ε χK ,ε (x) = 0 falls d K (x) ≥ ε. Es ist leicht zu zeigen, dass d K und damit auch die Funktionen χK ,ε stetig sind. Wir haben damit der (in aller Regel unstetigen) charakteristischen Funktion χK eine Familie von stetigen Funktionen zugeordnet, die sich von χK nur auf einem „kleinen“ Bereich unterscheiden. Ist K ⊆ Rn beschränkt, dann ist χK ,ε darüber hinaus in C c+ (Rn ) enthalten. Insbesondere ist der Träger von χK ,ε nur geringfügig größer als der Träger von χK . Ist beispielsweise K ein Quader der Form [a 1 , b 1 ] × ... × [a n , b n ], dann gilt supp(χK ,ε ) = [a 1 − ε, b 1 + ε] × ... × [a n − ε, b n + ε]. Proposition 5.6 Sei K ⊆ Rn kompakt und (φk )k∈N eine Folge in C c (Rn ) mit supp(φk ) ⊆ K und limk kφk k∞ = 0. Dann folgt lim I (φk ) = 0. k→∞ Beweis: Für jedes ε ∈ R+ gelten jeweils die Ungleichungen −kφk k∞ · χK ,ε ≤ −kφk k∞ · χK ≤ φk ≤ kφk k∞ · χK ≤ kφk k∞ · χK ,ε Auf Grund der Monotonie der Funktion I folgt daraus −kφk k∞ I (χK ,ε ) ≤ I (φk ) ≤ kφk k∞ I (χK ,ε ). Aus der Voraussetzung kφk k∞ → 0 folgt also I (φk ) → 0. ä Satz 5.7 (Satz von Dini) Sei X ein kompakter metrischer Raum und ( f k )k∈N eine punktweise monoton wachsende Folge stetiger Funktionen f k : X → R (es gelte also f k (x) ≤ f k+1 (x) für alle x ∈ X und k ∈ N). Sei f : X → R eine stetige Funktion mit der Eigenschaft, dass ( f k )k∈N punktweise gegen f konvergiert. Dann konvergiert ( f k )k∈N auch gleichmäßig gegen f . Beweis: Für vorgegebenes ε ∈ R+ und k ∈ N sei jeweils Uk = {x ∈ X | f (x) − f k (x) < ε}. Auf Grund der Stetigkeit von f k und f ist jedes Uk offen. Auf Grund der punktweisen Konvergenz bilden sie außerdem eine Überdeckung von X , denn für jedes x ∈ X gibt es ein k ∈ N mit f (x) − f k (x) < ε, und es folgt dann x ∈ Uk . Wegen f (x) − f k+1 ≤ f (x) − f k (x) gilt jeweils Uk ⊆ Uk+1 . Weil X kompakt ist, existiert eine endliche Teilüberdeckung von (Uk )k∈N und wegen Uk ⊆ Uk+1 für alle k somit ein ` ∈ N mit U` = X . Für alle k ≥ ` und x ∈ X gilt also f (x) − f ` (x) < ε. Damit ist die gleichmäßige Konvergenz bewiesen. ä —– 46 —– § 5. Das Lebesgue-Integral Proposition 5.8 Für jedes φ ∈ C c (Rn ) gilt |I (φ)| ≤ I (|φ|) = kφkL . Beweis: Aus φ ≤ |φ| folgt I (φ) ≤ I (|φ|), und wegen I (|φ|) ≥ 0 erhalten wir |I (φ)| ≤ I (|φ|). Weil |φ| eine Majorante von φ ist, gilt außerdem kφkL ≤ I (|φ|) nach Definition der Halbnorm k · kL . Zum Beweis der P Ungleichung I (|φ|) ≤ kφkL sei ∞ φ eine beliebige Majorante von |φ|. Für jedes m ∈ N sei k=1 k à ψm = m X |φ| ∧ ! φk C c+ (Rn ). ∈ k=1 Offenbar gilt supp(ψm ) ⊆ supp |φ| für alle m ∈ N. Außerdem konvergiert (ψm )m∈N punktweise wegen |φ|, P denn für jedes x ∈ X gibt es ein m ∈ N mit m φ (x) ≥ |φ(x)|. Weil die Träger von |φ| und ψm kompakt k=1 k sind und die Folge (ψm )m∈N außerdem monoton wachsend ist, können wir den Satz von Dini anwenden. Demnach konvergiert die Folge (ψm )m∈N gleichmäßig gegen |φ|, es gilt also lim kψm − |φ|k∞ 0. = m→∞ Nach Prop. (5.6) folgt daraus limm I (ψm ) = I (|φ|). Außerdem gilt ψm ≤ I (ψm ) ≤ m X I (φk ) ∞ X ≤ k=1 Pm k=1 φk für alle m ∈ N, damit I (φk ) k=1 P P I (φk ). Weil die I (φk ) für alle m ∈ N. Wegen I (ψm ) → I (|φ|) folgt daraus |I (φ)| ≤ ∞ und |I (ψm )| ≤ ∞ k=1 k=1 Majorante beliebig vorgegeben war, erhalten wir |I (φ)| ≤ kφkL wie gewünscht. ä Definition 5.9 Sei f ∈ L (Rn ) und ( f k )k∈N eine Folge in C c (Rn ) mit limk k f k − f kL = 0. Dann ist Z L Z f (x) d x = lim I ( f k ) = lim f k (x) d x k→∞ Rn k→∞ Rn das Lebesgue-Integral der Funktion f . Jede Lebesgue-integrierbaren Funktion f : B → R auf einer Teilmenge B ⊆ Rn ordnen wir das Lebesgue-Integral der Nullfortsetzung zu. R Um zu zeigen, dass der angebene Grenzwert existiert, weisen wir nach, dass die Zahlen I ( f k ) = Rn f k (x) d x eine Cauchyfolge bilden. Nach Voraussetzung existiert für beliebig vorgegebenes ε ∈ R+ ein N ∈ N, so dass k f k − f kL < 21 ε für alle k ≥ N gilt. Nach Prop. (5.8) folgt für alle k, ` ≥ N dann |I ( f k ) − I ( f ` )| = |I ( f k − f l )| ≤ k f k − f ` kL ≤ k f k − f kL + k f ` − f kL < 1 1 2ε+ 2ε = ε. Wir müssen noch zeigen, dass das Lebesgue-Integral von f ∈ L (Rn ) unabhängig von der Wahl der Folge ( f k )k∈N ist. Sei (g k )k∈N eine weitere Folge mit den in der Definition angegebenen Eigenschaften. Wegen k f k − g k kL = k( f k − f ) + ( f − g k )kL —– 47 —– ≤ k f k − f kL + kg k − f kL § 5. Das Lebesgue-Integral gilt limk k f k − g k kL = 0. Nach Prop. (5.8) gilt |I ( f k − g k )| ≤ k f k − g k kL , also folgt lim |I ( f k ) − I (g k )| = k→∞ lim |I ( f k − g k )| k→∞ = 0 und somit limk I ( f k ) = limk I (g k ). Ist f : Rn → R eine stetige Funktion mit kompaktem Träger, dann kann als Folge ( f k )k∈N in C c (Rn ) die konstante Folge f k = f gewählt werden. In diesem Fall stimmen Riemann- und Lebesgue-Integral also überein. Weiter unten werden wir zeigen, dass die Übereinstimmung der Integrale für beliebige Riemannintegrierbare Funktionen erhalten bleibt. Proposition 5.10 Sind f , g ∈ L (Rn ) und λ ∈ R, dann gilt L Z Rn L Z ( f + g )(x) d x = Rn L Z f (x) d x + Rn Z g (x) d x und L Rn (λ f )(x) d x = λ Z L Rn f (x) d x. Beweis: Wir führen diese Eigenschaften des Lebesgue-Integrals auf I (·) zurück. Nach Voraussetzung gibt es Folgen ( f k )k∈N und (g k )k∈N in C c (Rn ) mit limk k f k − f kL = 0 und limk kg k − g kL = 0. Für jedes k ∈ N gilt k( f k + g k ) − ( f + g )kL ≤ k f k − f kL + kg k − g kL k(λ f k ) − (λ f )kL und = |λ| · k f k − f kL . Daraus folgt limk k( f k + g k ) − ( f + g )kL = 0 und limk k(λ f k ) − (λ f )kL = 0. Nach Definition des LebesgueIntegrals gilt damit Z L Rn L Z ( f + g )(x) d x Z und ebenso L Rn = lim I ( f k + g k ) k→∞ = lim I ( f k ) + lim I (g k ) k→∞ (λ f )(x) d x = lim I (λ f k ) = λ lim I ( f k ) = λ k→∞ k→∞ Z k→∞ = Rn Z f (x) d x + L Rn g (x) d x L Rn f (x) d x. ä Proposition 5.11 (i) Ist f Lebesgue-integrierbar, dann auch | f |. (ii) Sind f , g ∈ L (Rn ), dann auch die Funktionen f ∧ g und f ∨ g . (iii) Sei f ∈ L (Rn ) und g : Rn → R beschränkt. Ist g zusätzlich stetig oder g ∈ L (Rn ), dann folgt f g ∈ L (Rn ). Beweis: zu (i) Die Funktion | f | ist jedenfalls in L̃ (Rn ) enthalten, weil mit f auch | f | eine Majorante besitzt. Sei nun ( f k )k∈N eine Folge in C c (Rn ) mit limk k f k − f kL = 0. Wegen || f | − | f k || ≤ | f − f k | gilt dann auch limk k| f k | − | f |kL = 0. Weil die Funktionen | f k | in C c (Rn ) liegen, folgt daraus die Behauptung. zu (ii) Dies folgt direkt aus den Gleichungen f ∧ g = 21 ( f + g − | f − g |) und f ∨ g = 12 ( f + g − | f − g |) sowie der Tatsache, dass die Lebesgue-integrierbaren Funktionen einen Untervektorraum von C˜ (Rn ) bilden. —– 48 —– § 5. Das Lebesgue-Integral zu (iii) Sei ( f k )k∈N wiederum eine Folge in C c (Rn ) mit limk k f k − f kL = 0. Nach Prop. (5.4) gilt k f g − f k g kL kg k∞ k f k − f kL ≤ für alle k ∈ N. Ist g stetig, dann liegen die Funktionen f k g alle in C c (Rn ), und aus limk k f g − f k g kL = 0 folgt die Lebesgue-Integrierbarkeit von f g . Ist g statt dessen ein Element aus L (Rn ), dann wählen wir für jedes k ∈ N ein g k ∈ C c (Rn ) mit 1 kg k − g kL ≤ kk f k k∞ falls f k 6= 0 und setzen ansonsten g k = 0. Dann folgt k f k g − f k g k kL ≤ k f k k∞ kg k − g kL ≤ Zusammen mit der Abschätzung k f k g k − f g kL ≤ k f k g k − f k g kL + k f k g − f g k ≤ 1 k für alle k ∈ N. k f k g k − f k g kL + kg k∞ k f k − f kL erhalten wir limk k f k g k − f g kL = 0 und somit f g ∈ L (Rn ). ä Zur Vereinfachung der Notation lassen wir das „L “ über dem Integralzeichen von nun an weg. Sollte einmal das Riemann-Integral an Stelle des Lebesgue-Integrals gemeint sein, wird ausdrücklich darauf hingewiesen. Proposition 5.12 (Rechenregeln für das Lebesgue-Integral) (i) Für alle f ∈ L (Rn ) gilt ¯Z ¯ ¯ ¯ ¯ ¯ ¯ n f (x) d x ¯ Z ≤ R Rn | f (x)| d x = k f kL . (ii) Ist f ∈ L (Rn ) und ( f k )k∈N eine Folge in L (Rn ) mit limk k f k − f kL = 0, dann gilt Z Z lim f k (x) d x = f (x) d x. k→∞ Rn Rn R (iii) Aus f ≥ 0 folgt Rn f (x) d x ≥ 0. (iv) Sei f ∈ L (Rn ) und g : Rn → R beschränkt und außerdem stetig oder in L (Rn ) enthalten. Dann gilt ¯Z ¯ Z ¯ ¯ ¯ ¯ ¯ n f (x)g (x) d x ¯ ≤ kg k∞ n | f (x)| d x. R R Beweis: zu (i) Wir führen die Aussage auf die Ungleichungen |I ( f )| ≤ I (| f |) ≤ k f kL für f ∈ C c (Rn ) aus Prop. (5.8) zurück. Sei also f ∈ L (Rn ) und ( f k )k∈N eine Folge in C c (Rn ) mit limk k f k − f kL = 0. Nach R Definition des Lebesgue-Integrals gilt limk I ( f k ) = Rn f (x) d x. Wegen || f k |−| f || ≤ | f k − f | gilt k| f k |−| f |kL ≤ R k f k − f kL für alle k ∈ N und damit limk I (| f k |) = Rn | f (x)| d x. Nun gilt ¯Z ¯ ¯Z ¯ ¯Z ¯ Z ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ f (x) d x ¯ ≤ ¯ f (x) d x − f k (x) d x ¯ + ¯ f k (x) d x ¯¯ ¯ Rn Rn ≤ ¯Z ¯ ¯ ¯ Rn Z Rn f (x) d x − Rn ¯ Z ¯ f k (x) d x ¯¯ + —– 49 —– Rn Rn | f k (x)| d x. § 5. Das Lebesgue-Integral R Für k → ∞ läuft der erste Summand auf der rechten Seite gegen Null und der zweite gegen Rn | f (x)| d x. Daraus folgt die erste behauptete Ungleichung. Für die Gleichung betrachten wir µZ ¶ Z Z Z | f (x)| d x = | f k (x)| d x + | f (x)| d x − | f k (x)| d x Rn Rn Rn Rn µZ = k f k kL + Z Rn | f (x)| d x − Rn ¶ | f k (x)| d x . Für k → ∞ konvergiert der erste Summand gegen k f kL und der zweite gegen Null. zu (ii) Dies folgt direkt aus Teil (i), denn für alle k ∈ N gilt ¯ ¯Z Z Z ¯ ¯ ¯ ¯ ≤ | f k (x) − f (x)| d x f (x) d x − f (x) d x k ¯ ¯ Rn Rn Rn ≤ k f − f k kL . Läuft der Ausdruck rechts gegen Null, dann also auch der linke. R R zu (iii) Dies erhält man durch Rn f (x) d x = Rn | f (x)| d x = k f kL ≥ 0. zu (iv) Nach Prop. (5.11) ist f g jedenfalls Lebesgue-integrierbar. Außerdem gilt ¯Z ¯ Z ¯ ¯ ¯ ¯ | f (x)g (x)| d x = k f g kL ¯ n f (x)g (x) d x ¯ ≤ n R R Z ≤ kg k∞ · k f kL = kg k∞ · Rn | f (x)| d x. ä Definition 5.13 Eine Teilmenge B ⊆ Rn heißt Lebesgue-messbar, wenn die charakteristische Funktion χB Lebesgue-integrierbar ist. In diesem Fall nennt man Z v L (B ) = χB (x) d x das Lebesgue-Maß von B. Rn Die Menge B wird Lebesguesche Nullmenge genannt, wenn kχB kL = 0 gilt. Unmittelbar aus der Definition folgt, dass jede Teilmenge M einer Lebesgueschen Nullmenge N wiederum eine Lebesguesche Nullmenge ist. Aus M ⊆ N folgt χM ≤ χN und damit 0 ≤ kχM kL ≤ kχN kL = 0. Man sagt üblicherweise, dass eine Funktion f : Rn → R eine Eigenschaft fast überall besitzt, wenn die Teilmenge N ⊆ Rn , auf der diese Eigenschaft nicht gilt, eine Lebesguesche Nullmenge ist. Proposition 5.14 (i) Eine Teilmenge N ⊆ Rn ist genau dann eine Lebesguesche Nullmenge, wenn sie Lebesgue-messbar ist und v L (N ) = 0 gilt. (ii) Jede Nullmenge ist eine Lebesguesche Nullmenge. —– 50 —– § 5. Das Lebesgue-Integral Beweis: zu (i) „⇒“ Ist kχN kL = 0, dann hat die Folge ( f k )k∈N in C c (Rn ) gegeben durch f k = 0 für alle k ∈ N die Eigenschaft limk k f k − χN kL = 0. Dies zeigt, dass χN Lebesgue-integrierbar ist. Außerdem gilt Z Z v L (N ) = χN (x) d x = lim f k (x) d x = 0 k Rn Rn R nach Definition des Lebesgue-Integrals. „⇐“ Aus χN ∈ L (Rn ) und Rn χN (x) d x = 0 folgt kχN kL = R R Rn |χN (x)| d x = Rn χN (x) d x = 0 nach Prop. (5.8). zu (ii) Sei ε ∈ R+ vorgegeben. Nach Definition der Nullmengen gibt es eine Familie (Q k )k∈N von Quadern P S mit N ⊆ ∞ Q und ∞ v(Q ) < ². Für jedes k ∈ N können wir ein εk ∈ R+ wählen, so dass I (χQ k ,εk ) < k=1 P k k=1 k v(Q k ) + ε2−k gilt. Es ist dann ∞ χ eine Majorante von χN , und es gilt k=1 Q k ,εk n X k=1 I (χQ k ,εk ) ≤ n X k=1 v(Q k ) + n X ε2−k ≤ ε+ε = 2ε. k=1 Weil ε beliebig vorgegeben war, folgt daraus kχN kL = 0. ä Umgekehrt kann man zeigen, dass jede Lebesguesche Nullmenge eine Nullmenge ist, die beiden Begriffe sind also äquivalent. Wir werden dieses Resultat aber nicht verwenden. Genau wie für die Riemannintegrierbaren Funktionen gilt auch hier Proposition 5.15 Seien f ∈ L (Rn ), N ⊆ Rn eine Nullmenge und f˜ : Rn → R eine Funktion mit f˜(x) = f (x) für alle x ∉ N . Dann ist auch f˜ Lebesgue-integrierbar, und die Lebesgue-Integrale von f und f˜ stimmen überein. P Beweis: Nach Voraussetzung gilt | f˜ − f | ≤ nk=1 χN , und wegen kχN kL = 0 folgt daraus k f˜ − f kL = 0 nach Prop. (5.2). Dies zeigt, dass f˜ − f eine Lebesgue-integrierbare Funktion mit Lebesgue-Integral Null ist. Daraus wiederum folgt auch die Lebesgue-Integrierbarkeit von f˜ = ( f˜ − f ) + f sowie die Gleichheit der Integrale. ä Für die spätere Anwendung bemerken wir noch, dass Prop. (5.2) gültig bleibt, wenn die Ungleichung | f (x)| ≤ P∞ g (x) nur fast überall erfüllt ist. Sei nämlich N ⊆ Rn die Nullmenge, auf der die Ungleichung nicht gilt k=1 k und f N die Funktion gegeben durch f N (x) = 0 für alle x ∈ N und f N (x) = f (x) für alle x ∈ Rn \ N . Nach Prop. (5.2) liegt f N in L̃ (Rn ), und es gilt ∞ X k f N kL ≤ kg k kL . k=1 Die Funktion | f − f N | stimmt fast überall mit der Nullfunktion überein und ist somit nach Prop. (5.15) R Lebesgue-integrierbar, mit k f − f N kL = Rn | f − f N |(x) d x = 0. Daraus folgt k f kL ≤ k f N kL + k f − f N kL = k f N kL . —– 51 —– § 5. Das Lebesgue-Integral (Satz von Beppo Levi) P Sei (g k ) eine Folge in L̃ (Rn ) mit k=1 kg k kL < +∞. Dann gilt Satz 5.16 (i) Die Reihe P∞ k=1 |g k (x)| konvergiert fast überall. (ii) Sei g : Rn → R eine Funktion mit der Eigenschaft, dass fast überall die Gleichung P g (x) = ∞ g (x) erfüllt ist. Dann liegt g in L̃ (Rn ), und es gilt k=1 k ° ° ° ° m X ° ° g k (x)° lim °g − m→∞ ° ° k=1 = 0. L (iii) Gilt g k ∈ L (Rn ) für alle k ∈ N, dann folgt g ∈ L (Rn ) und Z Rn g (x) d x = ∞ Z X g k (x) d x. n k=1 R P |g (x)| divergiert. Dann gilt Beweis: zu (i) Sei D ⊆ Rn die Menge der Punkte, in denen die Reihe ∞ k=1 k P∞ P∞ χD ≤ k=m+1 |g k | für alle m ∈ N. Nach Prop. (5.2) gilt kχD kL ≤ k=m+1 kg k kL für alle m ∈ N, und wegen P limm ∞ kg k kL = 0 folgt daraus kχD kL = 0. Also ist D eine Lebesguesche Nullmenge. k=m+1 P |g (x)| fast überall. Auf Grund der Vorbemerkung können wir zu (ii) Nach Voraussetzung gilt |g (x)| ≤ ∞ k=1 k P Prop. (5.2) auch in dieser Situation anwenden und erhalten g ∈ L̃ (Rn ). Wegen limm ∞ kg k kL = 0 und k=m+1 P∞ Pm kg − k=1 g k kL ≤ k=m+1 kg k kL gilt auch die zweite Aussage. P g in L (Rn ) erhalten. Wir finden deshalb jeweils ein f m ∈ C c (Rn ) mit zu (iii) Für jedes m ∈ N ist m k=1 k °Pm ° 1 1 ° g −f ° < m . Ist nun ε ∈ R+ vorgegeben, dann können wir m ∈ N so wählen, dass sowohl m < 12 ε k=1 kP m L 1 ∞ als auch k=m+1 kg k kL < 2 ε gilt. Es folgt dann kg − f m kL ≤ ∞ X kg k kL k=m+1 ° ° ° °X m ° ° gk − fm ° +° ° °k=1 < L 1 1 2ε+ 2ε = ε. Daraus folgt sowohl die Lebesgue-Integrierbarkeit von g als auch die Gleichung Z Z Rn g (x) d x = lim m→∞ Rn f m (x) d x = —– 52 —– lim m→∞ m Z X n k=1 R g k (x) d x. ä § 5. Das Lebesgue-Integral (Satz über die monotone Konvergenz) Folgerung 5.17 Sei ( f k )k∈N eine fast überall monoton wachsende Folge in L (Rn ) mit der Eigenschaft R supk Rn f n (x) d x = c < +∞. Dann gibt es ein f ∈ L (Rn ), so dass ( f k ) fast überall gegen f konvergiert mit Z Z lim k→∞ Rn f k (x) d x = Rn f (x) d x. Beweis: Sei die Folge (g k )k∈N definiert durch g 1 = f 1 und g k = f k − f k−1 für k ≥ 2. Dann gilt für alle m ∈ N die Abschätzung m X kg k kL = k f 1 kL + k=1 Z k f 1 kL + m Z X n k=2 R ¡ ¢ f k − f k−1 (x) d x = Z Rn f m (x) d x − Rn f 1 (x) d x ≤ 2k f 1 kL + c. P P kg k kL ist also konvergent, außerdem gilt f m = m g für alle m ∈ N nach Definition der Die Reihe ∞ k=1 k=1 k Folge (g k )k∈N . Wir können somit den Satz von Beppo Levi anwenden und erhalten die beiden gewünschten Aussagen. ä Das Beispiel der Folge (χk )k∈N vom Anfang des Kapitels zeigt, dass ein entsprechender Satz für Riemannintegrierbare Funktionen falsch ist. Der Satz über die monotone Konvergenz gilt auch für monoton fallende Folgen Lebesgue-integrierbarer Funktionen: Man erhält ihn dadurch, dass man den ursprünglichen Satz auf die Folge (− f k )k∈N anwendet. Hierbei muss man dann natürlich fordern, dass die Folge der Integrale nach unten beschränkt ist. Satz 5.18 (Satz von Lebesgue über die majorisierte Konvergenz) Sei ( f k )k∈N eine Folge in L (Rn ), die fast überall gegen eine Funktion f : Rn → R konvergiert. Sei ferner g eine nicht-negative, Lebesgue-integrierbare Funktion mit | f k | ≤ g für alle k ∈ N. Dann ist auch f Lebesgue-integrierbar, und es gilt Z Z f (x) d x = lim f k (x) d x. Rn k→∞ Rn Beweis: Nach Abänderung der Funktionen f k , f und g auf einer Nullmenge können wir davon ausgehen, dass ( f k )k∈N überall gegen f konvergiert. Nun definieren wir für alle k, ν ∈ N die Funktion g k,ν = max{ f k , f k+1 , ..., f k+ν }. Mit den f k sind auch die g k,ν integrierbar. Definieren wir g k (x) = limν g k,ν (x) für alle x ∈ Rn , dann gilt g k = sup{ f i | i ≥ k} für alle k ∈ N. Die Funktionenfolge (g k,ν )ν∈N konvergiert also monoton R wachsend gegen g k , und die Folge der Integrale ist durch Rn g (x) d x beschränkt. Aus dem Satz über die —– 53 —– § 5. Das Lebesgue-Integral monotone Konvergenz folgt nun, dass alle g k Lebesgue-integrierbar sind, und dass jeweils Z Z g k (x) d x = lim g k,ν (x) d x gilt. ν→∞ Rn Rn Die Folge (g k )k∈N konvergiert monoton fallend gegen f und ist betragsmäßig ebenfalls durch das Integral über g beschränkt. Wir können den Satz über die monotone Konvergenz also erneut anwenden und erhalten sowohl f ∈ L (Rn ) als auch die Gleichung Z Z g k (x) d x. f (x) d x = lim k→∞ Rn Rn Sei schließlich für jedes k ∈ N die Funktion h k definiert durch h k (x) = inf { f i (x) | i ≥ k}. Genau wie zuvor R R zeigt man, dass die h k alle Lebesgue-integrierbar sind und Rn f (x) d x = limk Rn h k (x) d x gilt. Wenden wir nun das Lebesgue-Integral auf die Ungleichungen h k ≤ f k ≤ g k an und betrachten den Grenzübergang R R k → ∞, dann erhalten wir insgesamt die gewünschte Gleichung Rn f (x) d x = limk Rn f k (x) d x. ä Wir leiten aus dem Satz über die majorisierte Konvergenz noch zwei wichtige Folgerungen ab: Die Stetigkeit parameterabhängiger Integrale und die Vertauschbarkeit von Lebesguescher Integration mit partieller Differentiation. Beide Ergebnisse sind für Riemann-Integrale nur sehr mühsam unter stärkeren Voraussetzungen erzielbar. Satz 5.19 Sei X ein metrischer Raum, x 0 ∈ X und f : Rm × X → R eine Funktion mit folgenden Eigenschaften. (i) Die Funktion Rm → R, t 7→ f (t , x) ist Lebesgue-integrierbar für alle x ∈ X . (ii) Es gibt eine nicht-negative, Lebesgue-integrierbare Funktion g auf Rm , so dass für alle x ∈ X jeweils | f (t , x)| ≤ g (t ) erfüllt ist, für fast alle t ∈ Rm . (iii) Die Abbildung X → R, x 7→ f (t , x) ist für fast alle t ∈ Rm stetig in x 0 . Z Dann ist die Funktion F (x) = f (t , x) d t stetig in x 0 . Rm Beweis: Sei (x k )k∈N eine Folge in X mit limk x k = x 0 . Wir definieren eine Folge ( f k )k∈N reellwertiger Funktionen durch f k (t ) = f (t , x k ) für alle t ∈ Rm und k ∈ N. Außerdem sei f 0 (t ) = f (t , x 0 ). Auf Grund der Voraussetzung (iii) konvergiert ( f k )k∈N fast überall punktweise gegen f . Wegen (i) ist die Folge in L (Rn ) enthalten, und wegen (ii) gilt f k ≤ g fast überall, für jedes k ∈ N. Nach dem Satz über die majorisierte Konvergenz gilt somit Z Z Z lim F (x k ) = lim f (t , x k ) d t = lim f k (t ) d t = lim f 0 (t ) d t k→∞ k→∞ Rm k→∞ Rm k→∞ Rm Z = Rm f (t , x 0 ) d t Damit ist die Stetigkeit von F in x 0 bewiesen. = F (x 0 ). ä —– 54 —– § 5. Das Lebesgue-Integral Für den folgenden Satz legen wir die folgende Notation fest: Ist V ⊆ Rn eine offene Teilmenge und f : Rm × V → R eine Funktion, dann bezeichnen wir für jeden Punkt (t , x) = (t 1 , ..., t m , x 1 , ..., x n ) und jedes j mit 1 ≤ j ≤ n durch ∂ j f (t , x) die partielle Ableitung von f nach der Variablen x j , sofern diese existiert. Satz 5.20 Sei V ⊆ Rn offen und f : Rm × V → R eine Funktion. Wir setzen voraus, dass f für ein j ∈ {1, ..., n} die folgenden Eigenschaften besitzt. (i) Für alle x ∈ V ist die Funktion Rm → R, t 7→ f (t , x) Lebesgue-integrierbar. (ii) Es gibt eine Nullmenge N ⊆ Rm und eine nicht-negative, Lebesgue-integrierbare Funktion g auf Rm , so dass ∂ j f (t , x) für alle t ∈ Rm \N und alle x ∈ V existiert und die Abschätzung |∂ j f (t , x)| ≤ g (t ) erfüllt ist. Z Dann ist die Funktion F (x) = f (t , x) d t nach x j partiell differenzierbar, und es gilt Rm ∂F (x) ∂x j Z = Rm ∂ j f (t , x) d t für alle x ∈ V. Beweis: Sei x 0 ∈ V und r ∈ R+ so gewählt, dass die offene Kugel vom Radius r um x 0 bezüglich der Maximumsnorm ganz in V enthalten ist. Sei (h k )k∈N eine Folge reeller Zahlen mit 0 < |h k | < r für alle k ∈ N und limk h k = 0. Für jedes k ∈ N definieren wir eine reellwertige Funktion f k auf Rm durch f k (t ) = ¢ 1 ¡ f (t , x 0 + h k e j ) − f (t , x 0 ) hk , wobei e j ∈ Rn den j -ten Einheitsvektor bezeichnet. Wegen (i) ist jedes f k in L (Rm ) enthalten. Nach Definition der partiellen Ableitung ∂ j f und auf Grund der Voraussetzung (ii) konvergiert f k (t ) außerdem für alle t ∈ Rm \ N gegen ∂ j f (t , x 0 ). Nach dem Mittelwertsatz der Differentialrechnung existiert für alle t ∈ Rm \ N jeweils ein θt ,k ∈ R mit 0 < θt ,k < 1 und f k (t ) = ∂ j f (t , x 0 + θt ,k h k e j ). Daraus folgt | f k (t )| ≤ g (t ) für alle t ∈ Rm \ N . Ingesamt ist damit der Satz über die majorisierte Konvergenz anwendbar. Demnach ist die Funktion t 7→ ∂ j f (t , x 0 ) in L (Rm ) enthalten, außerdem gilt µZ ¶ Z Z Z 1 ∂ j f (t , x 0 ) d t = lim f k (t ) d t = lim f (t , x 0 + h k e j ) d t − f (t , x 0 ) d t k→∞ Rm k→∞ h k Rm Rm Rm = ¢ 1 ¡ F (x 0 + h k e j ) − F (x 0 ) k→∞ h k lim —– 55 —– = ∂F (x 0 ). ∂x j ä § 6. Reelle und komplexe Differenzierbarkeit Zu Beginn wiederholen wir die bekannten Faktren über komplexe Zahlen aus der Analysis einer Variablen. (i) Der Körper C der komplexen Zahlen bilden einen Erweiterungskörper von R. (ii) Es gibt ein ausgezeichnetes Element i ∈ C \ R mit i 2 = −1, die sogenannte imaginäre Einheit. (iii) Jedes Element z ∈ C kann auf eindeutige Weise in der Form z = a +i b mit a, b ∈ R dargestellt werden. Man nennt a den Real- Re(z) und b den Imaginärteil Im(z) von z. (iv) Auf C ist eine Abbildung ι : C → C gegeben durch ι(a + i b) = a − i b für alle a, b ∈ R, die sogenannte komplexe Konjugation. Es gilt ι(z + w) = ι(z) + ι(w), ι(zw) = ι(z)ι(w) und ι(ι(z)) = z für alle z, w ∈ C sowie ι(x) = x für alle x ∈ R. Für jedes z ∈ C nennt man ι(z) die zu z konjugierte komplexe Zahl. An Stelle von ι(z) ist auch die Schreibweise z̄ für die konjugierte komplexe Zahl gebräuchlich. p (v) Für jedes z ∈ C nennt man |z| = z z̄ ∈ R+ den komplexen Absolutbetrag (kurz Betrag) von z. Ist z = a + i b mit a, b ∈ R, dann gilt |z|2 = a 2 + b 2 . Weiter gilt |z| = 0 ⇔ z = 0, |zw| = |z||w| und |z + w| ≤ |z| + |w| für alle z, w ∈ C. Satz 6.1 Für jede komplexe Zahl z ∈ C \ {0} gibt es ein eindeutig bestimmtes ϕ ∈ R mit 0 ≤ ϕ < 2π, das sogenannte Argument arg(z) von z, mit der Eigenschaft z = |z|(cos ϕ + i sin ϕ). Das Paar (|z|, ϕ) bezeichnet man als die Polarkoordinaten von z. Beweis: Sei ρ : R+ × [0, 2π[ → R \ {(0, 0)}, (r, ϕ) 7→ (r cos ϕ, r sin ϕ) die Polarkoordinaten-Abbildung aus der Analysis mehrerer Variablen. Wie dort gezeigt wurde, ist ρ eine Bijektion. Ist z = a + i b mit a, b ∈ R, dann gibt es also Paar (r, ϕ) mit a = r cos ϕ und b = r sin ϕ, und es gilt r2 = (r cos ϕ)2 + (r sin ϕ)2 = a2 + b2 = |z|2 , also r = |z|. Dies beweist die Existenz von ϕ. Ist nun ψ ∈ [0, 2π[ ein weiteres Element mit z = |z|(cos ψ + i sin ψ), dann liefert der Vergleich von Real- und Imaginärteil |z| cos ϕ = Re(z) = |z| cos ψ und |z| sin ϕ = Im(z) = |z| sin ψ, also ρ(|z|, ϕ) = ρ(|z|, ψ). Auf Grund der Injektivität von ρ folgt ϕ = ψ. Damit ist die Eindeutigkeit bewiesen. ä Bereits in der Analysis einer Variablen wurde definiert, dass eine Folge (z n )n∈N in C gegen eine Zahl z ∈ C konvergiert, also z = lim z n n→∞ —– 56 —– § 6. Reelle und komplexe Differenzierbarkeit gilt, wenn für jedes ε ∈ R+ ein N ∈ N existiert, so dass |z n − z| < ε für alle z n mit n ≥ N erfüllt ist. Von einer Cauchyfolge in C spricht man, wenn es für jedes ε ∈ R+ ein N ∈ N gibt, so dass |z m −z n | < ε für alle m, n ∈ N mit m, n ≥ N gilt. Proposition 6.2 Sei (z n )n∈N eine Folge in C und z ∈ C ein weiteres Element. Es sei z n = a n + i b n und z = a + i b die Zerlegung der Zahlen in Real- und Imaginärteil, mit a n , b n , a, b ∈ R. Dann sind die folgeden Aussagen äquivalent. (i) Die Folge (z n )n∈N konvergiert in C gegen z. (ii) Es gilt lim a n = a und lim b n = b. n→∞ n→∞ Beweis: “⇒“ Sei ε ∈ R+ vorgegeben. Dann gibt es ein N ∈ N mit |z n − z| < ε für alle n ≥ N . Es gilt z n −z = (a n −a)+i (b n −b), also |z n −z|2 = (a n −a)2 +(b n −b)2 und somit |a n −a| ≤ |z n −z| und |b n −b| ≤ |z n −z| für alle n ∈ N. Daraus folgt |a n − a| < ε und |b n − b| < ε für alle n ≥ N . “⇐“ Auch hier sei ε ∈ R+ beliebig vorgegeben. Auf Grund der Voraussetzung gibt es N ∈ N mit |a n −a| < 12 ε und |b n − b| < 21 ε für alle n ≥ N . Wegen |z n − z| ≤ |a n − a| + |b n − b| folgt |z n − z| < ε für alle n ≥ N . Also konvergiert (z n )n∈N in C gegen die Zahl z. ä Ebenso leicht kann man überprüfen, dass (z n )n∈N eine genau dann eine Cauchyfolge in C ist, wenn die Folgen (a n )n∈N der Real- und die Folge (b n )n∈N der Imaginärteile beides Cauchyfolgen in R sind. Aus der Analysis I ist bekannt, dass die Cauchyfolgen in R genau die konvergenten Folgen in R sind. Daraus folgt unmittelbar, dass auch in C die Cauchyfolgen-Eigenschaft gleichbedeutend mit Konvergenz ist. Mit Hilfe des Konvergenzbegriffs können wir nun Stetigkeit und Grenzwerte für Funktionen f : U → C definieren, wobei U eine beliebige Teilmenge von C bezeichnet. Wir sagen, die Funktion f ist stetig im Punkt z ∈ U , wenn für jede Folge (z n )n∈N in U , die gegen z konvergiert, jeweils lim f (z n ) n→∞ = f (z) erfüllt ist. Sei nun w ∈ C \ U und b ∈ C. Wir bezeichnen b als Grenzwert der Funktion f für z → w und schreiben limz→w f (z) = b, wenn eine Folge (z n )n∈N mit lim z n = w exisitiert und für jede solche Folge jeweils n→∞ lim f (z n ) = b gilt. n→∞ Für jedes w ∈ C und r ∈ R+ bezeichnen wir die Menge B r (w) = {z ∈ C | |w − z| < r } als offenen Ball vom Radius r um den Punkt w. Wird in der Ungleichung |w − z| < r das “<“ durch “≤“ ersetzt, dann sprechen wir von einem abgeschlossenen Ball, der mit B̄ r (w) bezeichnet wird. Wir bezeichnen eine Teilmenge U ⊆ C als offen, wenn für jedes z ∈ U ein ε ∈ R+ mit B ε (z) ⊆ U existiert. —– 57 —– § 6. Reelle und komplexe Differenzierbarkeit Als nächstes werden wir nun den Begriff der Differenzierbarkeit von den reellen auf die komplexen Zahlen übertragen. Sei U ⊆ C eine offene Teilmenge und w ∈ U . Dann können wir für jede Funktion f : U → C den Differenzialquotienten f (z) − f (w) g (z) = z −w als komplexwertige Funktion auf U \ {w} betrachten. Definition 6.3 Sei U ⊆ C offen und w ∈ U . Wir bezeichnen eine Funktion f : U → C als komplex differenzierbar im Punkt w, wenn der Grenzwert lim z→w f (z) − f (w) z −w existiert. Wir bezeichnen diese gegebenenfalls als die komplexe Ableitung f 0 (w) von f im Punkt w. Ist f in jedem Punkt z ∈ U komplex differenzierbar, dann bezeichnen wir f als holomorphe Funktion auf der Menge U . Genau wie in der Analysis einer Variablen beweist man die folgenden Rechenregeln für komplexe Ableitungen. Für die Abbildung id : C → C, z 7→ z gilt id0 (z) = 1, für alle z ∈ C. Ist f : C → C konstant, gibt es also ein w ∈ C mit f (z) = w für alle z ∈ C, dann folgt f 0 (z) = 0 für alle z ∈ C. Außerdem gilt Proposition 6.4 Sei U ⊆ C offen, und seien f , g : U → C Abbildungen. Sind f und g in einem Punkt z ∈ U komplex differenzierbar, dann auch die Funktionen f + g und f g . Es gilt ( f + g )0 (z) = f 0 (z) + g 0 (z) und ( f g )0 (z) = f 0 (z)g (z) + f (z)g 0 (z). f Gilt darüber hinaus g (z) 6= 0, dann ist auch g im Punkt z komplex differenzierbar, und es gilt µ ¶0 f 0 (z)g (z) − f (z)g 0 (z) f (z) = . g g (z)2 Auch für die komplexe Differenzierbarkeit existiert eine Kettenregel. Proposition 6.5 Seien U ,V ⊆ C offene Teilmengen und f : U → C und g : V → C Abbildungen, wobei wir f (U ) ⊆ V voraussetzen. Ist f in einem Punkt z ∈ U und g im Punkt w = f (z) komplex differenzierbar, dann ist auch g ◦ f in z komplex differenzierbar, und es gilt (g ◦ f )0 (z) = g 0 ( f (z)) · f 0 (z). Die Beweise sind wortwörtlich dieselben wie in der reellen Analysis, weshalb wir auf eine erneute Wiedergabe verzichten. —– 58 —– § 6. Reelle und komplexe Differenzierbarkeit Wir untersuchen nun, wie die komplexe Differenzierbarkeit mit dem Ableitungsbegriff aus der Analysis mehrerer Variablen zusammenhängt. Dazu betrachten wir C nun als 2-dimensionalen R-Vektorraum und die komplexen Zahlen 1 und i als Richtungsvektoren. Ist U ⊆ C offen, f : U → C eine Funktion und w = u + i v ∈ U ein vorgegebener Punkt, dann bezeichnen wir mit ∂f (w) ∂x = ∂1 f (w) , ∂f (w) ∂y ∂i f (w) = die Richtungsableitungen von f im Punkt w bezüglich der Richtungen 1 und i . Nach Definition gilt ∂f (w) ∂x und ∂f (w) ∂y = f (w + t ) − f (w) t = f (w + i t ) − f (w) t = lim = t →0 lim t →0 lim f (x + i v) − f (u + i v) x −u lim f (u + i y) − f (u + i v) . y −v x→u y→v Schreiben wir f in der Form f = g + i h mit reellwertigen Funktionen g , h : U → R, dann gilt offenbar ∂f ∂x = ∂g ∂h +i ∂x ∂x ∂f ∂y und ∂g ∂h +i . ∂y ∂y = Diese Richtungsableitungen lassen sich auch als gewöhnliche partielle Ableitungen interpretieren. Dazu betrachten wir die Abbildung ι : C → R2 gegeben durch x + i y 7→ (x, y). Es handelt sich bei ι um einen Isomorphismus von R-Vektorräumen. Setzen wir nun fR ι ◦ f ◦ ι−1 = , dann erhalten wir eine Abbildung von der offenen Teilmenge Ũ = ι(U ) ⊆ R2 nach R2 . Für alle (x, y) ∈ ι(U ) gilt f R (x, y) = (ι ◦ f ◦ ι−1 )(x, y) = (ι ◦ f )(x + i y) = ι(g (x + i y) + i h(x + i y)) = (g (x + i y), h(x + i y)). Die Komponenten von f R sind also gegeben durch ( f R )1 (x, y) = g (x + i y) und ( f R )2 (x, y) = = h(x + i y). Setzen wir w = u +i v, dann sind die partiellen Ableitungen der Komponenten von f R im Punkt (u, v) gegeben durch ∂1 ( f R )1 (u, v) = lim t →0 ( f R )1 (u + t , v) − ( f R )1 (u, v) t = g (w + t ) − g (w) t = ∂g (w) ∂x g (w + i t ) − g (w) t = ∂g (w). ∂y lim t →0 und ∂2 ( f R )1 (u, v) = lim t →0 ( f R )1 (u, v + t ) − ( f R )1 (u, v) t = lim t →0 Genauso beweist man die Gleichungen ∂1 ( f R )2 (u, v) = ∂h (w) ∂x und ∂2 ( f R )2 (u, v) = —– 59 —– ∂h (w). ∂y § 6. Reelle und komplexe Differenzierbarkeit Ist f R an der Stelle (u, v) sogar total differenzierbar, dann gilt mit w = u + i v also ∂g ∂g ∂x (w) ∂y (w) 0 f R (u, v) = . ∂h ∂h (w) (w) ∂x ∂y Definition 6.6 Sei U ⊆ C offen. Eine Funktion f : U → C wird reell differenzierbar im Punkt w ∈ U genannt, wenn sie als Funktion auf dem R-Vektorraum C in w total differenzierbar ist. Aus der mehrdimensionalen Kettenregel folgt unmittelbar, dass eine Funktion f : U → C genau dann im Punkt w ∈ U reell differenzierbar ist, wenn die Funktion f R = ι ◦ f ◦ ι−1 im Punkt ι(w) total differenzierbar ist. Wir illustrieren die bisher durchgeführten Herleitungen an zwei konkreten Beispielen. Sei f : C → C gegeben durch z 7→ z 2 . Wegen (x + i y)2 = x 2 + 2x(i y) + i 2 y 2 = (x 2 − y 2 ) + i (2x y) für alle x, y ∈ R gilt f = g + i h mit den Funktionen g (x + i y) = x 2 − y 2 und h(x + i y) = 2x y. Die Ableitung von f R im Punkt (x, y) ∈ R2 ist somit gegeben durch à ! 2x −2y 0 f R (x, y) = 2y 2x Sei nun f : C → C gegeben durch f (z) = z̄, die komplexe Konjugation. In diesem Fall gilt f = g + i h mit g (x + i y) = x und h(x + i y) = −y. Für alle (x, y) ∈ R2 erhalten wir diesmal à ! 1 0 0 f R (x, y) = 0 −1 0 Beide angebenen Funktionen f sind reell differenzierbar, denn f R ist in beiden Fällen offenbar stetig differenzierbar, woraus die totale Differenzierbarkeit von f R und f in jedem Punkt des Definitionsbereichs folgt. Proposition 6.7 Ist f : U → C im Punkt w ∈ U komplex differenzierbar, dann ist sie im selben Punkt auch reell differenzierbar. Beweis: Nach Definition der komplexen Differenzierbarkeit gilt limz→0 ϕ(z) = 0 für die Funktion ϕ(z) = f (w + z) − f (w) − f 0 (w). z Es gilt also f (z +w) = f (w)+ f 0 (w)z +ϕ(z)z, wobei der „Fehlerterm“ ψ(z) = ϕ(z)z auch nach Division durch |z| noch gegen Null läuft. Außerdem ist die Abbildung z 7→ f 0 (w)z ein Endomorphismus im R-Vektorraum C. Insgesamt haben wir damit gezeigt, dass f im Punkt w total differenzierbar ist. ä —– 60 —– § 6. Reelle und komplexe Differenzierbarkeit Wir formulieren nun ein notwendiges und hinreichendes Kriterium für komplexe Differenzierbarkeit. Satz 6.8 Sei U ⊆ C offen, f : U → C eine Funktion und w ∈ U ein Punkt, in dem f reell differenzierbar ist. Dann sind folgende Aussagen äquivalent. (i) Die Funktion f ist in w komplex differenzierbar. (ii) Es gelten die Cauchy-Riemannschen Differentialgleichungen ∂h ∂g (w) = (w) ∂y ∂x ∂h ∂g (w) = − (w). ∂x ∂y und Sind diese Bedingungen erfüllt, dass ist die komplexe Ableitung von f im Punkt w gegeben durch ∂g ∂h f 0 (z) = (w) + i (w). ∂x ∂x Beweis: „(i) ⇒ (ii)“ Wie wir im Beweis von Prop. (6.7) gesehen haben, ist die totale Ableitung von f an der Stelle w die R-lineare Abbildung C → C, z 7→ f 0 (w)z. Sei f 0 (w) = a + i b mit a, b ∈ R. Wie aus der Analysis mehrerer Variablen bekannt, erhält man die Richtungsableitungen einer Funktion, indem man die Richtungsvektoren in die totale Ableitung einsetzt. Deshalb gilt ∂g ∂h (w) + i (w) ∂x ∂x = ∂f (w) ∂x f 0 (w)(1) = Es folgt ∂g (w) = a , ∂x Durch Einsetzen des Richtungsvektors i erhalten wir ∂g ∂h (w) + i (w) ∂y ∂y und somit = ∂f (w) ∂y ∂g (w) = −b ∂y (a + i b) · 1 = a + i b. ∂h (w) = b. ∂x f 0 (w)(i ) = = , = (a + i b) · i = (−b) + i a ∂h (w) = a. ∂y Ingesamt erhalten wir somit ∂g ∂h (w) = a = (w) ∂y ∂x , ∂h ∂g (w) = b = − (w) , ∂x ∂y die Cauchy-Riemannschen Differentialgleichungen sind also im Punkt w erfüllt. „(ii) ⇒ (i)“ Da f im Punkt w reell differenzierbar ist, gibt eine R-lineare Abbildung φ : C → C und eine Abbildung ψ : U → C mit f (w + z) = f (w) + φ(z) + ψ(z) (1) —– 61 —– § 6. Reelle und komplexe Differenzierbarkeit für alle z in einer Umgebung vom Nullpunkt und limz→0 ψ(z)/|z| = 0. Dann gilt auch limz→0 ψ(z)/z = 0. Sei nun ∂g ∂h ∂h ∂g a= (w) = (w) und b= (w) = − (w). ∂x ∂y ∂x ∂y Weil die Richtungsableitungen von f durch Einsetzen der Richtungsvektoren 1 und i zu Stande kommen, gilt ∂f ∂g ∂h φ(1) = (w) = (w) + i (w) = a + i b ∂x ∂x ∂x und ∂f ∂g ∂h φ(i ) = (w) = (w) + i (w) = (−b) + i a = i (a + i b). ∂y ∂y ∂y Weil φ eine lineare Abbildung auf dem R-Vektorraum C ist, erhalten wir für jedes z = x + i y ∈ C die Gleichung φ(z) = φ(x + i y) = xφ(1) + yφ(i ) = x(a + i b) + yi (a + i b) = (x + i y)(a + i b) = z(a + i b). Durch Divison von (1) durch z und Einsetzen von φ(z) = (a +i b)z erhalten wir für alle z in einer Umgebung von Null die Gleichung ψ(z) f (w + z) − f (w) = − (a + i b). z z Aus lim ψ(z)/z = 0 folgt also z→0 f (w + z) − f (w) = a + i b. z→0 z Also ist f im Punkt w komplex differenzierbar, und die Ableitung f 0 (w) hat den angegebenen Wert. lim Häufig werden zur Untersuchung der komplexen Differenzierbarkeit die Wirtinger-Ableitungen µ µ ¶ ¶ ∂f ∂f ∂f ∂f ∂f ∂f = 12 −i und = 12 +i ∂z ∂x ∂y ∂z̄ ∂x ∂y Durch Einsetzen der Komponenten f = g + i h erhält man ∂f ∂z̄ = 1 2 ∂g 1 ∂h 1 ∂g 1 ∂h + i + i − ∂x 2 ∂x 2 ∂y 2 ∂y 1 2 = µ ¶ ¶ µ ∂g ∂h ∂h ∂g 1 + 2i . − + ∂x ∂y ∂x ∂y Nach Satz (6.8) ist f in einem Punkt w also genau dann komplex differenzierbar, wenn ∂f (w) ∂z̄ = 0 gilt. Die komplexe Ableitung ist in diesem Fall gegeben durch µ µ ¶ ¶ ∂g ∂h ∂g ∂h ∂h ∂g f 0 (w) = (w) + i (w) = 12 (w) + (w) + 21 i (w) − (w) ∂x ∂x ∂x ∂y ∂x ∂y Für die Funktion f (z) = z 2 gilt beispielsweise in jedem Punkt z = x + i y jeweils Für die Funktion f (z) = z̄ gilt ∂f (z) = 0 ∂z̄ und ∂f (z) = 2z. ∂z ∂f (z) = 1 ∂z̄ und ∂f (z) = 0. ∂z —– 62 —– = ∂f (w). ∂z ä § 7. Komplexe Potenzreihen Sei (a n )n∈N eine Folge komplexer Zahlen. Wie in der Analysis einer Variablen verwenden wir die Notation ∞ X an n=1 P für die Folge (s n )n∈N der Summen s n = ∞ a und nennen sie die Reihe über (a n )n∈N . Die Zahlen s n k=1 k werden die Partialsummen der Reihe genannt. Konvergiert die Folge (s n )n∈N gegen eine komplexe Zahl P a, dann wird die Bezeichnung ∞ a n auch für den Grenzwert a verwendet. Man nennt die Reihe absolut P∞ n=1 konvergent, wenn die Reihe n=1 |a n | in den reellen Zahlen konvergiert. Wie in der Analysis einer Variablen beweist man auch hier, dass jede komplexe absolut konvergente Reihe konvergent im herkömmlichen Sinn ist (siehe hierzu auch die Übungen). Auch die Potenzreihen wurden bereits in der Analysis einer Variablen definiert. Ist a ∈ C und (a n )n∈N eine Folge komplexer Zahlen, dann bezeichnet der Ausdruck ∞ X a n (z − a)n n=0 die Potenzreihe über (a n )n∈N im Entwicklungspunkt a. Die Zahl ρ ∈ R+ ∪ {+∞} gegeben durch ρ −1 = p lim supn n |a n | wird der Konvergenzradius der Potenzreihe genannt. Der folgende Satz aus der Analysis einer Variablen (siehe dort Satz 16.7 und Folgerung 16.8) gilt auch im Komplexen. Auch beim Beweis ergeben sich gegenüber den reellen Zahlen keine wesentlichen Änderungen. Satz 7.1 Sei (a n )n∈N eine Folge komplexer Zahlen, a ∈ C und f (z) = ∞ X a n (z − a)n n=0 die zugehörige komplexe Potenzreihe im Entwicklungspunkt a. Sei ρ der Konvergenzradius der Potenzreihe. (i) Im Fall ρ = 0 konvergiert f nur im Punkt a. (ii) Im Fall ρ = +∞ konvergiert f in jedem Punkt z ∈ C absolut. (iii) Sei nun 0 < ρ < +∞. Dann ist f in allen Punkte z ∈ B ρ (a) absolut konvergent und in allen Punkten z ∉ B̄ ρ (a) divergent. Gilt (iii), dann definiert f auf B ρ (a) eine stetige C-wertige Funktion. Im Fall (ii) ist diese Funktion sogar auf ganz C definiert. Die sogenannte formale Ableitung einer Potenzreihe f (z) wie oben ist gegeben durch die Potenzreihe f 0 (z) = ∞ X n=1 na n (z − a)n−1 = ∞ X (n + 1)a n+1 (z − a)n . n=0 —– 63 —– § 7. Komplexe Potenzreihen Wie in der reellen Analysis zeigt man auch hier, dass f und f 0 denselben Konvergenzradius besitzen (vgl. Prop. 19.10). Der folgende Satz zeigt, dass die formale Ableitung zugleich die komplexe Ableitung der durch f definierten C-wertigen Funktion liefert. Satz 7.2 Sei r ∈ R+ und f : B r (a) → C eine Funktion, deren Werte durch eine Potenzreihe im Entwicklungspunkt a ∈ C mit Konvergenzradius ρ ≥ r gegeben sind. Dann ist f auf B r (a) eine holomorphe Funktion, und die Ableitung von f ist in jedem Punkt z ∈ B r (a) der Wert der formalen Ableitung. Beweis: Zur Vereinfachung der Notation beschränken wir uns beim Beweis auf den Entwicklungspunkt a = 0. Sei z ∈ B r (0) vorgegeben. Die komplexe Differenzierbarkeit von f und die Aussage über den Wert der Ableitung ist bewiesen, wenn wir zeigen können, dass die Differenz zwischen dem Differentialquotienten und dem Wert der formalen Ableitung µ∞ ¶ ∞ ∞ ∞ X X f (z + h) − f (z) X 1 X n n−1 n − a n (z + h) − na n z = an z − na n z n−1 = h h n=0 n=1 n=0 n=1 ¶ ∞ µ µ∞ ¶ ∞ ∞ X X X 1 1 X 1 a n (z + h)n − (z + h)n − z n − nz n−1 an z n − na n z n−1 = an h n=1 h h n=1 n=1 n=1 für h → 0 gegen Null konvergiert. Für den Ausdruck im Inneren der Klammer gilt nach dem Binomischen Lehrsatz à ! n n 1 1 1 n 1 X n n−1 h k z n−k − z n − nz n−1 = (z + h) − z − nz = h h h k=0 k h à ! à ! n n n n 1 n 1 n 1 X 1 X k n−k n−1 n−1 h z − z − nz h k z n−k . z + nz + = h h k=2 k h h k=2 k Diese Summe können wir weiter abschätzen. Für 0 ≤ k ≤ n − 2 gilt à ! à ! n n n! ≤ (k + 1)(k + 2) = (k + 1)(k + 2) k +2 k +2 (k + 2)!(n − k − 2)! à ! (n − 2)! n −2 = n(n − 1) = n(n − 1) k!(n − 2 − k)! k = n! k!(n − k − 2)! und somit = ¯ ¯ à ! à ! à ! ¯1 X ¯ n n n n n−2 X X n ¯ k n−k ¯ −1 k n−k −1 h z |h| |z| = |h| |h|k+2 |z|n−(k+2) ¯ ¯ = |h| ¯ h k=2 k ¯ k k + 2 k=2 k=0 à ! à ! n−2 n−2 X X n −2 n |h| |h|k |z|(n−2)−k ≤ n(n − 1)|h| |h|k |z|(n−2)−k = n(n − 1)|h|(|h| + |z|)n−2 . k + 2 k k=0 k=0 —– 64 —– § 7. Komplexe Potenzreihen Wir erhalten somit die Abschätzung ¯ ¯ ∞ ¯ f (z + h) − f (z) X ¯ n−1 ¯ ¯ − na n z ¯ ¯ h n=1 ≤ |h| ∞ X n(n − 1)|a n | ( |h| + |z| )n−2 . n=1 Seien nun δ, s ∈ R+ so gewählt, dass |z| + δ < s < r erfüllt ist. Dann erhalten wir insgesamt für 0 < |h| < δ die Abschätzung ¯ ¯ µ∞ ¶ ∞ X ¯ f (z + h) − f (z) X ¯ n−1 ¯ n−2 ¯ − na z ≤ |h| n(n − 1)|a |s . (1) n n ¯ ¯ h n=1 n=2 Die zweite formale Ableitung von f ist gegeben durch f 00 = ∞ X n(n − 1)a n z n−2 . n=2 Weil die Konvergenzradien von f , f 0 und f 00 übereinstimmen, ist f 00 im Punkt s absolut konvergent. Deshalb ist auch der Ausdruck in der Klammer auf der rechten Seite von (1) konvergent, und wir erhalten für h → 0 die gewünschte Konvergenz gegen Null. ä Folgerung 7.3 Durch die sogenannte Exponential-, Sinus- und Kosinusreihe exp(z) = ∞ zn X n=0 n! , sin(z) = ∞ X (−1)n n=0 z 2n+1 (2n + 1)! und cos(z) = ∞ X (−1)n n=0 z 2n (2n)! sind jeweils auf ganz C definierte holomorphe Funktionen gegeben. Es gilt exp0 (z) = exp(z) , sin0 (z) = cos(z) und cos0 (z) = − sin(z) für alle z ∈ C. Beweis: In der Analysis einer Variablen wurde gezeigt, dass die Reihen von Exponential-, Sinus und Kosinusfunktion auf ganz R konvergieren. Also ist der Konvergenzradius aller drei Reihen gleich +∞, und man erhält nach Satz (7.2) auf ganz C definierte, holomorphe Funktionen. Ebenfalls auf Grund des Satzes erhält man die komplexen Ableitungen der drei Funktionen einfach durch formale Ableitung der zugehörigen Potenzreihen. Für den komplexen Kosinus erhält man so beispielsweise die Ableitung ∞ X n=1 (−1)n (2n) z 2n−1 (2n)! − = ∞ X (−1)n n=1 ∞ X n=0 (−1)n z 2n−1 (2n − 1)! z 2n+1 (2n + 1)! = = ∞ X (−1)n+1 n=0 − sin(z). —– 65 —– ä z 2n+1 (2n + 1)! = § 7. Komplexe Potenzreihen Durch Einsetzen in die formalen Potenzreihen erhält man auch eine Gleichung, welche die drei Funktionen verbindet, nämlich exp(i z) = cos(z) + i sin(z) für alle z ∈ C. Dies rechnen wir in den Übungen nach. An Stelle von exp(z) schreibt man häufig auch e z . Die Gleichung zeigt, dass man die Polarkoordinaten-Darstellung einer komplexen Zahl auch in der Form z = r e i ϕ angeben kann, wobei r den Betrag und ϕ das Argument von z bezeichnet. —– 66 —– § 8. Komplexe Kurvenintegrale und Cauchyscher Integralsatz Bereits in §3 haben wir Integrale über Kurven im R2 definiert und eine Reihe von Hilfsmitteln zu ihrer Berechnung zusammengestellt. Da C als R-Vektorraum isomorph zu R2 ist, bereitet es keine Schwierigkeiten, diese Konzepte auf Kurven in C zu übertragen. Sei U ⊆ C eine beliebige Teilmenge. Unter einer Kurve in U verstehen wir eine stetige Abbildung γ : [a, b] → U auf einem kompakten Intervall [a, b] ⊆ R, die stückweise stetig differenzierbar ist. Wie in §3 definieren wir (i) die Normierung γ̃ : [0, 1] → C einer solchen Kurve γ durch γ̃(t ) = γ((1 − t )a + t b) für alle t ∈ [0, 1] (ii) die Konkatenation zweier normierter Kurven γ, δ : [0, 1] → U mit γ(1) = δ(0) durch γ(2t ) für 0 ≤ t ≤ 21 δ ∗ γ : [0, 1] −→ U , t 7→ δ(2t − 1) für 1 ≤ t ≤ 1 2 (iii) die Inversion einer normierten Kurve γ durch γ− (t ) = γ(1 − t ) für alle t ∈ [0, 1]. Die folgenden beiden Kurventypen werden im Folgenden uns besonders häufig begegnen: Sind w 1 , w 2 ∈ C zwei beliebige Punkte, dann ist die Verbindungsstrecke zwischen w 1 und w 2 die Kurve [w 1 , w 2 ] gegeben durch [w 1 , w 2 ] : [0, 1] −→ C , t 7→ (1 − t )w 1 + t w 2 . Sei w ∈ C und r ∈ R+ . Bezeichnen wir mit B̄ r (w) die abgeschlossene Kreisscheibe vom Radius r um den Punkt w, dann ist die (positiv orientierte) Randkurve von B̄ r (w) die Kurve ∂B̄ r (w) gegeben durch ∂B̄ r (w) : [0, 1] −→ C , t 7→ w + r e 2πi t . Um die nächste Definition vorzubereiten, führen wir die folgende Notation ein: Sei f : [a, b] → C eine stetige Funktion und f = g + i h deren Zerlegung in Real- und Imaginärteil, mit stetigen, reellwertigen Funktionen g , h auf [a, b]. Dann setzen wir Z b Z f (x) d x a = b a Z g (x) d x + i b h(x) d x. a Das Integral über f ist also eine komplexe Zahl. Bezeichnen G und H (reelle) Stammfunktionen von g und h, dann erhält man Z b f (x) d x a = [G(x)]ba + i [H (x)]ba , indem man den Hauptsatz der Differential- und Integralrechnung auf die Funktionen g und h anwendet. Setzt man F = G + i H und definiert die Ableitung von F durch F 0 (x) = G 0 (x) + i H 0 (x), dann lässt sich die Rb Gleichung auch kürzer in der Form a f (x) d x = [F (x)]ba darstellen. —– 67 —– § 8. Komplexe Kurvenintegrale und Cauchyscher Integralsatz Definition 8.1 Sei U ⊆ C, f : U → C eine stetige Funktion und γ : [a, b] → U eine Kurve in U . Dann ist das Kurvenintegral von f über γ definiert durch Z b Z γ f (z) d z = a ( f ◦ γ)(t )γ0 (t ) d t . Komplexe Kurvenintegrale über Verbindungsstrecken werden auch in der Form w2 Z Z f (z) d z w1 1 Z f (z) d z = [w 1 ,w 2 ] = 0 f ((1 − t )w 1 + t w 2 )(w 2 − w 1 ) d t notiert. Wir illustrieren die Defintion, indem wir das Kurvenintegral zweier Funktionen über die Randkurve γ = ∂B̄ 1 (0) gegeben durch γ(t ) = e 2πi t berechnen. Für die Funktion C → C, z 7→ z 2 erhalten wir Z Z 2 γ z dz = 1 0 2 0 γ(t ) γ (t ) d t e = 4πi t 0 · (2πi )e 1 Z 0 · 1 sin(6πt ) 2πi 6π 0 1 Z dt 2πi = · ¸1 1 − 2π − cos(6πt ) 6π 0 0 = = 1 Z ¸1 e 6πi t d t 0 cos(6πt ) d t + 2πi · i 2πi = 2πi t 1 Z (cos(6πt ) + i sin(6πt )) d t 2πi = 1 Z sin(6πt ) d t 0 2πi 2π (0 − 0) − (−1 + 1) 6π 6π = 0. Die Rechnung lässt sich abkürzen, wenn man verwendet, dass für jedes λ ∈ C die Ableitung von F (t ) = e λt jeweils durch F 0 (t ) = λe λt gegeben ist. Überprüfen lässt sich diese Gleichung durch Zerlegung von F in Real- und Imaginärteil. Ist λ = u + i v mit u, v ∈ R, dann gilt F (t ) = e λt e ut +i v t = e u (cos(v t ) + i sin(v t )) = = G(t ) + i H (t ) mit G(t ) = e ut cos(v t ) und H (t ) = e ut sin(v t ). Die beiden Ableitungen G 0 (t ) = ue ut cos(v t ) + (−v)e ut sin(v t ) und H 0 (t ) = ue ut sin(v t ) + ve ut cos(v t ) liefern F 0 (t ) = = G 0 (t ) + i H 0 (t ) = ue ut cos(v t ) + (−v)e ut sin(v t ) + i ue ut sin(v t ) + i ve ut cos(v t ) (u + i v)e ut cos(v t ) + (u + i v)e ut i sin(v t ) = (u + i v)e ut (cos(v t ) + i sin(v t )) = λe λt . Umgekehrt folgt aus der Gleichung, dass für jedes λ ∈ C mit λ 6= 0 die Funktion f (t ) = e λt jeweils F (t ) = λ1 e λt als Stammfunktion besitzt. Wir erhalten somit · ¸ Z Z 1 ³ ´ 1 6πi t 1 2 6πi t z d z = 2πi e d t = 2πi e = 31 e 6πi ·1 − e 6πi ·0 = 31 (1 − 1) = 0. 6πi γ 0 0 Für die Funktion C \ {0} → C, z 7→ Z 1 dz γz Z = 0 1 1 z ergibt sich dagegen γ0 (t ) dt γ(t ) 1 Z = 0 2πi e 2πi t e 2πi t —– 68 —– Z dt = 1 1 dt 2πi 0 = 2πi . § 8. Komplexe Kurvenintegrale und Cauchyscher Integralsatz Das hier definierte Kurvenintegral ist das komplexe Analogon zum Kurvenintegral aus §3, und beide Definitionen hängen eng miteinander zusammen. Sei f = g + i h die Zerlegung von f in Real- und Imaginärteil, mit g , h : U → R. Seien außerdem γ1 , γ2 die beiden Komponenten von ι ◦ γ : [a, b] → R2 , wobei ι : C → R den Vektorraum-Isomorphismus aus §7 bezeichnet. Dann gilt Z Z b f (z) d z = ((g ◦ γ)(t ) + i (h ◦ γ)(t ))(γ01 (t ) + i γ02 (t )) d t = γ Z b a a (g ◦ γ)(t )γ01 (t ) d t − a b Z a Z +i b Z (h ◦ γ)(t )γ02 (t ) d t + i a (( f R )1 ◦ ι ◦ γ)(t )γ01 (t ) d t b a b Z (g ◦ γ)(t )γ02 (t ) d t + i b Z − (( f R )1 ◦ ι ◦ γ)(t )γ02 (t ) d t a Z +i b Z a (h ◦ γ)(t )γ01 (t ) d t = (( f R )2 ◦ ι ◦ γ)(t )γ02 (t ) d t b a (( f R )2 ◦ ι ◦ γ)(t )γ01 (t ) d t also Z Re *à Z γ f (z) d z = ι◦γ ! + ( f R )1 , ds −( f R )2 Z und Im *à Z γ f (z) d z = ι◦γ ! + ( f R )2 , ds . ( f R )1 Da sich also Real- und Imaginärteil des komplexe Kurvenintegrals als Kurvenintegrale im R2 interpretieren lassen, übertragen sich die Rechenregeln für Kurvenintegrale in R2 auf die komplexe Situation: Wegen ι ◦ (δ ∗ γ) = (ι ◦ δ) ∗ (ι ◦ γ) und erhält man für komplexe Kurvenintegrale wie in §3 die Regeln Z Z Z f (z) d z = f (z) d z + f (z) d z und δ∗γ γ (ι ◦ γ)− = ι ◦ γ− Z δ Bezeichnet γ̃ die Normierung einer Kurve γ, dann gilt Z Z γ− f (z) d z = − γ f (z) d z. Z f (z) d z = γ̃ f (z) d z. γ Die Länge einer komplexen Kurve γ : [a, b] → C ist definiert durch Z b |γ0 (t )| d t . L (γ) = a Auch diese Definition ist bereits aus §3 bekannt, denn wie man sich leicht überzeugt, gilt L (γ) = L (ι◦γ) für die Kurve ι ◦ γ im R2 . Aus den entsprechenden Rechenregeln im R2 leitet man die Gleichungen L (δ ∗ γ) = L (δ) + L (γ) und L (γ− ) = L (γ) ab. Für die spätere Verwendung notieren wir noch die folgende Abschätzung für Kurvenintegrale. Proposition 8.2 Sei U ⊆ C, γ : [a, b] → U eine Kurve, f : U → C eine stetige Funktion und c ∈ R+ eine Konstante, so dass | f (z)| ≤ c für alle z ∈ γ([a, b]) erfüllt ist. Dann gilt ¯Z ¯ ¯ ¯ ¯ f (z) d z ¯ ≤ cL (γ). ¯ ¯ γ —– 69 —– § 8. Komplexe Kurvenintegrale und Cauchyscher Integralsatz Beweis: Die Ungleichung erhält man durch die Rechnung ¯ ¯Z b ¯ ¯Z Z b ¯ ¯ ¯ ¯ ¯ f d z ¯ = ¯ ( f ◦ γ)(t )γ0 (t ) d t ¯ ≤ |( f ◦ γ)(t )||γ0 (t )| d t ¯ ¯ ¯ ¯ γ a a Z ≤ b c a |γ0 (t )| d t = cL (γ) wobei im zweiten Schritt Prop. (5.12) (i) verwendet wurde. ä Unser wichtigstes Ziel in diesem Abschnitt ist der Nachweis, dass Kurvenintegrale holomorpher Funktionen, die auf einer konvexen Teilmenge U ⊆ C definiert sind, stets den Wert Null haben. Zunächst werden wir sehen, dass sich dies für Randkurven von C 1 -Normalbereichen direkt aus dem Greenschen Integralsatz ergibt. Wir bezeichnen eine Teilmenge B ⊆ C als C 1 -Normalbereich, wenn die Bildmenge B R = ι(B ) ⊆ R2 ein solcher Normalbereich im Sinne von §3 ist. Sei γR = ∂B R die Randkurve wie in Satz (3.7) definiert und γ = ι−1 ◦ γR die entsprechende Kurve in C. Sei außerdem U eine offene Teilmenge von C mit U ⊇ B und f : U → C eine holomorphe Funktion mit stetiger komplexer Ableitung f 0 . Der Greensche Integralsatz, angewendet auf das C 1 -Vektorfeld (( f R )1 , −( f R )2 ), liefert uns dann *à ! + Z Z Z ¡ ¢ ( f R )1 Re f (z) d z = , ds = −∂1 ( f R )2 (x, y) − ∂2 ( f R )1 (x, y) d (x, y). −( f R )2 γ ∂B R BR Ist f = g + i h die Zerlegung von f in Real- und Imaginärteil, dann erhalten wir für die Funktion unter dem Integralzeichen ∂h ∂g (x + i y) − (x + i y) = 0 ∂x ∂y R auf Grund der Cauchy-Riemannschen Differentialgleichungen. Also ist Re γ f (z) d z = 0. Genau leitet man R die Gleichung Im γ f (z) d z = 0 aus dem Greenschen Integralsatz und den Cauchy-Riemannschen Differentialgleichungen ab. Insgesamt gilt in dieser Situation also tatsächlich Z f (z) d z = 0. −∂1 ( f R )2 (x, y) − ∂2 ( f R )1 (x, y) = − γ Um dieses Resultat für beliebige geschlossene Kurven auf konvexen Gebieten herzuleiten, erweist sich die Voraussetzung, dass γ Randkurve eines Normalbereichs sein muss, allerdings als unpraktisch. Ein weiterer Nachteil bei dieser Herleitung besteht darin, dass wir die Stetigkeit der komplexen Ableitung voraussetzen mussten. Wir zeigen nun zunächst, dass die Aussage für Randkurven von Dreiecken auch ohne diese Annahme zutrifft. Definition 8.3 Seien u, v, w ∈ C drei Punkte, die nicht auf einer gemeinsamen affinen Geraden liegen. Dann bezeichnen wir die Menge ∆ = ∆(u, v, w) = {λu + µv + νw | λ, µ, ν ∈ [0, 1], λ + µ + ν = 1} als Dreieck mit den Eckpunkten u, v, w. Als Randkurve des Dreiecks definieren wir die zusammengesetzte Kurve ∂∆ = [w, u] ∗ [v, w] ∗ [u, v]. —– 70 —– § 8. Komplexe Kurvenintegrale und Cauchyscher Integralsatz Eine Teilmenge U ⊆ C wird als konvex bezeichnet, wenn für zwei beliebige Punkte w 1 , w 2 ∈ C auch das Bild der Verbindungsstrecke [w 1 , w 2 ]([0, 1]) vollständig in U liegt. Aus der Definition der Konvexität folgt unmittelbar, dass für jede konvexe Teilmenge U ⊆ C mit u, v, w ∈ U auch das Dreieck ∆ = ∆(u, v, w) in U enthalten ist. Ist f : U → C eine stetige Funktion, dann gilt auf Grund der Rechenregel für die Konkatenation von Kurven jeweils Z Z Z Z v ∂∆ f (z) d z = u w f (z) d z + u f (z) d z + v f (z) d z. w Die Länge von ∂∆, also die Zahl |v − u| + |w − v| + |u − w|, bezeichnen wir als Umfang des Dreiecks. Proposition 8.4 Sei U ⊆ C ein konvexes Gebiet, und seien u, v, w ∈ U Punkte, die nicht auf einer affinen Geraden liegen. Sei ∆ = ∆(u, v, w), und seien u 0 = 12 (v +w), v 0 = 12 (u+w), w 0 = 12 (u + v) die Seitenmittelpunkte von ∆. Dann können wir ∆ in die vier kleineren Dreiecke ∆1 = ∆(u, w 0 , v 0 ) , ∆2 = ∆(v, u 0 , w 0 ) , ∆3 = ∆(w, v 0 , u 0 ) und ∆4 = ∆(u 0 , v 0 , w 0 ) zerlegen. Für jede stetige Funktion f : U → C gilt Z Z Z Z Z f (z) d z = f (z) d z + f (z) d z + f (z) d z + f (z) d z. ∂∆ ∂∆1 ∂∆2 ∂∆3 ∂∆4 Beweis: Die Gleichung erhält man durch mehrfache Anwendung der Rechenregeln für Konkatenation und Inversion. Nach Definition der Verbindungsstrecken gilt allgemein Z w1 Z Z w2 f (z) d z = f (z) d z = − f (z) d z [w 1 ,w 2 ]− w2 w1 für beliebige Punkte w 1 , w 2 ∈ C. Daraus folgt Z Z Z Z f (z) d z + f (z) d z + f (z) d z + f (z) d z ∂∆1 w0 ÃZ u ÃZ f (z) d z + v0 f (z) d z + Z f (z) d z + f (z) d z + Z v0 f (z) d z + v u ! ÃZ v v u0 Z f (z) d z + Z f (z) d z + v Z f (z) d z + v0 u0 u0 w Z f (z) d z + f (z) d z + f (z) d z + Z ∂∆4 ! ÃZ u v0 u0 u Z ∂∆3 w Z f (z) d z + v0 w0 u w0 Z u0 Z w ∂∆2 v0 Z = v w0 Z f (z) d z + u u0 f (z) d z + v0 Z f (z) d z + w w0 w0 w f (z) d z. = ∂∆ Als letzte Vorbereitung für den Cauchyschen Integralsatz benötigen wir —– 71 —– ! f (z) d z = w u0 f (z) d z Z f (z) d z f (z) d z + u0 Z f (z) d z + v0 ! v Z w0 Z f (z) d z + w0 ä = § 8. Komplexe Kurvenintegrale und Cauchyscher Integralsatz Lemma 8.5 Sei U ⊆ C offen, f : U → C eine stetige Funktion und F : U → C eine komplexe Stammfunktion von f , also eine komplex differenzierbare Funktion mit F 0 (z) = f (z) für alle z ∈ U . Dann gilt Z f (z) d z = (F ◦ γ)(b) − (F ◦ γ)(a) γ für jeden in U Zverlaufenden Weg γ : [a, b] → C. Ist γ insbesondere ein geschlossener Weg, dann gilt also γ f (z) d z = 0. Beweis: Die Aussage erhält man durch Anwendung des Hauptsatzes der Differential- und Integralrechnung aus der reellen Analysis. Seien f = g + i h und F = G + i H die Zerlegungen von f und F in Real- und Imaginärteil. Dann sind G ◦ γ und H ◦ γ Real- und Imaginärteil von F ◦ γ, und (G ◦ γ)0 , (H ◦ γ)0 sind Realund Imaginärteil von (F ◦γ)0 . Zunächst betrachten wir den Fall, dass γ auf dem offenen Intervall ]a, b[ stetig differenzierbar ist. Auf Grund der Kettenregel und dem Hauptsatz der Differential- und Integralrechnung gilt Z b Z γ f (z) d z Z b a = a 0 (F ◦ γ) (t ) d t ( f ◦ γ)(t )γ0 (t ) d t Z = b a Z = 0 (G ◦ γ) (t ) d t + i (G ◦ γ)(b) − (G ◦ γ)(a) + i (H ◦ γ)(b) − i (H ◦ γ)(a) b a Z (F 0 ◦ γ)(t )γ0 (t ) d t b a (H ◦ γ)0 (t ) d t = = = (F ◦ γ)(b) − (F ◦ γ)(a). Nun sei γ ein beliebiger Weg, und a = x 0 < ... < x n = b eine Unterteilung mit der Eigenschaft, dass γk = γ|]xk−1 ,xk [ für 1 ≤ k ≤ n stetig differenzierbar ist. Auf Grund der bereits bewiesenen Gleichung erhalten wir Z γ f dz = n Z X k=1 γk f dz ((F ◦ γ)(x k ) − (F ◦ γ)(x k−1 )) = k=1 (F ◦ γ)(x n ) − (F ◦ γ)(x 0 ) Satz 8.6 n X = = (F ◦ γ)(b) − (F ◦ γ)(a). ä (Cauchyscher Integralsatz für Dreiecke) Ist U ⊆ C offen, f : U → C eine holomorphe Funktion und ∆ ⊆ U ein Dreieck, dann gilt Z f (z) d z = 0. ∂∆ —– 72 —– § 8. Komplexe Kurvenintegrale und Cauchyscher Integralsatz Beweis: Wie in Prop. (8.4) unterteilen wir das Dreieck ∆ in vier Dreiecke ∆1 , ∆2 , ∆3 , ∆4 . Sei ∆(1) von diesen vier Dreiecken dasjenige mit dem maximalen Betrag ¯ ¯Z ¯ ¯ ¯ f (z) d z ¯¯ , i ∈ {1, 2, 3, 4} ¯ ∂∆i (0) des Kurvenintegrals. Setzen wir ∆ = ∆, dann gilt ∆(0) ⊇ ∆(1) und ¯Z ¯ ¯Z Z Z Z ¯ ¯ ¯ ¯ ¯ ¯ f (z) d z + f (z) d z + f (z) d z + f (z) d z ¯ = ¯ ¯ ∂∆1 ∂∆(0) ¯Z ¯ ¯ ¯ ∂∆1 ¯ ¯Z ¯ ¯ f (z) d z ¯¯ + ¯¯ ∂∆2 ∂∆2 ¯ ¯Z ¯ ¯ f (z) d z ¯¯ + ¯¯ ∂∆3 ¯ ¯Z ¯ ¯ f (z) d z ¯¯ + ¯¯ ∂∆3 ∂∆4 ¯ ¯ f (z) d z ¯¯ ≤ ∂∆4 ¯ ¯ f (z) d z ¯¯ ¯Z ¯ 4 ¯¯ ∂∆(1) ≤ ¯ ¯ f (z) d z ¯¯ . Indem wir dieselbe Konstruktion wie zuvor auf ∆ auf das Dreieck ∆(1) anwenden, erhalten wir ein Dreieck ∆(2) ⊆ ∆(1) , und Iteration dieses Vorgangs liefert eine Folge ∆(0) ⊇ ∆(1) ⊇ ∆(2) ⊇ ∆(3) ⊇ ... von Dreiecken mit ¯Z ¯ ¯Z ¯ ¯ ¯ ¯ ¯ n¯ ¯ ¯ f (z) d z ¯ ≤ 4 ¯ f (z) d z ¯¯ . ¯ ∂∆(0) ∂∆(n) Bezeichnen wir jeweils mit `n den Umfang und mit δn den Durchmesser von ∆n , dann gilt `n = 2−n `0 und δn = 2−n δ0 für alle n ∈ N0 . Weil die Dreiecke kompakt sind und sich gegenseitig enthalten, gibt es nach dem Schachtelungsprinzip aus der Analysis mehrer Variablen einen Punkt w ∈ C mit der Eigenschaft ∞ \ ∆(n) = {w}. n=0 Auf Grund der komplexen Differenzierbarkeit von f im Punkt w existiert eine Funktion h : U → C mit f (z) = f (w) + (z − w) f 0 (w) + h(z) mit lim z→w h(z) = 0. |z − w| Die Funktion g (z) = f (w)+(z−w) f 0 (w) besitzt G(z) = f (w)z+ 21 (z−w)2 f 0 (w) als komplexe Stammfunktion. Mit Lemma (8.5) erhalten wir Z Z Z Z f (z) d z = (g + h)(z) d z = g (z) d z + h(z) d z ∂∆(n) ∂∆(n) ∂∆(n) Z = 0+ ∂∆(n) Z ∂∆(n) h(z) d z = ∂∆(n) h(z) d z. Sei nun ε ∈ R+ beliebig vorgegeben. Auf Grund der Grenzwerteigenschaft der Funktion h gilt |h(z)| ≤ ε|z − w| für z in einer hinreichend kleinen Umgebung V ⊆ U von w. Da der Durchmesser δn von ∆(n) für n → ∞ gegen Null konvergiert, ist das Dreieck ∆(n) für hinreichend großes n in V enthalten. Für alle z ∈ ∆(n) gilt dann |z − w| ≤ δn und somit |h(z)| ≤ εδn . Weil der Dreiecksumfang zugleich die Länge des Integrationsweges ist, erhalten wir mit Prop. (8.2) die Abschätzung ¯Z ¯ ¯Z ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ f (z) d z ¯ = ¯ h(z) d z ¯¯ ≤ εδn `n = 4−n δ0 `0 ε. ¯ ∂∆(n) ∂∆(n) Es folgt ¯Z ¯ ¯ ¯ ∂∆(0) ¯ ¯ f (z) d z ¯¯ ¯Z ¯ 4n ¯¯ ≤ und da ε ∈ R+ beliebig vorgegeben war, folgt ∂∆(n) ¯ ¯ f (z) d z ¯¯ ≤ δ0 `0 ε , Z ∂∆ f (z) d z = 0. —– 73 —– ä § 8. Komplexe Kurvenintegrale und Cauchyscher Integralsatz In Anwendungen des Cauchyschen Integralsatzes stellt es sich häufig als günstig heraus, wenn man auf die Holomorphie der Funktion f in einem Punkt des Definitionsbereichs verzichten kann. Proposition 8.7 Sei ∆ = ∆(u, v, w) ein Dreieck, a ∈ ∆ ein Punkt, U ⊆ C offen mit U ⊇ ∆ und f : U → C eine stetige Funktion, die auf U \ {a} holomorph ist. Dann gilt Z f (z) d z = 0. ∂∆ Beweis: Zunächst betrachten wir den Fall, dass a mit einem der Eckpunkte des Dreiecks übereinstimmt; sei etwa a = u. Seien ferner v 1 und w 1 zwei beliebige Punkte auf den an u anliegenden Dreiecksseiten [u, v] bzw. [u, w]. Definieren wir ∆1 = ∆(u, v 1 , w 1 ), ∆2 = ∆(w, w 1 , v 1 ) und ∆3 = ∆(v 1 , v, w), dann erhalten wir eine Unterteilung des Dreiecks ∆ in drei kleinere Dreiecke. Wie in Prop. (8.4) rechnet man nach, dass Z Z Z Z f (z) d z = f (z) d z + f (z) d z + f (z) d z ∂∆ ∂∆1 ∂∆2 ∂∆3 erfüllt ist. Weil f auf ∆2 und ∆3 holomorph ist, verschwindet das Integral für diese beiden Dreiecke, und es folgt Z Z ∂∆ f dz = ∂∆1 f d z. (1) Weil ∆ kompakt ist, nimmt die stetige Funktion z 7→ | f (z)| auf ∆ ein Maximum m ∈ R+ an. Auf Grund von Prop. (8.2) gilt die Abschätzung ¯ ¯Z ¯ ¯ ¯ f (z) d z ¯¯ ≤ L (∂∆1 )m. ¯ ∂∆1 Nach Gleichung (1) ist das Integral über ∂∆1 von der Lage der Punkte v 1 , w 1 auf den Dreiecksseiten unabhängig. Lassen wir nun v 1 und w 1 gegen a = u laufen, dann konvergiert der Umfang L (∂∆1 ) von ∆1 gegen Null. Es folgt Z Z ∂∆ f (z) d z = ∂∆1 f (z) d z = 0. Als nächstes betrachten wir den Fall, dass a zwar auf einer Seite des Dreiecks liegt, etwa in [u, v], aber mit keinem der Eckpunkte übereinstimmt. Wir bilden dann die Dreiecke ∆1 = ∆(u, a, w) und ∆2 = ∆(v, w, a). Wieder zeigt man durch eine Rechnung wie in Prop. (8.4), dass Z Z Z f (z) d z + f (z) d z gilt. f (z) d z = ∂∆1 ∂∆ ∂∆2 Nach Konstruktion ist a ein Eckpunkt sowohl von ∆1 als auch von ∆2 . Wir können also die Aussage im bereits bewiesenen Fall anwenden und erhalten Z Z Z f (z) d z = f (z) d z + f (z) d z = 0 + 0 = 0. ∂∆ ∂∆1 ∂∆2 —– 74 —– § 8. Komplexe Kurvenintegrale und Cauchyscher Integralsatz Schließlich betrachten wir noch den Fall, dass a im Inneren des Dreiecks enthalten ist. Dann gibt es λ, µ, ν ∈ µ λ u + λ+µ v liegt dann auf der Verbindungs]0, 1[ mit λ + µ + ν = 1 und a = λu + µv + νw. Der Punkt b = λ+µ strecke [u, v], stimmt aber weder mit u noch mit v überein, und a ist wegen µ ¶ µ ¶ λ µ λ µ (1 − ν)b + νw = (1 − ν) u+ v + νw = (λ + µ) u+ v + νw λ+µ λ+µ λ+µ λ+µ λu + µv + νw = = a in der Verbindungsstrecke [b, w] enthalten. Es sind dann ∆1 = ∆(u, b, w) und ∆2 = ∆(v, w, b) Dreiecke mit der Eigenschaft, dass a auf einer ihrer Seiten liegt. Wiederum ist die Aussage damit auf einen bereits bewiesenen Fall zurückgeführt, und wir erhalten Z Z Z f (z) d z = f (z) d z + f (z) d z = 0 + 0 = 0. ä ∂∆ ∂∆1 ∂∆2 Proposition 8.8 Sei G ein konvexes Gebiet, f : G → C stetig und auf G mit eventueller Ausnahme eines einzelnen Punktes holomorph. Ist a ∈ G ein beliebiger Punkt, dann ist durch Z z F : G −→ C , z 7→ f (w) d w a eine Stammfunktion von f definiert. Beweis: Für ein beliebiges b ∈ G ist zu zeigen, dass F in b differenzierbar ist und F 0 (b) = f (b) gilt. Sei z ∈ G ein beliebiger Punkt und ∆ = ∆(b, a, z). Dann ist ∆ vollständig im Gebiet G enthalten. Auf Grund des R Cauchyschen Integralsatzes für Dreiecke gilt ∂∆ f (w) d w = 0, also Z F (b) + b z b Z f (w) d w − F (z) = f (w) d w + a z Z b a Z f (w) d w + f (w) d w z = 0 und somit z Z F (z) − F (b) f (w) d w = = b Z1 mit g (z) = 1 Z 0 f ((1 − t )b + t z)(z − b) d t = (z − b)g (z) Z1 f ((1 − t )b + t z) d t . Es gilt g (b) = 0 f (b) d t = f (b), und wegen 0 1 Z g (z) − g (b) = 0 ( f ((1 − t )b + t z) − f (b)) d t ist |g (z) − g (b)| durch max{| f ((1 − t )b + t z) − f (b) | 0 ≤ t ≤ 1} beschränkt. Weil f auf G stetig ist, konvergiert diese Differenz gegen Null, wenn wir z → b laufen lassen; also ist auch g im Punkt b stetig. Es folgt nun F (z) − F (b) z→b z −b lim = lim g (z) z→b = g (b) = f (b). Damit haben wir gezeigt, dass F in b differenzierbar ist, und dass F 0 (b) = f (b) gilt. —– 75 —– ä § 8. Komplexe Kurvenintegrale und Cauchyscher Integralsatz Satz 8.9 (Cauchyscher Integralsatz für konvexe Gebiete) Sei G ein konvexes Gebiet, f : G → C stetig und mit eventueller Ausnahme eines einzelnen Punktes holomorph. Dann gilt für jede in G verlaufende, geschlossene Kurve γ Z f (z) d z = 0. γ Beweis: Weil f auf G nach Prop. (8.8) eine Stammfunktion besitzt, erhalten wir die Aussage durch Anwendung von Lemma (8.5). ä —– 76 —– § 9. Die Cauchysche Integralformel In diesem Abschnitt leiten wir aus dem Cauchyschen Integralsatz eine wichtige Formel ab, welche besagt, dass eine holomorphe Funktion auf einer Kreisscheibe vollständig durch ihre Werte auf dem Kreisrand festgelegt ist. Viele fundamentale Eigenschaften holomorpher Funktionen lassen sich auf diese Formel zurückführen. Als Vorbereitung für den Beweis des Satzes zeigen wir, dass Kurvenintegrale über stetige Funktionen, die von einem komplex differenzierbaren Parameter abhängen, selbst komplex differenzierbare Funktionen darstellen. Seien U ,W ⊆ C offene Teilmengen und f : U × W → C eine Funktion mit der Eigenschaft, dass für jedes z ∈ U die Funktion f z : W → C gegeben durch f z (w) = f (z, w) für alle w ∈ W eine holomorphe Funktion ist. Bezeichnet f z0 jeweils die komplexe Ableitung von f z , dann setzen wir ∂w f (z, w) = f z0 (w) und erhalten dadurch erhalten somit eine neue C-wertige Funktion ∂w f : U × W → C. Proposition 9.1 Seien U ,W ⊆ C offen und f : U ×W → C eine stetige Funktion. Außerdem setzen wir voraus, dass ∂w f auf ganz U ×W existiert und stetig ist. Sei γ : [a, b] → U eine Kurve in U . Dann ist Z F : W −→ C , w 7→ f (z, w) d z γ eine holomorphe Funktion, und es gilt F 0 (w) = Z γ ∂w f (z, w) d z. Beweis: Wesentliches Hilfsmittel ist Satz (5.20) über die Vertauschbarkeit von Integration und partieller Differentiation. Sei WR = ι(W ) und f˜ die Nullfortsetzung von [a, b] × WR −→ C , (t , u, v) 7→ f (γ(t ), u + i v)γ0 (t ) auf die Menge R × WR . Sei f˜ = g + i h die Zerlegung von f˜ in Real- und Imaginärteil. Sei (u 0 , v 0 ) ∈ WR ein festgewählter Punkt und w 0 = u 0 + i v 0 . Nach Voraussetzung ist f z (w) = f (z, w) für jedes z ∈ U stetig, und die komplexe Ableitung f z0 ist auf U × W eine stetige Funktion. Daraus folgt, dass auch die Richtungableitungen f z nach 1 und i , die wir mit ∂u f und ∂v f bezeichnen, auf ganz U × W existieren und dort stetig sind. Folglich existieren für jedes t ∈ R auch die partiellen Ableitungen ∂2 g (t , u, v) = ∂3 g (t , u, v) = ¡ ¢ Re ∂2 f˜(t , u, v) ¡ ¢ Re ∂3 f˜(t , u, v) = = —– 77 —– ¡ ¢ Re ∂u f (γ(t ), u + i v)γ0 (t ) ¡ ¢ Re ∂v f (γ(t ), u + i v)γ0 (t ) § 9. Die Cauchysche Integralformel und ∂2 h(t , u, v) = ∂3 h(t , u, v) = ¡ ¢ Im ∂2 f˜(t , u, v) ¡ ¢ Im ∂3 f˜(t , u, v) = = ¡ ¢ Im ∂u f (γ(t ), u + i v)γ0 (t ) ¡ ¢ Im ∂v f (γ(t ), u + i v)γ0 (t ) und sind stetig als Funktionen auf der Menge [a, b] × WR ; außerhalb diese Menge sind sie identisch Null. Nach eventueller Ersetzung von W durch eine kleinere offene Umgebung von w 0 können wir also annehmen, dass alle vier partiellen Ableitungen auf ganz R ×WR betragsmäßig durch eine einheitliche Konstante c ∈ R+ beschränkt sind. Wir überprüfen nun die Voraussetzungen von Satz (5.20). Für jedes (u, v) ∈ WR sind die Abbildungen t 7→ g (t , u, v) und t 7→ h(t , u, v) auf dem Intervall [a, b] stetig und außerhalb des Intervalls gleich Null. Somit handelt es sich um Lebesgue-integrierbare Funktionen. Die Funktion c · χ[a,b] ist ebenfalls Lebesgueintegrierbar, und es gilt |∂2 g (t , u, v)| ≤ c · χ[a,b] (t ) für alle t ∈ R; dieselbe Abschätzung ist auch für die anderen drei partiellen Ableitungen gültig. Daraus folgt, dass die Funktionen Z Z G : WR → R , (u, v) 7→ g (t , u, v) d t und H : WR → R , (u, v) 7→ h(t , u, v) d t [a,b] [a,b] partiell differenzierbar sind, mit partiellen Ableitungen Z Z ∂1G(u, v) = ∂2 g (t , u, v) d t , ∂2G(u, v) = [a,b] ∂1 H (u, v) = Z [a,b] ∂2 h(t , u, v) d t [a,b] ∂2 H (u, v) = , ∂3 g (t , u, v) d t Z [a,b] , ∂3 h(t , u, v) d t . Nach Satz (5.19) sind die partiellen Ableitungen ∂1G, ∂2G, ∂1 H und ∂2 H außerdem stetig als Funktionen auf WR . Als stetig partiell differenzierbare Funktionen sind G und H auf WR total differenzierbar. Auf Grund der Gleichung Z Z b Z b F (u + i v) = f (z, u + i v) d z = f (γ(t ), u + i v)γ0 (t ) d t = f˜(t , u, v) d t γ a Z = a Z [a,b] g (t , u, v) d t + i h(t , u, v) d t [a,b] G(u, v) + i H (u, v) = ist die Funktion F : W → C damit reell differenzierbar im Sinne von Def. (6.6). Weiter gilt für alle w = u + i v ∈ W jeweils Z Z b ¡ ¢ ∂ Re(F ) (w) = ∂1G(u, v) = ∂2 g (t , u, v) d t = Re ∂u f (γ(t ), u + i v)γ0 (t ) d t ∂u [a,b] a µZ b ¶ µZ ¶ 0 = Re ∂u f (γ(t ), w)γ (t ) d t = Re ∂u f (z, w) d z , γ a und ebenso erhält man die Gleichungen µZ ¶ ∂ Im(F ) (w) = Im ∂u f (z, w) d z ∂u γ und ∂ Im(F ) (w) ∂v , = µZ ¶ ∂ Re(F ) (w) = Re ∂v f (z, w) d z ∂v γ µZ ¶ Im ∂v f (z, w) d z . —– 78 —– γ § 9. Die Cauchysche Integralformel Weil die Funktion f z für jedes z ∈ U laut Angabe sogar komplex differenzierbar ist, gelten die CauchyRiemannschen Differentialgleichungen Im ∂v f (z, w) Re ∂u f (z, w) = Im ∂u f (z, w) und = −Re ∂v f (z, w) für alle (z, w) ∈ U × W . Daraus folgt für jedes w ∈ W die Gleichung ∂F (w) ∂z̄ = 1 2 ∂F ∂ Re(F ) ∂ Im(F ) ∂F ∂ Im(F ) ∂ Re(F ) (w) + 12 i (w) = 12 (w) − 12 (w) + 12 i (w) + 12 i (w) ∂u ∂v ∂u ∂v ∂u ∂v µZ ¶ µZ ¶ µZ ¶ µZ ¶ Re ∂u f (z, w) d z − 12 Im ∂v f (z, w) d z + 12 i Im ∂u f (z, w) d z + 12 i Re ∂v f (z, w) d z 1 2 = γ = 1 2 Z γ γ ¡ γ ¢ Re ∂u f (z, w) − Im ∂v f (z, w) d z + 12 i Z ¡ γ γ ¢ Im ∂u f (z, w) + Re ∂v f (z, w) d z = 0 , wodurch die komplexe Differenzierbarkeit von F in w bewiesen ist. Für die komplexe Ableitung von F erhalten wir den Wert µZ ¶ µZ ¶ ∂ Re(F ) ∂ Im(F ) ∂F (w) = (w) + i (w) = Re ∂u f (z, w) d z + i Im ∂u f (z, w) d z F 0 (w) = ∂z ∂u ∂u γ γ Z Z ¡ ¢ = ∂u Re( f )(z, w) + i ∂u Im( f )(z, w) d z = ∂w f (z, w) d z. ä γ γ Proposition 9.2 Sei a ∈ C und r ∈ R+ . Dann gilt für jedes z ∈ B r (a) jeweils Z ∂B r (a) dw w −z = 2πi . R dw für alle z ∈ B r (a). Nach Prop. (9.1) ist diese Beweis: Sei h : B r (a) → C definiert durch h(z) = ∂B r (a) w−z Funktion holomorph, und ihre komplexe Ableitung erhält man durch Differentiation nach z unter dem Integralzeichen. Es gilt also Z dw h 0 (z) = . (w − z)2 ∂B r (a) Weil die Funktion C\{z} → C, w 7→ (w −z)−2 für alle z ∈ B r (a) unter dem Integralzeichen die Stammfunktion w 7→ −(w − z)−1 besitzt, ist das Kurvenintegral über w 7→ (w − z)−2 jeweils Null. Es gilt also h 0 (z) = 0 für alle z ∈ B r (a) nach Lemma (8.5). Somit ist h auf B r (a) konstant. Setzen wir γ(t ) = a + r e 2πi t , dann erhalten wir für alle z ∈ B r (a) jeweils Z Z Z 1 dw dw γ0 (t ) = h(z) = h(a) = = dt w −z w −a 0 γ(t ) − a ∂B r (a) ∂B r (a) 1 Z = 0 2πi r e 2πi t r e 2πi t Z dt = 1 2πi d t 0 —– 79 —– = 2πi . ä § 9. Die Cauchysche Integralformel Lemma 9.3 Sei U ⊆ C offen, a ∈ U und r ∈ R+ , so dass die abgeschlossene Kreisscheibe B̄ r (a) in U liegt. Dann gibt es ein ε ∈ R+ , so dass auch noch die offene Kreisscheibe B r +ε (a) in U enthalten ist. Beweis: Angenommen, die Aussage ist falsch. Dann gibt es eine Folge (z n )n∈N im Komplement V = C \U mit |z n − a| ≤ r + n1 für alle n ∈ N. Weil die gesamte Folge in der kompakten Kreisscheibe B̄ r +1 (a) enthalten ist, können wir durch Übergang zu einer konvergenten Teilfolge voraussetzen, dass (z n )n∈N gegen ein z ∈ C konvergiert. Diese Teilfolge erfüllt weiterhin die Abschätzung |z n − a| ≤ r + n1 für alle n ∈ N. Nun gilt |z − a| = lim |z n − a| n→∞ ≤ ¶ µ 1 lim r + n→∞ n = r , also z ∈ B̄ r (a). Weil aber V abgeschlossen ist, ist auch z in V enthalten. Dies widerspricht der Voraussetzung, dass B̄ r (a) in U enthalten ist. ä Satz 9.4 (Cauchysche Integralformel) Sei U ⊆ C offen und f : U → C eine holomorphe Funktion. Sei a ∈ U und r ∈ R+ mit B̄ r (a) ⊆ U . Dann gilt für jedes z ∈ B r (a) die Gleichung f (z) 1 2πi = Z ∂B r (a) f (w) d w. w −z Beweis: Sei ε ∈ R+ so gewählt, dass auch B r +ε (a) noch in U liegt. Dann ist G = B r +ε (a) ein konvexes Gebiet. Für ein festgewähltes z ∈ B r (a) betrachten wir auf G die Funktion gegeben durch g (w) = f (w) − f (z) w −z f 0 (z) für w 6= z für w = z. Diese Funktion ist auf G\{z} holomorph und auf Grund der komplexen Differenzierbarkeit von f im Punkt z stetig. Wir können somit den Cauchyschen Integralsatz in der Fassung von Satz (8.9) anwenden. Zusammen mit Prop. (9.2) erhalten wir Z Z Z Z f (w) − f (z) f (w) dw dw = d w − f (z) 0 = g (w) d w = w −z w −z w −z ∂B r (a) ∂B r (a) ∂B r (a) Z = ∂B r (a) ∂B r (a) f (w) d w − 2πi f (z). w −z Umstellen dieser Gleichung nach f (z) liefert die gewünschte Aussage. —– 80 —– ä § 9. Die Cauchysche Integralformel Aus der Cauchyschen Integralformel ergeben sich eine ganze Reihe überraschender Konsequenzen. Satz 9.5 Sei U ⊆ C offen und f : U → C eine holomorphe Funktion. Dann ist f auf U beliebig oft komplex differenzierbar, und alle höheren Ableitungen f (n) sind wieder holomorph. Beweis: Sei a ∈ U und r ∈ R+ mit B̄ r (a) ⊆ U . Auf Grund der Cauchyschen Integralformel gilt f (z) = 1 2πi Z ∂B r (a) f (w) dw w −z für alle z ∈ B r (a). f (w) Wir betrachten nun die Funktion g : ∂B r (a) × B r (a) → C, (w, z) 7→ w−z . Diese ist offenbar in w stetig und nach z stetig differenzierbar. Nach Prop. (9.1) können wir Integration über die Kurve und Differentiation vertauschen. Die Funktion f ist demnach komplex differenzierbar, und es gilt 0 f (z) = 1 2πi Z ∂B r (a) f (w) d w. (w − z)2 f (w) Wiederum ist die Funktion (w−z)2 unter dem Integralzeichen stetig in w und nach z stetig differenzierbar. Die erneute Anwendung von Prop. (9.1) zeigt, dass auch f 0 holomorph ist. Wir können also dieselben Argumente wie zuvor auch auf die Funktion f 0 anwenden. Durch vollständige Induktion beweist man die Existenz und Holomorphie der höheren Ableitungen f (n) für alle n ∈ N. ä Durch wiederholte Differentiation von f (w) w−z f (n) (z) nach z erhält man die Integralformel = n! 2πi Z ∂B r (a) f (w) dw (w − z)n+1 (1) für die höheren Ableitungen von f . Die Durchführung eines entsprechenden Induktionsbeweises ist eine einfache Übungsaufgabe. Folgerung 9.6 Besitzt eine Funktion f : U → C auf U eine komplexe Stammfunktion, dann ist f auf U holomorph. Beweis: Sei F : U → C eine Stammfunktion. Dann ist F 0 = f auf Grund des soeben bewiesenen Satzes holomorph. ä —– 81 —– § 10. Anwendungen der Cauchyschen Integralformel (I) Entwicklung holomorpher Funktionen in Potenzreihen Lemma 10.1 Sei U ⊆ C und ( f n )n∈N eine Folge stetiger Funktionen f n : U → C, die gleichmäßig gegen eine Funktion f : U → C konvergiert. Dann gilt für jede in U verlaufende Kurve γ jeweils Z Z lim n→∞ γ f n (z) d z = γ f (z) d z. Beweis: Sei ε ∈ R+ vorgegeben. Dann gibt es auf Grund der gleichmäßigen Konvergenz ein N ∈ N, so dass | f n (z) − f (z)| < ε für alle z ∈ U und n ≥ N erfüllt ist. Nach Prop. (8.2) kann das Integral über f n − f betragsmäßig durch εL (γ) abgeschätzt werden. Für alle n ≥ N gilt also ¯ ¯Z ¯ ¯Z Z ¯ ¯ ¯ ¯ ¯ f n (z) d z − f (z) d z ¯ = ¯ ( f n − f )(z) d z ¯ ≤ εL (γ). ä ¯ ¯ ¯ ¯ γ γ γ Satz 10.2 Sei U ⊆ C offen und f : U → C eine holomorphe Funktion. Sei außerdem a ∈ U und r = sup{s ∈ R+ | B s (a) ⊆ U }. Dann gilt (i) Die Funktion ist auf der offenen Kreisscheibe B r (a) durch eine Potenzreihe definiert, für z ∈ B r (a) gilt also f (z) = ∞ X a n (z − a)n n=0 mit einer geeigneten komplexen Folge (a n )n∈N . Für den Konvergenzradius ρ dieser Potenzreihe gilt ρ ≥ r . (ii) Die Koeffizienten a n ∈ C der Potenzreihe sind eindeutig bestimmt, genauer gilt a n = f (n) (a)/(n!) für alle n ∈ N0 . (iii) Ist s ∈ R+ mit s < r , dann sind die Koeffizienten a n für alle n ∈ N0 auch durch die Integralformel an = 1 2πi Z ∂B s (a) f (w) dw (w − a)n+1 —– 82 —– gegeben. § 10. Anwendungen der Cauchyschen Integralformel Beweis: Sei s ∈ R+ mit s < r . Dann gilt auf Grund der Cauchyschen Integralformel Z 1 f (w) f (z) = dw für alle z ∈ B s (a). 2πi w −z ∂B a (s) Sei nun z ∈ B s (a) fest gewählt. Dann ist der komplexe Absolutbetrag α der Zahl (z − a)/(w − a) für alle w ∈ ∂B s (a) gleich, und es gilt α < 1. Die geometrische Reihe liefert ∞ ³ z − a ´n X n=0 w − a = 1 z−a 1 − w−a für alle w ∈ ∂B s (a). Ferner konvergiert die Reihe auf der linken Seite für alle w gleichmäßig gegen ihren jeweiligen Grenzwert, denn es existiert die von w unabhängige Abschätzung ¯ ¯ ¯X ∞ ³ z − a ´k ¯ ∞ X ¯ ¯ αk . ¯ ¯ ≤ ¯k=n w − a ¯ k=n Weil die Funktion f stetig ist, ist sie auf ∂B s (a) beschränkt, ebenso die Funktion w 7→ f (w)/(w − a), und wegen µ∞ ³ ¶ ∞ f (w)(z − a)n X z − a ´n f (w) X f (w) f (w) 1 · = = · = z−a n+1 w −z 1 − w−a w −a w −a n=0 w − a n=0 (w − a) konvergiert auch diese Reihe gleichmäßig gegen ihren Grenzwert. Nach Lemma (10.1) können wir das Kurvenintegral und die Summation vertauschen und erhalten Z Z ∞ 1 X 1 f (w) (z − a)n f (z) = dw = f (w) d w 2πi w −z 2πi n=0 (w − a)n+1 ∂B s (a) ∂B s (a) = ∞ X 1 n=0 2πi Z ∂B s (a) f (w) d w (z − a)n . n+1 (w − a) Bezeichnen wir die komplexen Zahlen in der großen Klammer hinter dem Summenzeichen jeweils mit a n , dann gilt also ∞ X f (z) = a n (z − a)n für alle z ∈ B s (a). n=0 Auf Grund von Gleichung (1) aus §9 gilt aber auch Z f (w) 1 an = dw 2πi (w − a)n+1 = ∂B s (a) f (n) (a) n! für alle n ∈ N0 . Dies zeigt, dass die Koeffizienten a n von der Wahl von s < r unabhängig sind. Auf diese Weise sieht man P n auch, dass die Potenzreihen-Entwicklung f (z) = ∞ n=0 a n (z − a) sogar auf B r (a) gültig und der Konvergenzradius der Reihe also mindestens r beträgt. Es bleibt zu zeigen, dass die Koeffizientenfolge (a n )n∈N eindeutig bestimmt ist. Durch wiederholte Differentiation der Potenzreihe erhält man f (k) (z) = ∞ X n(n − 1) · · · (n − k + 1)a n (z − a)n−k n=k —– 83 —– für alle k ∈ N0 . § 10. Anwendungen der Cauchyschen Integralformel f (k) (a) Inbesondere gilt f (k) (a) = (k!)a k und somit a k = k! . Dies zeigt, dass die Koeffizienten a k in einer beliebigen Potenzreihenentwicklung von f um a durch die Funktion f bereits eindeutig festgelegt sind. ä (II) Der Identitätssatz Definition 10.3 Sei U ⊆ C offen und f : U → C holomorph. Eine Funktion f besitzt in einem Punkt w ∈ C eine Nullstelle der Ordnung n, wenn f (k) (w) = 0 für 0 ≤ k < n und f (n) (w) 6= 0 gilt. Man sagt, ein Wert a ∈ C wird von f in w mit Vielfachheit n angenommen, wenn die Funktion z 7→ f (z) − a in w eine Nullstelle der Ordnung n besitzt. Von einer Nullstelle der Ordnung ∞ in w spricht man, wenn f (n) (w) = 0 für alle n ∈ N0 gilt. Proposition 10.4 Sei U ⊆ C offen, w ∈ U und f : U → C holomorph und n ∈ N. Dann sind die folgenden Aussagen äquivalent. (i) Die Funktion f besitzt in w eine Nullstelle der Ordnung n. (ii) Es gibt ein r ∈ R+ und eine Folge (a k )k≥n komplexer Zahlen mit a n 6= 0 und f (z) = ∞ X a k (z − w)k für alle z ∈ B r (w). k=n (iii) Es gibt eine offene Umgebung V von w mit V ⊆ U und eine holomorphe Funktion g auf V mit g (w) 6= 0 und f (z) = (z − w)n g (z) für alle z ∈ V . Beweis: “(i) ⇒ (ii)“ Sei r ∈ R+ so gewählt, das B r (w) ⊆ U gilt. Nach Satz (10.2) besitzt f auf B r (w) eine P Potenzreihen-Entwicklung f (z) = ∞ a (z−w)k . Auf Grund der Formel a k = f (k) (w)/(k!) für die Ableitung k=0 k einer Potenzreihe gilt a k = 0 für 0 ≤ k < n und a n 6= 0. P “(ii) ⇒ (iii)“ Sei g auf der offenen Umgebung V = B r (w) von w durch g (z) = ∞ a (z − w)k−n definiert. k=n k Dann ist g nach Satz (7.2) auf B r (w) holomorph. Außerdem gilt g (w) = a n 6= 0 und f (z) = (z − w)n g (z) für alle z ∈ B r (w). “(iii) ⇒ (i)“ Wir beweisen durch vollständige Induktion über n ∈ N0 : Ist V ⊆ U eine offene Umgebung von w und f eine holomorphe Funktion auf V der Form f (z) = (z − w)n g (z), wobei g eine holomorphe Funktion auf V mit g (w) 6= 0 bezeichnet, dann ist w eine Nullstelle der Ordnung n von f . Im Fall n = 0 folgt aus der Voraussetzung direkt f (w) 6= 0, also braucht hier nichts gezeigt werden. Setzen wir nun die Aussage für n voraus, und sei f (z) = (z − w)n+1 g (z) mit einer Funktion g wie angegeben. Dann gilt auf Grund der Produktregel ¡ ¢ f 0 (z) = (n + 1)(z − w)n g (z) + (z − w)n+1 g 0 (z) = (z − w)n (n + 1)g (z) + (z − w)g 0 (z) . —– 84 —– § 10. Anwendungen der Cauchyschen Integralformel Die Funktion h : V → C, z 7→ (n + 1)g (z) + (z − w)g 0 (z) ist holomorph, und es gilt h(w) = (n + 1)g (w) + (w − w)g 0 (w) = (n + 1)g (w) 6= 0. Wegen f 0 (z) = (z − w)n h(z) kann also die Induktionsvoraussetzung auf die Funktion f 0 (z) angwendet werden. Wir erhalten f (k) (w) = 0 für 1 ≤ k ≤ n und f (n+1) (w) 6= 0. Außerdem ist offenbar f (0) (w) = f (w) = (w − w)n+1 g (w) = 0 erfüllt. Also besitzt f in w eie Nullstelle der Ordnung n + 1. ä Definition 10.5 Sei U ⊆ C eine offene Menge. Eine Teilmenge D ⊆ U wird diskret in U genannt, wenn es für jeden Punkt w ∈ D eine Umgebung V ⊆ U gibt, so dass D ∩V = {w} erfüllt ist. Umgekehrt ist eine Teilmenge N ⊆ C also nichtdiskret, wenn zumindest ein Punkt w ∈ N die angegebene Bedingung verletzt. Dies bedeutet, dass für jedes n ∈ N ein von w verschiedener Punkt w n in B 1/n (w) existiert, der zugleich in N \ {w} liegt. Es gibt also eine Folge (z n )n∈N in N \ {w} mit limn z n = w. Satz 10.6 (Identitätssatz) Sei G ⊆ C ein Gebiet, und seien f und g holomorphe Funktionen auf G. Dann sind folgende Aussagen äquivalent. (i) f = g (ii) Es gibt einen Punkt w ∈ G, so dass die Funktion h = f − g in w eine Nullstelle unendlicher Ordnung besitzt. (iii) Es gibt eine nicht-diskrete Teilmenge N ⊆ G mit f |N = g |N . Beweis: “(i) ⇒ (iii)“ Die Menge G ist nichtdiskret, denn jede Umgebung eines Punktes w ∈ G enthält eine Menge der Form B r (w) mit einem geeigneten r ∈ R+ , und B r (w) enthält neben w noch unendlich viele weitere Punkte. Also ist die Aussage (iii) mit N = G erfüllt. “(iii) ⇒ (ii)“ Sei N ⊆ G nichtdiskret. Dann gibt es also einen Punkt w ∈ N und eine Folge (z n )n∈N in N \ {w} mit limn z n = w. Wir zeigen nun, dass die Funktion h = f − g in diesem Punkt w eine Nullstelle unendlicher Ordnung besitzt. Nach Voraussetzung gilt h(z n ) = f (z n ) − g (z n ) = f (z n ) − f (z n ) = 0 für alle n ∈ N. Nehmen wir an, die Nullstellenordnung m in w ist nur endlich (möglicherweise gleich Null). Dann gibt es nach Prop. (10.4) eine offene Umgebung W ⊆ G von w und eine holomorphe Funktion u auf W mit u(w) 6= 0 und h(z) = (z − w)m u(z) für alle z ∈ W . Als holomorphe Funktion ist u inbesondere im Punkt w stetig. Es folgt u(w) = lim u(z n ) n→∞ = lim h(z n ) n→∞ (z n − w)m = lim 0 n→∞ (z n − w)m = 0 im Widerspruch zur Annahme. Also muss die Nullstellenordnung von h in w unendlich sein. —– 85 —– § 10. Anwendungen der Cauchyschen Integralformel “(ii) ⇒ (i)“ Nach Voraussetzung besitzt h im Punkt w eine Nullstelle unendlicher Ordnung; zu zeigen ist h = 0. Dazu betrachten wir für jedes n ∈ N0 die Menge Mn = {z ∈ G | h (n) (z) = 0} T und setzen M = ∞ n=0 M n . Nach Voraussetzung gilt w ∈ M . Als Urbild der einelementigen Menge {0} unter der stetigen Abbildung h (n) sind die Mengen M n alle abgeschlossen, also ist auch M . Wir zeigen, dass M andererseits auch offen ist. Sei dazu v ∈ M ein beliebig gewählter Punkt und r ∈ R+ so P n gewählt, dass h auf B r (v) die Potenzreihen-Entwicklung ∞ n=0 a n (z − v) besitzt. Für alle n ∈ N0 gilt v ∈ M n , also h (n) (v) = 0 und somit auch a n = und es folgt B r (v) ⊆ M . h (n) (v) n! = 0. Dies zeigt, dass h auf der Menge B r (v) konstant Null ist, Damit ist die Offenheit von M bewiesen. Insgesamt ist M also eine nichtleere, offene und zugleich abgeschlossene Teilmenge von G. Weil G als Gebiet zusammenhängend ist, folgt daraus M = G und somit auch M 0 = G. Dies zeigt, dass die Funktion h auf G konstant Null ist. Aus h = 0 folgt wiederum f = g . ä (III) Satz von Liouville und Fundamentalsatz der Algebra Satz 10.7 (Cauchysche Ungleichungen) Sei f : U → C eine holomorphe Funktion auf einer offenen Teilmenge U ⊆ C, a ∈ U und r ∈ R+ mit B r (a) ⊆ U , so dass die Funktion f auf B r (a) die Potenzreihen-Entwicklung f (z) = ∞ X a n (z − a)n n=0 besitzt. Setzen wir m = max{| f (z)| | z ∈ ∂B r (a)}, dann gilt |a n | ≤ m für alle n ∈ N0 . rn Beweis: Nach Satz (10.2) erhält man die Koeffizienten der Potenzreihen-Entwicklung durch die Formel Z f (w) 1 an = dw für alle n ∈ N0 . 2πi ∂B r (a) (w − a)n+1 Der Betrag des Integranden kann durch mr −(n+1) abgeschätzt werden, und der Integrationsweg hat die Länge 2πr . Mit Prop. (8.2) erhalten wir |a n | ≤ 2πr · (2π)−1 mr −(n+1) = mr −n . ä Für die Formulierung des nächsten Satzes definieren wir folgenden Begriff: Eine ganze Funktion ist eine holomorphe Funktion mit Definitionsbereich C. Satz 10.8 (Satz von Liouville) Eine ganze Funktion f mit der Eigenschaft, dass ihr Wertebereich f (C) als Teilmenge von C beschränkt ist, ist konstant. —– 86 —– § 10. Anwendungen der Cauchyschen Integralformel P n Beweis: Sei f (z) = ∞ n=0 a n z die Potenzreihen-Entwicklung von f um den Nullpunkt. Weil f auf ganz C holomorph ist, besitzt die Potenzreihe nach Satz (10.2) einen unendlichen Konvergenzradius. Ist nun f (C) beschränkt, dann ist m = sup{| f (z)| | z ∈ C} ein endlicher Wert. Nach Satz (10.7) gilt |a n | ≤ mr −n für alle n ∈ N und r ∈ R+ . Weil r beliebig groß gewählt werden kann, folgt daraus a n = 0 für alle n ≥ 1. Weil die Potenzreihen-Entwicklung auf ganz C gültig ist, gilt also f (z) = a 0 für alle z ∈ C. ä Satz 10.9 (Fundamentalsatz der Algebra) Sei f : C → C eine nicht-konstante Polynomfunktion, also eine Funktion der Form f (z) = a n z n + a n−1 z n−1 + ... + a 1 z + a 0 wobei n ≥ 1, a k ∈ C für 0 ≤ k ≤ n und a n 6= 0 ist. Dann besitzt f eine Nullstelle in C. Beweis: Nehmen wir an, die Funktion f besitzt auf ganz C keine Nullstelle. Dann ist g (z) = f (z)−1 eine ganze Funktion. Wir zeigen, dass der Wertebereich g (C) von g beschränkt ist. Definieren wir die Funktion h : C× → C durch a n−1 a1 a0 h(z) = + ... + n−1 + n , z z z dann gilt f (z) = z n (a n + h(z)) für alle z ∈ C× . Die einzelnen Summanden von h konvergieren für |z| → ∞ gegen Null. Es gibt also ein r ∈ R+ mit |h(z)| ≤ 12 |a n | für alle z ∈ C mit |z| > r . Daraus folgt | f (z)| ≥ 12 |a n |r n und |g (z)| ≤ 2|a n |−1 r −n für alle z außerhalb von B̄ r (0). Als stetige Funktion ist g auf der kompakten Menge B̄ r (0) ebenfalls beschränkt, insgesamt also auf ganz C. Nach Satz (10.8) von Liouville wäre g damit konstant, also auch die Funktion f . Aber wegen n ≥ 1 und a n 6= 0 ist f offensichtlich nicht konstant. Unsere Annahme hat also zu einem Widerspruch geführt, und folglich besitzt f eine Nullstelle. ä Aus der Linearen Algebra ist bekannt, dass jede Polynomfunktion f vom Grad n mit einer Nullstelle a ∈ C in der Form f (z) = (z − a)g (z) geschrieben werden kann, wobei g eine Polynomfunktion vom Grad n − 1 bezeichnet. Durch vollständige Induktion über n kann so leicht gezeigt werden, dass jede komplexe Polynomfunktion in Linearfaktoren zerfällt. (IV) Gebietstreue und Maximumsprinzip Die Cauchyschen Ungleichungen beschränken den Wert f (a) einer holomorphen Funktion im Mittelpunkt w einer Kreisscheibe B̄ r (w) durch die Werte auf dem Rand. Dies bedeutet auch, dass die Funktion z 7→ f (z)−1 , sofern f auf B̄ r (w) nicht verschwindet, im Mittelpunkt w nicht zu klein werden darf. Diese Überlegung liefert ein Kriterium für Nullstellen holomorpher Funktionen. Lemma 10.10 Sei U ⊆ C offen, f : U → C holomorph, w ∈ U und r ∈ R+ mit B̄ r (w) ⊆ U . Sei außerdem m = min{ | f (z)| | z ∈ ∂B r (w)}. Gilt nun | f (w)| < m, dann besitzt f in B r (w) eine Nullstelle. —– 87 —– § 10. Anwendungen der Cauchyschen Integralformel Beweis: Ist die Ungleichung | f (w)| < m erfüllt, dann ist f auf dem Rand ∂B r (w) ungleich Null. Die Menge V = {z ∈ U | f (z) 6= 0} ist offen. Besitzt f auch in B r (w) keine Nullstelle, dann gilt insgesamt B̄ r (w) ⊆ V , und nach Lemma (9.3) gibt es ein ε ∈ R+ , so dass auch B r +ε (w) noch in V liegt. Dies bedeutet, dass g (z) = f (z)−1 auf B r +ε (w) eine holomorphe Funktion ist. Sei nun g (z) = ∞ X a n (z − w)n n=0 die Potenzreihen-Entwicklung von g um den Punkt w. Es gilt |g (z)| ≤ m −1 für alle z ∈ ∂B r (w), aus den Cauchyschen Ungleichungen (Satz (10.7)) folgt damit |g (w)| = |a 0 | ≤ m −1 . Wir erhalten | f (w)| = |g (w)|−1 ≥ m, im Widerspruch zur Voraussetzung. ä Satz 10.11 (Satz von der Gebietstreue) Sei G ⊆ C ein Gebiet und f : G → C eine nicht-konstante, holomorphe Funktion. Dann ist auch die Bildmenge f (G) ein Gebiet in C. Beweis: Aus der Analysis mehrerer Variablen ist bekannt, dass das Bild einer zusammenhängenden Menge unter einer stetigen Abbildung wieder zusammenhängend ist. Also ist f (G) ⊆ C zusammenhängend. Zum Nachweis der Offenheit sei a ∈ f (G) beliebig vorgegeben und w ∈ G mit f (w) = a. Auf Grund des Identitätssatzes (Satz (10.6)) wird der Wert a von f nur auf einer diskreten Teilmenge von G angenommen, denn ansonsten wäre f auf G konstant gleich a. Insbesondere gibt es also ein r ∈ R+ , so dass B̄ r (w) ⊆ G gilt und f |B̄ r (w) den Wert a nur im Punkt w annimmt. Wir zeigen nun, dass ein ε ∈ R+ mit B ε (a) ⊆ f (B̄ r (w)) ⊆ f (G) existiert und beweisen damit die Offenheit von f (G). Die Funktion z 7→ | f (z) − a| nimmt auf ∂B r (w) ein Minimum an, und dieses ist positiv. Es gibt also ein ε ∈ R+ mit | f (z) − a| ≥ 2ε für alle z ∈ ∂B r (w). Sei nun b ∈ B ε (a) vorgebeben und g (z) = f (z) − b für alle z ∈ B̄ r (w). Dann gilt für alle z ∈ ∂B r (w) einerseits die Ungleichung | f (z) − a| ≤ | f (z) − b| + |b − a| und somit |g (z)| = | f (z) − b| ≥ | f (z) − a| − |b − a| ≥ 2ε − ε = ε , also ist min{ |g (z)| | z ∈ ∂B r (w) } ≥ ε. Andererseits ist |g (w)| = | f (w) − b| = |a − b| < ε. Nach Lemma (10.10) hat die Funktion g (z) = f (z)−b damit in B r (w) eine Nullstelle. Es gibt also ein z ∈ B r (w) mit b = f (z), somit ist b ∈ f (B r (w)) und insgesamt B ε (a) ⊆ f (B r (w)). ä Satz 10.12 (Maximumsprinzip) Sei G ein Gebiet und f : G → C eine holomorphe Funktion. Wenn der Betrag | f | von f in einem Punkt a ∈ G ein lokales Maximum besitzt, dann ist f auf G konstant. —– 88 —– § 10. Anwendungen der Cauchyschen Integralformel Beweis: Angenommen, a ∈ G ist ein lokales Maximum von | f |. Dann gibt es ein r ∈ R+ , so dass | f (a)| ≥ | f (z)| für alle z ∈ B r (a) erfüllt ist. Die offene Kreisscheibe B r (a) ist ein Gebiet in C. Ist die Funktion f nichtkonstant, so kann Satz (10.11) von der Gebietstreue angewendet werden, und folglich ist auch f (B r (a)) ⊆ C ein Gebiet. Dies bedeutet, dass eine offene Umgebung von f (a) in f (B r (a)) enthalten ist. Insbesondere gibt es Punkte w ∈ f (B r (a)) mit |w| > | f (a)|, im Widerspruch zur vorherigen Feststellung. Also ist f auf G konstant. ä —– 89 —– § 11. Isolierte Singularitäten Für die folgende Theorie benötigen wir eine eine Verallgemeinerung des Cauchyschen Integralsatzes und der Cauchyschen Integralformel, die wir allerdings aus Zeitgründen nicht beweisen können. Definition 11.1 Sei U ⊆ C offen. Eine Kette in U ist eine formale Summe der Form Γ = n X n k γk k=1 bestehend aus Kurven γk : [a k , b k ] → U und Koeffizienten n k ∈ Z. Sind A(z), B (z) ⊆ {1, ..., r } für z ∈ C definiert durch A(z) = {k|γ(a k ) = z} und B (z) = {k|γ(b k ) = z}, und gilt X nk X = k∈A(z) für alle z ∈ C , nk k∈B (z) dann bezeichnet man Γ als Zyklus in U . Die Vereinigung sp(Γ) = dann definiert man Sr k=1 sp(γk ) nennt man die Spur der Kette Γ. Ist f : U → C eine stetige Funktion, Z f dz = r X Z nk k=1 Γ γk f d z. Definition 11.2 Sei Γ ein Zyklus in U und z ∈ C \ sp(Γ). Dann ist n(Γ, z) = 1 2πi Z Γ dw w −z die Umlaufzahl des Zyklus um den Punkt z. Der Zyklus wird nullhomolog in U genannt, wenn n(Γ, z) = 0 für alle z ∈ C \U erfüllt ist. Man kann zeigen, dass n(Γ, z) stets eine ganze Zahl ist. Anschaulich gesprochen gibt n(Γ, z) die Häufigkeit an, mit der Γ den Punkt z gegen den Uhrzeigersinn umläuft. Umläufe in der entgegengesetzten Richtung (also mit dem Uhrzeigersinn) werden negativ gezählt. —– 90 —– § 11. Isolierte Singularitäten Satz 11.3 (verallgemeinerter Cauchyscher Integralsatz und Integralformel) Sei U ⊆ C offen, Γ ein nullhomologer Zyklus in U und f : U → C eine holomorphe Funktion. Dann gilt Z f dz = 0 n(Γ, z) f (z) und = Γ 1 2πi Z Γ f (w) dw w −z für alle z ∈ U \ sp(Γ). Beweis: siehe [Fi], Kapitel IV, Satz 2.1 Wir untersuchen nun den Aufbau holomorpher Funktionen auf Kreisringen. Definition 11.4 Seien a ∈ C und r, s ∈ R+ mit r < s. Dann ist der Kreisring um a mit den Radien r und s definiert durch K r,s (a) = {z ∈ C | r < |z − a| < s}. Bei der Definition kann für r auch der Wert Null und für s der Wert +∞ zugelassen werden. Für r ∈ R+ ist dann K 0,r (a) = B r (a) \ {a} und K r,+∞ (a) = C \ B̄ r (a). Lemma 11.5 Seien ρ, σ ∈ R+ mit r < ρ < σ < s, und seien die Kurven γρ , γσ : [0, 1] → K r,s (a) gegeben durch γρ (t ) = a + ρe 2πi t und γσ (t ) = a + σe 2πi t für alle t ∈ [0, 1]. Dann ist der Zyklus Γ = γσ − γρ nullhomolog in K r,s (a). Beweis: Sei z ∈ C \ K r,s (a) vorgegeben. Zu zeigen ist n(Γ, z) = 0. Ist |z| ≥ s, dann ist die Funktion w 7→ auf B s (0) ⊇ K r,s (a) holomorph, und der Cauchysche Integralsatz liefert Z Z Z 1 dw 1 dw 1 dw n(Γ, z) = = − = 0 − 0 = 0. 2πi w −z 2πi w − z 2πi w −z Γ ∂B σ (a) 1 w−z ∂B ρ (a) Gilt andererseits |z| ≤ r , dann können wir die Cauchysche Integralformel auf die konstante Funktion gegeben durch f : C → C, z 7→ 1 anwenden und erhalten Z Z Z dw 1 dw 1 dw 1 = − = n(Γ, z) = 2πi w −z 2πi w − z 2πi w −z Γ 1 2πi Z ∂B a (σ) f (w) 1 dw − w −z 2πi ∂B σ (a) Z ∂B a (ρ) f (w) dw w −z = f (z) − f (z) —– 91 —– ∂B ρ (a) = 1−1 = 0. ä § 11. Isolierte Singularitäten Satz 11.6 (Satz über holomorphe Funktionen auf Kreisringen) Seien a ∈ C, r, s ∈ R+ mit r < s und f : K r,s (a) → C eine holomorphe Funktion. Dann gibt es holomorphe Funktionen f h : K r,+∞ (a) −→ C f n : B s (a) −→ C und so dass f = f h + f n auf K r,s = K r,+∞ (a) ∩ B s (a) erfüllt ist und lim|z|→+∞ | f h (z)| = 0 gilt. Die Funktionen f h und f n sind durch diese Bedingungen eindeutig festgelegt. Man nennt f h den Haupt- und f n den Nebenteil der Funktion f . Beweis: Zunächst definieren wir für jedes ρ ∈ R+ mit r < ρ < s eine Funktion f n,ρ : B ρ (a) → C durch f n,ρ (z) 1 2πi = Z ∂B ρ (a) f (w) d w. w −z Seien nun ρ, σ ∈ R+ mit r < ρ < σ < s. Dann ist nach Lemma (11.5) der Zyklus γσ − γρ nullhomolog, und der verallgemeinerte Cauchysche Integralsatz liefert f n,ρ (z) = f n,σ (z) für alle z ∈ B ρ (a). Wir können also eine holomorphe Funkton f n : B s (a) → C für z ∈ B s (a) durch f n (z) = f n,ρ (z) definieren, wobei ρ ∈ R+ mit max{r, |z − a|} < ρ < s beliebig gewählt werden kann; der Wert f n (z) ist von dieser Wahl unabhängig. Für jedes ρ ∈ R+ mit r < ρ < s definieren wir für z ∈ K ρ,+∞ (a) ebenso f h,ρ (z) 1 − 2πi = Z ∂B ρ (a) f (w) d w. w −z Wie zuvor zeigt man f h,ρ (z) = f h,σ (z) für z ∈ B ρ (a) und r < ρ < σ < s. Also kann f h : K r,+∞ (a) → C definiert werden durch f h (z) = f h,ρ (z), wobei ρ ∈ R+ mit r < ρ < min{s, |z − a|} beliebig gewählt wurde. Die Funktion f ist auf dem Integrationsweg sp(γρ ) beschränkt, und der Nenner kann durch |w − z| = |z − w| ≥ |z| − |w| f (w) nach unten abgeschätzt werden. Für |z| → +∞ konvergiert der Integrand w−z somit gleichmäßig gegen Null, und wir erhalten lim f h (z) = 0. |z|→+∞ Wir beweisen nun die Gleichung f (z) = f h (z) + f n (z) für z ∈ K r,s (a). Sei also z ∈ K r,s (a) vorgegeben, und seien ρ, σ ∈ R+ mit r < ρ < |z − a| < σ < s. Wie man mit Hilfe der Cauchyschen Integralformel unmittelbar nachrechnet, gilt n(Γ, z) = 1 für den Zyklus Γ = γσ − γρ . Die verallgemeinerte Cauchysche Integralformel liefert nun Z 1 f (w) f (z) = n(Γ, z) f (z) = dw = 2πi w −z Γ 1 2πi Z γσ f (w) 1 dw − w −z 2πi Z γρ f (w) dw w −z —– 92 —– = f n (z) + f h (z). § 11. Isolierte Singularitäten Nun beweisen wir die Eindeutigkeit. Sei f = g h + g n eine Zerlegung von f in holomorphe Funktionen g h : B r,+∞ (a) → C und g n : B s (a) → C, wobei wir auch lim g h (z) = |z|→+∞ 0 voraussetzen. Dann gilt f h − g h = g n − f n auf K r,s (a). Definieren wir u = f h − g h auf B r,+∞ (a) und u = g n − f n auf B s (a), dann ist u eine ganze Funktion mit lim|z|→+∞ u(z) = 0. Also ist u auf C beschränkt. Nach dem Satz (10.8) von Liouville ist u konstant, und auf Grund des Grenzwerts für |z| → +∞ kommt als konstanter Wert nur Null in Frage. Es folgt f h = g h auf B r,+∞ (a) und f n = g n auf B s (a). ä Der Nebenteil f n kann also in eine auf B s (a) konvergente Potenzreihe f n (z) = ∞ X a n (z − a)n n=0 entwickelt werden. Eine Entwicklung für den Hauptteil f h erhält man nun auf folgende Weise: Die Abbildung j : w 7→ a + w1 ist auf K 0,1/r (0) holomorph und bildet diesen Definitionsbereich bijektiv auf K r,+∞ (a) ab. Aus lim f h (z) = 0 folgt dann lim ( f h ◦ j )(w) = 0. |z|→+∞ |w|→0 Die Funktion f h ◦ j kann also stetig auf B 1/r (0) fortgesetzt werden. Nach Prop. (8.8) existiert auf B 1/r (0) eine komplexe Stammfunktion von f h ◦ j , und nach Folgerung (9.6) ist f h ◦ j damit auf der Menge B 1/r (0) holomorph. Folglich existiert eine Potenzreihenentwicklung ( f h ◦ j )(w) ∞ X = bn w n , n=1 die für alle w ∈ B 1/r (0) gültig ist. Durch Einsetzen von w = (z − a)−1 = j −1 (z) erhalten wir die Gleichung f h (z) = ∞ X b n (z − a)−n für z ∈ K r,+∞ (a). n=1 Definieren wir a −n = b n für alle n ∈ N, dann erhalten wir also insgesamt die Darstellung f h (z) = −1 X a n (z − a)n für den Hauptteil. n=−∞ Folgerung 11.7 Eine auf K r,s (a) holomorphe Funktion besitzt eine auf dem gesamten Definitionsbereich gültige Reihenentwicklung f (z) = +∞ X a n (z − a)n . n=−∞ Eine Reihe dieser Form wird Laurentreihe genannt. Dabei konvergiert die Teilsumme von n = −∞ bis −1 gegen den Hauptteil und die Teilsumme von n = 0 bis ∞ gegen den Nebenteil von f . —– 93 —– § 11. Isolierte Singularitäten Ohne Beweis bemerken wir noch, dass die Koeffizienten a n durch die Formel Z f (w) 1 dw für n ∈ Z, r < ρ < s an = 2πi (w − a)n+1 (1) ∂B ρ (a) berechnet werden können. Definition 11.8 Sei D ⊆ C eine Teilmenge. Ein Punkt z ∈ D wird als isolierter Punkt von D bezeichnet, wenn eine Umgebung V von z in C mit V ∩ D = {z} existiert. Eine Teilmenge D ⊆ C ist also genau dann diskret, wenn sie nur aus isolierten Punkten besteht. Definition 11.9 Sei U ⊆ C offen und f : U → C eine holomorphe Funktion. Dann werden die Punkte in D = C \U als Singularitäten von f bezeichnet. Ein isolierter Punkt von D wird eine isolierte Singularität von f genannt. Eine isolierte Singularität a bezeichnet man als (i) hebbar, wenn eine Umgebung V ⊆ C von a existiert, so dass f |V ∩U beschränkt ist (ii) eine Polstelle, wenn lim | f (z)| = +∞ gilt z→a (iii) eine wesentliche Singularität, wenn sie weder hebbar noch eine Polstelle ist. Satz 11.10 (Riemannscher Hebbarkeitssatz) Eine isolierte Singularität a ist genau dann hebbar, wenn f auf U ∪ {a} holomorph fortsetzbar ist. Beweis: “⇐“ Sei V ⊆ C eine kompakte Umgebung von a mit V ∩D = {a}. Sei fˆ die holomorphe Fortsetzung von f auf U ∪ {a}. Als stetige Funktion ist fˆ auf V beschränkt. Somit ist auch die Funktion f auf V ∩ U beschränkt. “⇒“ Sei V ⊆ C eine offene Umgebung von a mit V ∩D = {a}. Wir definieren eine Funktion g : V → C durch (z − a) f (z) für z ∈ V ∩U g (z) = 0 für z = a. Die Funktion g ist stetig in a, weil f nach Voraussetzung auf der Menge V ∩ U beschränkt ist. Auf dem restlichen Definitionsbereich ist sie holomorph und besitzt damit nach Prop. (8.8) in einer konvexen, offenen Umgebung von a eine Stammfunktion. Dies bedeutet nach Folgerung (9.6), dass g in a holomorph —– 94 —– § 11. Isolierte Singularitäten ist. Nach Definition der komplexen Differenzierbarkeit gibt es also eine in a stetige Funktion h mit g (z) = g (a)+(z −a)h(z) = (z −a)h(z) für alle z ∈ V . Auf V ∩U stimmt f mit h überein. Dies zeigt, dass f eine stetige Fortsetzung fˆ auf U ∪ {a} besitzt. Nochmalige Anwendung von Prop. (8.8) und Folgerung (9.6) zeigt, dass diese Fortsetzung auch holomorph ist. ä Satz 11.11 Ist a ∈ D eine Polstelle von f , dann gibt es eine Umgebung V ⊆ C von a mit V ∩ D = {a}, eine eindeutig bestimmte Zahl n ∈ N und eine holomorphe Funktion h : V → C mit h(a) 6= 0 f (z) = (z − a)−n h(z) für alle z ∈ V \ {a}. und Man bezeichnet die Zahl n als die Ordnung der Polstelle a. Beweis: Wir wählen die Umgebung V von a so klein, dass V ∩ D = {a} gilt und f auf V \ {a} auch keine Nullstelle besitzt. Dann ist die Funktion g (z) = f (z)−1 auf V \ {a} holomorph, und aus limz→a | f (z)| = +∞ folgt lim g (z) = 0. z→a Also kann g in a stetig fortgesetzt werden. Nach Prop. (8.8) und Folgerung (9.6) ist diese Fortsetzung holomorph. Sei nun n ∈ N die Nullstellenordnung von g in a. Dann gibt es eine holomorphe Funktion h̃ auf V mit g (z) = (z − a)n h̃(z) und h̃(a) 6= 0. Durch eventuelle Verkleinerung von V können wir h̃(z) 6= 0 für alle z ∈ V annehmen. Es folgt dann f (z) = (z − a)−n h(z) mit h(z) = h̃(z)−1 für alle z ∈ V \ {a}. Zum Beweis der Eindeutigkeit nehmen wir an, dass n 1 , n 2 ∈ N mit n 1 < n 2 und holomorphe Funktionen h 1 , h 2 auf V mit h 1 (a), h 2 (a) 6= 0 und (z − a)−n1 h 1 (z) = f (z) = (z − a)−n2 h 2 (z) für z ∈ V \ {a} existieren. Dann gilt (z − a)n2 −n1 h 1 (z) = h 2 (z) für alle z ∈ V \ {a}, und auf Grund des Identitätssatzes (Satz (10.6)) ist die Gleichung auch in z = a erfüllt. Es folgt h 2 (a) = (a − a)n2 −n1 h 1 (a) = 0 im Widerspruch zu den Voraussetzungen. ä Definition 11.12 Sei U ⊆ C offen und D = C\U . Sei V eine weitere offene Teilmenge von C. Man bezeichnet eine holomorphe Funktion f : U → C als meromorphe Funktion auf V , wenn alle Singularitäten in V ∩ D Polstellen (also insbesondere isolierte Singularitäten) sind. 1 Beispielsweise sind C× → C, z 7→ z −1 und C \{0, 1} → C, z 7→ z(z−1) meromorphe Funktionen auf C. Jede holomorphe Funktion U → C auf einer offenen Teilmenge U ⊆ C ist nach Definition auf U auch meromorph. —– 95 —– § 11. Isolierte Singularitäten Satz 11.13 Sei a ∈ D eine isolierte Singularität von f : U → C, und seien r, s positive reelle Zahlen mit r < s und K r,s (a) ⊆ U . Sei ferner f (z) = ∞ X a n (z − a)n n=−∞ die Laurentreihen-Entwicklung von f auf dem Kreisring K r,s (a). (i) Die Singularität a ist genau dann hebbar, wenn a n = 0 für alle n < 0 gilt. (ii) Sie ist eine Polstelle der Ordnung n genau dann, wenn a −n 6= 0 und a k = 0 für alle k ∈ Z mit k < −n gilt. (iii) Sie ist genau dann eine wesentliche Singularität, wenn a n 6= 0 für unendlich viele negative Zahlen n ∈ Z erfüllt ist. Beweis: zu (i) Ist a eine hebbare Singularität, dann kann f auf B s (a) holomorph fortgesetzt werden. Dies bedeutet, dass f auf K r,s (a) mit seinem Nebenteil übereinstimmt, und dass der Hauptteil verschwindet. Auf Grund der Holomorphie von f auf B s (a) besitzt f auf der Kreisscheibe B s (a) und damit erst recht auf K r,s (a) eine Potenzreihenentwicklung. Daraus folgt a n = 0 für alle n < 0. Umgekehrt liefert im Fall a n = 0 und n < 0 die Potenzreihenentwicklung eine holomorphe Fortsetzung von f auf B s (a), inbesondere eine holomorphe Fortsetzung im Punkt a, woraus sich die Hebbarkeit von a ergibt. zu (ii) Besitzt die Funktion f in a eine Polstelle der Ordnung n, dann gibt es nach Satz (11.11) eine offene Umgebung V ⊆ C von a mit V ∩ D = {a} und eine holomorphe Funktion h : V → C mit h(a) 6= 0 und f (z) = P (z − a)−n h(z) für alle z ∈ V \ {a}. Sei h(z) = ∞ b (z − a)k die Potenzreihenentwicklung von h in einer k=0 k Umgebung des Punktes a. Durch eventuelle Verkleinerung von V können wir annehmen, dass sie auf ganz V gültig ist; dabei gilt b 0 = h(a) 6= 0. Für die Funktion f erhalten wir die Darstellung f (z) = ∞ X b k+n (z − a)k . k=−n Aus der Eindeutigkeit der Laurentreihenentwicklung von f auf K r,s (a) folgt a k = b k+n für alle k ≥ −n und a k = 0 für alle k < 0. Außerdem ist a −n = b 0 6= 0. Setzen wir umgekehrt voraus, dass f auf dem Kreisring K r,s (a) eine Laurentreihenentwicklung der Form P f (z) = ∞ a (z − a)k mit a −n 6= 0 besitzt, dann können wir in einer Umgebung von a die holomorphe k=−n k P Funktion h(z) = ∞ a (z − a)k mit h(a) = a −n 6= 0 definieren und erhalten damit für f die Darstellung k=0 k−n −n f (z) = (z − a) h(z). Nach Satz (11.11) besitzt f dann in a eine Polstelle der Ordnung n. Die Äquivalenzaussage in (iii) folgt unmittelbar aus den Aussagen (i) und (ii). —– 96 —– ä § 12. Der Residuensatz Definition 12.1 Sei U ⊆ C offen, f : U → C eine holomorphe Funktion, D = C \U und a ∈ D eine isolierte Singularität. Sei r ∈ R+ so klein gewählt, dass B̄ r (a) ∩ D = {a} gilt. Dann nennt man Z 1 resa ( f ) = f (z) d z 2πi ∂B r (a) das Residuum von f an der Stelle a. Ist a ∈ U , dann setzt man resa ( f ) = 0. Mit Hilfe des verallgemeinerten Cauchyschen Integralsatzes sieht man leicht, dass die Zahl resa ( f ) von der Wahl des Radius r unabhängig ist. Sind nämlich r, s ∈ R+ mit r < s und B̄ s (a) ∩ D = {a}, dann ist der Zyklus γs − γr bestehend aus den Kurven γr , γs : [0, 2π] → C mit γr (t ) = a + r e i t und γs (t ) = a + se i t nullhomolog. P n Lemma 12.2 Ist f = ∞ n=−∞ a n (z − a) die Laurentreihen-Entwicklung von f in einer Umgebung des Punktes a, dann gilt a −1 = resa ( f ). Beweis: Das folgt direkt aus der Gleichung (1) aus §11 für die Laurent-Koeffizienten. ä Lemma 12.3 Besitzt die Funktion f bei a eine einfache Polstelle und ist g eine weitere Funktion, die in a holomorph ist, dann gilt resa ( f g ) = g (a)resa ( f ). Beweis: Auf Grund der Voraussetzungen besitzen die Funktionen f und g in einer Umgebung von a P P∞ n n Laurentreihen-Entwicklungen der Form f = ∞ n=−1 a n (z − a) und g = n=0 b n (z − a) . Es folgt µ ∞ ¶µ ∞ ¶ ∞ X X X n n c n (z − a)n ( f g )(z) = a n (z − a) b n (z − a) = n=−1 n=0 n=−1 mit c n = a k b ` , wobei die Summe über alle k ≥ −1, ` ≥ 0 mit k + ` = n gebildet wird. Insbesondere ist c −1 = a −1 b 0 = resa ( f )g (a) das Residuum von f g an der Stelle a. ä P Proposition 12.4 Sei D ⊆ C eine diskrete und abgeschlossene Teilmenge und Γ ein Zyklus mit sp(Γ) ∩ D = ∅. Dann gilt n(Γ, z) 6= 0 für nur endlich viele z ∈ D. Beweis: Die Spur sp(γ) einer Kurve γ ist als Bild eines abgeschlossenen Intervalls unter einer stetigen Abbildung kompakt. Weil sp(Γ) ein endliche Vereinigung solcher Spuren ist, handelt es sich ebenfalls um eine kompakte Teilmenge von C. Es gibt also ein r ∈ R+ mit sp(Γ) ⊆ B̄ r (0). —– 97 —– § 12. Der Residuensatz Die Abbildung C \ sp(Γ) → C, z 7→ n(Γ, z) ist stetig, da die Funktion unter dem Integralzeichen von Z 1 dw n(Γ, z) = 2πi Γ w − z in w und z stetig ist (siehe Prop. (9.1)). Sei nun a ∉ B̄ r (0) beliebig gewählt. Dann ist s 7→ n(Γ, sa) eine stetige Funktion auf {s ∈ R | s ≥ 1}. Für s → +∞ konvergiert diese gegen Null, weil der Integrand in Z dw 1 n(Γ, sa) = 2πi Γ w − sa auf sp(Γ) gleichmäßig gegen Null konvergiert. Weil aber n(Γ, sa) für alle s ≥ 1 ganzzahlig ist, muss n(Γ, a) = 0 gelten. Somit sind alle z ∈ D mit n(Γ, z) 6= 0 in B̄ r (0) enthalten. Weil D diskret ist, finden wir für jedes z ∈ D ∩ B̄ r (0) eine Umgebung U z mit U z ∩ D = {z}. Aus der Abgeschlossenheit von D folgt, dass U = C \ D eine offene Teilmenge von C ist. Ingesamt bilden die U z mit z ∈ D zusammen mit U eine offene Überdeckung von B̄ r (0). Weil B̄ r (0) kompakt ist, können wir aus dieser Überdeckung eine endliche Teilüberdeckung wählen. In jeder offenen Menge dieser Teilüberdeckung liegt höchstens jeweils ein Punkt aus D. Dies zeigt, dass die Menge D ∩ B̄ r (0) endlich ist. Folglich ist auch die Menge der z ∈ D mit n(Γ, z) 6= 0 endlich. ä (Residuensatz) Satz 12.5 Sei f : U → C eine holomorphe Funktion und V ⊇ U eine offene Teilmenge mit der Eigenschaft, dass die Menge D = V \U diskret und abgeschlossen ist. Dann gilt für jeden nullhomologen Zyklus Γ in V mit sp(Γ) ∩ D = ∅ die Gleichung Z X f (z) d z = 2πi n(Γ, z)resz ( f ). z∈V Γ Beweis: Nach Prop. (12.4) gibt es nur endlich viele Singularitäten z 1 , ..., z m ∈ D mit n(Γ, z k ) 6= 0. Für alle übrigen z ∈ D gilt dann n(Γ, z) = 0. Sei nun E = D \ {z 1 , ..., z m }. Für jedes k ∈ {1, ..., m} sei h k : C \ {z k } → C der P Hauptteil der Laurentreihen-Entwicklung von f im Punkt z k . Dann ist die Funktion g = f − m h von k=1 k V \ D auf V \ E holomorph fortsetzbar, weil sie in z 1 , ..., z m hebbare Singularitäten besitzt. Weil der Zyklus Γ nicht nur in V , sondern auch in V \ E nullhomolog ist, können wir den verallgemeinerten Cauchyschen Integralsatz anwenden und erhalten Z Γ Z f (z) d z = Γ g (z) d z + m Z X k=1 Γ h k (z) d z = m Z X k=1 Γ Wir betrachten nun jeden einzelnen Hauptteil als Laurentreihe der Form h k (z) = −1 X a kn (z − z k )n . n=−∞ —– 98 —– h k (z) d z. § 12. Der Residuensatz Die Folge der Partialsummen konvergiert auf sp(Γ) gleichmäßig gegen die Funktion h k . Nach Lemma (10.1) gilt deshalb Z Z −1 X h k (z) d z = a kn (z − z k )n d z. Γ Γ n=−∞ 1 (z − z k )n+1 , die auf Für n ≤ −2 besitzt die Funktion z 7→ (z − z k ) die komplexe Stammfunktion z 7→ n+1 Pr C \ {z k } und damit erst recht auf U holomorph ist. Sei nun Γ = `=1 n ` γ` die Darstellung von Γ als Summe von Kurven γ` : [a ` , b ` ] → C. Nach Lemma (8.5) gilt Z 1 1 (z − z k )n d z = (γ` (b ` ) − z k )n+1 − (γ` (a ` ) − z k )n+1 n +1 n +1 γ` n für 1 ≤ ` ≤ r . Weil Γ ein Zyklus ist, erhalten wir mit der Notation von Def. (11.1) jeweils Z (z − z k )n d z = Γ X X n` n` (z − z k )n+1 − (z − z k )n+1 n + 1 n + 1 z∈U `∈B (z) z∈U `∈A(z) X X P P auf Grund der Gleichungen `∈A(z) n ` = `∈B (z) n ` für z ∈ U . Es folgt Z Z h k (z) d z = a k,−1 (z − z k )−1 d z = 2πi n(Γ, z k )reszk (h k ) Γ Γ = = 0 2πi n(Γ, z k )reszk ( f ) und insgesamt Z Γ f (z) d z = 2πi m X n(Γ, z k )reszk ( f ) = X 2πi n(Γ, z)resz ( f ). ä z∈V k=1 Meistens wird der Residuensatz in der Situation V = C angewendet. Er gilt dann für alle Zyklen Γ mit sp(Γ) ∩ D = ∅, die Bedingung „nullhomolog in V “ an Γ ist automatisch erfüllt. Anwendungsbeispiel 1 Wir verwenden den Residuensatz zum Beweis der Integralformel Z x2 dx 4 −∞ x + 1 = π p . 2 z 7→ z2 z4 + 1 ∞ Dazu betrachten wir die holomorphe Funktion f : C \ D −→ C , , wobei D die Nullstellenmenge des Polynoms x 4 + 1 bezeichnet. Für jedes r ∈ R+ betrachten wir außerdem die Kurve γr : [0, π] → C, t 7→ r e i t , die die obere Hälfte des Kreises vom Radius r um den Nullpunkt durchläuft. Sofern γr keine Nullstelle von x 4 + 1 durchquert, liefert uns der Residuensatz die Gleichung Z r Z X n(Γ, z)resz ( f ). (1) f (z) d z + f (z) d z = 2πi −r γr z∈C —– 99 —– § 12. Der Residuensatz Auf der linken Seite wird der obere Hälfte des bereits erwähnten Kreises umlaufen; insgesamt wird über eine geschlossene Kurve (also über einen Zykel Γ) integriert. Um die rechte Seite der Gleichung zu berechnen, bestimmen wir zunächst die komplexen Nullstellen von x 4 + 1. Es gilt x 8 − 1 = (x 4 − 1)(x 4 + 1). Die kπi kπi 2πi 4πi 6πi Nullstellenmenge von x 8 − 1 ist {e 4 | 0 ≤ k < 7}, die von x 4 − 1 ist {e 2 | 0 ≤ k < 3} = {1, e 4 , e 4 , e 4 }. Die Nullstellen von x 4 + 1 sind genau die Nullstellen von x 8 − 1, die keine Nullstellen von x 4 − 1 sind, also die Elemente der Menge πi 3πi 5πi 7πi {e 4 , e 4 , e 4 , e 4 }. πi 3πi 5πi 7πi Ist r > 1, dann liegen e 4 und e 4 im Inneren des Halbkreises. Die Nullstellen e 4 und e 4 liegen außerhalb, weil sie einen negativen Imaginärteil besitzen und somit im unteren Teil der komplexen Ebene liegen, während sich der Halbkreis im oberen Teil befindet. Es gilt also πi 4 n(Γ, e ) = n(Γ, e 3πi 4 )=1 n(Γ, e und 5πi 4 ) = n(Γ, e 7πi 4 ) = 0. πi 3πi Nun verwenden wir Lemma (12.3), um die Residuen in den Punkten e 4 und e 4 zu berechnen. Weil das Residuum von z−e1πi /4 im Punkt e πi /4 gleich 1 ist, erhalten wir das Residuum von f in diesem Punkt durch Einsetzen in die Funktion z2 . 3πi 5πi 7πi (z − e 4 )(z − e 4 )(z − e 4 ) Es gilt also res πi e 4 (f ) (e = πi 4 (e πi πi 2 3πi 4 )(e πi 4 )2 −e 5πi 4 πi 4 )(e −e πi e− 4 (1 − e −e πi 4 )(1 − e πi )(1 − e 3πi 2 ) Ebenso erhalten wir das Residuum von f in e 3πi 4 = ) πi e− 4 (1 − i )(1 − (−1))(1 + i ) = 7πi 4 e− 4 4 = = 1 4 µ ¶ 1−i p . 2 durch Einsetzen in z2 (z − e πi 4 )(z − e 5πi 4 )(z − e 7πi 4 ) also durch die Rechnung res e 3πi 4 (f ) = (e (e 3πi 4 −e πi 4 )(e 3πi 4 3πi 4 )2 −e 5πi 4 )(e 3πi 4 −e 3πi e− 4 (1 + i )(1 − i )(1 − (−1)) 7πi 4 e− = ) πi (1 − e − 2 )(1 − e 3πi = e− 4 4 3πi 4 1 4 = µ πi 2 )(1 − e πi ) = ¶ −1 − i . p 2 Insgesamt ist die rechte Seite von (1) für r > 1 also gegeben durch 2πi X n(Γ, z)resz ( f ) = 2πi rese πi /4 ( f ) + 2πi rese 3πi /4 ( f ) = z∈V = µ ¶ i 2πi · − p 2 2 = —– 100 —– π p . 2 2πi · 1 4 µ ¶ µ ¶ 1−i 1 −1 − i + 2πi · 4 p p 2 2 § 12. Der Residuensatz Nun untersuchen wir die linke Seite der Gleichung (1). Durch Betrachtung der Kurve δr : [−r, r ] → C, t 7→ t mit δ0r (t ) = 1 für t ∈ [−r, r ] erkennt man, dass Z r Z f (z) d z = −r r Z δr f (z) d z = −r Z f (δr (t ))δ0r (t ) d t = r −r t2 dt. t4 +1 Rr Es handelt sich bei −r f d z also um das gewöhnliche, reelle Riemann-Integral über das Intervall [−r, r ], und lassen wir r gegen +∞ laufen, so erhalten wir das gesuchte Integral über die gesamte reelle Achse. Das zweite Integral auf der linken Seite von (1) schätzen wir ab. Für alle t ∈ [0, π] und r > 1 gilt f (γr (t )) γr (t )2 γr (t )4 + 1 = r2 . Weil die Kurvenlänge gleich πr r 4 −1 und somit | f (γr (t ))| ≤ (8.2) die Abschätzung ¯Z ¯ ¯ ¯ γr ¯ ¯ f (z) d z ¯¯ r 2 e 2i t = r 4 e 4i t + 1 ist, erhalten wir für das Kurvenintegral mit Prop. πr 3 . r4 −1 ≤ Dieser Wert läuft für r → +∞ gegen Null. Insgesamt erhalten wir nun Z x2 dx 4 −∞ x + 1 ∞ Z = r lim r →+∞ −r x2 dx x4 + 1 = 2πi X Z n(Γ, z)resz ( f ) − lim r →+∞ γ r z∈V f dz = π p . 2 Anwendungsbeispiel 2 Als weitere Anwendung des Residuensatzes beweisen wir die Gleichung Z ∞ cos(x) π −a dx = e für alle a ∈ R+ . 2 2 2a 0 x +a Zunächst bringen wir das Integral auf der linken Seite der Gleichung in eine „symmetrische“ Form. Für alle r ∈ R+ gilt Z 0 −r cos(x) dx x2 + a2 0 Z = (−1) r cos(−x) dx (−x)2 + a 2 r Z = 0 cos(x) dx x2 + a2 und somit Z r −r cos(x) dx x2 + a2 Z = 0 −r cos(x) dx + x2 + a2 r Z 0 cos(x) dx x2 + a2 Z = 2 0 r cos(x) d x. x2 + a2 Um den Residuensatz anwenden zu können, betrachten wir die holomorphe Funktion f (z) = ei z (z − i a)(z + i a) und den Integrationsweg γr : [−r, r ] → C, t 7→ t . Es gilt Z r Z f (z) d z −r = r Z f (t ) d t −r = r −r ei t dt t 2 + a2 —– 101 —– Z = r −r cos(t ) dt +i t 2 + a2 Z r −r sin(t ) dt t 2 + a2 § 12. Der Residuensatz und somit µZ r ¶ f (z) d z Re −r Z = r −r cos(x) d x. x2 + a2 Betrachten wir nun für r, s ∈ R+ den rechteckigen Integrationsweg mit den Eckpunkten ±r , ±r + i s, der wie immer in positiver Richtung, also gegen den Uhrzeigersinn, durchlaufen wird. Die beiden Polstellen von f sind ±i a. Für s > a ist die Polstelle i a im Inneren des Rechtecks enthalten, und der Residuensatz liefert Z r −r r +i s Z f (z) d z + Z f (z) d z + r −r +i s r +i s −r Z f (z) d z + f (z) d z −r +i s = 2πi · resi a ( f ). (2) Mit Hilfe von Lemma (12.3) berechnen wir zunächst die rechte Seite der Gleichung: Es gilt resi a ( f ) = e i (i a) 2i a = e −a 2i a , 2πi resi a ( f ) = π −a e . a Nun schätzen wir die Terme auf der linken Seite der Gleichung ab. Für t ∈ [0, s] gilt f (r + i t ) = e i (r +i t ) (r + i (t − a))(r + i (t + a)) = e −t +i r . (r + i (t − a))(r + i (t + a)) Der Zähler kann betragsmäßig durch 1 abgeschätzt werden, so dass wir | f (r + i t )| ≤ Länge des Integrationsweges ist, erhalten wir ¯Z ¯ ¯ ¯ r r +i s ¯ ¯ f (z) d z ¯¯ ≤ 1 r2 erhalten. Weil s die s . r2 Für −r ≤ t ≤ r gilt weiter f (t + i s) Es folgt | f (t + i s)| ≤ 1 (s−a)2 e i (t +i s) e −s+i t = . (t + i (s − a))(t + i (s + a)) (t + i (s − a))(t + i (s + a)) ¯R ¯ ¯ −r +i s ¯ 2r und ¯ r +i s f d z ¯ ≤ (s−a) 2 . Für t ∈ [0, s] gilt schließlich = e i (−r +i t ) e −t −i r = (−r + i (t − a))(−r + i (t + a)) (−r + i (t − a))(−r + i (t + a)) ¯ ¯ R −r also | f (−r + i t )| ≤ r12 und ¯ −r +i s f d z ¯ ≤ rs2 . Setzen wir s = r , dann können das zweite bis vierte Integral auf 2r 1 der linken Seite von (2) also zusammen abgeschätzt werden durch den Wert r1 + (r −a) 2 + r , der für r → +∞ gegen Null läuft. Wir erhalten µZ r ¶ Z ∞ cos(x) π π −a 1 f (z) d z = 12 · e −a = d x = lim Re e . 2 2 + a2 r →+∞ x a 2a 0 −r f (−r + i t ) = —– 102 —– § 13. Der Existenz- und Eindeutigkeitssatz für gewöhnliche DGL Definition 13.1 Sei D ⊆ R2 und f : D → R eine stetige Funktion. Dann nennt man y0 = f (x, y) (1) eine Differentialgleichung (DGL) erster Ordnung. Die Menge D bezeichnen wir als den Definitionsbereich der DGL. Eine Lösung von (1) ist eine auf einem Intervall I ⊆ R definierte, differenzierbare Funktion ϕ : I → R, so dass (x, ϕ(x)) ∈ D und ϕ0 (x) = f (x, ϕ(x)) für alle x ∈ I gilt. Die Gleichung ϕ0 (x) = f (x, ϕ(x)) kann auch als Integralgleichung formuliert werden. Nach dem Hauptsatz der Integral- und Differentialrechnung ist sie äquivalent zu Z x ϕ(x) = ϕ(a) + f (t , ϕ(t )) d t , a wobei der „Startpunkt“ a ∈ I beliebig gewählt werden kann. Die DGL (1) kann auch geometrisch interpretiert werden: Durch die Funktion f wird auf D ein Vektorfeld definiert. Der Graph Γϕ ⊆ D einer Lösung ϕ besitzt in jedem seiner Punkte (x, y) ∈ Γϕ den Vektor (1, f (x, y)) ∈ R2 jeweils als Tangentialvektor. y Beispiel 1 Die Differentialgleichung y 0 = x mit dem Definitionsbereich D = R+ × R besitzt als Lösungen die Funktionen ϕc : R+ → R, x 7→ cx, wobei c die reellen Zahlen durchläuft. Dies überprüft man unmittelbar durch Differentiation der Funktion ϕc : Für alle x ∈ R+ gilt ϕ0c (x) = c = cx x = ϕc (x) . x Aus dem Eindeutigkeitssatz, den wir Kürze formulieren werden, wird sich ergeben, dass keine weitere Lösungen der DGL existieren. Beispiel 2 Die Differentialgleichung y 0 = − xy mit dem Definitionsbereich R × R+ besitzt als Lösungen die Funktionen der Form p ¤ p p £ ϕc : − c, c −→ R , x 7→ c − x 2 , wobei c die positiven reellen Zahlen durchläuft. Auch hier überprüft man die Lösungseigenschaft unmit¤ p p £ telbar durch Differentiation: Für alle c ∈ R+ und x ∈ − c, c gilt ϕ0c (x) = 2x − p 2 c − x2 = —– 103 —– − x . ϕc (x) ä § 13. Der Existenz- und Eindeutigkeitssatz für gewöhnliche DGL Definition 13.2 Sei n ∈ N, D ⊆ R × Rn und f : D → Rn eine stetige Funktion, mit Komponentenfunktionen f 1 , ..., f n . Dann nennt man y 10 y 20 f 1 (x, y 1 , ..., y n ) f 2 (x, y 1 , ..., y n ) = = .. . = y n0 (2) f n (x, y 1 , ..., y n ) ein System von n Differentialgleichungen erster Ordung. Eine Lösung von (2) ist eine auf einem Intervall I ⊆ R definierte, stetig differenzierbare Funktion ϕ : I → Rn , so dass (x, ϕ(x)) ∈ D und ϕ0k (x) = f k (x, ϕ(x)) für alle x ∈ I und für 1 ≤ k ≤ n erfüllt ist. Definition 13.3 Sei n ∈ N, D ⊆ R × Rn und f : D → R eine stetige Funktion. Eine Differentialgleichung n-ter Ordnung ist eine Gleichung der Form y (n) = f (x, y, y 0 , y 00 , ..., y (n) ). (3) Eine Lösung von (3) ist eine n-mal differenzierbare Funktion ϕ : I → R auf einem Intervall I ⊆ R, so dass (x, ϕ(x), ϕ0 (x), ..., ϕ(n−1) (x)) ∈ D und ϕ(n) (x) = f (x, ϕ(x), ϕ0 (x), ..., ϕ(n−1) (x)) für alle x ∈ I erfüllt ist. Dabei bezeichnet ϕ(k) für jedes k ∈ N0 jeweils die k-te Ableitung der Funktion ϕ. Jeder Differentialgleichung n-ter Ordung der Form (3) lässt sich ein System von Differentialgleichungen erster Ordung zuordnen, und zwar y 00 = y 1 , y 10 = y 2 , ..., 0 y n−2 = y n−1 , 0 y n−1 = f (x, y 0 , ..., y (n−1) ). (4) Ist ϕ : I → R eine Lösung von (3), dann ist durch (ϕ, ϕ0 , ..., ϕ(n−1) ) eine Lösung von (4) gegeben. Ist umgekehrt (ϕ0 , ..., ϕn−1 ) eine Lösung von (4), dann ist die Funktion ϕ0 eine der DGL (3). Beispiel 3 Die auf D = R × R2 definierte DGL y 00 = −y besitzt die Lösung ϕ(x) = sin(x). Diese DGL zweiter Ordnung entspricht dem System von DGLs erster Ordnung y 00 = y 1 , y 10 = −y 0 . mit der Lösung ψ(x) = (sin(x), cos(x)). —– 104 —– § 13. Der Existenz- und Eindeutigkeitssatz für gewöhnliche DGL Im folgenden bezeichnet k · k stets die Maximumsnorm k · k∞ auf dem Rn . Definition 13.4 Sei D ⊆ R × Rn und f : D → Rn eine Abbildung. (i) Wir sagen, f genügt auf D einer Lipschitz-Bedingung, wenn eine Konstante L ∈ R+ existiert (die sog. Lipschitz-Konstante), so dass k f (x, y) − f (x, z)k ≤ Lky − zk für alle (x, y), (x, z) ∈ D erfüllt ist. (ii) Die Funktion f genügt auf D lokal einer Lipschitz-Bedingung, wenn für jeden Punkt (x, y) ∈ D eine Umgebung U ⊆ D existiert, so dass f |U auf U einer LipschitzBedingung genügt. Proposition 13.5 Sei D ⊆ R × Rn offen und f : D → Rn eine stetige, nach y 1 , ..., y n stetig partiell differenzierbare Funktion. Letzteres bedeutet, dass die Funktionen (x, y) 7→ ∂(0,e i ) f (x, y) für 1 ≤ i ≤ n auf ganz D definiert und stetig sind, wobei e i ∈ Rn jeweils den i -ten Einheitsvektor bezeichnet. Dann genügt f einer lokalen Lipschitz-Bedingung. Beweis: Sei (a, b) ∈ D vorgegeben und U ⊆ D eine kompakte, konvexe Umgebung von (a, b). Für (x, y) ∈ D setzen wir f x (y) = f (x, y). Dann gibt es eine Konstante γ ∈ R+ , so dass die partiellen Ableitungen ∂i ( f x )k (y) der Komponentenfunktionen ( f x )k für (x, y) ∈ U durch γ beschränkt sind. Seien x, y, z mit (x, y), (x, z) ∈ U vorgegeben und v = y − z. Nach dem Mittelwertsatz für Richtungsableitungen (siehe Mathe III, Satz 10.5) ¤ £ gibt es für 1 ≤ k ≤ n jeweils ein p k ∈ y, z ⊆ U , so dass f k (x, y) − f k (x, z) = ( f x )k (y) − ( f x )k (z) = ∂v ( f x )k (p k ) = n X (y i − z i )∂i ( f x )k (p k ) i =1 P erfüllt ist. Die Summe ni=1 |y i − z i | ist die 1-Norm des Differenzvektors y − z. Weil je zwei Normen auf dem Rn äquivalent sind, gibt es eine Konstante α mit ky − zk1 ≤ αky − zk für alle y, z ∈ U . Setzen wir L = αγ, dann gilt also k f (x, y) − f (x, z)k ≤ γky − zk1 ≤ αγky − zk = Lky − zk für alle y, z ∈ U . ä Die Bedingung in Prop. (13.5) ist natürlich insbesondere dann erfüllt, wenn f in Abhängigkeit von allen Variablen x, y 1 , ..., y n stetig partiell differenzierbar ist. y Beispielsweise genügen die Funktionen f (x, y) = x und g (x, y) = − xy aus den Beispielen 1 und 2 einer lokalen Lipschitz-Bedingung, denn sowohl die Funktionen selbst als auch ihre partiellen Ableitungen nach y gegeben durch (x, y) 7→ x1 und (x, y) 7→ yx2 sind auf ihrem gesamten Definitionsbereich stetig. —– 105 —– § 13. Der Existenz- und Eindeutigkeitssatz für gewöhnliche DGL Bevor wir nun den Eindeutigkeitssatz beweisen, führen wir noch die folgende Notation ein: Ist g : [a, b] → Rn eine stetige Funktion, dann setzen wir µZ b ¶ Z b Z b g (x) d x = g 1 (x) d x, ..., g n (x) d x , a a a wobei g 1 , .., g n die Komponentenfunktionen von g bezeichnen. Ist α ∈ R+ eine Konstante mit kg (x)k ≤ α Rb für alle x ∈ [a, b], dann gilt |g k (x)| ≤ α für alle x ∈ [a, b] und 1 ≤ k ≤ n. Es folgt a |g k (x)| d x ≤ α(b − a) für alle k und somit ¯¯ ° °Z b ¾ ¾ ½Z b ½¯Z b ¯ ¯¯ ¯ ° ° ¯ ¯ ¯ ° ° ≤ max |g k (x)| d x ¯ 1 ≤ k ≤ n g k (x) d x ¯ ¯ 1 ≤ k ≤ n g (x) d x ° = max ¯ ° a a a Z ≤ Satz 13.6 b a kg (x)k d x ≤ α(b − a). (Eindeutigkeitssatz) Sei D ⊆ R × Rn und f : D → Rn eine Funktion, die lokal einer Lipschitz-Bedingung genügt. Seien ϕ, ψ : I → Rn zwei Lösungen der Differentialgleichung y0 = auf einem Intervall I ⊆ R. f (x, y) Gilt ϕ(a) = ψ(a) für ein a ∈ I , dann folgt ϕ(x) = ψ(x) für alle x ∈ I . Beweis: Wir zeigen zunächst: Gilt ϕ(a) = ψ(a) für ein a ∈ I , dann gibt es ein ε ∈ R+ mit ϕ(x) = ψ(x) für alle x ∈ I mit |x − a| ≤ ε. Durch Integration von ϕ0 (x) = f (x, ϕ(x)) und ψ0 (x) = f (x, ψ(x)) erhalten wir mit der Voraussetzung ϕ(a) = ψ(a) für x ∈ I die Gleichung Z x ¡ ¢ ϕ(x) − ψ(x) = f (t , ϕ(t )) − f (t , ψ(t )) d t . a Auf Grund der lokalen Lipschitz-Bedingung gibt es L, δ1 ∈ R+ mit k f (t , ϕ(t )) − f (t , ψ(t ))k ≤ Lkϕ(t ) − ψ(t )k mit |t − a| ≤ δ1 . für alle t ∈ I Sei nun δ ∈ ]0, δ1 ] und x ∈ [a − δ, a + δ]. Dann gilt Z x °¡ ¢° ° f (t , ϕ(t )) − f (t , ψ(t )) ° d t kϕ(x) − ψ(x)k ≤ ≤ a ¯Z ¯ L ¯¯ x a ¯ ¯ kϕ(t ) − ψ(t )k d t ¯¯ . Setzen wir nun jeweils m(δ) = sup{kϕ(t ) − ψ(t )k | |t − a| ≤ δ}, dann erhalten wir die Abschätzung kϕ(x) − ψ(x)k ≤ L|x − a|m(δ) ≤ Lδm(δ). Bilden wir auf der linken Seite das Maximum über alle x ∈ [a − δ, a + δ], dann folgt m(δ) ≤ Lδm(δ). Sei nun ε ∈ ]0, δ1 ] so klein gewählt, dass Lε < 1 ist. Dann muss m(ε) = 0 gelten. Wir erhalten ϕ(x) = ψ(x) für alle x mit |x − a| ≤ ε. —– 106 —– § 13. Der Existenz- und Eindeutigkeitssatz für gewöhnliche DGL Nun zeigen wir, dass ϕ(x) = ψ(x) für alle x ∈ I mit x ≥ a gilt. Dazu definieren wir b = sup {t ∈ I | ϕ|[a,t ] = ψ|[a,t ] }. Ist b = +∞ oder das rechte Intervallende von I , dann sind wir fertig. Ansonsten gibt es ein δ ∈ R+ mit [b, b + δ] ⊆ I , und es gilt ϕ(x) = ψ(x) für alle x mit a ≤ x < b. Weil ϕ und ψ stetig sind, gilt auch ϕ(b) = ψ(b). Wenden wir nun die im ersten Teil bewiesene Aussage auf den Anfangspunkt b an, so erhalten wir ein ε ∈ R+ mit ϕ(x) = ψ(x) für alle x ∈ I mit |x −b| < ε, im Widerspruch zur Definition von b. Also muss ϕ(x) = ψ(x) für alle x ∈ I mit x ≥ a gelten. Genauso beweist man, dass ϕ(x) = ψ(x) für alle x ∈ I mit x ≤ a erfüllt ist. ä Ein Beispiel für eine Differentialgleichung, für die der Eindeutigkeitssatz nicht gilt, ist durch y0 = y 2/3 gegeben. Eine Lösung dieser DGL durch den Punkt (0, 0) erhält man durch die Nullfunktion, also durch 1 3 x ist eine Lösung durch diesen Punkt, ϕ : R → R mit ϕ(x) = 0 für x ∈ R. Aber auch die Funktion ψ(x) = 27 denn es gilt ψ(0) = 0 und ¡ 1 3 ¢2/3 3 2 . ψ0 (x) = 27 x = 19 x 2 = 27 x Allgemein kann man leicht überprüfen, dass für jedes Paar (b, c) ∈ R2 mit b < 0 und c > 0 die Funktion 1 (x − b)3 für x ≤ b 27 ψbc (x) = 0 für b ≤ x ≤ c 1 3 (x − c) für x ≥ c 27 eine Lösung der DGL ist. Denn es gilt ψbc (0) = 0, für alle x > c gilt ¢ ¡1 3 2/3 ψ0bc (x) = 19 (x − c)2 = 27 (x − c) , und für x < b erhält man ebenso ψ0bc (x) = 2 1 9 (x − b) = ¡ ¢ 3 2/3 1 . 27 (x − b) Für b < x < c ist ψ0bc (x) = 0 und ψbc (x) = 0, also ist die Gleichung ψ0bc (x) = ψ(x)2/3 auch hier erfüllt. An den kritischen Stellen x = b und x = c zeigt man durch Betrachtung der links- und rechtsseitigen Ableitung, dass ψ0bc auch hier gleich Null ist. Der Eindeutigkeitssatz kann auf die Funktion f (x, y) = y 2/3 nicht angewendet werden, weil sie in einer Umgebung von (0, 0) keiner lokalen Lipschitz-Bedingung genügt. Beispielsweise gilt für alle n ∈ N 1 f (0, n1 ) − f (0, 2n ) 1 n 1 − 2n = = n −2/3 − (2n)−2/3 = 1 2n 2n 1/3 − (2n)1/3 = 2n(n −2/3 − (2n)−2/3 ) (2 − 21/3 )n 1/3 . Für n → ∞ geht dieser Wert gegen unendlich. Es gibt also keine Umgebung U von (0, 0), so dass die Ungleichung | f (x, y) − f (x, z)| ≤ L|y − z| für alle (x, y), (x, z) ∈ U mit einer geeigneten Konstanten L > 0 erfüllt ist. —– 107 —– § 13. Der Existenz- und Eindeutigkeitssatz für gewöhnliche DGL Nach der Eindeutigkeit beschäftigen wir uns nun mit der Existenz von Lösungen einer DGL. Das wesentliche Hilfsmittel hierbei ist der Banachsche Fixpunktsatz, den wir bereits in der Mathe III-Vorlesung kennengelernt haben: Ist (X , d ) ein vollständiger metrischer Raum und φ : X → X eine Kontraktion, dann besitzt φ in X einen eindeutig bestimmten Fixpunkt, also ein a ∈ X mit φ(a) = a. Wir erinnern daran, dass eine Abbildung φ als Kontraktion bezeichnet wird, wenn es eine Konstante γ ∈ [0, 1[ gibt, so dass d (φ(x), φ(y)) ≤ γd (x, y) für alle x, y ∈ X erfüllt ist. Lemma 13.7 Sei I = [a, b] ⊆ R ein abgeschlossenes Intervall mit a, b ∈ R, a < b. Sei außerdem n ∈ N und C (I , Rn ) die Menge der stetigen Funktionen f : I → Rn . Dann ist C (I , Rn ) mit k f k∞ = sup{k f (x)k | x ∈ I } ein Banachraum, also ein vollständiger normierter R-Vektorraum. Beweis: Zunächst zeigen wir, dass durch k · k∞ eine Norm auf C (I , Rn ) gegeben ist. Sei dazu f ∈ C (I , Rn ) vorgegeben. Ist f die Nullfunktion, dann gilt k f (x)k = 0 für alle x ∈ I , und es folgt k f k∞ = 0. Setzen wir umgekehrt k f k∞ = 0 voraus, dann folgt k f (x)k = 0 und auf Grund der Normeigenschaft von k·k auch f (x) = 0 für alle x ∈ I . Also ist in diesem Fall f der Nullvektor in C (I , Rn ). Ist f ∈ C (I , Rn ) und 0 6= λ ∈ R, dann gilt für alle x ∈ I die Abschätzung kλ f (x)k |λ|k f (x)k = ≤ |λ|k f k∞ und somit auch kλ f k∞ ≤ |λ|k f k∞ . Setzen wir g = λ f , dann erhalten wir ebenso k f k∞ = k λ1 g k∞ ≤ | λ1 |kg k∞ = 1 kλ f k∞ |λ| , also |λ|k f k∞ ≤ kλ f k∞ und insgesamt Gleichheit. Für λ = 0 ist die Gleichung kλ f k∞ = |λ|k f k∞ offenbar ebenfalls erfüllt. Zum Beweis der Dreiecksungleichung seien f , g ∈ C (I , Rn ) vorgegeben. Für alle x ∈ I ist k( f + g )(x)k = k f (x) + g (x)k ≤ k f (x)k + kg (x)k ≤ k f k∞ + kg k∞ , also auch k f + g k∞ ≤ k f k∞ + kg k∞ . Damit sind die Normeigenschaften nachgewiesen. Sei nun ( f m )m∈N eine Cauchyfolge in C (I , Rn ) bezüglich k · k∞ . Dann gibt es für jedes ε ∈ R+ ein K ∈ N, so dass k f k − f m k∞ < ε für alle k, m ≥ K erfüllt ist. Es folgt k f k (x) − f m (x)k ≤ ε für alle x ∈ I und k, m ≥ K , d.h. die Folge ( f m (x))m∈N ist für jedes x ∈ I eine Cauchyfolge in Rn . Da der Rn bezüglich jeder Norm vollständig ist, konvergiert die Folge ( f m (x))m∈N gegen einen Vektor f (x) ∈ Rn . Zu zeigen ist, dass die auf diese Weise definierte Funktion f : I → Rn stetig und ein Grenzwert der Folge ( f m )m∈N in C (I , Rn ) ist. —– 108 —– § 13. Der Existenz- und Eindeutigkeitssatz für gewöhnliche DGL Wir beweisen die Stetigkeit von f mit Hilfe des ε-δ-Kriteriums. Seien a ∈ I und ε ∈ R+ vorgegeben. Dann existiert ein K ∈ N mit k f k − f m k∞ < 13 ε für alle k, m ≥ K . Auf Grund der Stetigkeit der Normfunktion auf Rn gilt k f K (x) − f (x)k = lim k f K (x) − f m (x)k ≤ lim k f K − f m k∞ ≤ 13 ε m→∞ m→∞ für alle x ∈ I . Weil die Funktion f K auf I stetig ist, gibt es ein δ ∈ R+ mit k f K (x) − f K (a)k < 13 ε für alle x ∈ I mit |x − a| < δ. Es folgt k f (x) − f (a)k ≤ k f (x) − f K (x)k + k f K (x) − f K (a)k + k f K (a) − f (a)k < 1 1 1 3ε+ 3ε+ 3ε = ε für alle x ∈ I mit |x − a| < δ. Damit ist die Stetigkeit von f bewiesen. Wir wenden nun die CauchyfolgenEigenschaft noch einmal an, um zu zeigen, dass f der Grenzwert der Folge ( f m )m∈N in C (I , Rn ) ist. Für jedes ε ∈ R+ gibt es ein K ∈ N mit k f k − f m k∞ < ε für alle k, m ≥ K , also k f k (x) − f m (x)k < ε für alle x ∈ I und k, m ≥ K . Durch Grenzübergang m → ∞ erhalten wir k f k (x) − f (x)k ≤ ε für alle x ∈ I und k ≥ K , also k f k − f k∞ ≤ ε für k ≥ K . Also ist f tatsächlich der Grenzwert der Folge ( f m )m∈N im R-Vektorraum C (I , Rn ) enthalten. ä Lemma 13.8 Sei B̄ ⊆ Rn eine abgeschlossene Teilmenge. Dann ist die Menge der Funktionen C (I , B̄ ) abgeschlossen in C (I , Rn ). Also ist C (I , B̄ ) bezüglich der Metrik d ( f , g ) = k f − g k∞ ein vollständiger metrischer Raum. Beweis: Sei ( f m )m∈N eine Folge in C (I , B̄ ), die in C (I , Rn ) eine Grenzwert besitzt. Zu zeigen ist, dass der Grenzwert dann auch in C (I , B̄ ) liegt. Ist x ∈ I ein beliebiger Punkt, dann bilden die Vektoren f m (x) eine Folge in Rn , die wegen lim k f m (x) − f (x)k ≤ lim k f m − f k∞ = 0 m→∞ m→∞ n gegen f (x) konvergiert. Weil B̄ in R abgeschlossen ist und alle Vektoren in f m (x) in B̄ liegen, gilt dasselbe auch für den Grenzwert f (x). Damit haben wir gezeigt, dass f eine Funktion I → B̄ ist. ä Satz 13.9 (Existenzsatz von Picard-Lindelöf ) Sei D ⊆ R × Rn offen und f : D → Rn eine stetige Funktion, die lokal einer LipschitzBedingung genügt. Dann gibt es zu jedem Punkt (a, b) ∈ D ein δ ∈ R+ und eine Lösung ϕ : ]a − δ, a + δ[ −→ Rn der Differentialgleichung y 0 = f (x, y) mit ϕ(a) = b. Beweis: Sei I ein abgeschlossenes Intervall, a ein Punkt im Inneren von I und ε ∈ R+ so klein gewählt, dass die Menge X = I × B̄ ε (b) in D enthalten ist und f auf X eine Lipschitz-Bedingung mit einer LipschitzKonstanten L ∈ R+ genügt. Weil X kompakt und f stetig ist, gibt es ein m ∈ R+ mit k f (t , x)k ≤ m für alle —– 109 —– § 13. Der Existenz- und Eindeutigkeitssatz für gewöhnliche DGL (t , x) ∈ X . Weiter wählen wir δ ∈ R+ so klein, dass das Intervall J = [a − δ, a + δ] in I enthalten ist und die Ungleichungen Lδ < 1 sowie mδ < ε gelten. Wir definieren nun auf dem Banachram V = C (J , Rn ) mit der Norm k · k∞ die Abbildung Z x Φ : V −→ V gegeben durch Φ(ϕ)(x) = b + f (t , ϕ(t )) d t a sowie die Teilmenge Y = C (J , B̄ ε (b)) von V . Dann ist Y nach Lemma (13.8) mit d (ϕ, ψ) = kϕ−ψk∞ ebenfalls ein Banachraum. Für alle ϕ ∈ Y und x ∈ J gilt ° °Z x ° ° ° f (t , ϕ(t )) d t ° kΦ(ϕ)(x) − bk ≤ ° ° ≤ mδ < ε , a also ist auch Φ(ϕ) in Y enthalten, und folglich ist Φ eine Abbildung Y → Y . Um den Banachschen Fixpunktsatz anwenden zu können, zeigen wir, dass es sich bei Φ um eine Kontraktion handelt. Seien ϕ, ψ ∈ Y vorgegeben. Für jedes t ∈ J gilt nach Voraussetzung ϕ(t ), ψ(t ) ∈ B̄ ε (b), und auf Grund der Lipschitz-Bedingung gilt k f (t , ϕ(t )) − f (t , ψ(t ))k ≤ Lkϕ(t ) − ψ(t )k. Wir erhalten somit ° °Z x ° ° ° kΦ(ϕ) − Φ(ψ)k∞ = sup ° ( f (t , ϕ(t )) − f (t , ψ(t ))) d t ° ° a x∈J x Z ≤ sup x∈J a k f (t , ϕ(t )) − f (t , ψ(t ))k d t ≤ sup |x − a| · L · kϕ − ψk∞ x∈J = δLkϕ − ψk∞ . Wegen δL < 1 ist die Kontraktionseigenschaft damit nachgewiesen. Sei nun ϕ ∈ Y ein Fixpunkt von Φ. Aus Φ(ϕ) = ϕ folgt dann Z x ϕ(x) = b + f (t , ϕ(t )) d t ∀ x ∈ J und ϕ0 (x) = f (x, ϕ(x)) für alle x ∈ J . ä a Folgerung 13.10 Sei D ⊆ R × Rn offen, f : D → Rn eine stetige Funktion, die lokal einer Lipschitz-Bedingung genügt, und (a, b) ∈ D. Dann gibt es ein offenes Intervall I ⊆ R mit a ∈ I und eine differenzierbare Funktion ϕ : I → Rn , so dass gilt (i) ϕ(a) = b und ϕ0 (x) = f (x, ϕ(x)) für alle x ∈ I (ii) Ist J ⊆ R ein weiteres offenes Intervall mit a ∈ J und ψ : J → Rn eine differenzierbare Funktion mit ψ(a) = b und ψ0 (x) = f (x, ψ(x)) für alle x ∈ J , dann gilt J ⊆ I und ϕ| J = ψ. Man bezeichnet ϕ als maximale Lösung des Anfangswertproblems gegeben durch die gewöhnliche Differentialgleichung y 0 = f (x, y) und das Paar (a, b). —– 110 —– § 13. Der Existenz- und Eindeutigkeitssatz für gewöhnliche DGL Beweis: Auf Grund des Existenzsatzes gibt es zumindest ein δ ∈ R+ , so dass auf dem offenen Intervall I δ = ]a − δ, a + δ[ eine Lösung ϕ des Anfangswertproblems existiert. Sei x + das Supremum über alle x > a mit der Eigenschaft, dass es auf ]a − δ, x[ eine solche Lösung gibt. Dann ist a + δ ≤ x + ≤ +∞, und auf ]a − δ, x + [ existiert eine Lösung. Ebenso bilden wir das Infimum x − über alle x < a mit der Eigenschaft, dass auf ]x, a + δ[ eine Lösung existiert. Dann gilt −∞ ≤ x − ≤ a − δ, und auf ]x − , a + δ[ gibt es eine Lösung ϕ− . Auf Grund des Eindeutigkeitssatzes stimmen ϕ− und ϕ+ auf I δ überein, so dass wir insgesamt eine Lösung ϕ auf I = ]x − , x + [ erhalten, mit ϕ|]a−δ,x+ [ = ϕ+ und ϕ|]x− ,a+δ[ = ϕ− . Sei nun ψ : J → Rn wie unter (ii) angegeben. Ist J keine Teilmenge von I , dann gibt es ein c ∈ J mit c > x + oder c < x − . Nehmen wir an, dass der erste Fall eintritt. Wegen des Eindeutigkeitssatzes stimmen ϕ und ψ auf ]a, x + [ überein, und wir erhalten insgesamt eine Lösung auf ]a − δ, c[, im Widerspruch zur Definition von x + als Supremum. Genauso kann c < x − ausgeschlossen werden. Die Gleichung ϕ| J = ψ folgt wiederum aus dem Eindeutigkeitssatz. ä Wir formulieren den Existenz- und Eindeutigkeitssatz in der letzten Version noch einmal für Differentialgleichungen n-ter Ordnung. Auf Grund der Bemerkung zur Korrespondenz zwischen Lösungen eines Systems erster Ordnung und einer DGL n-ter Ordnung (im Anschluss an Def. (13.3)) folgt diese Aussage unmittelbar aus der soeben bewiesenen Folgerung (13.10). Folgerung 13.11 Sei D ⊆ R × Rn offen, f : D → R eine stetige Funktion, die lokal einer Lipschitz-Bedingung genügt, und (a, b) ∈ D, b = (b 0 , ..., b n−1 ) ∈ Rn . Dann gibt es ein offenes Intervall I mit a ∈ I und eine n-mal differenzierbare Funktion ϕ : I → R mit den folgenden Eigenschaften. (i) Die Funktion ϕ ist eine Lösung der DGL y (n) = f (x, y, ..., y (n−1) ) mit b k = ϕ(k) (a) für 0 ≤ k ≤ n − 1. (ii) Ist ψ : J → R eine weitere Lösung auf einem offenen Intervall mit den unter (i) genannten Eigenschaften, dann gilt J ⊆ I und ϕ| J = ψ. Neben dem hier bewiesenen Existenz- und Eindeutigkeitssatz spielt auch der sog. Existenzsatz von Peano in der Theorie der Differentialgleichungen eine wichtige Rolle, bei dem für f nur die Stetigkeit, aber keine lokale Lipschitz-Bedingung gefordert wird. Unter diesen Voraussetzungen existiert eine Lösung der DGL. Sie ist aber nicht mehr eindeutig bestimmt, noch nicht einmal lokal, wie das Beispiel nach Satz (13.6) zeigt. —– 111 —– § 13. Der Existenz- und Eindeutigkeitssatz für gewöhnliche DGL (Existenzsatz von Peano) Satz 13.12 n Sei D ⊆ R × R offen, f : D → Rn stetig und (a, b) ∈ D. Dann gibt es ein offenes Intervall I ⊆ R mit a ∈ I und eine Lösung ϕ : I → Rn von y 0 = f (x, y) mit ϕ(a) = b. Aus Zeitgründen verzichten wir auf den Beweis des Satzes. —– 112 —– § 14. Elementare Lösungsmethoden In diesem Abschnitt werden wir Lösungsverfahren für zwei einfache Typen von Differentialgleichungen kennenlernen. (a) Differentialgleichungen mit getrennten Variablen Definition 14.1 Seien I , J ⊆ R offene Intervalle und f : I → R, g : J → R stetige Funktionen, wobei g (y) 6= 0 für alle y ∈ J gilt. Dann nennt man y0 = f (x)g (y) eine Differentialgleichung mit getrennten Variablen. Seien f , g wie in Def. (14.1) angegeben und (a, b) ∈ I × J . Dann findet man eine Lösung ϕ der DGL y 0 = f (x)g (y) durch Ausführung der folgenden Einzelschritte. (1) Zunächst berechnet man Stammfunktionen F : I → R und G : J → R der beiden Funktionen f und 1/g auf I mit F (a) = G(b) = 0. (2) Dann bestimmt man die Umkehrfunktion H : J 0 → J von G (mit J 0 = G(J )). (3) Sei I 0 ⊆ I ein Intervall mit a ∈ I 0 und F (I 0 ) ⊆ J 0 . Dann ist durch ϕ = H ◦F eine Lösung von y 0 = f (x)g (y) mit ϕ(a) = b gegeben. Wir überprüfen kurz, dass die drei Schritte in dieser Form durchführbar sind und tatsächlich eine Lösung ϕ der DGL mit ϕ(a) = b liefern. Weil f und g stetig sind, erhält man durch Z x Z y dt F (x) = f (t ) d t und G(y) = a b g (t ) Stammfunktionen von f und 1/g mit F (a) = G(b) = 0. Weil die Funktion 1/g nirgends auf dem Intervall J den Wert Null annimmt, gilt entweder 1/g (y) > 0 oder 1/g (y) < 0, für alle y ∈ J . Deshalb ist die Funktion G auf dem gesamten Intervall J entweder streng monoton wachsend oder streng monoton fallend. Deshalb besitzt G : J → J 0 eine Umkehrfunktion H : J 0 → J . Die Funktion ϕ = H ◦F ist auf dem Intervall I 0 tatsächlich eine Lösung der DGL. Denn für alle x ∈ I 0 gilt ϕ(x) = (H ◦ F )(x) ⇔ (G ◦ ϕ)(x) = F (x), und mit der Kettenregel erhält man (G ◦ ϕ)0 (x) = F 0 (x) ⇔ G 0 (ϕ(x))ϕ0 (x) = F 0 (x) ⇔ ϕ0 (x) = f (x) g (ϕ(x)) Außerdem gilt G(b) = 0 ⇔ b = H (0) und folglich ϕ(a) = H (F (a)) = H (0) = b. —– 113 —– ⇔ ϕ0 (x) = f (x)g (ϕ(x)). § 14. Elementare Lösungsmethoden Beispiel: Wir bestimmen für jedes c ∈ R+ eine Lösung ϕc der Differentialgleichung y0 = y2 ϕc (0) = c mit im Definitionsbereich D = R × R+ . Dazu betrachten wir die Funktionen f : R → R, x 7→ 1 und g : R+ → R, y 7→ y 2 . Die zugehörigen Funktionen F und G sind dann definiert durch x Z F (x) dt = y Z 0 = x G(y) und = c dt t2 1 ¯¯ y − ¯ t c = = 1 1 − c y ¤ £ ¤ £ für alle x ∈ R und y ∈ R+ . Wegen G ( ]0, +∞[ ) = −∞, 1c können wir I 0 = −∞, 1c wählen; dies ist das maximale offene Intervall mit F (I 0 ) = I 0 ⊆ G( ]0, +∞[ ). Die Umkehrfunktion H von G erhält man durch die Umformung x = G(y) ⇔ x= 1 1 − c y 1 1 = −x y c ⇔ ⇔ y= 1 1 c −x = die gesuchte Funktion ist also y = H (x). Für alle x ∈ I 0 gilt H (F (x)) = H (x) = also eine Lösung ϕc : I 0 → R der DGL mit ϕc (0) = c definiert. Tatsächlich gilt ϕ0c (x) = (−c 2 )(−1)(1 − cx)−2 = c2 (1 − cx)2 = ³ c ´2 1 − cx c 1 − cx c 1−cx . = , Durch ϕc (x) = c 1−c x ist ϕc (x)2 . für alle x ∈ I 0 . (b) Lineare Differentialgleichungen Definition 14.2 Sei I ⊆ R ein offenes Intervall, und seien f , g : I → R stetige Funktionen. Dann nennt man y 0 = f (x)y + g (x) eine lineare DGL erster Ordnung. Ist g (x) = 0 für alle x ∈ I , dann spricht man von einer homogenen, ansonsten von einer inhomogenen Differentialgleichung. Für jedes Paar (a, b) ∈ I × R lässt sich eine Lösung ϕ : I → R der homogenen DGL mit ϕ(a) = b leicht angeben. Definiert man nämlich Z x F : I → R , x 7→ f (t ) d t und ϕ(x) = be F (x) für x ∈ I , a dann gilt auf F 0 (x) = f (x) auf Grund des Hauptsatzes der Differential- und Integralrechnung und ϕ0 (x) = be F (x) F 0 (x) = be F (x) f (x) = f (x)ϕ(x) auf Grund der Kettenregel, jeweils für alle x ∈ I . —– 114 —– § 14. Elementare Lösungsmethoden Für die Lösung inhomogener linearer DGL der Form y 0 (x) = f (x)y + g (x) gibt es ein Verfahren, das unter dem Namen Variation der Konstanten bekannt ist. Sei ϕ : I → R die bereits gefundene Lösung der homogenen linearen DGL y 0 (x) = f (x)y mit ϕ(a) = 1. Für jedes c ∈ R ist dann ϕc = cϕ eine Lösung mit ϕc (a) = cϕ(a) = c. Der entscheidende Ansatz besteht nun darin, die Konstante c durch eine Funktion u : I → R zu ersetzen (daher der Name des Verfahrens), so dass ψ(x) = u(x)ϕ(x) zu einer Lösung der inhomogenen DGL wird. Es kommt also daran an, eine passende Funktion u zu finden. Aus ψ = uϕ folgt ψ0 = uϕ0 + u 0 ϕ. Dass es sich bei ψ um eine Lösung der inhomogenen DGL handelt, ist äquivalent zu ψ0 (x) = f (x)ψ(x) + g (x) u(x)ϕ0 (x) + u 0 (x)ϕ(x) = f (x)u(x)ϕ(x) + g (x) ⇔ u(x) f (x)ϕ(x) + u 0 (x)ϕ(x) = u(x) f (x)ϕ(x) + g (x) für alle x ∈ R. Die letzte Gleichung ist äquivalent zu Z x g (t ) u(x) = b + dt a ϕ(t ) ⇔ u 0 (x)ϕ(x) = g (x) ⇔ für alle x ∈ I , (1) mit einer geeigneten Konstanten b ∈ R. Dabei ist zu beachten, dass nach Definition der homogenen Lösung ϕ(x) 6= 0 für alle x ∈ I gilt. Definieren wir die Funktion u also wie in (1) angegeben, und setzen wir ψ = uϕ, dann ist ψ eine Lösung der inhomogenen DGL mit ψ(a) = b. Beispiel: Wir bestimmen für jedes b ∈ R eine Lösung ψb : R → R der DGL y0 2x y + x 3 = mit ψb (0) = b. Diese inhomogene lineare DGL ist aus den Funktionen f , g : R → R gegeben durch f (x) = 2x und g (x) = x 3 aufgebaut. Die zugehörige Funktion F erhalten wir durch Z x Z x ¯x ¯ F (x) = f (t ) d t = 2t d t = t 2 ¯ = x 2 . 0 0 0 2 Somit ist ϕ : R → R, x 7→ e x eine Lösung der homogenen linearen DGL y 0 = 2x y mit ϕ(0) = 1. Um die inhomogene lineare DGL zu lösen, bestimmen wir die Hilfsfunktion u. Mit Hilfe der Substitutionsregel und durch partielle Integration erhalten wir Z u(x) b+ 1 2 = b+ x2 Z se 0 −s 0 ds x g (t ) dt ϕ(t ) b− = 2 = b+ ¯x 2 1 −s ¯ 2 se ¯ 0 2 t3 x Z e 0 + 12 b − 12 x 2 e −x − 21 e −x + 12 Z t2 x2 dt e −s d s 0 = = b+ = 1 2 x Z 2 (2t )t 2 e −t d t 0 ¯x 2 ¯ b − 12 se −s − 21 e −s ¯ 0 = = 2 b + 21 − 12 (x 2 + 1)e −x . 2 Durch ψb (x) = ϕ(x)u(x) = (b + 12 )e x − 12 (x 2 + 1) ist also eine Lösung mit ψb (0) = b gegeben. —– 115 —– § 15. Systeme linearer Differentialgleichungen Definition 15.1 Sei I ⊆ R ein Intervall und A : I → Mn,R eine stetige Abbildung von I in den Raum der reellen n ×n-Matrizen. Sei b : I → Rn eine weitere stetige Funktion. Dann nennt man y 0 = A(x)y + b(x) ein lineares System von Differentialgleichungen. Ist die Funktion b konstant Null, dann spricht man von einem homogenen, sonst von einem inhomogenen System. Neben diesen reellwertigen betrachtet man häufig auch komplexwertige lineare Systeme von Differentialgleichungen. Dabei werden A und b durch Abbildungen nach Mn,C bzw. Cn ersetzt. Der Definitionsbereich der Funktionen ist aber weiterhin ein Intervall in den reellen Zahlen. Im Folgenden bezeichnet K einen der Körper R oder C. Für lineare Systeme von Differentialgleichungen nimmt der Existenz- und Eindeutigkeitssatz die folgende Form an. Satz 15.2 Sei I ⊆ R offen, a ∈ I und c ∈ Kn . Dann gibt es eine eindeutig bestimmte Lösung ϕ : I → Kn des Systems y 0 = A(x)y + b(x) mit ϕ(a) = c. Beweis: Sei die Funktion f : I × Rn → Rn gegeben durch f (x, y) = A(x)y + b(x) auf I × Kn . Ist K ⊆ I ein kompaktes Teilintervall, dann ist L = sup{kA(x)k | x ∈ K } endlich, wobei kA(x)k jeweils die in der Analysis mehrerer Variablen eingeführte Operatornorm bezeichnet. Für alle x ∈ K und y, ỹ ∈ Rn gilt dann k f (x, y) − f (x, ỹ)k = kA(x)(y − ỹ)k ≤ Lky − ỹk. Also genügt f einer lokalen Lipschitz-Bedingung, und somit gibt es nach Folgerung (13.10) ein eindeutig bestimmtes, maximales offenes Intervall J ⊆ K mit a ∈ J und eine eindeutig bestimmte Lösung ϕ : J → Rn mit ϕ(a) = c. Nehmen wir nun an, dass sup J < sup K gilt. Sei δ ∈ R+ so gewählt, dass Lδ < 1 und sup J + δ < sup K gilt. Sei außerdem a 1 ∈ J ein Punkt mit a 1 +δ > sup J . Wie im Beweis von Satz (13.9) gezeigt wurde, existiert eine Lösung ψ auf I δ = ]a 1 − δ, a 1 + δ[ mit ψ(a 1 ) = ϕ(a 1 ). Auf Grund der Eindeutigkeit in Folge der LipschitzBedingung stimmen ϕ und ψ auf J ∩ I δ überein. Wir erhalten also insgesamt eine Lösung, die auf J ∪ I δ —– 116 —– § 15. Systeme linearer Differentialgleichungen definiert ist, was der Maximalität der Lösung ϕ auf J widerspricht. Also muss sup J = sup K gelten. Ebenso beweist man inf J = inf K . Insgesamt haben wir damit gezeigt, dass die Lösung ϕ auf das Innere jedes kompakten Teilintervalls K ⊆ I fortgesetzt werden kann. Damit ist ϕ auf ganz I fortsetzbar. ä Nun sehen wir uns die Gesamtheit der Lösungen eines homogenen linearen Systems genauer an. Satz 15.3 Sei I ⊆ R ein offenes Intervall, A : I → Mn,K eine stetige Abbildung und L 0 die Menge aller Lösungen von y 0 = A(x)y auf dem Intervall I . Dann ist L 0 ein ndimensionaler K-Vektorraum. Ist m ∈ N, dann sind für ein m-Tupel (ϕ1 , ..., ϕm ) von Lösungen die folgenden Aussagen äquivalent: (i) Die Funktionen ϕ1 , ..., ϕm sind linear unabhängig. (ii) Es gibt es a ∈ I , so dass ϕ1 (a), ..., ϕm (a) in Kn linear unabhängig sind. (iii) Für alle a ∈ I sind die Vektoren ϕ1 (a), ..., ϕm (a) in Kn linear unabhängig. Beweis: Zunächst zeigen wir, dass es sich bei L 0 tatsächlich um einen K-Vektorraum handelt. Die Nullfunktion 0 : I → Kn erfüllt offensichtlich die Gleichung 00 = A(x)0, also ist 0 in L 0 enthalten. Seien nun ϕ, ψ ∈ L 0 und λ ∈ K vorgegeben. Dann liegen auch ϕ + ψ und λϕ in L 0 , denn für alle x ∈ I gilt (ϕ + ψ)0 (x) = ϕ0 (x) + ψ0 (x) = A(x)ϕ(x) + A(x)ψ(x) = A(x)(ϕ + ψ)(x) und (λϕ)0 (x) = λϕ0 (x) = λA(x)ϕ(x) = A(x)(λϕ)(x). Nun beweisen wir die Äquivalenz der Aussagen (i) bis (iii). Die Implikation “(iii) ⇒ (ii)“ ist offensichtlich. P λ ϕ = 0 vorgegeben. Dann gilt insbesondere Zum Beweis von “(ii) ⇒ (i)“ seien λ1 , ..., λm ∈ K mit m k=1 k k m X λk ϕk (a) = 0 , k=1 und auf Grund der linearen Unabhängigkeit der Vektoren ϕ1 (a), ..., ϕm (a) folgt λ1 = ... = λm = 0. Damit ist die lineare Unabhängigkeit der Funktionen ϕ1 , ..., ϕm bewiesen. Nun zeigen wir noch “(i) ⇒ (iii)“. Angenommen, es gibt ein a ∈ I , so dass die Vektoren ϕ1 (a), ..., ϕm (a) linear abhängig sind. Dann gibt es Koeffizienten λ1 , ..., λm ∈ K, nicht alle gleich Null, mit m X λk ϕk (a) = 0. k=1 P Sei nun ϕ = m λ ϕ ∈ L 0 . Dann gilt ϕ(a) = 0. Nach Satz (15.2) besitzt das System y 0 = A(x)y nur eine k=1 k k Lösung ψ mit ψ(a) = 0, und das ist die Nullfunktion. Also folgt ϕ = 0, im Widerspruch zur Voraussetzung, dass die Funktionen ϕ1 , ..., ϕm linear unabhängig sind. —– 117 —– § 15. Systeme linearer Differentialgleichungen Es bleibt zu zeigen, dass dim L 0 = n gilt. Seien dazu e 1 , ..., e n die Einheitsvektoren im Rn . Für 1 ≤ k ≤ n sei ϕk ∈ L 0 das eindeutig bestimmte Element des Lösungsraums mit ϕk (a) = e k . Weil die Vektoren ϕ1 (a), ..., ϕn (a) linear unabhängig sind, gilt auf Grund der Implikation “(ii) ⇒ (i)“ dasselbe auch für die Funktionen ϕ1 , ..., ϕk . Daraus folgt zunächst dim L 0 ≥ n. Nehmen wir nun an, dass dim L 0 > n gilt. Dann gibt es n + 1 linear unabhängige Funktionen ψ1 , ..., ψn+1 in L 0 . Wegen “(i) ⇒ (iii)“ wären dann auch die Vektoren ψ1 (a), ..., ψn+1 (a) ∈ Kn linear unabhängig. Aber dies ist wegen dim Kn = n unmöglich. ä Jedes Tupel (ϕ1 , ..., ϕn ) von Elementen aus L 0 kann mit einer Funktion Φ : I → Mn,K identifiziert werden, bei der ϕ1 (a), ..., ϕn (a) für jedes a ∈ I jeweils die Spalten der Matrix Φ(a) sind. Die Funktionen ϕ1 , ..., ϕn bilden nach Satz (15.3) genau dann eine Basis von L 0 , wenn det Φ(a) 6= 0 gilt. Ist dies erfüllt, dann bezeichnet man Φ als ein Fundamentalsystem von Lösungen des linearen Systems. Durch Vergleich der einzelnen Spalten sieht man, dass Φ0 (x) = A(x)Φ(x) für alle x ∈ I gilt, wobei die Matrix Φ0 (x) durch Differentiation der einzelnen Einträge von Φ(x) zu Stande kommt. Beispiel: Für eine beliebige Konstante ω ∈ R+ betrachten wir das lineare System von DGL gegeben durch y 10 = −ωy 2 und y 20 = ωy 1 . In Matrixschreibweise ist dies y 0 = A(x)y mit der konstanten Funktion à ! 0 −ω A : R −→ M2,R , x 7→ . ω 0 Durch ϕ1 (x) = (cos(ωx), sin(ωx)) und ϕ2 (x) = (− sin(ωx), cos(ωx)) sind zwei spezielle Lösungen des Systems gegeben. Weiter ist à ! cos(ωx) − sin(ωx) Φ(x) = sin(ωx) cos(ωx) ein Fundamentalsystem von Lösungen, denn Φ(0) ist die Einheitsmatrix mit det Φ(0) = 1 6= 0. Nun wenden wir uns den Lösungsmengen der inhomogenen linearen Systeme zu. Satz 15.4 Sei y 0 = A(x)y + b(x) eine inhomogene lineare DGL, L die Menge ihrer Lösungen und L 0 der K-Vektorraum der Lösungen von y 0 = A(x)y. Ist ψ0 : I → Kn eine spezielle Lösung des inhomogenen Systems, dann gilt L = ψ0 + L 0 . Beweis: “⊆“ Sei ψ ∈ L und ϕ = ψ − ψ0 . Dann gilt für alle x ∈ I die Gleichung ϕ0 (x) = ψ0 (x) − ψ00 (x) = = (A(x)ψ(x) + b(x)) − (A(x)ψ0 (x) + b(x)) A(x)(ψ − ψ0 )(x) = A(x)ϕ(x). Dies zeigt, dass ϕ ∈ L 0 enthalten ist, und folglich gilt ψ = ψ0 + ϕ, also ψ ∈ ψ0 + L 0 . —– 118 —– § 15. Systeme linearer Differentialgleichungen “⊇“ Sei ψ ∈ ψ0 + L 0 , also ψ = ψ0 + ϕ für ein ϕ ∈ L 0 . Dann gilt ψ0 (x) (ψ0 + ϕ)0 (x) = = = ψ00 (x) + ϕ0 (x) A(x)(ψ0 + ϕ)(x) + b(x) A(x)ψ0 (x) + b(x) + A(x)ϕ(x) = = A(x)ψ(x) + b(x) und folglich ψ ∈ L . ä Die Methode der Variation der Konstanten lässt sich auf den mehrdimensionalen Fall verallgemeinern. Satz 15.5 Sei y 0 = A(x)y + b(x) ein inhomogenes lineares System von Differentialgleichungen und Φ ein Fundamentalsystem von Lösungen des zugehörigen homogenen Systems. Dann erhält man eine spezielle Lösung des inhomogenen Systems durch Z x ψ(x) = Φ(x)u(x) mit u(x) = Φ(t )−1 b(t ) d t . a Beweis: Aus ψ(x) = Φ(x)u(x) und u 0 (x) = Φ−1 (x)b(x) für alle x ∈ I folgt ψ0 (x) = Φ0 (x)u(x) + Φ(x)u 0 (x) Φ0 (x)u(x) + b(x) = = Φ0 (x)u(x) + Φ(x)Φ(x)−1 b(x) A(x)Φ(x)u(x) + b(x) = A(x)ψ(x) + b(x). = ä Beispiel: Wir betrachten das System linearer Differentialgleichungen gegeben durch y 10 = −y 2 , y 20 = y 1 + x. In Matrixschreibweise entspricht dies der Gleichung y 0 = A(x)y + b(x) mit à ! à ! 0 −1 0 A(x) = und b(x) = . 1 0 x Wie wir im vorherigen Beispiel gesehen haben, ist ! à cos(x) − sin(x) Φ(x) = sin(x) cos(x) für x ∈ R ein Fundamentalsystem von Lösungen der homogenen DGL y 0 = A(x)y. Es gilt à ! cos(x) sin(x) −1 Φ(x) = − sin(x) cos(x). Um eine spezielle Lösung des inhomogenen Systems zu erhalten, berechnen wir zunächst !à ! ! Z xà Z xà cos(t ) sin(t ) 0 t sin(t ) u(x) = dt = dt. t t cos(t ) 0 − sin(t ) cos(t ) 0 —– 119 —– § 15. Systeme linearer Differentialgleichungen Wir bestimmen die beiden Komponenten von u(x) durch partielle Integration. Es gilt Z x ¯x ¯x Z x ¯ ¯ cos(t ) d t = −t cos(t ) + sin(t )¯ = sin(x) − x cos(x) t sin(t ) d t = −t cos(t )¯ + 0 0 0 0 und x Z t cos(t ) d t 0 = ¯x Z ¯ t sin(t )¯ − 0 x sin(t ) d t 0 Wir erhalten somit à u(x) = = ¯x ¯ t sin(t ) + cos(t )¯ 0 sin(x) − x cos(x) cos(x) + x sin(x) − 1 = x sin(x) + cos(x) − 1. ! und ! sin(x) − x cos(x) = ψ(x) = Φ(x)u(x) = cos(x) + x sin(x) − 1 à ! à ! cos(x)(sin(x) − x cos(x)) − sin(x)(cos(x) + x sin(x) − 1) −x + sin(x) = sin(x)(sin(x) − x cos(x)) + cos(x)(cos(x) + x sin(x) − 1) 1 − cos(x) à cos(x) − sin(x) sin(x) cos(x) !à Wir formulieren die bisher erzielten Ergebnisse noch einmal für Differentialgleichungen höherer Ordnung. Definition 15.6 Sei I ⊆ R ein Intervall, und seien a k : I → K für 0 ≤ k < n und b : I → K stetige Funktionen. Dann ist y (n) + a n−1 (x)y (n−1) + ... + a 1 (x)y 0 + a 0 (x)y = b(x) (1) eine lineare Differentialgleichung n-ter Ordnung. Diese wird als homogen bezeichnet, wenn b = 0 ist, ansonsten als inhomogen. Satz 15.7 Gegeben sei eine lineare Differentialgleichung n-ter Ordnung der Form (1). (i) Die Lösungsmenge L 0 der homogenen linearen DGL ist ein n-dimensionaler KVektorraum. (ii) Ein System (ϕ1 , ..., ϕn ) von Lösungen der homogenen DGL ist genau dann linear unabhängig, wenn für ein (und damit für alle) x ∈ I die sogenannte WronskiDeterminante ϕ1 (x) ... ϕn (x) ... ϕ0n (x) ϕ01 (x) W (x) = det ungleich Null ist. .. .. . . ϕ(n−1) (x) ... ϕ(n−1) (x) n 1 Man nennt (ϕ1 , ..., ϕn ) in diesem Fall ein Fundamentalsystem von Lösungen der homogenen linearen DGL. —– 120 —– § 15. Systeme linearer Differentialgleichungen Beweis: Seien L̃ 0 die Lösungen des homogenen Systems linearer Differentialgleichungen gegeben durch y 00 = y 1 y 10 = y 2 , , 0 y n−2 = y n−1 ... , 0 , y n−1 = −a 0 (x)y 0 − a 1 (x)y 1 − ... − a n−1 (x)y n−1 . Wie wir in Kapitel 15 gesehen haben, ist durch ϕ 7→ (ϕ, ϕ0 , ..., ϕ(n−1) ) eine Bijektion L 0 → L̃ 0 gegeben. Damit ergeben sich alle Aussagen unmittelbar aus Satz (15.3). ä Als wichtigen Spezialfall der Theorie betrachten wir nun lineare Differentialgleichungen mit konstanten P Koeffizienten. Sei I ⊆ R ein Intervall. Jedem komplexen Polynom p ∈ C[t ] der Form p = nk=0 a k t k mit Koeffizienten a 0 , ..., a n ∈ C kann durch ∂ p ∂x µ n X ¶ = µ ak k=0 ∂ ∂x ¶k eine Abbildung auf dem Raum der n-mal differenzierbaren Funktionen zugeordnet werden, und zwar durch ¶ ∂ p ϕ ∂x µ = n X µ ak k=0 ∂ ∂x ¶k ϕ = n X a k ϕ(k) . k=0 ∂ ) einen Differentialoperator n-ter Ordnung. Beispielsweise handelt es sich bei der geMan nennt p( ∂x wöhnlichen Ableitung ϕ 7→ ϕ0 um einen Differentialoperator erster Ordnung. Proposition 15.8 Seien p, q ∈ C[t ] Polynome vom Grad ≤ n, außerdem I ⊆ R ein Intervall und ϕ : I → R eine 2n-mal differenzierbare Funktion. Dann gilt µ ¶ µ ¶ µ ¶ ∂ ∂ ∂ (i) (p + q) ϕ=p ϕ+q ϕ ∂x ∂x ∂x µ ¶ µ µ ¶ µ ¶¶ ∂ ∂ ∂ (ii) (pq) ϕ= p ◦q ϕ ∂x ∂x ∂x P P Beweis: Sei p = nk=0 a k t k und q = nk=0 b k t k . Für alle k ∈ N mit k > n setzen wir a k = b k = 0. Dann erhalten wir durch (i) die Rechnung à µ ¶ µ ¶k ! n n X X ∂ ∂ (a k + b k )ϕ(k) = (p + q) ϕ = (a k + b k ) ϕ = ∂x ∂x k=0 k=0 n X ak ϕ (k) k=0 + n X bk ϕ (k) = n X k=0 k=0 µ ak ∂ ∂x ¶k ϕ+ n X µ ak k=0 ∂ ∂x ¶k ϕ ¶ µ ¶ ∂ ∂ p ϕ+q ϕ. ∂x ∂x µ = Für den Beweis von (ii) bemerken wir zunächst, dass pq = 2n X k=0 ck t k mit ck = k X a i −k b k i =0 —– 121 —– = X i + j =k ai b j gilt. § 15. Systeme linearer Differentialgleichungen Die gewünschte Gleichung erhalten wir nun durch ! ! µ ¶Ã n µ ¶` à n µ ¶µ µ ¶ ¶ n X X X ∂ ∂ ∂ ∂ (k) (k) bk ϕ = q ϕ = p bk ϕ = a` p ∂x ∂x ∂x k=0 ∂x k=0 `=0 à ! µ ¶ 2n n 2n n X X X X X ∂ (k) (k) (`+k) ai b j ϕ = ck ϕ = (pq) a` bk ϕ = ϕ. ∂x k=0 k=0 i + j =k `=0 k=0 ä Lemma 15.9 (i) Für jedes λ ∈ C gilt ∂ λx λx ∂x (e ) = λe . (ii) Für jedes Polynom p ∈ C[t ] und jedes λ ∈ C gilt µ ¶ ∂ e λx = p(λ)e λx . p ∂x Beweis: zu (i) Für λ ∈ R folgt die Aussage unmittelbar aus der bekannten Ableitungsregel für die Exponentialfunktion. Sei nun λ ∈ C und λ = a + i b die Zerlegung von λ in Real- und Imaginärteil. Dann gilt ∂ λx (e ) ∂x ∂ ax (e (cos(bx) + i sin(bx))) ∂x = ae ax cos(bx) + e ax (−b sin(bx)) + i ae ax (sin(bx) + bi e ax cos(bx)) = = ∂ (a+i b)x (e ) ∂x = (a + i b)e ax cos(bx) + i (a + i b)e ax sin(bx) (a + i b)e ax (cos(bx) + i sin(bx)) zu (ii) Sei p = = = (a + i b)e (a+i b)x = λe λx . Pn a k t k . Durch Anwendung von (i) erhalten wir µ ¶k µ ¶ n n X X ∂ ∂ λx e = ak e λx = a k λk e λx p ∂x ∂x k=0 k=0 k=0 = p(λ)e λx . ä P Satz 15.10 Sei p ∈ C[t ] ein Polynom vom Grad n der Form p = t n + n−1 a t k , mit n k=0 k paarweise verschiedenen Nullstellen λ1 , ..., λn ∈ C. Dann bilden die Funktionen ϕk : R −→ C , x 7→ e λk x ein Fundamentalsystem von Lösungen der linearen Differentialgleichung n-ter Ordnung µ ¶ ∂ p y = y (n) + a n−1 y (n−1) + ... + a 1 y 0 + a 0 y = 0. ∂x —– 122 —– § 15. Systeme linearer Differentialgleichungen ∂ Beweis: Nach Lemma (15.9) gilt p( ∂x )ϕk = p(λk )e λk x = 0 für 1 ≤ k ≤ n. Damit ist jede der Funktionen ϕk jedenfalls eine Lösung der DGL. Zum Nachweis der linearen Unabhängigkeit des Systems verwenden wir Satz (15.7). Für 0 ≤ m < n gilt ϕk(m) (x) = λm e λk x für alle x ∈ R. Die Wronski-Determinante an der Stelle k x 0 = 0 ist also gegeben durch W (0) = 1 λ1 det .. . λn−1 1 1 λ2 .. . λn−1 2 ··· ... ··· 1 λn .. . λn−1 n Es handelt sich um eine sogenannte Vandermonde-Determinante. Durch vollständige Induktion über n zeigt man leicht, dass Y (λi − λ j ) 6= 0 gilt. detW (0) = i>j Also sind die Lösungen ϕ1 , ..., ϕn tatsächlich linear unabhängig. ä Beispiel 1: Wir betrachten die DGL y 000 − y 00 − 2y 0 = 0. Das entsprechende Polynom p ist gegeben durch p t 3 − t 2 − 2t = = t (t + 1)(t − 2) , und die Nullstellen sind λ1 = 0, λ2 = −1 und λ3 = 2. Also ist durch ϕ1 (x) = 1, ϕ2 (x) = e −x und ϕ3 (x) = e 2x ein Fundamentalsystem von Lösungen gegeben. Beispiel 2: Für beliebiges ω ∈ R+ betrachten wir die DGL y 00 + ω2 y = 0. Das zugehörige Polynom ist p = t 2 + ω2 = (t − i ω)(t + i ω) mit den Nullstellen λ1 = i ω und λ2 = −i ω. Damit ist durch ϕ1 (x) = e i ωx und ϕ2 (x) = e −i ωx ein Fundamentalsystem von Lösungen gegeben. In physikalischen Anwendungen ist man häufig eher an einem reellwertigen System von Lösungen interessiert. Wir bilden dazu die Linearkombinationen ψ1 (x) = 1 1 2 ϕ1 (x) + 2 ϕ2 (x) = 1 1 2 (cos(ωx) + i sin(ωx)) + 2 (cos(ωx) − i sin(ωx)) = cos(ωx) und 1 1 ϕ1 (x) − ϕ2 (x) = sin(ωx). 2i 2i Auch (ψ1 , ψ2 ) ist eine Basis des Lösungsraums. Die Matrix des Basiswechsels von (ψ1 , ψ2 ) nach (ϕ1 , ϕ2 ) ist gegeben durch à ! 1 1 1 2 −i i ψ2 (x) = —– 123 —– § 15. Systeme linearer Differentialgleichungen Wir verallgemeinern das Verfahren zur Bestimmung eines Fundamentalsystems von Lösungen nun auf Polynome mit mehrfachen Nullstellen, also auf Polynome der Form p = r Y (t − λi )e i , i =1 wobei λ1 , ..., λr ∈ C paarweise verschiedene komplexe Zahlen und e 1 , ..., e r natürliche Zahlen bezeichnen. Lemma 15.11 Sei λ ∈ C und k ∈ N0 . Dann gilt für jede auf einem Intervall I ⊆ R mindestens k-mal differenzierbare Funktion f : I → C die Gleichung µ ¶k ∂ − λ ( f (x)e λx ) ∂x = f (k) (x)e λx . Beweis: Wir beweisen die Aussage durch vollständige Induktion über k. Für k = 0 ist nichts zu zeigen. Den Induktionsschritt von k auf k + 1 erhält man durch die Rechnung µ ¶k+1 µ ¶ ∂ ∂ −λ ( f (x)e λx ) = − λ ( f (k) (x)e λx ) = ∂x ∂x f (k+1) (x)e λx + f (k) (x)λe λx − λ f (k) (x)e λx = f (k+1) (x)e λx . Wir im reellwertigen Fall bezeichnen wir eine Funktion g : R → C als Polynomfunktion vom Grad k ∈ N, wenn es Koeffizienten a 0 , ..., a k ∈ C mit a k 6= 0 gibt, so dass g (x) = k X ai x i für alle x ∈ R erfüllt ist. i =0 Lemma 15.12 Sei p ∈ C[t ] und λ ∈ C mit p(λ) 6= 0. Ist g : R → C eine Polynomfunktion vom Grad k, dann gibt es eine weitere Polynomfunktion h : R → C vom selben Grad mit µ ¶ ∂ p (g (x)e λx ) = h(x)e λx für alle x ∈ R. ∂x P Beweis: Sei p vom Grad n. Wir schreiben p in der Form p = ni=0 c i (t − λ)i , mit geeigneten Koeffizienten c i ∈ C. Dies ist möglich, da die Polynome g i = (t − λ)i mit 0 ≤ i ≤ n über C linear unabhängig sind. Wegen p(λ) 6= 0 ist c 0 6= 0. Nun gilt auf Grund des vorherigen Lemmas µ ¶ µ ¶i n n X X ∂ ∂ λx (g (x)e ) = ci − λ (g (x)e λx ) = c i g (i ) (x)e λx . p ∂x ∂x i =0 i =0 —– 124 —– § 15. Systeme linearer Differentialgleichungen Die gesuchte Polynomfunktion h ist also durch h(x) = Pn i =0 c i g (i ) (x) gegeben. ä Q Satz 15.13 Sei p ∈ C ein Polynom der Form ri=1 (t − λi )e i , mit paarweise verschiede∂ )y = 0 ein nen λ1 , ..., λr ∈ C und e 1 , ..., e r ∈ N. Dann besitzt die Differentialgleichung p( ∂x Fundamentalsystem von Lösungen bestehend aus den Funktionen ϕi m (x) = x m e λi x , 0 ≤ m < ei , 1 ≤ i ≤ r. Beweis: Wir zeigen zunächst, dass die Funktionen ϕi m tatsächlich Lösungen der DGL sind. Für 1 ≤ i ≤ m sei das Polynom q i ∈ C[t ] jeweils der Faktor in der Zerlegung p = (t −λi )e i q i . Auf Grund von Lemma (15.11) und wegen e i > m gilt ¶ ∂ p ϕi m ∂x µ µ = qi ∂ ∂x ¶µ ∂ − λi ∂x ¶e i m λi x (x e µ ) = qi ∂ ∂x ¶ µµ ∂ ∂x ¶e i m (x ) · e λi x ¶ = 0. Nun beweisen wir noch die lineare Unabhängigkeit des Systems. Eine beliebige Linearkombination der Funktionen ϕi m kann in der Form r X g i (x)e λi x i =1 dargestellt werden, mit geeigneten Polynomfunktionen g i vom Grad ≤ e i − 1. Zu zeigen ist, dass diese Linearkombination nur dann gleich Null ist, wenn alle Polynomfunktionen gleich Null sind. Wir zeigen dies durch vollständige Induktion über r . Aus g 1 (x)e λi x = 0 für alle x ∈ R folgt offenbar g 1 = 0. Setzen wir nun die Aussage für r − 1 als gültig voraus, und sei r X g i (x)e λi x = 0. i =1 Wenn eine der Polynomfunktionen g i gleich Null ist, folgt die Behauptung unmittelbar aus der Induktions∂ −λr )e r auf die Gleichung an. Dann voraussetzung. Ansonsten wenden wir den Differentialoperator D = ( ∂x verschwindet der letzte Summand, und nach Lemma (15.12) gibt es Polynomfunktionen h i desselben Grades wie g i mit D(g i (x)e λi x ) = h i (x)e λi x für 1 ≤ i ≤ r − 1. Wir erhalten die Gleichung rX −1 h i (x)e λi x = 0. i =1 Da alle h i 6= 0 sind, widerspricht dies der Induktionsvoraussetzung. Also muss bereits g i = 0 für 1 ≤ i ≤ r gelten. ä Beispiel: Wir betrachten die DGL y (4) + 8y 00 + 16y = 0. Das zugehörige Polynom ist p = t 4 + 8t 2 + 16 = (t 2 + 4)2 —– 125 —– = (t − 2i )2 (t + 2i )2 . § 15. Systeme linearer Differentialgleichungen Die beiden Nullstellen sind also λ1 = 2i und λ2 = −2i , mit Vielfachheiten e 1 = e 2 = 2. Auf Grund des Satzes ist also durch ϕ1,0 (x) = e 2i x ϕ1,1 (x) = xe 2i x , , ϕ2,0 (x) = e −2i x ϕ2,1 (x) = xe −2i x , ein Fundamentalsystem von Lösungen gegeben. Um ein System aus reellwertigen Funktionen zu erhalten, bilden wir die Linearkombinationen ψ1 (x) = 1 1 2 ϕ1,0 (x) + 2 ϕ2,0 (x) = 1 2i x 2e + 12 e −2i x 1 1 2 (cos(2x) + i sin(2x)) + 2 (cos(2x) − i sin(2x)) ψ2 (x) = 1 1 2i ϕ1,0 (x) − 2i ϕ2,0 (x) = 1 2i x 2i e = 1 1 2 ϕ1,1 (x) + 2 ϕ2,1 (x) = 2i x 1 2 xe − 2i1 e −2i x = 1 1 2i ϕ1,1 (x) − 2i ϕ2,1 (x) = 1 2i = sin(2x) = + 12 xe −2i x 1 1 2 (x cos(2x) + i x sin(2x)) + 2 (x cos(2x) − i x sin(2x)) ψ4 (x) cos(2x) = 1 1 2i (cos(2x) + i sin(2x)) − 2i (cos(2x) − i sin(2x)) ψ3 (x) = = = x cos(2x) xe 2i x − 2i1 xe −2i x 1 1 2i (x cos(2x) + i x sin(2x)) − 2i (x cos(2x) − i x sin(2x)) = = x sin(2x) Auch (ψ1 , ψ2 , ψ3 , ψ4 ) ist ein Fundamentalsystem von Lösungen, denn die Funktionen des Systems (ϕ1,0 , ϕ1,1 , ϕ2,0 , ϕ2,1 ) können durch Bildung geeigneter Linearkombinationen aus den ψi zurückgewonnen werden. Betrachten wir nun inhomogene Differentialgleichungen n-ter Ordnung, also Gleichungen der Form µ ¶ ∂ y = b(x) p ∂x mit einer stetigen Funktion b : I → C auf einem Intervall I ⊆ R. In dieser allgemeinen Situation kann eine Lösung bestimmt werden, indem man die Gleichung in ein System erster Ordnung übersetzt und darauf die Variation der Konstanten anwendet (Satz (15.5)). Besitzt die Funktion b aber eine spezielle Form, gibt es einen einfacheren Weg. Zunächst bemerken wir Lemma 15.14 Seien m ∈ N, b 1 , ..., b m : I → C stetige Funktionen auf einem Intervall ∂ I ⊆ R und p ∈ C[t ]. Für 1 ≤ i ≤ m sei ψ j eine Lösung der DGL p( ∂x )y = b j (x). Dann ist Pm ∂ ψ(x) = j =1 ψ j (x) eine Lösung von p( ∂x )y = b(x). —– 126 —– § 15. Systeme linearer Differentialgleichungen ∂ ∂ Beweis: Aus der Linearität des Operators ∂x folgt unmittelbar die Linearität von p( ∂x ), d.h. für hinreichend oft differenzierbare Funktionen ψ, ψ̃ und λ ∈ C gilt µ ¶ µ ¶ µ ¶ µ ¶ µ ¶ ∂ ∂ ∂ ∂ ∂ p (ψ + ψ̃) = p (ψ) + p (ψ̃) und p (λψ) = λp (ψ). ∂x ∂x ∂x ∂x ∂x Damit ergibt sich die Aussage aus der Rechnung ! µ ¶Ã m µ ¶ m X X ∂ ∂ p ψ j (x) = p (ψ j (x)) ∂x j =1 ∂x j =1 m X = b j (x) = b(x). ä j =1 Satz 15.15 Seien p ∈ C[t ], c ∈ C und µ ∈ C mit p(µ) 6= 0. ³ ´ ∂ c (i) Die DGL p ∂x y = ce µx hat ψ(x) = p(µ) e µx als Lösung. (ii) Sei allgemeiner³ m ´∈ N und f : R → C eine Polynomfunktion vom Grad m. Dann ∂ hat die DGL p ∂x y = f (x)e µx eine Lösung der Form ψ(x) = g (x)e µx , mit einer geeigneten Polynomfunktion g vom Grad m. Beweis: zu (i) Dies folgt direkt aus der Rechnung µ ¶ µ ¶ ∂ ∂ c µx p ψ(x) = p e ∂x ∂x p(µ) = cp(µ) µx e p(µ) = ce µx , wobei im zweiten Schritt Lemma (15.9) (ii) angewendet wurde. zu (ii) Hier führen wir den Beweis durch vollständige Induktion über m = grad( f ), wobei der Fall m = 0 durch (i) bereits erledigt ist. Sei nun m ∈ N, und setzen wir die Aussage für Polynomfunktionen vom Grad ≤ m − 1 voraus. Nach Lemma (15.12) existiert eine Polynomfunktion f 0 vom Grad m mit µ ¶ ∂ (x m e µx ) = f 0 (x)e µx . p ∂x Für ein geeignetes c ∈ C ist f 1 = f − c f 0 eine Polynomfunktion vom Grad ≤ m − 1. Wir können die Induktionsvoraussetzung anwenden und erhalten eine Polynomfunktion g 1 vom Grad ≤ m − 1 mit µ ¶ ¢ ∂ ¡ p g 1 (x)e µx = f 1 (x)e µx . ∂x Setzen wir nun g (x) = cx m + g 1 (x), dann ist g eine Polynomfunktion vom Grad m, und es gilt µ ¶ µ ¶ µ ¶ ¢ ∂ ¡ ∂ ∂ p g (x)e µx = cp (x m e µx ) + p (g 1 (x)e µx ) = ∂x ∂x ∂x c f 0 (x)e µx + f 1 (x)e µx = f (x)e µx . —– 127 —– ä § 15. Systeme linearer Differentialgleichungen Beispiel: Wir bestimmen eine Lösung der DGL dritter Ordnung y 000 − 2y 00 − 2y 0 + 2y 2 sin(x). = Setzen wir p = x 3 − 2x 2 − 2x + 2, dann erhält man diese Gleichung wegen e i x = cos(x) + i sin(x) als Imaginärteil von µ ¶ ∂ p y = 2e i x . ∂x Es gilt p(i ) = i 3 −2i 2 −2i +2 = −i +2−2i +2 = 4−3i 6= 0. Nach Satz (15.15) (i) ist ψC (x) = der komplexen DGL. Wegen 2 p(i ) = 2 4 − 3i 2(4 + 3i ) (4 − 3i )(4 + 3i ) = = 2 ix p(i ) e eine Lösung 1 25 (8 + 6i ) gilt ψC (x) = 1 25 (8 + 6i )(cos(x) + i sin(x)) = ¡ 8 6 25 cos(x) − 25 sin(x) ¢ +i ¡ 6 8 25 cos(x) + 25 sin(x) ¢ . Also ist der Imaginärteil von ψC (x), und damit eine Lösung der reellen Ausgangsgleichung, gegeben durch ψ(x) = 6 8 25 cos(x) + 25 sin(x). Definition 15.16 Ein homogenes System linearer DGL mit konstanten Koeffizienten ist eine Gleichung der Form y 0 = Ay, wobei A = (a i j ) eine komplexe n × n-Matrix bezeichnet. In ausgeschriebener Form handelt es sich also um das System y i0 = n X ai j y j , 1≤i ≤n j =1 von Differentialgleichungen. Aus Satz (15.3) ist bekannt, dass der Lösungsraum von y 0 = Ay ein n-dimensionaler C-Vektorraum ist. Um diesen zu beschreiben, wiederholen wir einige Begriffe aus der Linearen Algebra. Ist A ∈ Mn,C und λ ∈ C, so nennt man v ∈ Cn einen Eigenvektor der Matrix A zum Eigenwert λ, wenn Av = λv und v 6= 0Cn gilt. Man bezeichnet A als diagonalisierbar, wenn A ähnlich zu einer Diagonalmatrix ist. Dies bedeutet, dass eine Diagonalmatrix D ∈ Mn,C und eine invertierbare Matrix S ∈ GLn (C) existieren, so dass D = S AS −1 erfüllt ist. Eine Matrix A ist genau dann diagonalisierbar, wenn eine Basis von Cn existiert, die ausschließlich aus Eigenvektoren von A besteht. —– 128 —– § 15. Systeme linearer Differentialgleichungen Satz 15.17 Sei A ∈ Mn,C . (i) Ist λ ∈ C ein Eigenwert von A und v ∈ Cn ein zugehöriger Eigenvektor, dann ist ϕ : R → Cn , x 7→ e λx v eine Lösung von y 0 = Ay. (ii) Setzen wir nun voraus, dass A diagonalisierbar ist. Sei (v 1 , ..., v n ) eine Basis von bestehend aus Eigenvektoren v k ∈ Cn von A, und seien λ1 , ..., λn ∈ C die zugehörigen Eigenwerte. Dann bilden die Funktionen ϕk : R → Cn gegeben durch ϕk (x) = e λk x für 1 ≤ k ≤ n ein Fundamentalsystem für y 0 = Ay. (iii) Sei S ∈ GLn (C) und B = S AS −1 . Genau dann ist ϕ : R → Cn eine Lösung von y 0 = Ay, wenn ψ : R → Cn gegeben durch ψ(x) = Sϕ(x) eine Lösung von z 0 = B z ist. Beweis: zu (i) Für alle x ∈ R gilt ϕ0 (x) = λve λx = Ave λx = Aϕ(x). zu (ii) Dies folgt aus der Tatsache, dass die Startvektoren ϕk (0) = v k und somit auch die Lösungsfunktionen ϕ1 , ..., ϕn linear unabhängig sind (vgl. Satz (15.3)). zu (iii) Für alle x ∈ R gilt ψ0 (x) = Sϕ0 (x). Daraus folgt die Äquivalenz ϕ0 (x) = Aϕ(x) ⇔ S −1 ψ0 (x) = AS −1 ψ(x) ⇔ SS −1 ψ0 (x) = S AS −1 ψ(x) ⇔ ψ0 (x) = B ψ(x). ä Aus Teil (iii) des Satzes ergibt sich das folgende Lösungsschema für Systeme der Form y 0 = Ay mit diagonalisierbarer Matrix A ∈ Mn,C : Zunächst bestimmt man mit den Methoden der Linearen Algebra eine Matrix S ∈ GLn (C), so dass D = S AS −1 eine Diagonalmatrix ist. Sind dann λ1 , ..., λn die Einträge auf der Diagonalen von D, dann bilden die Funktionen ϕk (x) = e λk x Se k , 1≤k ≤n ein Fundamentalsystem für y 0 = Ay. (Ist A über C nicht diagonalisierbar, dann benötigt man die Jordansche Normalform von A zur Bestimmung eines Fundamentalsystems. Näheres dazu findet man in [Wa], Kap. III, §17.) Zum Abschluss diskutieren wir die möglichen Lösungen für eine DGL der Form y 0 = Ay mit A ∈ M2,R . 1. Fall: A ist über R diagonalisierbar In diesem Fall besitzt A zwei linear unabhängige Eigenvektoren v 1 , v 2 ∈ R2 mit zugehörigen Eigenwerten λ1 , λ2 ∈ R. Nach Satz (15.17) (ii) bilden die Funktionen ϕ1 (x) = e λ1 x v 1 und ϕ2 (x) = e λ2 x v 2 ein Fundamentalsystem für y 0 = Ay. Dabei ist sowohl λ1 = λ2 als auch λ1 6= λ2 möglich. —– 129 —– § 15. Systeme linearer Differentialgleichungen 2. Fall: A ist über C, aber nicht über R diagonalisierbar Hier besitzt A ein Paar (λ, λ̄) von konjugiert-komplexen Eigenvektoren, mit λ ∈ C \ R. Ist v = u + i w ∈ C2 ein Eigenvektor zum Eigenwert λ (mit u, w ∈ R2 ), dann ist der konjugiert-komplexe Vektor v̄ = u − i w ein Eigenvektor zu Eigenwert λ̄. Die Funktionen ϕ1 (x) = e λx v ϕ2 (x) , = e λ̄x v̄ bilden ein komplexes Fundamentalsystem für y 0 = Ay. Zerlegen wir den Eigenwert λ in Real- und Imaginärteil, λ = µ + i ω mit µ, ω ∈ R, dann erhält man durch ψ1 (x) = 1 2 (ϕ1 (x) + ϕ2 (x)) = e µx (cos(ωx)u − sin(ωx)w) ψ2 (x) = 1 2i (ϕ1 (x) − ϕ2 (x)) = e µx (sin(ωx)u + cos(ωx)w) ein reelles Fundamentalsystem. 3. Fall: A ist über C nicht diagonalisierbar Dann hat A nur einen Eigenwert λ ∈ R. Aus der Theorie der Jordanschen Normalformen ist bekannt, dass eine Matrix S ∈ GL2 (R) mit à ! λ 1 −1 S AS = existiert. 0 λ Sei B = S AS −1 . Wie man leicht nachrechnet, bilden dann die Funktionen à ! à ! λx 1 λx x ψ1 (x) = e , ψ2 (x) = e 0 1 ein (reelles) Fundamentalsystem für z 0 = B z. Mit Satz (15.17) (iii) erhält man das Fundamentalsystem ϕ1 (x) = Sψ1 (x), ϕ2 (x) = Sψ2 (x) für die Ausgangsgleichung y 0 = Ay. —– 130 —– Literatur [Au] B. Aulbach, Gewöhnliche Differentialgleichungen. Spektrum Akademischer Verlag, München 2004. [Fi] W. Fischer, I. Lieb, Funktionentheorie. Springer-Verlag, Berlin 2004. [Fo] O. Forster, Analysis 2. vieweg-Verlag, 5. Auflage, 1993. [Jä] K. Jänich, Funktionentheorie. Springer-Verlag, Berlin 2004. [Kö] K. Königsberger, Analysis 2. Springer-Verlag, Berlin 2000. [Wa] W. Walter, Gewöhnliche Differentialgleichungen. Springer-Verlag, Berlin 2000. [Wi] P. Wittbold, Vorlesungsskript Analysis III. Universität Essen-Duisburg, Wintersemester 2008-09.
© Copyright 2024 ExpyDoc