Werner Universität Münster SS 10 Gewöhnliche Differentialgleichungen (Kurzskript)1 1 Diesem Skript liegt zum Teil eine in LATEX abgefasste Mitschrift einer früheren Veranstaltung des Verfassers zu Grunde, welche von Stefan Girke, Michael Holl und Sven Kaulmann erstellt worden ist. Gewöhnliche Differentialgleichungen (Kurzskript) 2 Kapitel 1 Definitionen. Einige geschlossen lösbare Beispiele 1.1 Einführung Differentialgleichungen spielen eine wichtige Rolle bei der mathematischen Modellierung von Vorgängen, die von einem Parameter (üblicherweise der Zeit) abhängen. In der numerischen Mathematik beschäftigt man sich mit näherungsweisen Lösungen. Wir werden uns hier mit ein paar wenigen Beispielen befassen, die man direkt lösen kann, sodann wichtigen Existenz- und Eindeutigkeitsaussagen herleiten und uns schließlich mit Methoden befassen, die es erlauben, qualitative Aussagen über das Verhalten von Lösungen zu treffen, selbst wenn eine geschlossene Berechnung dieser Lösungen nicht möglich ist. 1.1.1 Zwei Beispiele Es ist eine Kunst für sich, Probleme der “realen” Welt in ein mathematisches zu übersetzen. Meist müssen bei dieser Gelegenheit Annahmen gemacht werden, die sich nicht mathematisch begründen lassen sondern aus dem Bereich stammen, in dem Mathematik angewandt werden soll. Hier ist ein sehr einfaches Beispiel: Es sei B(t) die Anzahl der Bakterien in einer Kultur. Wir gehen davon aus, dass der Zuwachs dieser Kolonie während eines Zeitintervalls ∆t, das so klein sein muss, dass Enkel noch keine Rolle spielen, proportional sowohl zur Menge der bereits vorhandenen Bakterien als auch zu ∆t ist. Ist der Proportionalitätsfaktor α, dann heißt das B(t + ∆t) − B(t) = αB(t)∆t Da diese Beziehung für alle ∆t gelten soll, kann man für alle Zeiten t den Grenzwert ∆t → 0 betrachten(falls man annimmt, dass B eine differenzier3 Gewöhnliche Differentialgleichungen (Kurzskript) 4 bare Funktion der Zeit ist) und schließen1 B 0 (t) = lim ∆t→0 B(t + ∆t) − B(t) = αB(t). ∆t Kurz: Eine Funktion B, die das Bakterienwachstum in dieser Weise modelliert, muss notwendigerweise der Gleichung B 0 = αB genügen.— Funktionen, die diese Gleichung erfüllen sind etwa die Exponentialfunktionen B(t) = A0 exp(αt), A0 ∈ R. Könnte es Bakterien geben, deren Wachstum ebenfalls durch B 0 = αB beschrieben wird, die jedoch in einer ganz anderen Weise als exponentiell anwachsen? Die Antwort lautet nein, und wir werden uns im Folgenden auch mit ganz allgemeinen Methoden beschäftigen, eine solche Frage zu beantworten. 2 Ein paar Bemerkungen noch zu diesem Beispiel: Normalerweise ist natürlich nicht davon auszugehen, dass eine Bakterienkultur in der Lage ist, zu allen Zeiten exponentiell zu wachsen. Es gibt eine ganze Reihe von Möglichkeiten, ein solches Wachstum in realistischer Weise zu beschränken. Hier kommt eine etwas kompliziertere Variante: Wir gehen von zwei Populationen aus, Räubern und deren Beute. Die Anzahl der ersten zum Zeitpunkt t beschreiben wir durch die Funktion R(t), die Anzahl der Beutetier sei B(t). Dann gelangt man durch eine ähnlich Überlegung wie oben zu zwei Gleichungen R0 = −αR + βRB B 0 = γB − δRB Dies ist ein (nichtlineares) System von Differentialgleichungen. Es ist in diesem Fall nicht mehr gut möglich, die Funktionen R und B direkt anzugeben. Mit etwas anspruchsvolleren Methoden gelingt es aber vorherzusagen, ob die Beute (und damit auch die Räuber) aussterben. 1.1.2 Eine Definition Das erste Beispiel des letzten Paragraphen fällt unter die folgende Definition; das zweite ist ein sogenanntes System gewöhnlicher Differentialgleichungen. 1 So, wie wir B(·) definiert hatten ist sie allerdings nicht einmal stetig; am einfachsten stellt man sich vor, dass die Funktion B zwischen den durch die Bakteriengeburten entsthehenden Sprungstellen differenzierbar interpoliert und die wahre Anzahl der Bakterien bis auf die erste Kommastelle genau vorhersagt — was viel besser wäre als die Situation im Labor hergibt. 2 Man sieht hier übrigens, dass die Lösung einer Differentialgleichung selbst nicht unbedingt (eigentlich sogar fast nie) eindeutig bestimmt ist. Dies ändert sich, sobald man von einem Anfangswert B0 zum Zeitpunkt t0 ausgeht und nach Lösungen sucht, die diese sogenannte Anfangswertbedingung erfüllt. Hier wäre B(t) = B0 exp [α(t − t0 )] die einzige (wie wir noch sehen werden) Lösung der Differentialgleichung, die der Bedingung B(t0 ) = B0 genügt. 5 Werner, Universität Münster, SS 10 Diese werden wir im 3.Abschnitt dieses Kapitels beginnen genauer zu betrachten. Definition 1 Eine (gewöhnliche) Differentialgleichung n-ter Ordnung ist eine Gleichung der Form F (x, y, y 0 , . . . , y (n) ) = 0 wobei F : D → R und D ⊂ Rn+1 offen ist. (i) Die Differentialgleichung heißt explizit, falls, für eine geeignete Funktion f , F (x, y, y 0 , . . . , y (n) ) = y (n) −f (x, y, y 0 , . . . , y (n−1) ), d.h. falls man die erste Gleichung in der Form y (n) = f (x, y, y 0 , . . . , y (n−1) ) schreiben kann. (ii) Eine Lösung der Gleichung F (x, y, y 0 , . . . , y (n) ) = 0 ist eine n-fach differenzierbare Funktion y : I → R, wobei I ⊆ R ein offenes Intervall ist und für alle x ∈ I gilt (x, y(x), y 0 (x), . . . , y (n) (x)) ∈ D sowie F (x, y(x), y 0 (x), . . . , y (n) (x)) = 0 (iii) Tritt zu der Gleichung F (x, y, y 0 , . . . , y (n) ) = 0 die Bedingung y (ν) (ξ) = ην , ν = 0, . . . , n − 1 hinzu, so nennt man dies ein Anfangswertproblem. Gelöst wird es durch eine Funktionen, welche sowohl die Differentialgleichung als auch diese Bedingung erfüllt. 1.2 1.2.1 Differentialgleichungen erster Ordnung Richtungsfelder Eine explizite Differentialgleichung 1.Ordnung y 0 = f (x, y) lässt sich gut anschaulich darstellen: Durch ihre rechte Seite wird ja jedem Punkt (x, y) der Ebene (hier sind x und y Zahlen!) ein Anstieg zugewiesen. Diesen kann man sich durch einen Pfeil fester (aber hier unbedeutender) Länge repräsentiert vorstellen, der am Punkt (x, y) angeheftet wird. Eine solche Darstellung könnte einen vielleicht auf den Gedanken bringen, dass jede nicht allzu bösartige rechte Seite der Differentialgleichung auf jeden Fall Lösungskurven zulässt. Dies ist tatsächlich der Fall, wie wir sp’ater noch sehen werden. Gewöhnliche Differentialgleichungen (Kurzskript) 6 Abbildung 1.1: Richtungsfeld für die Gleichung y 0 = x2 + y 2 sowie die Lösungskurven für die Anfangswertprobleme y1 (0) = 1, y2 (0) = 0 und y3 (0) = −1 1.2.2 Differentialgleichungen mit getrennten Veränderlichen Eine Differentialgleichung der Form y 0 f (y) = g(x) nennt man eine Differentialgleichung mit getrennten Veränderlichen. Für eine Lösungsfunktion y = y(x) ist ja y 0 (x)f (y(x)) die Ableitung der Funktion x 7−→ F (y(x)), falls F eine Stammfunktion von f ist. Besitzt g(x) die Stammfunktion G, so muss nach dem Mittelwertsatz eine Konstante C ∈ R existieren mit F (y(x)) = G(x) + C. Also: Ist y eine Lösungsfunktion der Differentialgleichung y 0 f (y) = g(x), so erfüllt sie die Beziehung F (y(x)) = G(x) + C für alle x, für die die Stammfunktionen F und G von f bzw. g definiert sind, sowie für ein festes C ∈ R. Umgekehrt folgt leicht durch Ableiten nach x, dass jede Funktion, die einer solchen Gleichung genügt, Lösung der Gleichung y 0 f (y) = g(x) ist. Der Begriff ‘Differentialgleichung mit getrennten Veränderlichen’ wird häufig für Differentialgleichungen der Form y 0 = ϕ(x)ψ(y) verwandt. Für 7 Werner, Universität Münster, SS 10 die Lösungen einer solchen Gleichung ist dann ein wenig Sorgfalt nötig, falls ψ Nullstellen besitzt. Beispiel Es sei p y 0 = 2 sign(y) |y| √ Ist y > 0, so erhalten wir y 0 = 2 y, woraus nach Division die Lösungen y(x) = (x + C)2 , C ∈ R, entstehen. Diese sind im Prinzip wegen der Bedingung y > 0 zunächst nur für x > −C Lösungen; es zeigt sich aber, dass diese Funktionen Lösungen bleiben, wenn man sie in x = −C durch den Wert 0 ergänzt. In derselben Weise bekommen wir es mit der Gleichung √ y 0 = −2 −y zu tun, falls wir y < 0 voraussetzen. Dieses Mal ergeben sich die Lösungen y(x) = −(x + C)2 , x < −C, C ∈ R, und auch diese können wieder in den Punkt x = −C hinein durch 0 zu Lösungen ergänzt werden.– Schließlich ist auch die konstante Nullfunktion auf jedem kleinen Intervall eine Lösung. Das Besondere hier ist, dass man aus diesen drei Lösungstypen (y = ±(x + C)2 , y = 0) abschnittweise neue Lösungen zusammensetzen kann. Damit besitzt jedes Anfagswertproblem y(ξ) = 0 (überabzählbar) unendlich viele Lösungen, die so gewählt werden können, dass sie in jeder zuvor gewählten kleinen R2 -Umgebung von ξ verlaufen. Gebremstes Wachstum Es gibt verschiedene Möglichkeiten, das ungebremste, exponentielle Wachstum, das die Differentialgleichung y 0 = αy für α > 0 hervorruft, an Situtationen anzupassen, bei denen es schließlich zu einer Verminderung des Zuwachses kommt. Eine dieser Möglichkeiten ist y 0 = αy − βy 2 , α, β > 0 Man kann sich diese Gleichung durch das Hinzutreten eines Terms entstanden denken, der die Verantwortung für ein gebremstes Wachstum dem Zusammentreffen zweier durch y beschriebenen Akteure zuordnet. Für eine vereinfachte Rechnung schreiben wir 1 0 y = αy 1 − y κ Die Lösungsfunktionen für diese Gleichung sind für y 6= 0, κ formal durch die Gleichung Z Z dy = α dx + C, C∈R y 1 − κ1 y gegeben. Durch eine (hier sehr einfache) Partialbruchzerlegung erhält man Z Z y dy 1 1 , = − dy = ln y y−κ y − κ y 1 − κ1 y Gewöhnliche Differentialgleichungen (Kurzskript) 8 und die Lösungen, von denen wir aus technischen Gründen zunächst annehmen, dass sie die Werte 0, κ nicht annehmen, sind durch die Beziehung κ −αx Ce = 1 − , C > 0, y gekennzeichnet. Unterscheidet man die Fälle y > κ, y < κ, so ergeben sich hieraus die beiden Lösungstypen y1 (x) = κ , 1 − Ce−αx sowie y2 (x) = κ , 1 + Ce−αx C>0 Schließlich ist auch leicht zu sehen, dass y = κ und y = 0 Lösungen sind. Wie sich zeigt, liegen die y1 (für x groß genug) strikt oberhalb von κ, während die y2 sich strikt unterhalb aufhalten. Außerdem gilt lim y1,2 (x) = κ x→∞ sowie lim y1,2 (x) = 0. x→−∞ Die Lösungen y1 sind etwas mit Vorsicht zu genießen, da sie für Ce−αx = 1 nicht definiert sind (was der Differentialgleichung nicht unmittelbar anzusehen ist). 1.2.3 Lineare Differentialgleichungen erster Ordnung Geht man bei der Modellierung von Wachstum von einer zeitlichen Abhängigkeit der Wachstumsrate aus, so gelangt man zu einer Differentialgleichung der Form y 0 + α(t)y = 0 Diese ist natürlich nicht neu und ihre Lösungen sind, nach Fallunterscheidung y > 0, y < 0, Z y(t) = C exp − α(t) dt , C ∈ R. Bei der Herleitung ist zu beachten, dass die Funktionen C exp für C ∈ R entweder ausschließlich strikt positive oder nur strikt negative Werte annehmen und dass y = 0 ebenfalls eine Lösung ist. Man nennt eine solche spezielle Gleichung trennbarer Veränderlicher eine homogene lineare Differentialgleichung erster Ordnung. ‘Linear’, da mit zwei Lösung y1,2 auch immer y1 + λy2 , λ ∈ R, wieder eine Lösung ist, und die Lösungsmenge daher in natürlicher Weise ein Vektorraum ist. Beispiel Findet der Zuwachs einer Größe y periodisch statt, so ist ein passendes Modell etwa durch y 0 − A(1 + cos ωt)y = 0 9 Werner, Universität Münster, SS 10 gegeben: Der Zuwachs schwankt hier mit der Frequenz ω zwischen den Werten 0 und 2A. Lösungen sind gegeben durch A y(t) = C exp At + sin ωt , C ∈ R. ω Inhomogene Gleichungen Eine inhomogene lineare Differentialgleichung erster Ordnung erhält man, wenn zu einer zeitlich abhängigen Wachstumsrate α(t) noch ein äuserer Einfluss in der Form einer Funktion β(t) hinzutritt (etwa durch dur ‘Fischen’), die Gleichung also die Form y 0 + αy = β besitzt. β heißt inhomogener Anteil, y 0 + αy = 0 heißt die zugehörige homogene lineare Differentialgleichung. Diese Definitionen haben natürlich Versionen für höhere Ordnungen: Eine lineare Differentialgleichung n-ter Ordnung ist von der Form y (n) + αn−1 y (n−1) + · · · + α0 y = β, wo α1 , . . . , αn−1 und β hinreichend gutartige Funktionen sind. Mit genau denselben Beweisen wie in der linearen Algebra zeigt man • Sind y1 , y2 Lösungen der homogene Differentialgleichung, so auch λ1 y1 + λ2 y2 für alle λ1 , λ2 ∈ R. • Ist yh eine Lösung der homogenen Differentialgleichung und yp eine Lösung der inhomogenen Differentialgleichung, so ist yh + yp Lösung der inhomogenen Differentialgleichung. • Sind y1 , y2 Lösungen der inhomogenen Differentialgleichung, so ist y1 − y2 Lösung der homogenen Differentialgleichung. Die Lösungsmenge der inhomogenen Gleichung ist also von der Form yp + Lh = {yp + y | y löst die homogene Gleichung } wo yp (irgend)eine Lösung der inhomogenen Gleichung ist. Wir werden hier nur den Fall erster Ordnung verfolgen; vor allem in physikalischen Anwendungen tritt der Fall n = 2 sehr häufig auf. Deren Lösungen stammen aus einem etwas unübesichtlichen Menge von ‘klassischen Funktionen der mathematischen Physik’. Lösung der inhomogenen Gleichung y 0 + αy = β Wir kennen bereits die allgemeine Lösung Z yC (t) = C exp(−A(t)), A(t) = α(t) dt Gewöhnliche Differentialgleichungen (Kurzskript) 10 der homogenen Gleichung, und es reicht nun, irgendeine feste Partikulärlösung yp der inhomogenen Gleichung aufzufinden; denn die allgemeine Lösung der inhomogenen Gleichung ist dann von der Form yp + yC , C ∈ R. Man findet ein solches yp durch die songenannte Variation der Konstanten, d.h. man ersetzt in yC die Konstante C durch eine Funktion C(t), setzt C(t) exp(−A(t)) in die inhomogene Gleichung ein und erhält für C die Differentialgleichung C 0 (t) = β(t) exp A(t), somit tatsächlich eine Partikulärlösung der Gestalt Z yp (t) = exp(−A(t)) β(t) exp A(t) dt , und die allgemeine Lösung der inhomogenen Gleichung besitzt die Form Z y(t) = yp (t) + yC (t) = exp(−A(t)) Beispiel β(t) exp A(t) dt + C exp(−A(t)), Z A(t) = α(t) dt, C ∈ R. Bei dem Anfangswertproblem y 0 − 2xy = 2x, y(0) = 2 ist die Lösung der homogenen Gleichung y 0 − 2xy durch die Funktionenschar yh (x) = C exp(x2 ), C∈R gegeben. Hier ist also A(x) = −x2 , und die Variation der Konstanten führt 2 auf die Gleichung C 0 = 2x exp(−x2 ) mit der Lösung C(x) = −e−x , was die Partikulärlösung yp (x) = C(x) exp(x2 ) = −1 ergibt. Die allgemeine Lösung ist also y(x) = yh (x) + yp (x) = C exp(x2 ) − 1, C ∈ R. Um das Anfangswertproblem zu lösen, bestimmt man die Konstante C aus dem Ansatz 2 = y(0) = C − 1 und erhält y(x) = 3 exp(x2 ) − 1. Durch einen kleinen Kunstgriff kann man diese Gleichung in der Form 0 y − 2x(y + 1) = 0 auch schneller lösen: Die Substitution z(x) = y(x) + 1 führt auf z 0 = y 0 und z 0 − 2xz = 0. Für die letzte Gleichung bedarf es keiner Variation der Kontanten mehr und man erhält direkt y(x) = z(x) − 1 = C exp x2 − 1, C ∈ R. 11 Werner, Universität Münster, SS 10 1.2.4 Exakte Differentialgleichungen Eine Differentialgleichung der Form y 0 a(x, y) + b(x, y) = 0 heißt exakt genau dann, wenn ∂a ∂b = ∂x ∂y gilt. Um zu verstehen, welche Bedeutung diese Bedingung besitzt, ist es günstig, sich den folgenden Satz in Erinnerung zu rufen: Satz 1 Es sei ω eine auf einer sternförmigen (allgemeiner: einfach zusammenhängenden), offenen Menge U ⊆ Rn definierte und dort stetig differenzierbare 1-Form. Dann sind die folgenden Aussagen äquivalent: (i) ω besitzt eine Stammfunktion R (ii) die Integrale γ ω hängen jeweils nur vom Anfangs- und Endpunkt von γ ab. (iii) ω erfüllt die Integrabilitätsbedingungen ∂ωj ∂ωi = ∂xj ∂xi i, j = 1, . . . , n, Falls ω einer dieser Bedingungen genügt, so nennt man sie exakt. Die Differentialgleichung y 0 a(x, y) + b(x, y) = 0 ist für Funktion a, b, die auf einer einfach zusammenhängenden, offenen Menge U ⊆ R2 definiert sind, folglich genau dann exakt, wenn a(x, y)dy + b(x, y)dx eine exakte 1Form ist, bzw. wenn es eine differenzierbare Funktion (x, y) 7→ F (x, y) gibt mit ∂ ∂ a(x, y) = F (x, y), b = F (x, y) ∂y ∂x In einem solchen Fall gilt, dass eine Funktion y der Gleichung F (x, y(x)) = C für alle x mit (x, y(x)) ∈ U und für ein fest gewähltes C ∈ R genau dann genügt, wenn d F (x, y(x)) = y 0 a(x, y) + b(x, y) = 0 dx für alle x mit (x, y(x)) ∈ U Man nennt eine solche Funktion F bisweilen auch ein erstes Integral oder eine Erhaltungsgröße der Differentialgleichung. Der zweite Begriff kommt daher, dass für jede feste Lösung des Systems sich die durch F definierte Größe zeitlich nicht ändert. Typische Beispiele für ein solches Verhalten sind die Erhaltungsgrößen der Physik wie Energie, Drehimpuls oder Ladungszahl.— Gewöhnliche Differentialgleichungen (Kurzskript) 12 Löst man eine exakte Differentialgleichung, indem man eine Stammfunktion der zu Grunde liegenden 1-Form bestimmt, so erhält man die Lösung zunächst (wie auch schon im Fall der Gleichung mit trennbaren Veränderlichen) nur in impliziter Form; mit Hilfe des Satzes von der impliziten Funktion kann man sodann (zumindest lokal) die Existenz einer explizit gegebenen Lösungsfunktion beweisen: Ist etwa das Anfangswertproblem y(ξ) = η ∂ vorgelegt, gilt g = ∂y F ist stetig und g(ξ, η) 6= 0), so existiert auf einer Umgebung von ξ eine Funktion y(·) mit y(ξ) = η und F (x, y(x)) = C, folglich eine Lösung des Anfangswertproblems. Von den bisher behandelten Differentialgleichungen ist y 0 g(y) − f (x) = 0 offenkundig exakt, und damit auch die homogene lineare Differentialgleichung erster Ordnung als Spezialfall. Schreibt man die inhomogene linear Differentialgleichung in der Form y 0 + αy − β = 0, so ist a(x, y) = 1, b(x, y) = α(x)y − β(y), und wir haben es genau nur dann mit einer exakten Gleichung zu tun, wenn α = 0 ist. Wiederholung: Bestimmung einer Stammfunktion Es sei ϕ : U ⊆ R2 → (R2 )∗ , U einfach zusammenhängendes Gebiet, eine exakte 1-Form. Die Charakterisierung dieser Formen zeigt, dass man sich irgendeinen festen Punkt u0 ∈ U und für jedes u ∈ U irgendeinen Weg γu : [a, b] → U , der u0 mit u verbindet, wählen kann, um durch Z Φ(u) := ϕ(dγu ) eine Stammfunktion zu ermitteln. Meist praktischer ist es jedoch, die folgende Überlegung zu verwenden. Ist ϕ = (ϕ1 , ϕ2 ) = Φ0 , so folgt aus ∂Φ ∂x und dem Mittelwertsatz, dass es eine ‘von y abhängige Integrationskonstante C(y)’ geben muss, so dass Z ϕ1 (x, y) dx − Φ(x, y) = C(y). ϕ1 = Damit wird Z ∂ d C(y) = ϕ1 (x, y) dx − ϕ2 (x, y), dy ∂y woraus sich C(y) und somit eine Stammfunktion von ϕ ermitteln lässt. Ein 2 2 Beispiel: + 4y(x3 + y 2 ) dy ist exakt, und aus Ω(x, y) = R 2 2 ω(x, y) = 6x y dx 0 6x y dx + C(y) folgt C (y) = 4y 3 , (bis auf eine Konstante) C(y) = y 4 , und wir erhalten die Stammfunktion Ω(x, y) = 2x3 y 2 + y 4 . 13 Beispiel Werner, Universität Münster, SS 10 Gegeben sei das Anfangswertproblem y 0 x + y + 2x2 = 0, y(1) = 1. Hier ist U = R2 , a(x, y) = x, b(x, y) = y + 2x2 , und wegen ∂ ∂ a(x, y) = 1 = b(x, y) ∂x ∂y ist diese Differentialgleichung exakt. Eine Stammfunktion für (x, y) 7−→ (a(x, y), b(x, y)) ist F (x, y) = yx + 23 x3 , so dass jede Lösung y = y(x) die Beziehung 2 y(x)x + x3 = C 3 für jeweils festes C ∈ R erfüllen muss. In diesem Fall kann diese Gleichung (für x 6= 0) nach y(x) aufgelöst werden, nämlich y(x) = C/x − 23 x2 . Das Anfangswertproblem y(ξ) = η mit ξ = η = 1 löst man durch den Ansatz C = F (ξ, η) = 5/3 und erhält y(x) = 2x2 5 − . 3x 3 Diese Lösung ist nur für x 6= 0 definiert. Ein Anfangswertproblem y(0) = η ergibt stets C = 0, und somit besitzt ein solches nur für η = 0 eine Lösung (nämlich y0 (x) = − 23 x2 , eine Lösung, bei der man gesondert den Punkt (0, 0) betrachten muss.) Der ‘integriererender Faktor’ Ist die Gleichung y 0 a(x, y) + b(x, y) = 0 nicht exakt, so kann man versuchen, diese durch Multiplikation mit einer geeigneten Funktion M (x, y) in eine exakte Differentialgleichung zu überführen (Dabei darf M nicht auf Mengen mit nichtleerem Innern verschwinden). Damit die vorgelegte Differentialgleichung nach Multiplikation mit M tatsächlich exakt ist, muß der integrierende Faktor M die Bedingung ∂M ∂M ∂a ∂b a− b+M − =0 ∂x ∂y ∂x ∂y erfüllen. Diese (partielle) Differentialgleichung für M ist in der Regel schwer zu lösen. Leichter gelingt dies, falls ein Multiplikator M existiert, der nur von der Variablen x (bzw. y) abhängt. Dies ist genau dann der Fall, wenn 1 ∂b ∂a 1 ∂a ∂b − bzw. − a ∂y ∂x b ∂x ∂y nur von x bzw. y abhängen. Falls dies der Fall ist, fällt (ln M (x))0 (bzw. (ln M (y))0 ) mit dem ersten (bzw. dem zweiten) hier aufgeführten Ausdruck zusammen. Gewöhnliche Differentialgleichungen (Kurzskript) 14 Spezialfälle dieses Gleichungstyps sind etwa die Gleichungen der Form y 0 = f (x)g(y) sowie die inhomogene lineare Gleichung erter Ordnung, y 0 = f (x)g(y) y 0 + a(x)y = h(x) Beispiel mit M (y) = g(y)−1 sowie Z mit M (x) = exp a(x) dx Gegeben sei die Differentialgleichung y 0 xy + x2 + y 2 + x = 0. Hier ist ∂ a(x, y) = y, ∂x ∂ b(x, y) = 2y, ∂y und diese Gleichung ist nicht exakt. Wegen ∂a 1 1 ∂b − = a ∂y ∂x x Gibt es den nur von x abhängigen integrierenden Faktor M (x) = x, und die mit M (x) multiplizierte Gleichung y 0 x2 y + x3 + y 2 x + x2 = 0 ist nun exakt. Als Stammfunktion der Form x2 y dy+(x3 +y 2 +x2 )dx ermittelt man 1 1 1 F (x, y) = x4 + + x3 + x2 y 2 , 4 3 2 und die Lösungskurven ermittelt man, indem man die in y quadratische Gleichung 1 4 1 1 x + + x3 + x2 y 2 + C = 0 4 3 2 für jeweils ein festes C ∈ R löst. Substitution Häufig gelingt es, gegebene Differentialgleichungen durch geeignete Substitution auf einen der hier behandelten Typen zu bringen. Die Möglichkeiten sind hier etwas zahlreicher, da man sowohl den Definitionsals auch den Bildbereich der gesuchten Funktion einer Transformation unterwerfen kann. Ist z.B. eine Differentialgleichung der Form y y0 = f x gegeben (eine sogenannte homogene Differentialgleichung), so führt die Substitution y(x) = z(x)x auf z 0 (x)x + z(x) − f (z) = 0, 15 Werner, Universität Münster, SS 10 eine Gleichung mit trennbaren Veränderlichen. Ein weiteres Beispiel ist die Bernoulli Gleichung y 0 + p(x)y = q(x)y n , welche durch z(x) := y 1−n (x) in eine lineare Differentialgleichung überführt werden kann. Gewöhnliche Differentialgleichungen (Kurzskript) 16 Kapitel 2 Systeme linearer Differentialgleichungen mit konstanten Koeffizienten Wir werden in diesem Abschnitt vergleichsweise einfache Systeme von Differentialgleichungen betrachten, also Gleichungen für Funktionen, die alle von einem Parameter (häufig die Zeit) abhängen. Die hier betrachteten Systeme sind linear und die auftretenden Koeffizientenfunktionen sind konstant. Wir werden später versuchen, kompliziertere Systeme durch Approximation durch die hier betrachteten in den Griff zu bekommen. 2.1 Systeme gewöhnlicher Differentialgleichungen Definition 2 Ein Differentialgleichungssystem n-ter Ordnung in m unbekannten Funktionen ist eine Gleichung der Form F (x, y, y 0 , . . . , y (n) ) = 0, wobei F : D → Rk mit D ⊆ R1+nm . (i) Dieses System heißt explizit, falls k = m und F (x, y, y 0 , . . . , y (n) ) = y (n) − f (x, y, y 0 , . . . , y (n−1) ) für eine geeignete Funktion f . (ii) Eine Lösung des Systems ist eine n-fach differenzierbare Funktion y : I → Rm , wobei I ⊆ R ein offenes Intervall ist und für alle x ∈ I gilt: F (x, y(x), y 0 (x), . . . , y (n−1) (x)) = 0 17 Gewöhnliche Differentialgleichungen (Kurzskript) 18 (iii) Fordert man für die Lösung zusätzlich y (ν) (ξ) = ην mit ξ ∈ R, ην ∈ Rm , so spricht man wiederum von einem Anfangswertproblem. 2.1.1 Reduktion auf Systeme erster Ordnung Systeme gewöhnlicher Differentialgleichungen können zu (größeren) Systemen erster Ordnung umgeformt werden. Ist zunächst F (x, y, y 0 , . . . , y (m) ) eine Differentialgleichung n-ter Ordnung in einer unbekannten Funktion y, so setzen wir yν = y (ν−1) , ν = 1, . . . , n. Dann ist die Differentialgleichung f (x, y, y 0 , . . . , y (n−1) ) = 0 äquivalent zu dem Differentialgleichung-System erster Ordnung mit n Unbekannten y1 , . . . , yn und n Gleichungen, y10 = y2 , ..., 0 yn−1 = yn , F (x, y1 , . . . , yn , yn0 ) = 0 (k) Ist (y1 , . . . , yn )> eine Lösung des Systems, so ist y1 (x) = y1+k (x) für (n) alle x und k = 0, . . . , n − 1 also F (x, y1 (x), y10 (x), . . . , y1 (x)) = 0, d.h. y1 ist eine Lösung der ursprünglichen Differentialgleichung. Und umgekehrt: Jede Lösung y der ursprünglichen Differentialgleichung führt auf die Lösung (y, y 0 , . . . , y (n−1) )> des Systems. In ähnlicher Weise verfährt man, um Systeme der Ordnung m in ein System erster Ordnung zu überführen. 2.1.2 Systeme Linearer Differentialgleichungen erster Ordnung Ein lineares Differentialgleichung-System erster Ordnung ist ein Differentialgleichungssystem der Form y 0 = A(x)y + b(x) Hierbei ist A eine Matrix, deren Einträge stetige Funktionen sind, die von einer reellen Variablen abhängen. Dies ist gleichbedeutend damit, dass A eine stetige, von einer reellen Variablen abhängige Abbildung ist, die Werte in dem Raum der n × n-Matrizen, Matm (R) annimmt. Weiterhin ist b eine stetige, von einer reellen Variablen abhängige Funktion mit Werten im Rn . Genau wie im Fall einer linearen Differentialgleichung nennt man b(x) die Inhomogenität des Systems, und ein lineares System heißt homogen, falls b(x) = 0. Auch der Lösungsraum ist wiederum von der Form yp + y A(y) = y 0 , wo yp eine (beliebige) Lösung des homogenen Systems ist. 19 2.2 Werner, Universität Münster, SS 10 Systeme mit konstanten Koeffizienten: Diagonalisierbarer Fall Die Systeme y 0 = Ay mit A ∈ Matn (R) stellen für die Theore der Differentialgleichungssysteme sind ein wichtiges Beispiel. Zum einen sind diese Gleichung kompliziert genug, um mit ihrer Hilfe allgemeinere Differentialgleichungen besser verstehen zu können. Dies wird der Gegenstand des 3. Kapitels sein. Zum anderen sind sie aber so einfach gebaut, dass man das Lösungsverhalten dieser Gleichungen komplett im Griff hat. Wir beginnen hier mit einem sehr einfachen Spezialfall, den sogenannten entkoppelten Gleichungen. Hierbei handelt es sich um den Fall, dass A Diagonalgestalt besitzt, das System also die Form yi0 = αi yi , i = 1, . . . , n aufweist. Man kann hier sofort Lösungen angeben (wobei wir die Vektorschreibweise verwenden): y1 (x) C1 exp(α1 x) .. .. . . yi (x) = Ci exp(αi x) , Ci ∈ R, i = 1, . . . , n, .. .. . . yn (x) Cn exp(αn x) Wir werden später sehen, dass damit bereits alle Lösungen gefunden sind. In diesem Abschnitt geht es darum, ein System y 0 = Ay zu ‘entkoppeln’, was in der Sprache der linearen Algebra auf die Diagonalisierung der Matrix A hinausläuft. 2.2.1 Reelle Eigenwerte Hier ist eine kurze Erinnerung: Eine linearer Endomorphismus Φ heißt diagonalisierbar, falls es eine Basis des zu Grunde liegenden Vekotorraums gibt, bezüglich derer die Matrixdarstellung von Φ Diagonalgestalt besitzt. Es galt der Satz 2 Es sei V ein endlichdimensionaler K-Vektorraum V sowie Φ : V → V linear mit den Eigenwerten λ1 , . . . , λk und dem charakteristischen Polynom k Y χΦ (λ) = det (λId − Φ) = (λ − λi )ni . i=1 Dann sind äquivalent: (i) Φ ist diagonalisierbar Gewöhnliche Differentialgleichungen (Kurzskript) 20 (ii) Es gibt eine Basis von V , die aus Eigenvektoren von Φ besteht. (iii) Sind V1 , . . . , Vk die Eigenräume zu den Eigenwerten λ1 , . . . , λk , so gilt dim Vi = ni für alle i = 1, . . . , k. Wir gehen für den Moment davon aus, dass in y 0 = Ay die Matrix A (bzw. der durch diese induzierte Endomorphismus) nur reelle Eigenwerte besitzt und diagonalisierbar ist. Es sei v1 , . . . , vn eine Basis aus Eigenvektoren und T die – invertierbare – Matrix, deren Spalten gerade die Eigenvektoren sind, die bezüglich der Standardbasis e1 , . . . , en dargestellt sind. Dann gilt für jedes i = 1, . . . , n T −1 AT ei = λi ei , so dass also T −1 AT bezüglich der Standardbasis Diagonalgestalt besitzt. Dabei sind die Einträge auf der Diagonalen gerade die Eigenwerte von A. Wir wenden uns nun wieder dem System y 0 = Ay zu. Wir multiplizieren beide Seiten von links mit T −1 und erhalten (T −1 y)0 = T −1 (y 0 ) = T −1 AT (T −1 y), ein entkoppeltes System von linearen Differentialgleichungen. Bezeichnet (·)B die Koordinatendarstellung eines Vektors bezüglich der Eigenbasis B = {v1 , . . . , vn }, so erhalten wir die Lösungen y1 (t) C1 exp(λ1 t) .. .. . . yi (t) = Ci exp(λi t) , .. .. . . yn (t) B Cn exp(λn t) B Ci ∈ R, i = 1, . . . , n, Multiplikation mit T führt die Darstellung (·)B wieder zurück in die alte Basisdarstellung und wir erhalten die Lösungen y(t) = C1 exp(λ1 t)v1 + · · · + Cn exp(λn t)vn Da die v1 , . . . , vn eine Basis ist, kann aus diesen Lösungen auch jedes Anfangswertproblem y(0) = y0 gelöst werden. 21 Werner, Universität Münster, SS 10 2.2.2 Komplexe Eigenwerte Wir nehmen jetzt an, dass die (reelle) Matrix A über dem Vektorraum Cn diagonalisierbar ist. Im Prinzip kann man genau wie im Fall der reellen Diagonalisierbarkeit vorgehen, und so erhält man für die Eigenwerte λ1 , . . . , λn mit Eigenbasis v1 . . . , ~vn Lösungen der Form y(x) = C1 exp(λ1 t)v1 + · · · Cn exp(λn t)n . Diese sind aber im Allgemeinen komplexe Lösungen, und für das reell definierte System y 0 = Ay benötigt man in der Regel auch reelle Lösungen. Die Koeffizienten des charakteristischen Polynoms von A jedoch sind sämtlich reell, und es ist leicht zu sehen, dass mit jedem Eigenwert λ zum Eigenvektor v auch λ ein Eigenwert zum Eigenvektor v ist. Hier entsteht v aus v durch koordinatenweise Konjugation. Verwendet man die Schreibweise Re v und Im v für die koordinatenweise gebildeten Real- und Imaginärteile, so ist, wie in C, v = Re v − i Im v. Wir erhalten die Lösungen y(t) = exp(λt)v sowie y(t) = exp(λt)v. Da y 0 = Ay auch komplex linear ist, sind auch Re y(t) und Im y(t) Lösungen, die jedoch beide reell sind. Setzt man λ = α + iω, so zeigt eine einfache Rechnung 1 (y(t) + y(t)) = eαt [cos(ωt) Re v − sin(ωt) Im v] 2 Re y(t) = und genauso Im y(t) = 1 (y(t) − y(t)) = eαt [sin(ωt) Re v + cos(ωt) Im v] 2i Satz 3 Es seien λ1 , . . . , λM die reellen und λM +1 , λM +1 . . . , λN , λN , M + 2(N −M ) = n, λk = αk +iωk die (echt) komplexen Eigenwerte der diagonalisierbaren Matrix A und v1 , . . . , vM , vM +1 , v M +1 , . . . , vN , v N die zugehörigen Eigenvektoren. (i) Für das System y 0 = Ay existieren die reellen Lösungen y(t) = M X Ck exp(λk t)vk + k=1 + N X Ak eαk t [cos(ωk t) Re v − sin(ωk t) Im v] + k=M +1 + Bk eαk t [sin(ωk t) Re v + cos(ωk t) Im v] , mit Ak , Bk , Ck ∈ R. Gewöhnliche Differentialgleichungen (Kurzskript) 22 (ii) Die Menge v1 , . . . , vM , Re vM , Im vM +1 ist eine Basis des Rn . Es sei η ∈ Rn und η= M X η k vk + k=1 N X ηk Re vk + ηk Im vk k=M +1 die Koordinatendarstellung bezüglich dieser Basis. Für das Anfangswertproblem y(0) = η ergibt sich dann eine Lösung wie in (i) aus Ck = η k Ak = ηk 2.3 für k = 1, . . . , M und Bk = η k sowie für k = M + 1, . . . , N . Beispiele und elementare Eigenschaften der Lösungen Die folgenden Beispiele finden im R2 statt. Solche Systeme sind gut der Anschauung zugänglich. Es wird dieses Mal jedem Punkt der Ebene eine Richtung samt Länge zugewiesen. Genau wie bei einer Differentialgleichung des Typs y 0 = f (x, y) muss eine Lösungskurve diesen Richtungsvorgaben folgen. Dem Bild der fertigen Lösungskurve sieht man jedoch die Länge dieser Richtungen (die der Momentangeschwindigkeit des Kurvenpunkts entspricht) nicht mehr an. Wir werden daher in den folgenden Abschnitten auf die Darstellung der Längen verzichten. 2.3.1 Reelle Eigenwerte Um ein etwas deutlicheres Bild vom Verhalten der Lösungen in dieser Situation zu erhalten, betrachten wir vorübergehend den Fall der Eigenräume Re1 , Re1 mit den Eigenwerten α, β ∈ R. Die Geometrie der allgemeinen Lösungskurve γ(t) = C1 exp(αt)e1 + C2 exp(βt)e2 lässt sich einfacher verstehen, wenn man sie als Graphen einer Funktion f : R → R darstellt. Wir setzen dazu x = C1 exp(αt), lösen diese Gleichung nach t auf und erhalten β/α β x x y(x) = C2 exp ln = C2 . α C1 C1 Diese Funktionen sind Hyperbeln für den Fall unterschiedlicher Vorzeichen der Eigenwerte sowie Parabeln, falls die Eigenwerte dasselbe Vorzeichen besitzen. (Natürlich sind auch jeweils die halben Koordinatenachsen die Bilder von Lösungskurven.) Dabei krümmen sich im Fall gleicher Vorzeichen die Äste der Parabeln in Richtung der Achse, die zum größeren Eigenwert gehört. Sind die Eigenräume andere als Re1,2 , so bleibt dieses Verhalten 23 Werner, Universität Münster, SS 10 relativ zum Eigenbasissystem erhalten; im Bild wirkt sich dies durch eine Deformation der Hyperbeln (Parabeln) aus. Nicht klar wird bei dieser Betrachtung, wie die Lösungen sich bezüglich des (ja eliminierten) Parameters t verhalten. Abbildung 2.1: Lineares System mit den Eigenwerten 5 und −4. Die zugehörigen Eigenräume sind hier leicht zu erkennen. Wir betrachten das System y10 = −7y1 + 6y2 y20 = −6y1 + 8y2 was dasselbe ist wie 0 y1 −7 6 y1 y = = =: Ay y2 −6 8 y2 0 Es ist χA (λ) = λ2 − λ − 20 mit den Nullstellen 5, −4. Die zugehörigen Eigenräume sind 1 E5 = R sowie 2 E−4 2 =R , 1 Gewöhnliche Differentialgleichungen (Kurzskript) 24 und die allgemeine Lösung ist von der Form 2 1 y(t) = C1 exp(−4t) + C2 exp(5t) 1 2 Die Lösungskurven dieses Systems zeigen das typische Verhalten des Falls zweier reeller Eigenwerte mit unerschiedlichem Vorzeichen, die Lösungskurven sind Hyperbeln, die durch eine (invertierbare) lineare Abbildung der Ebene deformiert worden sind. Das zeitliche Verhalten der Lösungen stellt sich wie folgt dar: Lösungen, die sich auf einer der beiden Eigenräume befinden, werden entweder vom Ursprung angezogen (negativer Eigenwert) oder von diesem abgestoßen (positiver Eigenwert). Zwischen diesen beiden Unterräumen findet eine Überlagerung beider Bewegungstypen statt. Dabei gewinnt in der Nähe des Ursprungs die abstoßende Richtung die Überhand, die Lösungskurven werden von dem zum positiven Eigenwert gehörigen Eigenraum angezogen. Für große Zeiten wird der Abstand zu diesem sogar beliebig klein, der Eigenraum ist, für positive Zeiten eine Asymptote für jede Lösungskurve. Umgekehrt wird bei immer kleineren Zeiten der Eigenraum des negativen Eigenwertes asymptotisch erreicht. Abbildung 2.2: Lineares System mit den Eigenwerten 5 und 4 und Eigenräumen, die durch die Punkte (1, 2) und (2, 1) gegeben sind. 25 Werner, Universität Münster, SS 10 Für das System y 0 = Ay mit 1 A= 3 11 2 −2 16 ist χA (λ) = λ2 − 9λ + 20 mit den Nullstellen 4 und 5, und dieses System unterscheidet sich von dem des letzten Abschnitts nur durch die Umkehrung des Vorzeichens eines der Eigenwerte; denn die zugehörigen Eigenvektoren sind gleich geblieben. Die Lösungskurven entfernen sich vom Ursprungs entlang (punktsymmetrischer) Parabeln, die sich in Richtung es Eigenraums krümmen, der zum Eigenwert 5 gehört. Abbildung 2.3: Dasselbe System nachdem eine lineare Transformation die Eigenvektoren in die Einheitsvektoren überführt hat. Man beachte hier insbesondere die Rolle, die der Ursprung spielt: Die Lösung des Anfangswertproblem y(0) = 0 verharrt (wie bei jedem anderen linearen System) für alle Zeiten im Ursprung. Bei rein positiven Eigenwerten aber entfernt sich jede Lösung, die nicht im Ursprung startet, beliebig weit, wenn man nur lange genug wartet. Sind die Eigenwerte rein negativ, zieht der Ursprung jede Lösung an (ohne dass der Nullpunkt von einer dieser Lösungen erreicht wird, wenn sie sich nicht dort bereits die ganze Zeit über aufgehalten hat). Gewöhnliche Differentialgleichungen (Kurzskript) 2.3.2 26 Komplexe Eigenwerte Besitzt ein zweidimensionales System die komplexen Eigenwerte λ, λ zu den (komplexen) Eigenvektoren v und v, so ist die allgemeine reelle Lösung von der Form C1 eαt [cos(ωt) Re v − sin(ωt) Im v] + C2 eαt [sin(ωt) Re v + cos(ωt) Im v] . Nehmen wir für den Moment an, dass Re v = ae1 , Im v = be2 und α = 0 ist, so erfüllt das Bild der entstandenen Kurve x(t) C1 a cos(ωt) + C2 a sin(ωt) γ(t) = = y(t) C2 b cos(ωt) − C1 b sin(ωt) die Ellipsengleichung x2 y 2 + 2 = C12 + C22 a2 b Diese Ellipsen ziehen sich im Fall α 6= 0 zu Spiralen auseinander, die sich für große Zeiten entweder beliebig weit vom Ursprung entfernen (α > 0), oder im Grenzwert t → ∞ den Nullpunkt erreichen (α < 0). Im allgemeinen Fall gilt für die Matrix T = Re v Im v α ω −1 . T AT = −ω α Diese Matrix besitzt auf dem Raum C2 die Eigenwerte λ1 = α − iω und λ2 = α + iω mit den Eigenräumen 1 1 und Ck = C Ck = C −i i Die Funktion T −1 y ist die Lösung in der Darstellung bezüglich der Basis Re k = e1 , Im k = e2 des R2 . Sie genügt der Gleichung α ω −1 0 T −1 y (T y) = −ω α und ist der oben beschriebene Spezialfall mit a = b = 1. Die Lösungsfunktion y selbst ergibt sich durch Ersetzen von e1,2 durch Re v, Im v, und stellt so eine linear deformierte Ellipse dar, deren Hauptachsen gegeneinander sowohl in ihrer Länge als auch in ihren Richtungen abgeändert worden sind. Ist schließlich α 6= 0, so entstehen wiederum Spiralen, die sich für α < 0 dem Nullpunkt beliebig nahe kommen, für α > 0 sich hingegen von diesem beliebig weit entfernen. Bei dem System y10 = −3x − 5y y20 = 5x + 3y 27 Werner, Universität Münster, SS 10 sind die Eigenwerte der zugehörigen Matrix λ1,2 = ±4i, und die Eigenräume lauten 1 − 2i 1 + 2i E4i = Cv = C E−4i = Cv = C . 1 + 2i 1 − 2i Damit lautet die allgemeine Lösung 1 −2 [C1 cos(ωt) + C2 sin(ωt)] + [C2 cos(ωt) − C1 sin(ωt)] , 1 2 welche um 45◦ gedrehte Ellipsen sind mit Hauptachsen in der Richtung der Ursprungsgeraden durch (±1, 1). Abbildung 2.4: System y10 = −3x − 5y y20 = 5x + 3y. Die Hauptachsen der Lösungskurven zeigen in diagonaler Richtung und besitzen das Längenverhältnis 2 : 1. Das System y10 = −2x − 5y y20 = 5x + 4y besitzt die Eigenwerte 1 ± 4i mit denselben Eigenräumen wie zuvor, 1 + 2i 1 − 2i E1+4i = Cv = C , E1−4i = Cv = C 1 − 2i 1 + 2i Gewöhnliche Differentialgleichungen (Kurzskript) 28 und die allgemeine Lösung dieses Systems unterscheidet sich von der des zuletzt behandelten Systems durch den Faktor et , et [C1 cos(ωt) + C2 sin(ωt)] 1 −2 + et [C2 cos(ωt) − C1 sin(ωt)] , 1 2 der die Ellipsen eben zu Spiralen auseinanderzieht. Abbildung 2.5: Dasselbe System nachdem eine lineare Transformation die Eigenvektoren in die Einheitsvektoren überführt hat. 2.4 Exponentialfunktion und der Fall der nicht diagonalisierbaren Matrizen Wir versuchen im Folgenden, das System y 0 = Ay durch einen Ansatz y(t) = exp(tA)y0 zu lösen. Zu klären ist dabei vor allem, was ‘e hoch Matrix’ sein soll, und ob man mit so etwas Differentialgleichungen lösen kann. Bevor wir dies tun, müssen wir ein paar Dinge erklären, die es ermöglichen, mit Matrizen Analysis zu betreiben. Wir werden diese Techniken dann schließlich anwenden, 29 Werner, Universität Münster, SS 10 um das System y 0 = Ay auch in dem Fall zu lösen, in dem die Matrix A nicht mehr diagonalisierbar ist. 2.4.1 Matrix-Normen und Exponentialfunktion Normen dienen bekanntlich zur Abstandsmessung und ergeben daher einen Konvergenzbegriff. Auf endlichdimensionalen Vektorräumen sind diese Konvergenzbegriffe alle identisch, und so wäre es eigentlich gleichgültig, welche Norm wir auf dem Raum Mn (K) auswählen. Dennoch sind einige Normen praktischer als andere, wie wir gleich sehen werden. Definition 3 Eine Norm k · k : Mn (K) → R+ 0 heißt Matrixnorm, genau dann wenn für alle A, B ∈ Mn (K) gilt kABk ≤ kAkkBk. Lemma 3.1 Es sei k · k eine Norm auf Kn . Dann definiert kAk = sup kAxk kxk≤1 eine Matrixnorm, für die zusätzlich gilt für alle x ∈ Kn und alle Matrizen A. kAxk ≤ kAkkxk Hier folgen die beiden Bedingungen kA + Bk ≤ kAk + kBk für alle A, B ∈ Mn (K) und kλAk = |λ|kAk sehr direkt aus der Definition. Aus 0 = kAk = supkxk0 ≤1 kAxk0 folgt unmittelbar kAxk = 0 für alle x mit kxk ≤ 1 und mit der Linearität von A auch A = 0. Die Eigenschaft kABk ≤ kAkkBk ergibt sich direkt aus der für alle x ∈ Kn gültigen Ungleichung kAxk ≤ kAkkxk, welche sich wiederum aus x kxk ≤ sup kAξkkxk = kAkkxk kAxk = A kxk kξk≤1 ergibt (hier ist für x = 0 nichts zu zeigen). Wir können damit im Folgenden mit (irgend)einer Norm auf dem Kn beginnen und die durch das voranstehende Lemma definierte Matrixnorm verwenden. Wem das zu wenig Festlegung ist, beginnt vielleicht mit der euklidische Norm. Satz 4 Sei m ∈ N und A, B ∈ Mn (K). Dann gilt (i) Es existiert der Grenzwert ∞ N X X 1 n 1 n e := A = lim A N →∞ n! n! A n=0 n=0 Gewöhnliche Differentialgleichungen (Kurzskript) 30 (ii) Falls AB = BA, so besteht die Beziehung eA+B = eA eB . Insbesondere ist eA stets invertierbar und (eA )−1 = e−A . (iii) Die Abbildung R → Matm (C), t 7→ etA ist differenzierbar und d tA e |t=t0 = Aet0 A dt für alle t0 ∈ R. P An Die Reihe ∞ n=0 n! konvergiert, genau dann wenn ihre Partialsummen eine Cauchy-Folge bilden. Der Nachweis dieser Tatsache gelingt mit Hilfe der Eigenschaften der Matrixnormen: Ist n < m so folgt nämlich m m n X X N N N X A A A − = ≤ N! N! N! N =0 N =n+1 N =0 N m m X X A kAkN ≤ ≤ , N ! N! N =n+1 N =n+1 und es gibt für ε > 0 einen Index n(ε), so dass für m > n ≥ n(ε) dieser AusP kAkn druck kleiner als ε ausfällt, da ja die Partialsummen von ekAk = ∞ n=0 n! eine Cauchy-Folge bilden. Den zweiten Tiel zeigt man wie im reellen oder komplexen Fall — die binomische Formel macht hier keinerlei Schwierigkeiten, und wenn man weiß, dass A und B miteinander kommutieren, dann kann man auch den Beweis des Satzes über das Cauchy-Produkt (absolut) konvergierender Reihen wörtlich übernehmen. Die Aussage über die Inverse ergibt sich unmittelbar. Vom Grundgedanken her recht ähnlich verhält es sich mit dem Beweis des dritten Teils. Auch hier ist die eindimensionale Situtation das Vorbild, das man nur richtig anzupassen hat. Wendet man den entsprechenden Satz in einer Dimension koordinatenweise an, so erhält man: Konvergieren für eine Folge von Funktionen γn : [a, b] → Kn sowohl (γn ) als auch (γn0 ) gleichmässig gegen die Funktionen ζ bzw. η, so ist ζ differenzierbar, und es gilt ζ 0 = η. Wir wenden diese Aussage auf die Funktionenfolge (γN ) mit γN (t) = N X tn n=0 n! A n und 0 γN (t) =A N X n=1 tn−1 A(n−1) (n − 1)! 0 ) konvergiert gleichmäßig gegen η(t) = A exp(tA), was an. Die Folge (γN daher die Ableitung von t 7→ exp(tA) ist. 31 Werner, Universität Münster, SS 10 2.4.2 Jordansche Normalform und eine neue Lösungsmethode Mit den Überlegungen des letzten Abschnitts erhalten wir nun sofort (unter Verwendung der Kettenregel): Korollar 4.1 Das Anfangswertproblem y 0 = Ay, y(0) = y0 wird durch die Funktion y(t) = exp(tA)y0 gelöst. Hier kommt die Anwendung der Kettenregel (die wir benötigen um die Funktion t 7→ exp(tA)y0 abzuleiten): exp(tA) ist eine Abbildung vom Typ K → Kn . Ist x ∈ Kn ein Vektor so definiert δx : Mn (K) → K, δx (A) = A(x) eine lineare Abbildung, deren Ableitung an allen Stellen gleich δx ist. Also wird [δx ◦ exp(·A)]0 = δx0 (exp(·A)) ◦ A exp(tA) = A exp(tA)x, woraus dann die Aussage des Korollars folgt. Wie berechnet man exp(A)? Sehr einfach ist dies wiederum, wenn die Matrix A Diagonalgestalt besitzt, A = diag(λ1 , . . . , λn ). In diesem Fall gilt exp (diag(λ1 , . . . , λn )) = diag(eλ1 , . . . , eλn ) Ist A diagonalisierbar, also A = U −1 DU mit D = diag(λ1 , . . . , λk ), so erhält man exp(A) = ∞ X An n=0 n! = ∞ X (U −1 DU )n n=0 n! = U −1 = ∞ X Dn n=0 n! ! U = U −1 diag(eλ1 , . . . , eλn )U, wobei die Stetigkeit der Abbildung A 7→ U −1 AU auszunutzen ist. Man kann sich überlegen, dass diese Lösung dasselbe Resultat liefert wie die, die wir bereits früher erhalten haben. Aber auch der allgemeine, nicht notwendigerweise diagonalisierbare Fall kann jetzt behandelt werden. Wir benötigen dazu die Jordansche Normalform in der folgenden, gegenüber der üblichen Version etwas schwächeren Fassung. Dazu erinnern wir daran, dass man eine lineare Abbildung N nilpotent von der Ordnung k nennt, falls N k = 0 und N k−1 6= 0 ist. Ein Vektor v 6= 0 heißt verallgemeinerter Eigenvektor der linearen Abbildung A zum (verallgemeinerten) Eigenwert λ, falls es ein k ∈ N gibt, so dass (A − λId)k v = 0 ist. Gewöhnliche Differentialgleichungen (Kurzskript) 32 Satz 5 Für jede lineare Abbildung A auf dem Cn exisitiert eine Basis aus verallgemeinerten Eigenvektoren. Es sei B = {b1 , . . . , bn } eine solche Basis und T = b1 . . . bn . Dann existieren lineare Abbildungen ∆ und N mit (i) A = ∆ + N und ∆N = N ∆ (ii) N ist nilpotent von der Ordnung k ≤ n, und T −1 ∆T = diag(λ1 , . . . , λn ), wo λ1 , . . . , λn die (mit ihren Vielfachheiten gezählten) Eigenwerte von A sind. Wenn wir davon ausgehen, dass dieser Satz richtig ist1 , so kann man ihm entnehmen, wie eine Basis aus verallgemeinerten Eigenvektoren zu bestimmen ist: ∆ und A besitzen dieselben Eigenwerte. Es sei Eλ der Eigenraum zum Eigenwert λ für ∆. Dieser ist invariant unter ∆, unter N und daher unter A. Die Einschränkung von A − ∆ auf Eλ ist von der Form A − λId und zugleich der Einschränkung von N auf diesen Raum. Es ist daher Ker(A−λId)s = Eλ für ein geeignetes s, und so können wir eine Basis {v1 , . . . , vr } für den Raum Eλ aus verallgemeinerten Eigenvektoren für A bestimmen, indem wir mit einer Basis für den Eigenraum EλA von A beginnen und diese sukzessive zu Basen der Räume Ker(A − λId)2 , . . . , Ker(A − λId)s−1 erweitern. Eine Basis {v1 , . . . , vn } aus verallgemeinerten Eigenvektoren für den ganzen Raum erhält man, wenn man dieses Verfahren für alle Eigenwerte wiederholt. Bezeichnet T die Matrix v1 . . . vn , so setzt man ∆ = T diag(λ1 , . . . , λn )T −1 N =A−∆ sowie und hat eine im Satz angegebene Zerlegung erhalten. Korollar 5.1 Ist A = ∆ + N die Jordansche Normalform von A mit N k = 0, T eine invertierbare Matrix mit ∆ = T diag(λ1 , . . . , λn )T −1 , so gilt exp(A) = T diag(eλ1 , . . . , eλn )T −1 k X Nκ κ=1 κ! , und das Anfangswertproblem y 0 = Ay, y(0) = y0 wird gelöst von y(t) = T diag(eλ1 t , . . . , eλn t )T −1 k X tκ N κ κ=1 1 κ! y0 , Er ergibt sich aus dem bekannten Satz über die Jordansche Normalform wie er in fast jedem Buch über lineare Algebra zu finden ist; in dieser Form wird er z.B. in den Büchern von Halmos, Finite Dimensional Vector Spaces, oder Hirsch/Smale, Differential Equations, Dynamical Systems and Linear Algebra bewiesen. 33 2.4.3 Werner, Universität Münster, SS 10 Beispiele Wir lösen im folgenden stets das Anfangswertproblem y 0 = Ay, y(0) = y0 . Die Matrix 3 1 A1 = −1 1 besitzt den zweifachen Eigenwert λ1,2 = 2. Damit wird alles ganz einfach; denn die Matrix diag(2, 2) kommutiert mit jeder anderen, und wir können ∆ = diag(2, 2) in der Zerlegung A1 = ∆ + N wählen. Damit ist N = A1 − S = 1 1 . −1 −1 Wegen N 2 = 0, ist die Lösung des Anfangswertproblems durch 2t 2t y(t) = e (Id + tN )y0 = e 1+t t y −t 1 − t 0 gegeben. Abbildung 2.6: Das hier beschriebene System mit nichttrivialem nilpotenten Anteil. Gewöhnliche Differentialgleichungen (Kurzskript) 34 Das Verhalten der Lösungen allerdings lässt sich so noch nicht ganz einfach vorhersagen. Wichtig ist die Kenntnis des Eigenraums 1 E2 = Ker N = Rv1 , v1 = , −1 welcher sich im Bild wiederfinden lässt. Weitere Vereinfachungen ergeben sich, wenn man unter den vielen, als zweitem Basiselement zur Auswahl stehenden einen Vektor v2 wählt, für den gilt N v2 = v1 . Dies führt auf die aus der linearen Algebra bekannte Version der Jordan-Form und ermöglicht hier ein besseres Verständnis der Lösungskurven (was genauer in den Übungen untersucht wird).— Im Fall von 1 0 0 A2 = −1 2 0 1 1 2 lauten die Eigenwerte λ1 = 1, λ2,3 = 2. Die zugehörigen Eigenräume sind > > Um eine Basis aus verallsowie E2 = R 0 0 1 E1 = R 1 1 −2 gemeinerten Eigenvektoren zu erhalten, müssen wir die Vektoren v1 , v2 um eine von diesen linear unbhängige Lösung v3 der Gleichung 1 0 0 (A1 − 2Id)2 v = 1 0 0 v = 0 −2 0 2 > ergänzen. Eine solche ist v3 = 0 1 0 . Die Transformationsmatrix T ist dann gegeben als 1 0 0 1 0 0 T = 1 0 1 mit T −1 = 2 0 1 . −2 1 0 −1 1 0 Um zu einer Zerlegung der Form A2 = ∆ + N zu 1 0 0 1 ∆ = T 0 2 0 T −1 = −1 0 0 2 2 so dass gelangen, berechnen wir 0 0 2 0 , 0 0 0 0 0 N = A2 − ∆ = 0 0 0 −1 1 0 mit N 2 = 0. Die Lösung des Anfangswertproblems ist damit gegeben durch t e 0 0 et 0 0 et − e2t e2t 0 y0 . y(t) = T 0 e2t 0 T −1 (1 + tN )y0 = 2t t 2t 0 0 e −2e + (2 − t)e 0 e2t Kapitel 3 Theorie: Existenz und Eindeutigkeit Wir beschäftigen uns im Folgenden in möglichst allgemeiner Weise mit der Frage, ob ein gegebenes Anfangswertproblem lösbar und ob diese Lösung eindeutig bestimmt ist. Befindet man sich in einer Situtation, in der eine Differentialgleichung versucht, Realität zu beschreiben, so vermitteln die Antworten auf diese Fragen sehr wichtige Einsichten in die Qualität der verwendeten mathematischen Modellbildung. Häufig stellt sich heraus, dass die abstrakten Sätze gar keine Lösungen für alle Zeiten vorhersagen können, was oft ein erster Hinweis auf ein explosives Lösungsverhalten ist. Wir werden uns im letzten Teil dieses Kapitels um den maximalen Definitionsbereich von Lösungen kümmern und schließlich eine Idee stärker formalisieren, die man bereits beim Betrachten der Bilder der ebenen Systeme haben konnte: Die Lösung einer Differentialgleichung ist wie ein Fluss, der einen in ihn geworfenen Punkt mit der Zeit in eine Lösungskurve treibt. 3.1 Satz von Picard-Lindelöf Satz 6 (Picard-Lindelöf ) Es sei F : [a, b] × Rn → Rn stetig, und es gelte für alle x ∈ [a, b] sowie y1,2 ∈ Rn kF (x, y1 ) − F (x, y2 )k ≤ Lky1 − y2 k für eine feste Zahl L ≥ 0. Dann besitzt das Anfangswertproblem y 0 (x) = F (x, y(x)), y(0) = y0 eine eindeutig bestimmte auf ganz [a, b] definierte Lösung. Der Beweis ist kozeptionell gesehen nicht besonders schwierig. Die wesentlichen Schritte sind die folgenden. Man betrachtet den Raum der auf dem 35 Gewöhnliche Differentialgleichungen (Kurzskript) 36 Intervall [a, b] definierten stetigen, Rn -wertigen Funktionen C([a, b], Rn ), versehen mit der Norm k · kβ , kf kβ := sup e−βx kf (x)k, x∈[a,b] wo β ∈ R gleich noch passend bestimmt wird. Wichtig ist, dass dieser normierte Raum vollständig ist — die Norm k · kβ ist nämlich äquivalent zur sup-Norm auf diesem Raum. Wir wollen den Banachschen Fixpunktsatz anwenden, und dazu bedarf es einer kontraktiven Abbildung. Diese ist Z x n n Φ : C([a, b], R ) → C([a, b], R ), (Φf )(x) = y0 + F (ξ, f (ξ)) dξ a Diese Abbildung hat eine besondere Bedeutung; denn der Hauptsatz der Differential- und Integralrechnung zeigt (bei koordinatenweiser Anwendung) dass die Fixpunkte von Φ genau die Lösungen der vorgelegten Anfangswertprobleme sind. Damit Φ Kontraktion wird, wählen wir β > L. Damit ergibt sich Z x k[Φ(f1 ) − Φ(f2 )](x)k = F (ξ, f1 (ξ)) − F (ξ, f2 (ξ)) dξ ≤ a Z x Z x ≤ Lkf1 (ξ) − f2 (ξ)k dξ ≤ Lkf1 − f2 kβ eβξ dξ = a a 1 L = Lkf1 − f2 kβ (eβx − eβa ) ≤ eβx kf1 − f2 kβ , β β und wir erhalten kΦ(f1 ) − Φ(f2 )kβ ≤ L kf1 − f2 kβ β was aufgrund der Wahl von β bedeutet, dass Φ eine Kontraktion ist. Aus dem Banachschen Fixpunktsatz folgt nun die Aussage des Satzes. Varianten Interessant ist die Frage, ob man den Verlauf der Lösungen eines Anfangswertproblems genauer vorhersagen kann, etwa dadurch, dass man von Vornherein die Funktion f in y 0 = f (x, y) als auf einer echten Teilmenge [a, b] × U , U ⊆ Rn gegeben betrachtet. Oft ist F dann auch auf [a, b] × U Lipschitz-stetig bezüglich der zweiten Variablen, während dies auf ganz [a, b] × Rn nicht der Fall ist. Man kann gewiss annehmen, dass U zusammenhängend ist. Es gilt dann Satz 7 (Picard-Lindelöf, lokale Version) Es sei U ⊆ Rn offen und zusammenhängend sowie dU (η) := sup r > 0 B r (η) ⊆ U 37 Werner, Universität Münster, SS 10 Ferner sei F : [a, b] × U → Rn stetig, und für positive Konstanten L, M gelte für alle x ∈ [a, b], y1,2 ∈ Rn . kF (x, y1 ) − F (x, y2 )k ≤ Lky1 − y2 k sowie kf (x, y)k ≤ M für alle (x, y) ∈ [a, b] × U . Dann besitzt das Anfangswertproblem y 0 = F (x, y), y(ξ) = η für jedes ε < M −1 dU (η) eine eindeutig bestimmte Lösung y, deren Graph in der Menge {(x, y) ∈ [ξ − ε, ξ + ε] × U | ky − ηk ≤ M |x − ξ| } enthalten ist. Der Beweis dieses Satzes unterscheidet sich nicht übermäßig von dem voranstehenden. Im Prinzip zeigt man die Ungleichung Z x kΦ(y) − ηk ≤ kF (t, y(t))k dt ≤ M |x − ξ|, ξ die es bei passender Wahl der Parameter ε und r ermöglicht, die Rekursion des Banachschen Fixpunktsatzes für Φ auf dem vollständigen metrischen Raum der stetigen Funktionen [ξ − ε, ξ + ε] → B r (η) durchzuführen. Eine Iteration Hier ist die Iteration des Beweises für das Anfangswertproblem y 0 = αy, y(0) = A. Wir wählen f0 (x) = A. Dann ist Zx F (x, f (x)) = αf (x), Φf (x) = A + α f (ξ) dξ, 0 und Zx Φf0 (x) = A + α A dξ = A + αAx 0 2 Zx Φ f0 (x) = A + α Zx Φf0 (ξ) dξ = A + α 0 A + αAξ dξ = A + αAx + α2 2 Ax 2 0 x α2 2 α2 2 α3 3 A + αAξ + Φ3 f0 (x) = A + α Aξ dξ = A + αAx + Ax + Ax 2 2 6 0 Durch vollständige Induktion, n X α 2 α3 3 αn n αν n Φ f0 (x) = A + αAx + Ax + Ax + . . . + Ax = A , 2 6 n! ν! Z ν=0 was schließlich lim Φn f0 (x) = lim A n→∞ n→∞ n X (αx)ν ν=0 ν! = Aeαx ergibt. Man beachte, dass ein anderer Startwert f0 auf eine komplett andere Folge geführt hätte. Gewöhnliche Differentialgleichungen (Kurzskript) 38 Funktionen mit und ohne Lipschitz-Eigenschaft Vom Anfangswertproblem y 0 = −y 2 , y(0) = η können wir direkt die Lösung y(x) = 1 x + 1/η ermitteln. Diese ‘explodiert’ jedoch in endlicher Zeit, ohne dass die Differentialgleichung dies zu erkennen gibt — das einzig auffällige Merkmal ist die Tatsache, dass f (x, y) = −y 2 als Funktion R2 → R nicht Lipschitz-stetig bezüglich ihres zweiten Arguments ist1 . Wir setzen an U = (η − A, η + A), A>0 Damit ist für alle x ∈ R, y ∈ U |f (x, y)| ≤ (A + |η|)2 =: M sowie dU (η) = A, und wir finden für jedes ε < A(A + |η|)−2 eine Lösung y auf dem Intervall [−ε, ε] mit |y(x) − y| ≤ (A + |η|)2 |x|. Man kann versuchen, das Intervall, auf welchem diese Lösung definiert ist, möglichst groß zu wählen. Eine Extremwertbetrachtung liefert für A = |η| die größtmöglichen Werte ε< 1 , 4|η| was einen erkennbaren Sicherheitsabstand zur Singularität am Punkt −1/η einhält. Die früher bereits betrachtete Gleichung y 0 = sign(y) p |y| besitzt eine rechte Seite, die Lipschitz-stetig in y nur dann ist, wenn der Betrag von y nach unten durch eine positive Schranke beschränkt ist. Dies ist in Übereinstimmung mit unserer Beobachtung, dass die Lösungen der Anfangswertprobleme y(ξ) = 0 im höchsten Maße uneindeutig sind. Lösungstheorie linearer Differentialgleichungssysteme Etwas allgemeiner als die im letzten Kapitel betrachtenten linearen Differentialgleichungssysteme mit konstanten Koeffizienten sind solche, bei denen die Koeffizienten von der freien Variablen (Zeit) abhängen dürfen, d.h. wir betrachten Systeme linearer Differentialgleichung erster Ordnung der Form y 0 = A(x)y, 1 A : [a, b] → Matn (K), Die Lipschitz-Bedingung überprüft man am einfachsten mit Hilfe der Ableitung nach der zweiten Variablen: Ist dieses beschränkt, so ist die Lipschitz-Bedingung erfüllt; ist diese Ableitung stetig, so gilt hiervon auch die Umkehrung. 39 Werner, Universität Münster, SS 10 wobei wir annehmen, dass die Matrizen A(x) stetig von x abhängen. In der allgemeinen Form y 0 (x) = F (x, y(x)) ist dann F (x, y(x)) = A(x)y(x), und die Funktion [a, b] × Rn 3 (x, y) 7→ F (x, y) = A(x)y ist stetig. Damit gibt es für die auf einem kompakten Intervall definierten Funktion x 7→ kA(x)} eine obere Schranke L, die wegen kF (x, y1 ) − F (x, y2 )k ≤ kA(x)k ky1 − y2 k ≤ Lky1 − y2 k Die Lipschitzkonstante ist, die wir für die Anwendung des Satzes von PicardLindelöf benötigen. Damit ergibt sich sofort der erste Teil von Satz 8 Vorgelegt sei ein System y 0 (x) = A(x)y(x), A(·) stetig. (a) Das Anfangswertproblem y(0) = η, η ∈ Rn besitzt eine eindeutig bestimmte Lösung. (a) Die Lösungsmenge von y 0 = Ay ist ein Vektorraum von Funktionen [a, b] → Rn der Dimension n. Eine Basis ist gegeben durch die n Lösungen des AWP y 0 = Ay, y(0) = y0 = ej . Für den zweiten Teil betrachtet man die Abbildung Ψ : L → Rn , Ψ(y) = y(0). Diese ist natürlich linear, die Existenzaussage des Picard-Lindelöf zeigt die Surjektivitiät von Ψ, die Eindeutigkeit der Lösungen die Injektivität. Ψ ist also ein Vektorraumisomorphismus, woraus sich die weiteren Aussagen ergeben. Ψ(ej ), j = 1, . . . , n Basis von L 3.2 Der Satz von Peano Schwächt man die Bedingung der Lipschitz-Stetigkeit im Satz von PicardLindelöf zur einfachen Stetigkeit ab, so erhält man immer noch die Existenz von Lösungen, verliert jedoch die Eindeutigkeit. Dieser sogenannte Peanosche Existenzsatz benötigt in seinen Beweisen stets eine genauere Kenntnis der Struktur kompakter Mengen von stetigen Funktionen. 3.2.1 Kompaktheit Sei (X, d) metrischer Raum. Dann heißt K ⊆ X kompakt, genau dann wenn jede Folge in K eine in K konvergente Teilfolge besitzt. Äquivalent hierzu ist, dass K abgeschlossen und überdeckungskompakt ist, dass also für jede offenen Überdeckung (Uα )α∈A offener Mengen mit eine endliche Teilüberdeckung α1 , . . . , αn ∈ A existiert. Wir werden gleich Gewöhnliche Differentialgleichungen (Kurzskript) 40 benötigen, dass es für jedes ε > 0 ein endliches, sogenanntes ε-Netz für die kompakte Menge K gibt, also eine endliche Menge {x1 , . . . , xn } ⊆ K, so dass jeder Punkt in K in seiner ε-Umgebung einen Punkt dieses Netzes vorfindet. Diese Tatsache folgt leicht aus der Überdeckungskompaktheit. Jede kompakte Menge in einem normierten Raum (V, k · k) ist beschränkt2 und abgeschlossen3 . In einem endlichdimensionalen Vektorraum ist umgekehrt auch jede beschränkte und abgeschlossene Menge kompakt. Wir beschäftigen uns mit der Bedingung, die im Raum C([a, b], Rn ) (versehen mit der Supremums-Norm) hinzuzunehmen ist, um dort Kompaktheit zu charakterisieren. Definition 4 Eine Teilmenge M ⊆ C(D, Rn ), D ⊆ R heißt gleichgradig stetig bei d0 ∈ D genau dann wenn für alle > 0 ein δ > 0 exisitiert, so dass für alle f ∈ M und d ∈ D aus kd − d0 k < δ folgt kf (d) − f (d0 )k < ε. M heißt gleichgradig stetig, wenn M an jedem Punkt von D gleichgradig stetig ist. Fast genau so, wie für eine einzelne Funktion beweist man: Jede gleichgradig stetige Teilmenge M ⊆ C(D, Rn ) mit D kompakt ist gleichgradig gleichmäßig stetig, was bedeutet, dass für jedes ε > 0 ein δ > 0 exisitiert, so dass aus |x1 − x2 | < δ stets kf (x1 ) − f (x2 )k < ε für alle f ∈ M folgt. Eine Teilmenge X0 ⊆ X, (X, d) metrischer Raum heißt dicht falls X 0 = X, oder, gleichbedeutend, falls es für alle x ∈ X eine Folge (xn ) in X0 mit x = limn→∞ xn gibt. Bekanntermaßen ist Q dicht in R, und Q ∩ [a, b] ist dicht in [a, b] für jedes Intervall [a, b] mit nichtleerem Innern. Lemma 8.1 Es sei A ⊆ [a, b] dicht. Konvergiert eine Folge (fn ) gleichgradig stetiger Funktionen fn : [a, b] → Rn punktweise auf A, so konvergiert (fn ) gleichmäßig auf ganz [a, b]. Wir zeigen, dass (fn ) eine Cauchy-Folge ist, was ausreicht, da ja der hier betrachtete Raum vollständig ist. Es sei ε > 0. Da die Folge (fn ) aus gleichmäßig gleichgradig stetigen Funktionen besteht, finden wir δ > 0 mit |x1 − x2 | < δ impliziert kfn (x1 ) − fn (x2 )k < ε 3 für alle n ∈ N. Da A dicht in [a, b] ist, gibt es a1 , . . . , ak so, dass für jedes x ∈ [a, b] ein aκ mit |x − aκ | < δ existiert. Da die Folgen (fn (rκ ))n für jedes κ konvergieren, 2 Falls nicht, so existiert eine Folge (kn )n∈N in K mit kkn k ≥ n ∀n ∈ N, die jedoch bestimmt keine konvergente Teilfolge besitzen kann. 3 Für eine in X konvergente Folge (xn ) muss der in K vorhandende Teilfolgenlimes der Limes der ganzen Folge sein und folglich in K liegen. 41 Werner, Universität Münster, SS 10 gibt es natürliche Zahlen Nκ (ε/3), κ = 1, . . . , k mit |fn (rκ ) − fm (rκ )| < ε/3, falls m, n ≥ Nκ . Für m, n ≥ N (ε) := max Nκ 1≤κ≤k gelten diese Abschätzungen an allen Punkte rκ gleichzeitig, und es folgt für alle m, n ≥ N (ε) und alle x ∈ [a, b] kfm (x) − fn (x)k ≤ ε ≤ kfm (x) − fm (rκ )k + kfm (rκ ) − fn (rκ )k + kfn (rκ ) − fn (x)k < 3 = ε, 3 wobei rκ in Abhänigkeit von x gewählt werden muss, die Abschätzungen dann aber letztlich unbhängig von dieser Wahl erfolgen können. Dieses Lemma verschafft einem rasch Beispiele für nicht gleichgradig stetige Mengen. Ist etwa fn : [0, 1] → R, fn (x) = xn , so konvergiert die Folge (fn ) bekanntlich punktweise gegen eine unstetige Funktion. Damit kann diese Folge nicht gleichmäßig konvergieren und aufgrund des soeben bewiesenen Lemmas auch nicht gleichgradig stetig sein. Satz 9 (Arzela-Ascolı́) Eine Teilmenge K ⊆ C([a, b], Rn ) ist kompakt genau dann, wenn K abgeschlossen, beschränkt und gleichgradig stetig ist. Ist K kompakt, so wählt man zu vorgegebenem ε > 0 ein ε/3-Netz Z in K und wählt δ(ε) jeweils als das Minimum der zu den Elementen von Z gehörigen δ’s zum Wert ε/3. Die andere Richtung benutzt Lemma 8.1 sowie den berühmten ‘Diagonalfolgentrick’: Es sei K beschränkt, abgeschlossen und gleichmäßig gleichgradig stetig sowie (fn )n∈N eine Folge in K. Es bezeichne A die dichte und abzählbaren Menge Q ∩ [a, b] = {rn | n ∈ N }. Da K beschränkt ist, finden wir induktiv Folgen (fni1 ,i2 ,...,ik ) mit fni1 ,i2 ,...,ik ,ik+1 ik+1 ∈N ist Teilfolge von fni1 ,i2 ,...,ik ik ∈N sowie fni1 ,i2 ,...,ik (rκ ) ik ∈N konvergiert für 1 ≤ κ ≤ k. Die Diagonalfolge fn1 , fni1 ,2 , fni1 ,i2 ,3 , ..., fni1 ,i2 ,...,ik−1 ,k , ... konvergiert dann an allen Punkten rn ∈ A. Nach dem Lemma konvergiert diese Teilfolge von (fn ) gleichmäßig gegen eine stetige Funktion f , die in K liegen muss, da K ja abgeschlossen ist. Gewöhnliche Differentialgleichungen (Kurzskript) 3.2.2 42 Der Schaudersche Fixpunktsatz Satz 10 (Schauderscher Fixpunktsatz) Es sei (X, k k) ein normierter Raum, D ⊆ X abgeschlossen und konvex. Ist das Bild der Abbildung Φ : D → D in einer kompakten Menge enthalten, so beitzt Φ einen Fixpunkt ξ ∈ D. Dieser Satz ist wesentlich schwieriger zu beweisen als der Banachsche Fixpunktsatz. Im eindimensionalen Fall ergibt er sich aus dem Zwischenwertsatz. Der Fall beliebiger endlicher Dimension stammt im Prinzip von Brouwer. Diesen Spezialfall nutzt auch die Verallgemeinerung für unendliche Dimensionen. Wir wenden diesen Satz hier an im Beweis von Satz 11 (Existenzsatz von Peano) Es sei U ⊆ Rn offen und zusammenhängend sowie d := sup r > 0 B r (η) ⊆ U Ferner sei F : [a, b] × U → Rn stetig mit kf (x, y)k ≤ M für alle (x, y) ∈ [a, b] × U . Dann besitzt das Anfangswertproblem y 0 = F (x, y), y(ξ) = η für jedes ε < M −1 d/2 eine Lösung y, deren Graph in der Menge {(x, y) ∈ [ξ − ε, ξ + ε] × U | ky − ηk ≤ M |x − ξ| } enthalten ist. Beim Beweis beginnt man wiederum mit der Abbildung Z x Φ(f )(x) = η + F (t, y(t)) dt, ξ die wir uns als Abbildung der konvexen Menge C([ξ − ε, ξ + ε], Bd (η)), vorstellen — dass Φ ein Element dieser Menge in diese abbildet, folgt aus der für f ∈ C([ξ − ε, ξ + ε], Bd (η)) gültigen Abschätzung Z x kΦ(f )(x) − ηk ≤ kF (t, y(t))k dt ≤ 2εM < d. ξ Wir haben dann noch zu zeigen, dass das Bild von Φ in einer kompakten Menge enthalten ist. Wegen Im Φ ⊆ C([ξ − ε, ξ + ε], Bε (η)) ist das Bild beschränkt. Zeigen wir, dass die Elemente in Im Φ gleichgradig stetig sind, dann ist der Abschluss der Menge Im Φ die gesuchte kompakte Menge; denn gleichgradige Stetigkeit vererbt sich auf den Grenzwert gleichmäßig konvergenter Folgen. Für eine Funktion der Form Φ(f ) gilt jedoch für x1 ≤ x2 Z x2 kΦ(f )(x1 ) − Φ(f )(x2 )k ≤ kF (t, y(t))k dt ≤ M |x1 − x2 |, x1 43 Werner, Universität Münster, SS 10 woraus die gleichmäßige Stetigkeit dieser Funktionenmenge folgt4 3.3 Verfeinerungen Wir werden im Folgenden stets von sogenannten autonomen Differentialgleichungen ausgehen, Gleichungen der Form y 0 = F (y), deren rechte Seite nicht explizit von der Zeit abhängt. Im nächsten Abschnitt ist dies reduziert das nur den Aufwand; im übernächsten gehen wir auf diese Weise größeren Schwierigkeiten aus dem Weg. 3.3.1 Maximale Definitionsbereiche Es sei U ⊆ Rn offen. Eine Funktion F : U → Rn heißt lokal Lipschitz, wenn für alle u ∈ U eine Umgebung V in U existiert, so dass F |U einer Lipschitzbedingung genügt. Der Unterschied zur einer auf ganz U bestehenden Lipschitz-Bedingung besteht darin, dass im lokalen Fall die LipschitzKonstanten variieren und somit auch beliebig groß werden dürfen. Der Mittelwertsatz der Differentialrechnung (sowie die Tatsache, dass stetige Funktionen auf kompakten Mengen beschränkt sind) zeigt, dass Funktionen mit stetiger Ableitung lokal Lipschitz sind. Satz 12 Es sei U ⊆ Rn offen und F : U → Rn lokal Lipschitz. Dann existiert ein offenes Intervall Imax sowie eine Lösung ymax : Imax → Rn des Anfangswertproblems y 0 = F (y), y(0) = η mit der Eigenschaft, dass für jede weitere Lösung y : I → Rn , I offen, gilt I ⊆ Imax und ymax |I = y. Beim Beweis dieser Aussage macht man sich zunächst klar, dass Lösungen y1,2 des Anfangswertproblems y 0 = F (y), y(t0 ) = y0 , die auf einem gemeinsamen offenen Intervall I definiert sind, dort übereinstimmen: Der Satz von Picard-Lindelöff und die lokale Lipschitz-Eigenschaft von F garantieren, dass dies für ein erst einmal kleineres Intervall I0 ⊆ I der Fall ist. Bezeichnet I ∗ jedoch das maximale Intervall mit y1 |I ∗ = y2 |I ∗ und wäre I ∗ echt in I enthalten, so besäßen aufgrund ihrer Stetigkeit beide Funktionen (etwa) auf dem rechten Randpunkt b von I ∗ immer noch denselben Wert. 4 Es gibt einen etwas direkteren Beweis dieses Satzes, der zugleich — mit etwas mehr Aufwand — zu einem numerischen Verfahren führt. Dazu konstruiert man für jedes η > 0 einen Polygonzug Πη über dem Intervall [ξ − ε, ξ + ε] mit Πη (ξ) = η, der an seinen differenzierbaren Stellen x der Beziehung kΠ0η (x) − F (x, Πη (x))k < η genügt. Die Funktionen Πη , η > 0 sind dann gleichgradig stetig, so dass eine gleichmäßig konvergente Folge Πηn , ηn → 0 existiert, von der man zeigen kann, dass sie gegen eine Lösung konvergiert. Gewöhnliche Differentialgleichungen (Kurzskript) 44 Das Anfangswertproblem y 0 = F (y), y(b) = y1,2 (b) besäße dann aber eine eindeutige Lösung, die beide Funktionen in eindeutiger Weise ein Stück weit fortsetzt, was ein Widerspruch zu Maximalität von I ∗ darstellt. Wir setzen nun m = inf {t ∈ R | Es gibt eine Lösung auf [m, 0] } , M = sup {t ∈ R | Es gibt eine Lösung auf [0, M ] } , Imax = (m, M ), wählen für t ∈ Imax eine Lösung y auf [0, t] und definieren ymax (t) = y(t). Dies ergibt aufgrund des oben gesagten eine auf ganz Imax wohldefinierte, eindeutig bestimmte Lösung des Anfanswertproblems. Was ist im Allgemeinen der Grund dafür, dass man eine Lösung nicht über Imax hinaus fortsetzen kann? Die etwas verwickelte Antwort enthält der folgende Satz 13 Gilt für Imax = (m, M ) dass M < ∞, so existiert für jede kompakte Teilmenge K ⊆ U gibt es einen Punkt t ≥ M mit ymax (t) 6∈ K. Eine ähnliche Aussage gilt im Fall m > −∞. Beim Beweis nimmt man an, dass für alle t ∈ Imax die Funktionswerte ymax (t) in einer kompakten Menge K ⊆ U enthalten sind. Es sei S ≥ 0 mit kF (x)k ≤ S für alle x ∈ K. Unter diesen Umständen wäre dann ymax in den Randpunkte M von Imax fortsetzbar. Hierzu zeigt man, dass ymax gleichmäßig (sogar Lipschitz-) stetig ist: Z t2 Z t2 0 kymax (t1 ) − ymax (t2 )k = y (t) dt kF (y(t))k dt ≤ S(t2 − t1 ) ≤ t1 t1 Eine gleichmäßig stetige Funktion ϕ : (a, b) → R lässt sich jedoch immer in die Randpunkte ihres Definitionsbereichs hinein fortsetzen5 Die auf (m, M ] fortgesetzte stetige Funktion ymax ist in M differenzierbar und genügt der Differentialgleichung. Dies gilt wegen Z ymax(b) = η + lim β→b 0 β Z F (ymax (t)) dt = η + b F (ymax (t)) dt, 0 was sich wiederum aus der Stetigkeit der Integralfunktion ergibt. Jetzt gäbe es aber eine Lösung auf einem Intervall (M −ε, M +ε), ε > 0, die die Lösung 5 Ist (bn ) eine gegen b konvergierende Folge in (a, b), so zeigt die gleichmäßige Stetigkeit, dass ϕ(bn ) eine Cauchy-Folge ist. Deren Grenzwert definiert ϕ(b). Dies ist wohldefiniert. Ist nämlich βn eine weiter Folge aus (a, b) mit Grenzwert b, so besitzt diesen Grenzwert auch die Mischfolge b1 , β1 , b2 , β2 , . . .. Da wie zuvor die Folgen (f (bn )), (f (βn )) sowie f (b1 ), f (β1 ), f (b2 ), . . . allesamt konvergent sind, folgt limn→∞ f (bn ) = limn→∞ f (βn ), und ϕ ist in den Punkt b hinein stetig fortgesetzt. 45 Werner, Universität Münster, SS 10 (eindeutig bestimmte) Lösung ymax auf das Intervall (m, M + ε) fortsetzt, was ein Widerspruch ist. Anders ausgedrückt existiert eine Folge (tn ) in Imax mit (tn ) → M und ymax (tn ) kommt dem Rand von U beliebig nah, wobei man hier in den ‘Rand’ von U auch den ‘Punkt’ ∞ einfügen muss6 Eine Folgerung des Beweises des letzten Satzes ist Korollar 13.1 Ist F : U → Rn lokal Lipschitz, und gibt es eine kompakte Menge K ⊆ U mit der Eigenschaft, dass das Bild jeder Lösung des Anfangswertproblems y(0) = η der Form y : [0, β) in K enthalten ist, dann existiert eine Lösung des Anfangswertproblems, welche auf ganz R+ 0 definiert ist. Weitere Beispiele Die Differentialgleichung y 0 = 1 + x2 besitzt eine stetig differenzierbare, auf ganz R definierte rechte Seite. Die Lösungen errechnet man zu y = tan(x + C), C ∈ R. Der maximale Definitionsbereich dieser Lösungen ist das offene Intervall mit den Ranpunkten ±π/2 − C. An diesen Punkten erreichen die Lösungen die ‘Randpunkte’ ±∞. Die rechte Seite der Gleichung y0 = 1 y2 − 1 ist auf dem offenen Intervall (−1, 1) definiert und dort differenzierbar mit stetiger Ableitung, folglich lokal Lipschitz. Die allgemeine Lösung lautet y3 −y+C =x 3 diese Kurve besitzt als Funktion des Typs y 7→ x = g(y) ein lokales Minimum bei 1 sowie ein lokales Maximum bei −1. Zwischen diesen Punkt fällt sie streng monoton und kann daher nach y aufgelöst werden. Dies ergibt die Lösungen der Anfangswertprobleme auf ihrem maximalen Definitionsbereich (−1, 1). Alle diese Funktionen erreichen auf dem Rand des maximalen 6 Man sieht dies, wenn man aus der Folge (tn ) mit f (tn ) 6∈ {x ∈ U | kxk ≤ n und dist(x, ∂K) ≥ 1/n } eine konvergente Teilfolge auswählt. Gewöhnliche Differentialgleichungen (Kurzskript) 46 Definitionsbereichs den Rand des Definitionsbereichs der rechten Seite der Differentialgleichung. Bei der Gleichung y0 = lässt sich F (x, y) = zes zeigt man 1 1+y 2 1 1 + y2 auf ganz R definieren. Mit Hilfe des Mittelwertsat- 2η |y2 − y1 | |F (x, y1 ) − F (x, y2 )| ≤ sup 2 2 (1 + η ) η∈R Wegen limη→±∞ 2η(1+η 2 )−2 = 0 erfüllt F überall eine Lipschitz-Bedingung mit derselben Konstanten. Mit Hilfe des Satzes von Picard-Lindelöf kann man zeigen, dass auch in einer solchen Situation aufs ganz R definierte Lösungen existieren (Übung). In der Tat ist die Lösung des Anfangswertproblems y(0) = y0 durch y+ y3 y3 − y0 − 0 = x 3 3 gegeben. Da y 7→ y + (1/3)y 3 streng monoton wächst, lässt sich diese Gleichung für alle x ∈ R nach y auflösen, was die vorhergesagte, überall definierte Lösung ergibt. 3.3.2 Der Fluss Wir werden in diesem Absatz die anschauliche Vorstellung prßisieren, die allgemeine Lösung einer Differentialgleichung für etwas hält, das einen gegebenen Punkt im Laufe der Zeit entlang eines Flusses in ein Lösung des entsprechenden Anfangswertproblems verwandelt. Wir werden meist davon ausgehen, dass wir es mit einer autonomen Gleichung zu tun haben, deren rechte Seite C 1 , also auch lokal Lipschitz ist. Es sei also U offen und F : U → Rn stetig differenzierbar. Damit besitzt das Anfangswertproblem y 0 = F (y), y(0) = η eine eindeutig bestimmte Lösung auf einem maximalen offenen Intervall mit den Randpunkten ±a = ±a(η). Wir schreiben für t ∈ (−a, a) und y0 ∈ U Φt (η) = y falls y 0 = F (y(t)) und y(0) = η Die für η ∈ U und t ∈ (−a(η), a(η)) definierte Abbildung Φt (η) nennt man den Fluss der Gleichung y 0 = F (x, y). Die elementaren Eigenschaften des Flusse sind: Φ0 = Id Φs+t = Φs Φt sowie Φ−t = Φ−1 t 47 Werner, Universität Münster, SS 10 Da die Funktion (t, η) 7→ Φt (η) im Allgemeinen einen etwas komplizierten Definitionsbereich besitzt, können diese Eigenschaften (die ansonsten leicht aus der Definition und der Eindeutigkeit der Lösung des Anfangswertproblems folgen) nur für solche s, t hingeschrieben werden, für die diese Gleichungen Sinn machen. Beispiele Für die weiter oben behandelte Gleichung y 0 = 1 + y 2 ist y(t) = tan(t + arctan η) die Lösung des Anfangswertproblems y(0) = η mit maximalem Definitionsbereich (−π/2 − arctan η, π/2 − arctan η). Dann ist der Fluss für diese Gleichung durch Φt (η) = tan(t + arctan η), (t, η) ∈ (−π/2 − arctan η, π/2 − arctan η) × R gegeben. Ein besonders prägnantes Beispiel ist ein lineares System mit konstanten Koeffizienten y 0 = Ay. Die allgemeine Lösung des Anfangswerproblems y(0) = η war ja exp(tA)η, und so ergibt sich hier Φt = exp(tA), t∈R Man kann zeigen, dass für die Gleichung y 0 = F (y) der Fluss stets differenzierbar von beiden Veränderlichen abhängt. Wir beschränken uns hier darauf nachzuweisen, dass diese Abhängigkeit stetig ist. Interessanterweise kann man etwas mehr zeigen: Satz 14 Es seien U ⊆ Rn offen, und F : U → Rn sei Liptschitz-stetig mit Konstante L ≥ 0. Es seien y1,2 zwei Lösungen der Differentialgleichung y 0 = F (y), die auf (a, b) definiert sind und in U verbleiben. Dann gilt für t0 , t ∈ (a, b) ky1 (t) − y2 (t)k ≤ eL|t−t0 | ky1 (t0 ) − y2 (t0 )k Korollar 14.1 Es sei F : U → Rn lokal Lipschitz sowie (t, x) → Φt (x) der auf {(t, x) | t ∈ (−a(x), a(x)), x ∈ Rn } definierte Fluss der Differentialgleichung y 0 = F (y). Dann ist Φ in t und x stetig. Die Stetigkeit (Differenzierbarkeit) in der Variablen t folgt unmittelbar aus der Definition des Flusses. Die Stetigkeit in der Ortsvariablen ergibt sich aus dem Satz, der die Differenz zweier Lösungen in einer Nachbarschaft des Punktes t0 zum gleichen Zeitpunkt t durch eine stetige, bei t0 verschwindende Funktion abschätzt. Wir beginnen den Beweis mit dem Lemma von Gronwall. Die hier bewiesene Variante ist wahrscheinlich die einfachste, die es gibt; bis auf Weiteres ist sie für unsere Zwecke ausreichend. Gewöhnliche Differentialgleichungen (Kurzskript) 48 Lemma 14.1 (Gronwall) Es seien C, K ≥ 0. Falls für die nichtnegative Funktion u : [0, a] → R gilt Z u(t) ≤ C + t Ku(τ ) dτ, t ∈ [0, a] 0 so folgt u(t) ≤ C exp (Ku(t)) für alle t ∈ [0, a]. Für den Beweis sei die rechte Seite der gegebenen Ungleichung durch U (t) abgekürzt. Wegen K > 0 folgt dann aus dieser (ln U )0 = U0 ≤ K. U Berücksichtigt man, dass Integration positiv ist, und setzt man vorläufig voraus, dass C > 0, so liefert Integration von 0 bis t ln U (t) ≤ ln U (0) + Kt = ln C + Kt. Damit aber folgt bereits u(t) ≤ U (t) ≤ CeKt . Ist schließlich C = 0, so folgt die Aussage aus einer Approximation von C durch eine Folge (Cn ) mit Cn > 0 und lim Cn = 0. Der Beweis des Satzes ergibt sich im Wesentlichen aus diesem Lemma: Man setzt u(t) = ky1 (t) − y2 (t)k, und folgert aus der Tatsache, dass beide Funktionen Lösungen sind Z t u(t) ≤ u(t0 ) + Lu(τ ) dτ. t0 Jetzt stimmt noch etwas mit den Zeiten nicht, was behoben ist, sobald wir zu v(t) = u(t + t0 ) übergehen. Nun gilt die Eingangsungleichung des GronwallLemmas in der Form Z t v(t) ≤ v(0) + Lv(τ ) dτ, 0 und es folgt v(t) ≤ v(0) exp Lv(t). Dies ist unschwer als die Aussage des Satzes zu erkennen. Kapitel 4 Stabilität Eine sehr allgemeine Idee bei der Untersuchung von Differentialgleichungen ist der Versuch, den Fluss in niedrigdimensionale Komponenten zu zerlegen, die dann vielleicht besser einer genaueren Analyse zugänglich sind. Diese Komponeten hätten invariant zu sein: Eine Lösungskurve verlässt sie nicht mehr, wenn einer ihrer Punkte zu irgendeinem Zeitpunkt in dieser Menge gelegen hat. Erfolgreich wäre eine solche Strategie, wenn es gelänge, jeden Fluss auf diese Weise in ‘Primfaktoren’ zu zerlegen. Leider ist das alles ein wenig komplizierter, und so muss z.B. auch untersucht werden, wie sich die Lösungskurven in der Nachbarschaft einer invarianten Teilmenge verhalten.— Wir befassen uns im Folgenden mit einer allerersten Stufe dieses Programms: Die invarianten Teilmengen sind hier Punkte (sogenannte Gleichgewichtslagen), und das Verhalten der Lösungen um diese Punkte herum beschreiben wir durch verschiedene Formen von ‘Stabilität’. 4.1 Definitionen und Beispiele Definition 5 Es sei F : U → Rn ein auf der offenen Menge U ⊆ Rn definiertes Vektorfeld. Eine Gleichgewichtslage für die autonome Gleichung y 0 = F (y) ist jeder Punkt y0 , für den die konstante Funktion y(t) = y0 eine Lösung ist. Ganz offensichtlich ist y0 genau dann ein solcher Punkt, wenn F (y0 ) = 0 ist. Definition 6 Es sei y0 eine Gleichgewichtslage des Systems y 0 = F (y). Dann heißt y0 (i) stabil, falls für alle ε > 0 ein δ > 0 existiert, so dass für alle y ∈ U mit ky − y0 k < δ und alle t ≥ 0 gilt kΦt (y) − y0 k < ε. 49 Gewöhnliche Differentialgleichungen (Kurzskript) 50 (ii) attraktiv, falls es ein δ > 0 gibt mit lim kΦt (y) − y0 k = 0, t→∞ für ky − y0 k < δ, (iii) asymptotisch stabil, falls dieser Punkt stabil und attraktiv ist, sowie (iv) instabil, falls y0 nicht stabil ist. Beispiele Die rechte Seite der Gleichung p y0 = 1 − y2 verschwindet an den Punkten y = ±1, wesegen diese beiden Punkte die Gleichgewichtslagen sind. Die Lösungen der Gleichung sind y(t) = sin(t + C), C ∈ R, sowie y = ±1, Unabhängig davon, wie dicht eine Lösung einem der Punkte ±1 kommt: Sie wird stets nach einiger Zeit zu diesem den Abstand 2 erreichen, und daher sind die Punkte ±1 instabile Gleichgewichtslagen. Lässt man die Wurzel weg und betrachtet y 0 = 1 − y 2 , so liegen unverändert Gleichgewichtslagen bei ±1 vor. Da die Lösungen dieser Gleichung, y(t) = tanh(t + C), C ∈ R, und y = ±1, für t → ±∞ gegen ±1 konvergieren, sind diese Punkte attraktiv und aufgrund der Monotonie des Tangenshyperbolicus asymptotisch stabil. Die Systeme linearer Gleichungen mit konstanten Koeffizienten der Dimension 2, die über ein Paar rein imaginärer Eigenwerte verfügen, besitzen den Ursprung als einzige Gleichgewichtslage (zumindest, wenn der Begriff ‘rein imaginär’ die Null ausschließt). Die Lösungskurven sind dann in der Ebene um den Ursprung gedrehte Ellipsen mit einem festen Verhältnis der Hauptachsen. Wählt man für ε > 0 die Zahl δ > 0 so, dass sich ε zu δ wie die kleinen zu den großen Hauptachsen verhalten, dann verläuft eine Lösung, die in einer δ-Umgebung des Ursprungs startet, stets in einer ε-Umgebung. Der Ursprung ist also eine stabile Gleichgewichtslage, die nicht attraktiv ist. 4.1.1 Der Fall linearer Gleichungen mit konstanten Koeffizienten Wir betrachten lineare Gleichungen y 0 = Ay, A eine n × n-Matrix. Der Ursprung ist in jedem Fall eine Gleichgewichtslage. Deren Stabilitätsverhalten beschreibt 51 Werner, Universität Münster, SS 10 Satz 15 Es sei A = ∆ + N die Jordan-Zerlegung der Matrix A sowie λ1 , . . . , λn deren mit ihren Vielfachheiten gezählten Eigenwerte. Für die Gleichung y 0 = Ay ist der Nullpunkt (i) asymptotisch stabil, falls max Re λi < 0, i=1,...,n (ii) sowie instabil, falls max Re λi > 0. i=1,...,n (iii) Ist maxi=1,...,n Re λi = 0, so gilt (a) der Ursprung ist stabil und nicht attraktiv, wenn die Einschränkung A|Eλ auf den Eigenraum Eλ von ∆ für jeden Eigenwert λ mit Re λ = 0 (über C) diagonalisierbar ist, (b) während er instabil ist, wenn N |Eλ 6= 0 für wenigstens ein Eigenwert λ mit Re λ = 0. Der Teil (i) dieser Aussage folgt aus der Abschätzung k κN κ X t k exp(tA)x0 k = T diag(eλ1 t , . . . , eλn t )T −1 x0 ≤ κ! κ=1 X k tκ kN kκ kx0 k; ≤ kT kkT −1 k exp max Re λi t i=1,...,n κ! κ=1 denn wegen max Re λi < 0 verschwindet die rechte Seite, falls t → ∞ (Regel von l’Hospital), und der Nullpunkt ist attraktiv. Dieselbe Abschätzung verwendet man, um die Stabilität nachzuweisen. Ist für (ii) Re λ > 0 und v eine Eigenvektor zum Eigenwert λ, so ist der Ursprung wegen k exp(tA)vk = eRe λt kvk → ∞ für t → ∞ instabil. Ist λ ein Eigenwert mit Re λ = 0, so können wir für den Fall, dass A − λId|Eλ = N |Eλ 6= 0 einen Vektor v mit N (v) 6= 0 und N k = 0 für k ≥ 2 wählen. Für einen solchen Vektor gilt dann k exp(tA)vk = eλt (v + tN (v)) ≥ |t|kN (v)k − kvk, Gewöhnliche Differentialgleichungen (Kurzskript) 52 was zeigt, dass in einem solchen Fall der Ursprung nicht stabil sein kann. Für den Teil (b) schreiben wir M M Eλ , Eλ sowie Ec = Es = Re λ=0 Re λ<0 so dass also E = Es ⊕ Ec . Mann nennt Es die stabile Mannigfaltigkeit und Ec die Zentrumsmanigfaltigkeit von A. Ist nun Ac := A|Ec diagonalisierbar, so gilt wie im Beweis von (i) k exp(tAc )x0 k ≤ kT kkT −1 kkx0 k. Ist ε > 0, so gilt für kx0 k < δ := ε kT kkT −1 k k exp(tAc )x0 k < ε, und der Ursprung ist stabil für Ac . Da A = As ⊕ Ac und weil der Ursprung asymptotisch für As ist, ergibt sich auch hier die Behauptung. 4.2 Hyperbolische Gleichgewichstlagen nichtlinearer Systeme Die Idee für die folgenden Abschnitte besteht darin, ein nichtlineares System y 0 = F (y) an einer Gleichgewichtslage y0 durch das linearisierte System y 0 = F 0 (y0 )y zu ‘approximieren’ und zu hoffen, dass man auf diese Weise zumindest etwas über den Stabilitätstyp von y0 für das nichtlineare System aussagen kann. Geht man über zu y = y − y0 , ändert sich die Form der Gleichung nicht. Auch die Linearisierte Gleichung sieht aus wie zuvor. Der einzige Unterschied besteht darin, dass nun der Ursprung ein Gleichgewicht ist. Wir werden häufig von dieser Möglichkeit Gebrauch machen. 4.2.1 Drei nicht lineare Systeme Wir beginnen damit, ein paar Beispiele genauer anzusehen. Der angenehme Fall Vorgelegt sei x0 = x + y 2 0 y = −y. (4.1) (4.2) Dieses System kann man explizit lösen. Der zweiten Gleichung entnimmt man y(t) = C1 e−t . Setzt man dies in die erste Gleichung ein, so ergibt sich x0 = x + C12 e−2t , 53 Werner, Universität Münster, SS 10 was eine inhomogene lineare Differentialgleichung 1.Ordnung ist. Deren Lösung können wir berechnen, x(t) = C2 et − C12 −2t e 3 Das Anfangswertproblem y(0, 0) = (x0 , y0 ) wird so durch x(t) = y2 y2 x0 + 0 − 0 e−2t 3 3 y(t) = y0 e−t gelöst. Es gibt hier zwei interessante Kurven, die x-Achse und die durch die Gleichung x+ y2 =0 3 bestimmte Kurve. Beide sind Lösungskurven, eine Lösung, die auf ihnen startet, verlässt diese nicht mehr. Unterscheiden von anderen solchen Kurven tun sie sich auf Grund der Tatsache, dass sie den Ursprung enthalten. Der Ursprung ist die einzige Gleichgewichtslage. Die Ableitung der Funktion F ist durch die Jacobi-Matrix 1 2y F (x, y) = 0 −1 0 gegeben. Das am Ursprung linearisierte System besitzt daher die Form x0 = x y 0 = −y. Ursprungsgleichung und deren Linearisierung am Nullpunkt sind hier ganz besonders eng miteinander verknüpft. Die Transfmoration (u, v) = T (x, y) mit y2 u=x+ v=y 3 bildet besitzt als ‘Koordinatenlinien’ die zuvor erwähnten Kurven. Schreibt man das gegeben System in diesen neuen Koordinaten, so erhält man 2 u0 = x0 + yy 0 = u 3 v 0 = y 0 = −v, also gerade das linearisierte System bezüglich der Koordinaten u, v. Gewöhnliche Differentialgleichungen (Kurzskript) 54 Abbildung 4.1: Das hier besprochene nicht lineare System (links) sowie dessen Linearsierung um den Ursprung. Blau hervorgehoben sind die ineinander deformierten ‘Koordinatenachsen’ Lokal in Ordnung, global daneben Das letzte Beispiel ist ein eher selten anzutreffender Idealfall. Häufiger ist es möglich, Differentialgleichung zumindest lokal um eine Gleichgewichtslage herum in die linearisierte Gleichung zu transformieren. Wir betrachten das System 1 x0 = x − y − 2 1 0 y = y+x− 2 1 3 x + y2x 2 1 3 z + x2 y 2 Auch dieses lässt sich explizit lösen, wenn man zuvor die Lösungskurven in Polarkoordinaten schreibt, x(t) = r(t) cos ϕ(t) y(t) = r(t) sin ϕ(t). Dann erhält man das System r0 = r(1 − r2 ) 2 ϕ0 = 1 Man braucht dieses System nicht explizit zu lösen, um die wesentlichen Züge seines Verhaltens um das (einzige) Gleichgewicht (0, 0) zu ergründen. Für Lösungen mit r = 1 verlassen den Einheitskreis offensichtlich nicht, solche mit r > 1 werden (da hier r0 < 0 gilt) in Richtung des Ursprungs und solche mit r < 1 (wegen r0 > 0) vom Ursprung weg vom Einheitskreis angezogen. Da es kein lineares System gibt, das eine einzelne, in sich geschlossene Lösungskurve besitzt, kann es keine globale Transformation geben, die dieses 55 Werner, Universität Münster, SS 10 System in ein lineares überführt. Die Linearisierung am Ursprung ist durch 0 1 x −1 x 2 = 1 12 y0 y gegeben. Auch dieses System besitzt den Ursprung als instabilen Gleichgewichtspunkt, und man kann auch eine Transformation finden, die beide Systeme auf dem offenen Einheitskreis ineinander überführt. Abbildung 4.2: Das der linken Abbildung zu Grunde liegende System lässt sich im Innern des Einheitskreis in die Linearisierung um den Ursprung deformieren. Jenseits davon nicht mehr. Ein anderes Gleichgewicht Auch das System x0 = −y + x(x2 + y 2 ) y 0 = x + y(x2 + y 2 ) ist direkt durch Transformation auf Polarkoordinaten behandelbar. Man erhält r0 = r3 ϕ0 = −1. Offensichtlich ist der Ursprung ein abstoßendes Gleichgewicht. Bei dem um den Nullpunkt linearisierten System x0 = −y y0 = x liegt ein stabiles Gleichgewicht vor. Wie wir gleich sehen werden, schließt ein solches Verhalten die Existenz einer Koordinatentransformation aus, die das Ausgangssystem in seine Linearisierung überführt. Gewöhnliche Differentialgleichungen (Kurzskript) 56 Abbildung 4.3: Für das linke System ist der Ursprung offensichtlich ein abstoßendes Gleichgewicht. Bei dessen Linearisierung (rechts) geht diese Eigenschaft verloren. 4.2.2 Der Satz von Hartman-Grobman Die Gleichgewichtslagen, die sich dieser Idee gegenüber aufgeschlossen zeigen, sind Gegenstand der folgenden Definition 7 Eine Gleichgewichtslage y0 des Vektorfelds F : U → Rn heißt hyperbolisch, falls für jeden Eigenwert λ von F 0 (0) gilt Re λ 6= 0. Satz 16 (Hartman-Grobman) Es sei F : Rn → Rn ein Vektorfeld mit F (0) = 0. Ist der Ursprung ein hyperbolisches Gleichgewicht, so ist F lokal topologisch konjugiert zu F 0 (0). Wir werden diesen Satz hier nicht komplett beweisen; stattdessen betrachten wir den Begriff der topologischen Konjugiertheit etwas genau, überlegen uns, warum dieses Ergebnis im einem Spezialfall richtig ist und folgen dann dem Beweis doch lange genug, um erkennen zu können, woher der Homöomorphismus kommt, der die Konjugation stiftet. Bei dieser Gelegenheit stoßen wir auf die sogenannte Lie-Ableitung eines Vektorfelds. Topologische Konjugation Es lässt sich recht einfach zeigen, dass für zwei vermöge des Homöomorphismus h zueinander topologisch konjugierte Differentialgleichungen gilt: • h bildet die Lösungskurven des einen auf die des anderen Systems ab. • Insbesondere gilt dies auch für Gleichgewichtslagen. • Gleichgewichtslagen, die von h aufeinander abgebildet werden, sind vom gleichen Typ. 57 Werner, Universität Münster, SS 10 Die im Satz von Hartman-Grobman auftretende topologische Konjugation mutet zunächst wie ein Fremdkörper in einer Umgebung an, in der es in der Hauptsache um Differenzierbarkeit geht. Hier ist ein Beispiel, dass die Beziehung illustriert, die durch topologische Konjugation entsteht: Wir betrachten die eindimensionale Gleichung y 0 = αy mit dem Fluss Φαt (x) = xeαt und stellen uns die Frage, für welche Paare (α1 , α2 ) die zugehörigen Flüsse Φαt 1 sowie Φαt 2 zueinander konjugiert sind. Man kann sich überlegen, dass die einzige Abbildung, die als konjungierende Homöomorphismen in Frage kommen, die Abbildungen h(x) = α2 x α1 α2 −|x| α1 für x ≥ 0 für x < 0 sind. Entscheidend ist deren Verhalten am Nullpunkt (an allen anderen Stellen sind diese Abbildungen differenzierbar; die Funktionen sind stets bijektiv): Stetig sind diese Funktionen bei 0 genau dann, wenn die Vorzeichen von α1 und α2 gleich sind. Differenzierbar nur, wenn α1 = α2 ist. Mit anderen Worten: die Gleichungen y 0 = α1 y und y 0 = α2 y sind topologisch konjugiert genau dann, wenn sign α1 = sign α2 gilt. (Dies ist genau dann der Fall, wenn die Gleichgewichtslage 0 vom selben Typ ist.) Die Abbildungen sind darüberhinaus differenzierbar konjugiert nur, wenn α1 = α2 ist. Womit dieser Typ von Äquivalenzrelation zumindest in diesem Fall eine viel zu feine Einteilung liefert. Dimensionen 2, reelle Eigenwerte Wir überprüfen nun eine Vorhersage, die aus dem Satz von Hartman-Grobman hergeleitet werden kann: Besitzt die Ableitung des Vektorfelds F am Ursprung nur negative Eigenwerte, so ist der Ursprung asymptotisch stabil. Wir betrachten die zweidimensionale Situation und gehen ferner davon aus, dass F 0 (0) diagonalisierbar ist. Wir beginnen also mit einem System x0 = F1 (x, y) y 0 = F2 (x, y) Eine Taylorentwicklung um den Nullpunkt gefolgt von einer linearen Koordinatentransformation, die F 0 (0) in diag(λ, µ), λ, µ < 0 transformiert führt wegen F (0) = 0 auf x0 = λx + R1 (x, y) y 0 = µy + R2 (x, y), Gewöhnliche Differentialgleichungen (Kurzskript) 58 mit limk(x,y)→0 k(x, y)k−1 |R1,2 (x, y) = 0. Wir zeigen dass, die Vektoren (x0 , y 0 ) stets in das Innere des Kreises weisen, auf dem (x, y) liegt. Dazu gehen wir von λ ≤ µ aus und schätzen ab 0 x x , = λ(x2 + y 2 ) + y 2 (µ − λ) + xR1 (x, y) + yR2 (x, y) ≤ 0 y y ≤ λ(x2 + y 2 ) + xR1 (x, y) + yR2 (x, y). Die linken Seite schreiben wir in Polarkoordinaten, auf der rechten dividieren wir durch k(x, y)k2 und gehen zum Grenzwert k(x, y)k → 0 über. Dann folgt für x(t) = (r(t) cos ϕ(t), r(t) sin ϕ(t)) und hinreichend kleine r rr0 < λ0 r2 , 0 > λ0 > λ beliebig somit r(t) < eλ0 t , und der Ursprung ist einee asymptotisch stabile Gleichgewichtslage. Wo kommt der Homöomorphismus her? Der Homöomorphismus h, der die topologische Konjugation vermittelt, entsteht aus einer Anwendung des Banachschen Fixpunktsatzes auf eine Abbildung Ψ. Der Nachweis, dass Ψ eine Kontraktion ist, gelingt nur, wenn man das Vektorfeld F zuvor passend beschneidet. (Wenn man will, kann man in diesem Vorgang eine Analogie zu der Verwendung einer gewichteten Norm im Beweis des Satzes von Picard-Lindelöf sehen.) Wir wählen zu diesem Zweck für r > 0 eine glatte Funktion ρ : Rn → [0, 1] mit den Eigenschaften: ρ(x) = 1 für kxk < r/2, ρ(x) = 0 für kxk > r sowie kρ0 (x)k < 4/r für x ∈ Rn (Hilfreich ist es hierbei, zunächst ρ0 : R+ → R+ passend zu wählen und diese dann radial fortzusetzen.) Wir betrachten nun F0 = A + F1 mit F1 (x) := ρ(x)(F (x) − Ax). Dieses Vektorfeld ist identisch mit X auf der offenen Kugel mit Radius r/2 um den Ursprung. Da es sich bei dem Satz um eine lokale Aussage handelt, genügt es, diese für das Vektorfeld F0 zu beweisen. Wir bezeichnen mit Φt den Fluss des Vektorfelds F0 . Gesucht ist ein Homöomorphismus h, den wir in der Form h = id + h1 schreiben, mit h (exp(tA)) = Φt (h(x)) Diese letzte Gleichung ist äquivalent zu exp(−tA)h1 (exp(tA)x) = exp(−tA)Φt (h(x)), 59 Werner, Universität Münster, SS 10 wo die rechte (und damit auch die linke) Seite eine in t differnzierbare Funktion ist. Geht man zur Ableitung nach t am Nullpunkt über, so erhält man LA h1 (x) = −Ah(x) + F0 (h(x)) = F1 (h(x)), bzw. LA h1 = F1 ◦ (id + h1 ). Hier bezeichnet LA h1 die Lie-Ableitung von h1 in Richtung A. Der Beweis besteht darin zu zeigen, dass die letzte Gleichung für ausreichend kleines r > 0 eine Löusng h1 besitzt und dass h = id + h1 der gesuchte Homöomorphismus auf der r-Umgebung des Nullpunkts ist. Wir konstruieren im Folgenden eine Rechtsinverse L−1 A zur Lie-Ableitung in Richtung A. Jede Lösung h1 der Fixpunktgleichung h1 = L−1 A (F1 ◦ (id + h1 )) ist dann ein Lösung von LA h1 = F1 ◦ (id + h1 ). An dieser Stelle geht mehrfach die Hyperbolizität von A ein, und zwar in der Form von Abschätzungen, die im Prinzip identisch sind mit denen, die wir bei der Diskussion der Stabilität des Ursprungs für lineare Systeme erhalten hatten. Zerlegt man nämlich wie im Beweis von Satz 15 den Vektorruam Rn = Es ⊕ Eu und entsprechend die Vektoren v des Rn in v = vs + vu in die stabilen und instabilen Anteile zu der Abbildung A, so findet man, wiederum ähnlich wie im Beweis von Satz 15, positive Zahlen C und λ mit ketA vs k ≤ Ce−λt kvs k ke−tA vu k ≤ Ce−λt kvu k sowie (∗) Diese Zerlegung zieht eine Zerlegung ganzer Vektorfelder X nach sich, X = Xs + Xu , Xs (x) = X(x)s und Xu (x) = X(x)u . Wir betrachten die (mit einer zunächst noch zu rechtfertigenden Bezeichnung versehene) Abbildung Z ∞ Z ∞ −1 tA −tA LA X(x) := e Xs (e x) dt − e−tA Xu (etA x) dt. 0 0 Diese ist auf Grund der Abschätzungen (∗) eine stetig Abbildung: Wegen kXs,u k ≤ kXk folgt nämlich aus (∗) ketA Xs (e−tA x)k ≤ Ce−λt kXk ke−tA Xu (etA x)k ≤ Ce−λt kXk, sowie woraus sich mit kL−1 A X − L−1 A Y Z k ≤ 2CkX − Y k die Lipschitz-Stetigkeit von Raum ∞ e−λt = 2λCkX − Y k 0 L−1 A ergibt. Dass L−1 A eine auf dem Banach- Cb (Rn , Rn ) = {X : Rn → Rn | X ist stetig und beschränkt } Gewöhnliche Differentialgleichungen (Kurzskript) 60 definierte Abbildung ist, folgt aus einem entsprechenden Satz über die Stetigkeit von durch parameterabhängigen Integralen definierten Funktionen. Was uns nun noch interessiert ist, ob diese Abbildung tatsächlich die LieAbleitung in Richtung A von rechts neutralisiert. Um dies zu bestätigen, entnehmen wir den hyperbolischen Abschätzungen (∗) dieses Mal die Gleichung limθ→∞ e−θA Y (eθA x) = 0. Mit deren Hilfe folgt aus dem Hauptsatz der Differential- und Integralrechnung Z d ∞ (τ −t)A LA L−1 e Xs (e(t−τ )A x) dτ |t=0 = (X )(x) = s A dt 0 Z d ∞ −θA =− e Xs (eθA x) dθ|t=0 = e−tA Xs (etA x)|t=0 = Xs (x) dt t sowie in fast derselben Weise Z d ∞ (−τ −t)A −1 LA LA (Xu )(x) = − e Xs (e(t+τ )A x) dτ |t=0 = Xu (x). dt 0 Setzt man beide Gleichungen zusammen, ergibt sich LA L−1 A = id. Die Existenz der Abbildung h1 ergibt sich, sobald man nachweist, dass die Abbildung Ψ : f 7→ L−1 A (F1 ◦ (id + f )) ein Kontraktion ist. Für f1,2 gilt (wir nehmen den Mittelwertsatz zu Hilfe) kΨ(f1 ) − Ψ(f2 )k ≤ 2λCkF10 kkf1 − f2 k, und es ist kF10 k abzuschätzen. Eine Anwendung der Produktregel liefert zunächst für kxk ≤ r 4 kF10 (x)k ≤ kF 0 (x) − Ak + kF (x) − Axk r Wählt man r hinreichend kleine, so wird der erste Summand gleichmäßig in x so klein, wie wir das vorschreiben; denn F1 ist ein glattes Vektorfeld und A ist der Wert dessen Ableitung am Ursprung. Wendet man die TaylorFormel mit Restglied auf den zweiten Summanden an, so wird auch dieser bei passender Wahl von r ausreichend klein, und Ψ wird zu einer Kontraktion. An dieser Stelle ist der Beweis noch nicht ganz zu Ende — es bleibt immer noch zu zeigen, dass h = id + h1 tatsächlich die im Satz behaupteten Eigenschaften besitzt. Wir werden das hier nicht mehr ausführen. Gleichgewichte im Miteinander von Raubtieren und deren Beute Wir kommen zurück zu dem ganz am Anfang besprochenen System R0 = −αR + βRB B 0 = γB − δRB, 61 Werner, Universität Münster, SS 10 in dem R(t) und B(t) die Populationsdichte von Räubern bzw. deren Beutetieren beschreibt. Neben dem (reichlich trivialen) Gleichtgewichtspunkt (0, 0) gibt es noch genau einen anderen, nämlich (R0 , B0 ) = (γ/δ, α/β). Die linearisierenden Abbildungen sind hier −α 0 0 γ und 0 − δα β βγ δ ! 0 Im ersten Fall liegt nach dem Satz von Hartman-Grobman ein instabiles Gleichgewicht vor. Die nichttriviale Gleichgewichtslage hingegen ist durch rein imaginäre Eigenwerte der Jacobi-Matrix gekennzeichnet, und so ist auf diesem Wege keinerlei Aussage möglich. Etwas anders liegen die Dinge, wenn man die im ersten Kapitel besprochene Sättigung der Bestände für beide Arten einführt, R0 = −α1 R − β1 R2 + γ1 RB B 0 = α2 B − β2 B 2 − γ2 RB mit αi , βi , γi ≥ 0. Bezeichnet F das Vektorfeld auf der rechten Seite, so ist 0 F (R, B) = −α1 − 2β1 R + γ1 B γ1 R −γ2 B α2 − 2β2 B − γ2 R Für eine Gleichgewichtslage (R∞ , B∞ ), bei der beide Koordinaten von Null verschieden sind, gilt 0 = −α1 − β1 R∞ + γ1 B∞ 0 = α2 − β2 B∞ − γ2 R∞ , weshalb −β1 R∞ γ1 R∞ F (R∞ , B∞ ) = . −γ2 B∞ −β2 B∞ 0 Wenn wir uns nur für die Gleichgewichte interessieren, bei denen es keine negativen Wert für R oder B gibt, so ist für denn Fall, dass β1 β2 + γ1 γ2 6= 0 wenigstens ein βi 6= 0 sp F 0 (R∞ , B∞ ) = −β1 R∞ − β2 B∞ < 0 sowie 0 det F (R∞ , B∞ ) = (β1 β2 + γ1 γ2 )R∞ B∞ > 0. Berücksichtigt man, dass sp A die Summe und det A das Produkt der Eigenwerte der Matrix A ist, so wird klar, dass es sich bei (R∞ , B∞ ) um ein asymptotisch stabiles Gleichgewicht handelt. Gewöhnliche Differentialgleichungen (Kurzskript) 4.3 62 Ljapunow-Theorie Definition 8 Es sei U ⊆ Rn offen und F : U → Rn ein Vektorfeld. Eine Ljapunow-Funktion für F um den Punkt y0 ist eine auf einer Umgebung U von y0 definierte und dort stetige, auf U \ {y0 } glatte Funktion mit n X ∂V V̇ (x) = Fi ≤ 0. ∂xi i=1 Die Bedeutung der manchmal so genannten Orbitableitung V̇ besteht darin, dass für jede Lösung y(t) die Ableitung von V entlang y(t) durch d V (y(t)) = V 0 (y(t))y 0 (t) = V 0 (y(t))F (y) = V̇ (y(t)) dt gegeben ist. Damit kann man über das Verhalten von V (y(t)) Aussagen treffen, ohne y(t) explizit kennen zu müssen. Satz 17 (Ljapunowscher Stabilitätssatz) Es sei y0 in Gleichgewichtspunkt der Differentialgleichung y 0 = F (y) und U eine Umgebung dieses Punktes. (i) Exisitiert eine Ljapunow-Funktion V : U → R, die in y0 ein striktes Minimum annimmt, so ist y0 stabil. (ii) Gilt zusätzlich V̇ (x) < 0 für alle x ∈ U \ {y0 }, so ist y0 asymptotisch stabil. (iii) Gilt für V : U → R hingegen V̇ > 0 auf U \ {y0 } und nimmt diese Funktion in y0 kein lokalen Minimalwert an, so ist y0 instabil. 4.3.1 Zweidimensionale Systeme und die exakten Differentialgleichungen Bevor wir den Ljapunowschen Satz beweisen, wollen wir uns wiederum zunächst etwas vertrauter mit seiner Aussage machen. Wir betrachten dazu Systeme in zwei Dimensionen. Die Orbitgleichung Es sei F : R2 → R2 ein Vektorfeld. Der zweidimensionale Fall unterscheidet sich von allen höherer Dimension dadurch, dass man die Geometrie der Lösungskurven vergleichsweise einfach behandeln kann: Lemma 17.1 Vorgelegt sei das System x0 = F1 (x, y) y 0 = F2 (x, y) Gilt auf einer Umgebung U des Ursprungs F1 (x, y) 6= 0, so existiert eine glatte Funktion ψ : (a, b) → R2 deren Graph in U enthalten ist mit 63 Werner, Universität Münster, SS 10 (i) ψ genügt der Differentialgleichung y 0 F1 (x, y) − F2 (x, y) = 0 (ii) Die Funktion (x(t), y(t)) = (x(t), ψ(x(t))) genügt dem Ausgangssystem. Umgekehrt existiert für jede Lösung ψ der Gleichung y 0 F1 (x, y)−F2 (x, y) = 0 eine Lösung des Ausgangssystems der Form (x(t), ψ(x(t))). Der Beweis benutzt den Satz über implizite Funktionen sowie die Kettenregel. Erste Integrale Wir gehen davon aus, dass wir die Bilder der Lösungskurven (x(t), y(t)) des zweidimensionalen Systems (x0 , y 0 ) = (F1 , F2 ) (unter Wegfall der Parametrisierung) in der Form (x, ψ(x)) schreiben können, wobei ψ der Gleichung y 0 F1 (x, y) − F2 (x, y) = 0 genügt. Gehen wir weiterhin davon aus, dass diese Gleichung exakt ist (oder in einfacher Weise auf eine exakte Gleichung gebracht werden kann), so gilt ja Φ(x, ψ(x)) = C für eine Stammfunktion Φ von (−F2 , F1 , ) und alle solchen Funktionen ψ. Man nennt die Funktion Φ auch ein erstes Integral. Die Bedeutung dieser Bezeichnung wird deutlich, wenn man die Orbitableitung von Φ bezüglich des Vektorfelds (F1 , F2 ) anschaut: Φ̇(x, y) = ∂Φ ∂Φ F1 + F2 = −F2 F1 + F1 F2 = 0. ∂x ∂y Φ eine ganz spezielle Ljapunow-Funktion; denn Φ(x(t), y(t)) ist sogar konstant entlang der Lösungskurven (x(t), y(t)), liefert also eine sogenannte ‘erhaltene Größe’ oder eben auch ‘erstes Integral’. Wir haben so eine Möglichkeit gefunden, Ljapunow-Funktionen konkret zu bestimmen. Besitzt Φ nun ein striktes Minimum in einem Punkt (x0 , y0 ), mit F1 (x0 , y0 ) = F2 (x0 , y0 ) = 0, so befindet sich das System an diesem Punkt in einem stabilen Gleichgewicht. Nochmals Räuber und Beute Wir wenden diese Methode nun auf den noch unklaren Fall des Gleichgewichts des Systems R0 = −αR + βRB B 0 = γB − δRB, Gewöhnliche Differentialgleichungen (Kurzskript) 64 am Punkt (R0 , B0 ) = (γ/δ, α/β). Die (etwas umgeformte) Orbitgleichung lautet hier α γ 0 y − +β + −δ =0 y x Diese Gleichung ist exakt und die Lösungen ergeben sich aus V (x, y) := γ ln |x| − δx + α ln |y| − βy = C. V ist eine Ljapunow Funktion. Wir wissen bereits, dass die Ableitung V 0 = (γ/x − δ, α/y − β) am Punkt (γ/δ, α/β) verschwindet. Nun ist aber ! γ δ2 − 0 0 − γ α 2 γ x und V 00 = V 00 (x, y) = , 2 0 − yα2 δ β 0 − βα weswegen V bei im Gleichgewichtspunkt (γ/δ, α/β) ein Minimum annimmt. Dieser Punkt ist daher nach dem Satz von Ljapunow stabil1 . 4.3.2 Beweis des Stabilitätssatzes 4.3.3 Weitere Beispiele 1 Mit weiter verfeinerten Methoden kann man zeigen, dass die Lösungen in einer Umgebung um diesen Punkt periodisch sind.
© Copyright 2025 ExpyDoc