Skript zur Vorlesung Numerik gewöhnlicher Differentialgleichungen Dr. M. Weise gehalten im WS2015/16 Technische Universität Chemnitz Website zur Vorlesung: http://www-user.tu-chemnitz.de/~wmicha/w15num_ode/ Dieses Vorlesungsskript wurde im WS 2006/07 erstellt von Roland Herzog unter Benutzung früherer Vorlesungen und Übungen von Prof. Peter Benner, Prof. Rüdiger Weiner, Prof. Joachim Stöckler, Prof. Hans Josef Pesch und Prof. Rolf Rannacher, denen ich herzlich für das Zurverfügungstellen der Unterlagen danke. Im WS 2007/08, WS 2012/2013 und WS 2013/2014 wurde es durch Rene Schneider teilweise überarbeitet und erweitert. Im WS 2010/11 hat Herbert Egger die Vorlesung gehalten und viele Hinweise zur Überarbeitung gegeben, die im WS 2011/12 zu einer wesentlichen Verbesserung geführt haben. Material für: 20–21 Vorlesungen à 90 Minuten Fehler und Kommentare bitte an: [email protected] Stand: 9. Oktober 2015 Inhaltsverzeichnis Kapitel 0. Einführung und Motivation 5 1 Aufgabenstellung, Beispiele und Ziele der Vorlesung 5 2 Wiederholung und Notation 8 Kapitel 1. Numerische Lösung von Anfangswertproblemen 15 3 Einschrittverfahren 3.1 Grundbegriffe und ein erstes Verfahren 3.2 Konvergenzanalysis allgemeiner Einschrittverfahren 3.3 Runge-Kutta-Verfahren 3.3.1 Allgemeine Ordnungsbedingungen 3.3.2 Explizite Runge-Kutta-Verfahren 3.3.3 Motivation impliziter Runge-Kutta-Verfahren 3.3.4 Implizite Runge-Kutta-Verfahren 3.3.5 Kollokationsverfahren und IRKV 3.3.6 Einige Klassen von IRKV 3.4 Stabilitätsbegriffe bei Einschrittverfahren 3.4.1 Stabilitätsgebiet und A-Stabilität 3.4.2 Steife Differentialgleichungen 3.4.3 L-Stabilität 3.5 Symplektische Verfahren 3.6 Praktische Aspekte von Einschrittverfahren 3.6.1 Schrittweitensteuerung 3.6.2 Linear implizite Runge-Kutta-Verfahren 3.6.3 Verfahren mit dichter Ausgabe 3.7 Einschrittverfahren für DGL zweiter Ordnung 15 15 22 33 38 42 46 48 54 57 61 61 67 70 74 79 79 91 96 98 4 Mehrschrittverfahren 4.1 Einleitung und Grundbegriffe 4.2 Konvergenzuntersuchung bei Mehrschrittverfahren 4.3 Stabilitätsbegriffe bei Mehrschrittverfahren 4.4 Praktische Aspekte bei Mehrschrittverfahren 103 103 117 134 141 5 Exponentielle Integratoren 145 6 Discontinuous-Galerkin-Verfahren 148 Kapitel 2. Weiterführende Themen 7 161 RWP mit gewöhnlichen Differentialgleichungen 8 Differentiell-algebraische Systeme 8.1 Einführung 8.2 Eigenschaften linearer DAE-Systeme 3 161 167 167 169 4 Kapitel 0. Inhaltsverzeichnis 8.3 9 Numerische Behandlung linearer DAE-Systeme Anfangsrandwertprobleme Literaturverzeichnis 182 188 195 KAPITEL 0 Einführung und Motivation Inhalt §1 1 Aufgabenstellung, Beispiele und Ziele der Vorlesung 5 2 Wiederholung und Notation 8 Aufgabenstellung, Beispiele und Ziele der Vorlesung Wir betrachten in dieser Vorlesung hauptsächlich Anfangswertprobleme für Systeme gewöhnlicher Differentialgleichungen (Dgl) erster Ordnung: Gesucht ist eine differenzierbare Funktion y : [0, T ] → Cn , sodass y 0 (t) = f (t, y(t)) für alle t ∈ [0, T ] (AWP) und y(0) = ya gilt. Dabei sind die rechte Seite f : R × Cn → Cn , der Anfangswert (AW) ya ∈ Cn , die Anfangszeit t = 0 und die Endzeit t = T gegeben. Die unabhängige Variable t spielt in vielen, aber nicht in allen Problemen die Rolle der Zeit. Die Ableitung y 0 (t) wird dann oft mit ẏ(t) bezeichnet. Die gesuchte Funktion y(t) heißt auch der Zustand der Dgl. Ist die rechte Seite f von t unabhängig, so heißt das Problem autonom. Meist beschränken wir uns auf reelle Zustände, also ya ∈ Rn und f : R × Rn → Rn . Zahlreiche Fragestellungen führen auf Probleme von diesem Typ. Beispiel 1.1 (Räuber-Beute-Modell) [Heuser, 1991, § 59] Wir nehmen an, eine Population y1 (Beutetiere) lebe von einer ausreichend vorhandenen Nahrungsquelle. Der einzige natürlich Feind ist eine Population y2 von Raubtieren, die auf y1 angewiesen sind. Ein einfaches Modell für die Populationsentwicklung ist gegeben durch Dabei sind α1 > 0 und α2 > 0 die natürliche Vermehrungs- bzw. Verminderungsraten der Beute bzw. der Räuber in Abwesenheit der jeweils anderen Population. Der 5 6 Kapitel 0. Einführung und Motivation Wechselwirkungsterm geht von einer Begegnungshäufigkeit von Räuber und Beute aus, die über Konstanten β1 , β2 > 0 proportional zu beiden Beständen ist. Ein typischer Lösungsverlauf ist in Abbildung 1.1 zu sehen. Predator−Prey model with α1 = 1, α2 = 2, β1 = β2 = 0.05 120 prey predator 100 population 80 60 40 20 0 0 2 4 6 8 10 time 12 14 16 18 20 Abbildung 1.1. Verlauf der Lösung aus Beispiel 1.1 (Räuber-BeuteModell) für die Parameterwahl α1 = 1, α2 = 2, β1 = β2 = 0.05 zum Anfangswert y(0) = (100, 10)> . Differentialgleichungen höherer Ordnung lassen sich durch Einführung zusätzlicher unbekannter Funktionen auf Systeme erster Ordnung reduzieren: Beispiel 1.2 (Newtonsches Bewegungsgesetz) Nach dem Newtonschen Bewegungsgesetz gilt für einen Körper der Masse m die Beziehung F = ma zwischen der auf ihn wirkenden Kraft F und der resultierenden Beschleunigung a. Bezeichnen wir mit s(t) ∈ R3 den Ort des Körpers, so gilt s00 (t) = a(t) und damit das Dgl-System zweiter Ordnung s00 (t) = F (t)/m. Durch Einführung der Geschwindigkeit v(t) = s0 (t) ∈ R3 als Zwischengröße können wir ein äquivalentes Dgl-System erster Ordnung in y(t) = (s(t), v(t))> ∈ R6 formulieren: Beim Anfangswertproblem sind dann AW für Ort und Geschwindigkeit gegeben. Das (AWP) wird man nur in seltenen Fällen analytisch lösen können. Wir behandeln deshalb in dieser Vorlesung numerische Verfahren für die näherungsweise Lösung von (AWP). Um die Brauchbarkeit der numerischen Lösung beurteilen zu können, benötigen wir Aussagen über ihre Genauigkeit. Ziele der Vorlesung sind • das Kennenlernen von Verfahren zur numerischen Lösung von (AWP), • die Analysis dieser Verfahren bzgl. Konvergenz und Stabilität, • deren praktische Umsetzung in Computerprogramme sowie § 1. Aufgabenstellung, Beispiele und Ziele der Vorlesung 7 • Techniken der Schrittweitensteuerung zur effizienten numerischen Lösung. Zwei weitere Beispiele zur Anwendung: Beispiel 1.3 (Schwingung einer Membran) wird modelliert durch die partielle DGL 0 = ρ(x)utt (x, t) + b(x) ut (x, t) − T0 ∆u(x, t) − f (x, t) ∀t ≥ 0, ∀x ∈ Ω, (1.1) wobei u(x, t) Auslenkung der Membran über dem Gebiet Ω ⊂ R2 und Zeit t, ρ(x) Dichte der Membran, b(x) Dämpfungskoeffizient, T0 die Vorspannung der Membran und f (x, t) eine von außen wirkende Kraftdichte bezeichnen. Hinzu kommen Randbedingungen u(x, t) = d(x, t), ∀t ≥ 0, ∀x ∈ ∂Ω, (1.2) und Anfangsbedingungen u(x, 0) = g0 (x) ut (x, 0) = g1 (x) ∀x ∈ Ω ∀x ∈ Ω. Eine Semidiskretisierung im Ort (z. B. mit Finite-Elemente-Methode) führt auf ein System gewöhnlicher DGLn zweiter Ordnung 0 = M ü + C u̇ + Ku − f (t), (1.3) wobei u(t) Vektor der Funktionswerte u(xi , t) in den Stützstellen der Ortsdiskretisierung ist, M die Massematrix, C Dämpfungsmatrix, K Steifigkeitsmatrix der Membran und f (t) aus den äußeren Kräften resultiert. Die Dimension n der Vektoren und Matrizen ist dabei i. A. sehr groß, 103 ≤ n ≤ 107 sind heute typische Werte. Ein Beispiel ist in Abbildung 1.2 gegeben. Abbildung 1.2. Beispiel einer Lösung Beispiel 1.3 (Membran) für eine FEM-Diskretisierung mit n = 24.576 Freiheitsgraden auf Gebiet Ω = (−1, 1)2 \ (0, 1) × (−1, 0) (L-förmig), ρ ≡ 1, b ≡ 1, T0 = 1, f ≡ 0, g0 ≡ g1 ≡ 0, d(x, t) „periodisches Kippen eines Teilrandes“. Auch in der Umsetzung von Steuerungs- und Regelungsaufgaben für gewöhnliche Differentialgleichungen werden die hier zu besprechenden Verfahren benötigt. 8 Kapitel 0. Einführung und Motivation Abbildung 1.3. Legway: Modell eines selbst-balancierenden, einachsigen Fahrzeugs. Beispiel 1.4 (Legway) (Ilka Riedel) Siehe Abbildung 1.3. §2 Wiederholung und Notation Wir wiederholen kurz einige wichtige Ergebnisse aus der Theorie der gewöhnlichen Differentialgleichungen sowie der Analysis. Hier und in Zukunft bedeutet kyk für einen Vektor y ∈ Rn immer die Euklidische Norm, also kyk = (y > y)1/2 . (Wir könnten auch jede andere Norm verwenden.) Satz 2.1 (Picard-Lindelöf ) [Heuser, 1991, Satz 12.2, Aufgabe 12.6] Es sei Q = [a1 , b1 ] × [a2 , b2 ] × · · · × [an , bn ] ⊂ Rn ein kompakter Quader und ya ∈ int(Q). Weiterhin sei f : [0, T ] × Q → Rn stetig und bzgl. y (gleichmäßig) Lipschitz-stetig, d. h., es gibt ein L > 0, sodass kf (t, y1 ) − f (t, y2 )k ≤ L ky1 − y2 k (2.1) gilt für alle t ∈ [0, T ] und alle y1 , y2 ∈ Q. Satz 2.2 (Stetige Abhängigkeit von den Anfangswerten) Unter den Voraussetzungen von Satz 2.1 gilt für die Lösung y(t; s) des (AWP) y 0 (t) = f (t, y(t)), y(0) = s zu verschiedenen AW s1 , s2 ∈ int(Q) die Abschätzung ky(t; s1 ) − y(t; s2 )k ≤ eL t ks1 − s2 k für alle t ≥ 0 aus dem gemeinsamen Intervall der Lösungen zu s1 und s2 . (2.2) Der Beweis von Satz 2.2 läuft über das Lemma von Gronwall. Wir geben hier eine recht allgemeine Version dieses Resultats an, das später (in diskreter Form) bei der Stabilitätsuntersuchung wieder eine Rolle spielt. § 2. Wiederholung und Notation 9 Exponential deviation of solutions for different initial values. y’(t) = y + 0.02 1.5 1 y(t) 0.5 0 −0.5 −1 0 0.5 1 1.5 time t 2 2.5 3 Abbildung 2.1. Illustration der exponentiellen Abweichung (2.2) über die Zeit bei der Lösung eines (AWP) zu verschiedenen Anfangswerten. Lemma 2.3 (Lemma von Gronwall (Thomas Hakon Grönwall, 1877–1932)) Es seien ϕ, L, C : [0, T ] → R nicht-negative stetige Funktionen. Die Funktion C sei monoton wachsend. Wenn die Abschätzung erfüllt ist, dann gilt: 0 ≤ ϕ(t) ≤ C(t) exp Z t L(s) ds 0 für alle t ∈ [0, T ]. (2.3) Insbesondere im Fall C(t) ≡ 0 ist also ϕ(t) ≡ 0. Falls L konstant ist, so vereinfacht sich (2.3) zu 0 ≤ ϕ(t) ≤ C(t) eL t für alle t ∈ [0, T ]. (2.4) Beweis: in Übung 1, Aufgabe 2 Voraussetzung 2.4 (Generalvoraussetzung) Wir betrachten das (AWP). Wir wollen im Folgenden stets voraussetzen, dass . . . 10 Kapitel 0. Einführung und Motivation Bemerkung 2.5 (Hinreichende Bedingung für Lipschitz-Stetigkeit) Es sei f : [0, T ]×Q → Rn stetig. Falls f außerdem stetige erste partielle Ableitungen ∂f /∂yi , i = 1, . . . , n besitzt, so ist die Lipschitz-Bedingung (2.1) mit erfüllt.1 Die Fehlerabschätzungen „leben“ später von der Glattheit (Differentiationsordnung) der Lösung. Diese erhält man aus folgendem Satz: Satz 2.6 (Maximale Regularität) Es sei y : [0, T ] → Q ⊂ Rn eine Lösung des (AWP) auf [0, T ]. Falls f ∈ C k ([0, T ]×Q) ist für ein k ∈ N0 , dann gilt y ∈ C k+1 ([0, T ]; Rn ). Beweis: Wir verwenden später häufig Abschätzungen, die auf dem Satz von Taylor bzw. dem daraus folgenden „Schrankensatz“ basieren. Da wir es mit vektorwertigen Funktionen zu tun haben, formulieren wir den Satz von Taylor in Integralform. Satz 2.7 (Satz von Taylor in Integralform) Es sei G ⊂ Rn offen und F : G → Rm (k + 1)-mal stetig partiell differenzierbar (diffbar). Falls die Punkte x und x + d und die gesamte Verbindungsstrecke in G 1Dabei ist kfy (t, y)k die durch die Euklidische Vektornorm induzierte Matrixnorm (Spektralnorm) der Jacobimatrix fy (t, y). § 2. Wiederholung und Notation liegen, dann gilt: k=0: k=1: Z 11 1 F 0 (x + s d) d ds 0 Z 1 0 (1 − s) F 00 (x + s d) [d, d] ds F (x + d) = F (x) + F (x) d + F (x + d) = F (x) + 0 k ∈ N0 : F (x + d) = k X F (j) (x) [d(j) ] j=0 j! + Z 1 0 (1 − s)k (k+1) F (x + s d) [d(k+1) ] ds. k! (Siehe [Heuser, 2002, Satz 168.4] für den Fall k = 1.) Dabei ist die Jacobimatrix F 0 (x) an der Stelle x als eine 1-Form (lineare Form) zu verstehen, die Rn nach Rm abbildet. Dementsprechend ist die j-te Ableitung F (j) (x) an der Stelle x eine multilineare Abbildung, die [Rn ]j nach Rm abbildet. Die Koeffizienten von F (j) (x) werden gebildet von den partiellen Ableitungen von F der Ordnung j an der Stelle x. Der Ausdruck F (j) (x)[d(j) ] bedeutet gerade das j-fache Einsetzen der Richtung d in diese multilineare Abbildung, die übrigens (Satz von Schwarz) symmetrisch ist. Folgerung 2.8 (Schrankensatz) Es seien die Voraussetzungen des Satzes 2.7 erfüllt. Weiter seien alle partiellen Ableitungen von F der Ordnung k + 1 in G beschränkt. Dann existiert eine Konstante Ck+1 , sodass die folgende Abschätzung für alle x, x + d ∈ G erfüllt ist: In die Konstante geht die Ableitung F (k+1) ein. Wir werden diese Sätze oft mit x = (t, y) anwenden. Mit Hilfe des Schrankensatzes für k = 0 kann man z. B. Bemerkung 2.5 beweisen. Wir schreiben auch k = 0 : F (x + d) = F (x) + O(kdk) k = 1 : F (x + d) = F (x) + ∇F (x)> d + O(kdk2 ) etc. mit Hilfe der folgenden Notation: Definition 2.9 (O- und o-Notation) (a) Man sagt, eine Funktion f : R+ → Rn verhält sich wie O(g(h)) mit einer anderen Funktion g : R+ → R+ (sprich: „groß O von g von h“) für h & 0, falls h0 > 0 und eine von h unabhängige Konstante c existieren, sodass gilt: kf (h)k ≤ c g(h) gilt für alle 0 < h ≤ h0 . 12 Kapitel 0. Einführung und Motivation (b) Eine Funktion f : R+ → Rn verhält sich wie o(g(h)) mit einer anderen Funktion g : R+ → R+ (sprich: „klein o von g von h“) für h & 0, falls gilt: kf (h)k = 0. h&0 g(h) lim Oft schreibt man auch kurz: f (h) = O(g(h)) oder f (h) ∈ O(g(h)) bzw. f (h) = o(g(h)) oder f (h) ∈ o(g(h)). Beispiel: Satz 2.10 (Banachscher Fixpunktsatz) [Heuser, 2002, Satz 111.11] Es sei X eine nichtleere, abgeschlossene Teilmenge des Rn und A : X → X eine kontrahierende Selbstabbildung von X; für alle x, y ∈ X gelte also kA x − A yk ≤ q kx − yk mit einem festen 0 < q < 1. Dann besitzt A genau einen Fixpunkt x∗ in X. Dieser kann iterativ gewonnen werden: Wählt man einen beliebigen Startwert x0 ∈ X und setzt xn+1 := A xn n = 0, 1, 2, . . . , so konvergiert xn → x∗ . Überdies gilt die Fehlerabschätzung Der Satz bleibt richtig, wenn man statt Rn einen allgemeinen Banachraum mit der Norm k·k zugrunde legt. Bemerkung 2.11 (Autonomie-Transformation) Eine Dgl erster Ordnung der Form y 0 (t) = f (y(t)) heißt autonom. Eine nichtautonome Dgl y 0 (t) = f (t, y(t)) kann durch Einführung einer zusätzlichen Zustandsvariablen immer auf ein autonomes Problem zurückgeführt werden: Man setzt welches dann die Dgl § 2. Wiederholung und Notation 13 erfüllt. KAPITEL 1 Numerische Lösung von Anfangswertproblemen Inhalt 3 Einschrittverfahren 3.1 Grundbegriffe und ein erstes Verfahren 3.2 Konvergenzanalysis allgemeiner Einschrittverfahren 3.3 Runge-Kutta-Verfahren 3.3.1 Allgemeine Ordnungsbedingungen 3.3.2 Explizite Runge-Kutta-Verfahren 3.3.3 Motivation impliziter Runge-Kutta-Verfahren 3.3.4 Implizite Runge-Kutta-Verfahren 3.3.5 Kollokationsverfahren und IRKV 3.3.6 Einige Klassen von IRKV 3.4 Stabilitätsbegriffe bei Einschrittverfahren 3.4.1 Stabilitätsgebiet und A-Stabilität 3.4.2 Steife Differentialgleichungen 3.4.3 L-Stabilität 3.5 Symplektische Verfahren 3.6 Praktische Aspekte von Einschrittverfahren 3.6.1 Schrittweitensteuerung 3.6.2 Linear implizite Runge-Kutta-Verfahren 3.6.3 Verfahren mit dichter Ausgabe 3.7 Einschrittverfahren für DGL zweiter Ordnung §3 15 15 22 33 38 42 46 48 54 57 61 61 67 70 74 79 79 91 96 98 4 4.1 4.2 4.3 4.4 Mehrschrittverfahren Einleitung und Grundbegriffe Konvergenzuntersuchung bei Mehrschrittverfahren Stabilitätsbegriffe bei Mehrschrittverfahren Praktische Aspekte bei Mehrschrittverfahren 103 103 117 134 141 5 Exponentielle Integratoren 145 6 Discontinuous-Galerkin-Verfahren 148 Einschrittverfahren § 3.1 Grundbegriffe und ein erstes Verfahren Wir erinnern noch einmal an unsere Generalvoraussetzung 2.4. Die exakte Lösung des (AWP) bezeichnen wir mit y(t). Alle in diesem Kapitel behandelten numerischen Verfahren bestimmen Näherungswerte der exakten Lösung auf einem Punktgitter. 15 16 Kapitel 1. Numerische Lösung von Anfangswertproblemen Definition 3.1 (Gitter, Gitterfunktion) (a) Ein Gitter auf [0, T ] ist eine endliche Punktmenge T = {t0 , t1 , . . . , tN } mit 0 = t0 < t1 < · · · tN = T. Die {ti } heißen auch die Stützstellen. Die Abstände hi = ti+1 − ti heißen die Schrittweiten des Gitters T . (b) Für ein gegebenes Gitter bezeichnet die (maximale) Gitterweite oder den Diskretisierungsparameter. Man sagt dann: Das Gitter T gehört1 zur Klasse Th . (c) Ist hi = h für alle i, so heißt das Gitter äquidistant. (d) Die Differentialgleichung y 0 (t) = f (t, y(t)) besagt, dass die gesuchte Lösung y(t) an der Stelle t die Tangentensteigung f (t, y(t)) hat. Mit anderen Worten, die Steigung der Lösung y(t) passt sich in das durch f (t, y) definierte Richtungsfeld ein. Für skalare Differentialgleichungen, also im Fall n = 1, lässt sich das einfach grafisch veranschaulichen (Abbildung 3.1 links). Das einfachste numerische Verfahren besteht nun darin, die Lösungskurve y(t) im Intervall [t, t + h] durch ihre Tangente im Punkt (t, y(t)) zu approximieren, deren Steigung aus dem Richtungsfeld, d. h. aus der rechten Seite f (t, y(t)) abgelesen werden kann. Auf einem Gitter T mit Stützstellen ti erhalten wir sukzessive die Näherungen yi = yh (ti ) für die Werte der exakten Lösung y(ti ) gemäß 1T gehört dann auch zur Klasse Th0 für alle h0 ≥ h. 17 § 3. Einschrittverfahren Slopefield for f(t,y) = 1 − t * y and solution for y(0) = −0.8 1 0.8 0.6 y(t+h) 0.4 Value y 0.2 y(t) 0 −0.2 −0.4 yh(t+h) =yh(t) −0.6 −0.8 −1 0 1 2 3 Time t 4 5 t t+h Abbildung 3.1. Richtungsfeld einer Dgl (links) und Konstruktionsidee des expliziten Euler-Verfahrens (Polygonzugmethode) (rechts). Die Näherungsvorschrift (3.1) heißt auch Methode von Euler, explizites EulerVerfahren oder Polygonzugmethode. In der englischsprachigen Literatur wird das Verfahren auch als Vorwärts-Euler-Verfahren (Forward Euler) bezeichnet. Eine wichtige Fragestellung ist die Untersuchung der Konvergenz und Konvergenzgeschwindigkeit der numerischen Lösungen, wenn die Gitterweite h & 0 strebt. Wir wollen dies zunächst exemplarisch für das explizite Euler-Verfahren untersuchen. Dazu bezeichnen wir für ein gegebenes Gitter T mit den (globalen) Fehler des Näherungsverfahrens am Gitterpunkt ti ∈ T . Auch eh ist eine Gitterfunktion. Die Abbildung 3.2 zeigt, dass sich der Fehler ei+1 an einem Gitterpunkt ti+1 aus zwei Anteilen zusammensetzt: 18 Kapitel 1. Numerische Lösung von Anfangswertproblemen =yh(t 2 ) =yh(t 1 ) z2 =yh(t 0 ) y(t 1 ) y(t 2 ) t1 t2 y(t 0 ) t0 Abbildung 3.2. Fehlerfortpflanzung bei einem Einschrittverfahren. Wir schätzen beide Anteile ab. (a) Zur Abschätzung des lokal hinzukommenden Fehlers definieren wir den sogenannten lokalen Diskretisierungsfehler di+1 des Euler-Verfahrens an der Stelle ti+1 über Man nennt di+1 auch den Konsistenzfehler (an der Stelle ti+1 ), da er sich aus dem Einsetzen der exakten Lösung in das diskrete Schema (hier (3.1)) ergibt. Um den lokalen Diskretisierungsfehler abzuschätzen, verwenden wir die Taylorentwicklung (Satz 2.7) § 3. Einschrittverfahren 19 Hierfür setzen wir voraus, dass y in C 2 ([0, T ]; Rn ) liegt.2 Wir setzen in (3.2) ein und erhalten die Fehlerdarstellung (3.3) Wegen der Beschränktheit von y 00 erhalten wir die Abschätzung (3.4) (b) Zur Untersuchung der Fortpflanzung des Fehlers ei müssen wir am Zeitpunkt ti zwei explizite Eulerschritte betrachten zu den Startwerten yh (ti ) und y(ti ), die nach Definition gerade um ei = yh (ti ) − y(ti ) auseinander liegen: Deren Differenz lässt sich abschätzen als: (3.5) 2Hinreichend dafür ist nach Satz 2.6 f ∈ C 1 ([0, T ] × Q). 20 Kapitel 1. Numerische Lösung von Anfangswertproblemen Hier setzen wir voraus, dass die rechte Seite f in einer geeigneten Menge Lipschitz-stetig bzgl. y mit L-Konstante L ist.3 Zusammen erhalten wir mit (3.2) und (3.5) also die Abschätzung für den globalen Fehler. Mit (3.6) haben wir eine Rekursion für die Fehlerfortpflanzung von Schritt zu Schritt gewonnen. Wir bringen diese durch ein Teleskopsummenargument 4 auf die Form Zur expliziten Abschätzung benutzen wir das folgende diskrete Lemma von Gronwall mit den Setzungen Lemma 3.2 (Diskretes Lemma von Gronwall, vgl. Lemma 2.3) Es seien {ϕn }, {Ln }, {Cn } nicht-negative Zahlenfolgen, n ∈ N0 . Die Folge {Cn } sei monoton wachsend. Wenn die Abschätzung 0 ≤ ϕ n ≤ Cn + 3Genauer: n−1 X j=0 Lj ϕj für alle n ∈ N0 Die diskreten Lösungen {yh (ti )} müssen auch in Q liegen. Einsetzen kei k in kei+1 k, beginnend bei ke0 k 4wiederholtes § 3. Einschrittverfahren 21 erfüllt ist, dann gilt: (3.8) Insbesondere im Fall Cn ≡ 0 ist also ϕn ≡ 0. Falls Lj ≡ L ist, so vereinfacht sich (3.8) zu (3.9) Beweis: eigene Übung Durch die Anwendung des Lemmas ergibt sich aus (3.7) die Abschätzung: Durch Einsetzen der Abschätzung (3.4) für den lokalen Fehler, also ergibt sich unter Beachtung von Pn j=1 hj−1 = tn folgender Konvergenzsatz: Satz 3.3 (Konvergenz des expliziten Euler-Verfahrens) Die Lösung des (AWP) sei C 2 ([0, T ]; Rn ). Dann gilt für den Fehler der Näherungslösungen des expliziten Euler-Verfahrens auf einem beliebigen Gitter {0 = t0 , t1 , . . . , tN = T } der Klasse Th die Abschätzung (3.10) 22 Kapitel 1. Numerische Lösung von Anfangswertproblemen für alle n = 0, 1, . . . , N und damit Bemerkung 3.4 Wesentliche Bestandteile des Konvergenzbeweises am Beispiel des expliziten EulerVerfahrens sind: Im nächsten Abschnitt werden wir dieses Vorgehen auf allgemeine Einschrittverfahren übertragen. § 3.2 Konvergenzanalysis allgemeiner Einschrittverfahren Als Verallgemeinerung von (3.1) betrachten wir im Rest von § 3 Verfahren der Bauart § 3. Einschrittverfahren 23 (3.12) die aus der Kenntnis eines Näherungswertes yi für y(ti ) und der Schrittweite hi einen neuen Näherungswert yi+1 für y an der Stelle ti+1 = ti + hi bestimmen. Definition 3.5 (Ein(zel)schrittverfahren) Ein numerisches Verfahren zur Lösung des (AWP), das der Vorschrift (3.12) genügt, heißt Einschrittverfahren (ESV). Φ heißt die Verfahrensfunktion oder Inkrementfunktion des Verfahrens.5 Wie wir bereits in § 3.1 gesehen haben, spielt der Konsistenzfehler eine wesentliche Rolle. Er bezieht sich immer auf das Einsetzen der exakten Lösung in das Verfahren. Definition 3.6 (Konsistenzfehler, Konsistenzordnung bei ESV) Es sei y(·) die Lösung der Dgl y 0 (t) = f (t, y(t)) auf dem Intervall [0, T ]. (a) Die Größe (3.13) heißt der Konsistenzfehler oder Abschneidefehler des ESV (3.12) an der Stelle t zur Schrittweite h. Später werden wir auch andere (beliebige) Funktionen z in d einsetzen, d(z, ., .), um Fehlerfortpflanzung zu untersuchen. (b) Das ESV heißt konsistent mit dem (AWP), falls gilt: (3.14) 5Natürlich hängt die Verfahrensfunktion Φ auch von der rechten Seite f ab (sonst würde ja das Verfahren die Dgl gar nicht berücksichtigen), aber diese Abhängigkeit drücken wir nicht explizit aus. 24 Kapitel 1. Numerische Lösung von Anfangswertproblemen (c) Das ESV besitzt die Konsistenzordnung p für das (AWP), falls Die Konsistenz und Konsistenzordnung beziehen sich dabei jeweils nur auf die Differentialgleichung des (AWP) auf [t, t + h], es werden hier exakte Anfangswerte bei t verwendet. Aus (3.13) folgt, dass ein ESV offenbar genau dann konsistent mit dem (AWP) ist, wenn gilt: lim Φ(t, y(t), h) = f (t, y(t)) gleichmäßig in [0, T − h]. h&0 Wie bereits beim Euler-Verfahren gesehen, bestimmt man die Konsistenzordnung mittels Taylorentwicklung, vgl. (3.3). Dafür mussten wir hinreichende Glattheit der exakten Lösung y annehmen, also hinreichende Glattheit der rechten Seite f . Allgemeiner geht maxt∈[0,T ] ky (p+1) (t)k in die Konstante c ein. Fazit: Ein Verfahren erreicht bei einer konkreten Aufgabenstelle „seine“ maximale Konsistenzordnung nur dann, wenn die rechte Seite hinreichend glatt ist. Exemplarisch listen wir nun einige weitere explizite und implizite ESV auf. Beispiel 3.7 (Einige explizite und implizite Einschrittverfahren) (a) Das explizite Euler-Verfahren (Forward Euler) hat die von h unabhängige Verfahrensfunktion (b) Das implizite Euler-Verfahren (Backward Euler) hat die implizit definierte Verfahrensfunktion § 3. Einschrittverfahren 25 (Lösbarkeit im Kontext allgemeinerer impliziter Verfahren, § 3.3.4) (c) Das verbesserte Euler-Verfahren (Collatz, 1960) hat die Verfahrensfunktion (d) Das Verfahren von Heun (Heun, 1900) hat die Verfahrensfunktion Alle obigen Verfahren sind Beispiele für sogenannte Runge-Kutta-Verfahren, die systematisch in § 3.3 behandelt werden. Die Struktur der mehrfachen (rekursiven) f -Auswertungen pro Zeitschritt ist typisch für diese Verfahren. Beispiel 3.8 (Taylorreihen-Methode) Weitere explizite ESV, die nicht zu den Runge-Kutta-Verfahren gehören, lassen sich durch die Taylorreihen-Methode konstruieren.6 Aus der Darstellung 6Dies ist das einzige Verfahren der ganzen Vorlesung, das Ableitungen von f verwendet, um eine höhere Ordnung zu erzielen. 26 Kapitel 1. Numerische Lösung von Anfangswertproblemen Ein Nachteil der Taylorreihen-Methode liegt darin, dass man entsprechend hohe Ableitungen von f berechnen muss. Der Aufwand zur Verwendung dieser steigt exponentiell mit p und polynomiell mit n. Beachte: Bereits y 000 enthält den Term fyy , eine bilineare Abbildung von Rn nach Rn . Bemerkung 3.9 (Lokaler Diskretisierungsfehler) Der in Definition 3.6 eingeführte Konsistenzfehler wird auch als lokaler Diskretisierungsfehler bezeichnet, da wir ihn — wie bereits in § 3.1 gesehen — wie folgt interpretieren können, siehe auch Abbildung 3.3 27 § 3. Einschrittverfahren y(t+h) h d(y(.),t+h,h) y(t) yh(t+h) =yh(t) t t+h Abbildung 3.3. Veranschaulichung lokaler Diskretisierungsfehler. Das heißt: Wenn man bei t mit dem exakten Startwert yh (t) = y(t) startet, so ist der Fehler nach einem einzelnen Integrationsschritt der Länge h gerade h d(y(·), t+h, h). Achtung: In manchen Büchern wird der Konsistenzfehler als h d(y(·), t + h, h) definiert. Definition 3.10 (Fehler, Konvergenz, Konvergenzordnung bei ESV) Es sei y(·) die Lösung des (AWP) auf dem Intervall [0, T ]. Weiter sei yh (·) eine mit einem ESV (3.12) erzeugte Näherungslösung auf einem Gitter T = {0 = t0 < t1 < . . . < tN = T }. (a) Die Größe (b) Das ESV heißt konvergent, falls auf jeder Folge von Gittern {Th } mit h & 0 für die erzeugten Näherungslösungen gilt: (c) Das ESV hat die Konvergenzordnung p ∈ N, falls eine von h unabhängige Konstante c > 0 sowie h0 > 0 existieren, sodass für die Näherungslösung auf einem beliebigen Gitter der maximalen Gitterweite h ≤ h0 gilt: 28 Kapitel 1. Numerische Lösung von Anfangswertproblemen Beim expliziten Euler-Verfahren hatten wir mit Hilfe einer Stabilitätsabschätzung (diskretes Lemma von Gronwall) nachgewiesen, dass aus der Konsistenz des Schemas die Konvergenz mit derselben Ordnung folgt. Dies wiederholen wir jetzt für ein allgemeines ESV. Lemma 3.11 (Diskrete Stabilität von ESV) Die Verfahrensfunktion des ESV (3.12) erfülle die Lipschitz-Bedingung (Stabilitätsbedingung) kΦ(t, w, h) − Φ(t, z, h)k ≤ K kw − zk (3.16) für alle t ∈ [0, T ], alle w, z ∈ Rn sowie alle h ≤ h0 . Es sei T = {0 = t0 , t1 , . . . , tN = T } ein Gitter auf [0, T ] mit maximaler Schrittweite h ≤ h0 und wh und zh zwei beliebige Gitterfunktionen auf T . Dann gilt die diskrete Stabilitätsabschätzung Beweis: § 3. Einschrittverfahren 29 Bemerkung 3.12 (zu Lemma 3.11) (a) Beim expliziten Euler-Verfahren galt Φ(t, y, h) = f (t, y) und daher K = L, die Lipschitz-Konstante der rechten Seite f , und zwar für alle h > 0. Auch bei allen anderen in dieser Vorlesung behandelten ESV (siehe § 3.3) ist die Bedingung (3.16) erfüllt. Bei impliziten ESV verlangt sie tatsächlich eine Beschränkung der Schrittweite h ≤ h0 , was natürlich für die Konvergenzbetrachtung keine Einschränkung darstellt. Im Allgemeinen hängt K von der Lipschitz-Konstanten der rechten Seite f ab. (b) Der Beweis von Lemma 3.11 zeigt, dass die (globale) Lipschitz-Bedingung (3.16) nicht notwendig für alle w, z ∈ Rn benötigt wird, sondern nur für solche, die in einer „hinreichend großen Menge“ liegen, die für h ≤ h0 alle Näherungslösungen enthält. Dasselbe trifft auch auf Satz 3.13 zu. Satz 3.13 (Konvergenz von ESV) Die Verfahrensfunktion des ESV (3.12) erfülle die Lipschitz-Bedingung (3.16) für alle h ≤ h0 . Besitzt das Verfahren die Konsistenzordnung p ∈ N und gehört die Lösung des (AWP) zu C p+1 ([0, T ]; Rn ), dann gilt für die Näherungslösungen auf einem beliebigen Gitter {0 = t0 , t1 , . . . , tN = T } der Klasse Th mit maximaler Schrittweite h ≤ h0 die Abschätzung (3.18) (3.19) 30 Kapitel 1. Numerische Lösung von Anfangswertproblemen Das Verfahren ist also (bei Verwendung exakter Anfangswerte) konvergent, und die Konvergenzordnung entspricht der Konsistenzordnung p. Beweis: Wir gehen vor wie im Beweis von Satz 3.3. Es sei y(·) die exakte Lösung unseres (AWP). Wir verwenden Lemma 3.11 (diskrete Stabilität), um die Fehlerfortpflanzung abzuschätzen. Dazu setzen wir für zh die Näherungslösung des ESV ein und für wh die exakte Lösung y (eingeschränkt auf das Gitter). Dann gilt nach Voraussetzung für die jeweiligen lokalen Fehler von der (3.19) eine direkte Konsequenz ist. Folgerung 3.14 Bemerkung 3.15 (zur Fehlerabschätzung (3.18)) (a) Der globale Fehler kann exponentiell mit der Zeit t anwachsen. Dieses Verhalten entspricht dem der Differenz zweier Lösungen zu verschiedenen Anfangsdaten, siehe Satz 2.1. (b) § 3. Einschrittverfahren 31 (c) (3.18) ist eine a-priori Abschätzung, da die Berechneten yi nicht in die Schranke eingehen, man also diese Schranke (aufgrund erwarteter Eigenschaften der Lösung, hier Glattheit) bereits erhält bevor man die yi überhaupt berechnet. Im Gegensatz dazu werden wir später a-posteriori Abschätzungen kennen lernen, welche die berechnete Näherungslösung verwenden um schärfere Aussagen zu treffen. (d) Da man die Konstante c des lokalen Fehlers (die maxt∈[0,T ] ky (p+1) (t)k enthält) und die Lipschitz-Konstante K des Verfahrens (beide abhängig von der rechten Seite f ) im Allgemeinen nicht kennt, kann man (3.18) kaum dazu verwenden, den globalen Fehler zu schätzen bzw. um eine Schrittweite h zu bestimmen, um diesen unter einer vorgegebenen Schranke zu halten. Hierfür sind a-posteriori Schranken besser geeignet. Die Fehlerabschätzung (3.18) lässt sich leicht dahingehend erweitern, dass Rundungsfehler bei der numerischen Durchführung berücksichtigt werden. In dem Fall ist also im Beweis von Satz 3.13 nicht mehr dzj = 0, sondern etwa hj−1 dzj = O(ε) mit der Maschinengenauigkeit ε. Für äquidistante Gitter ergibt sich so die Fehlerabschätzung In der Praxis zeigt sich allerdings, dass diese Abschätzung i. d. R. zu pessimistisch ist, da sich Rundungsfehler und lokale Fehler gegenseitig aufheben können. Dennoch gibt diese Überlegung den richtigen Hinweis, dass es für eine hohe Genauigkeit der Lösung i. A. wesentlich zielführender ist, ein Verfahren höherer Ordnung mit moderaten Schrittweiten h zu verwenden als ein Verfahren niedriger Ordnung mit geringer Schrittweite h. Kapitel 1. Numerische Lösung von Anfangswertproblemen 10 rounding error truncation error total error 9 8 7 6 errors 32 5 4 3 2 1 0 0 0.2 0.4 0.6 0.8 1 h Abbildung 3.4. Einfluss von Konsistenz- und Rundungsfehlern in der Fehlerabschätzung.
© Copyright 2024 ExpyDoc