Kapitel 2 Eigenschaften dynamischer Systeme Im Folgenden werden einige wichtige Grundlagen und Eigenschaften linearer und nichtlinearer dynamischer Systeme zusammengefasst. Diese bilden unmittelbar die Basis für den in den weiteren Kapiteln ausführlich behandelten Regelungsentwurf für lineare, zeitinvariante Systeme. Der Ausgangspunkt dieser Ausführungen ist durch die in (1.1) eingeführte mathematische Beschreibung zeitkontinuierlicher dynamischer Systeme gegeben, d.h. ẋ = f (x, u, t), t > t0 , y = h(x, u, t), t ≥ t0 x(t0 ) = x0 (2.1a) (2.1b) mit dem Zustand x ∈ Rn , dem Eingang u ∈ Rm und dem Ausgang y ∈ Rp . 2.1 Lösungsexistenz und Eindeutigkeit Eine der grundlegenden mathematischen Fragestellungen für nichtlineare Systeme beschäftigt sich mit der Existenz und der Eindeutigkeit einer Lösung. Hierzu wird im Weiteren angenommen, dass keine Eingangsgrößen u auf das System (2.1) wirken. Ein solches System wird frei genannt. Ein freies, nichtlineares System kann somit allgemein in der Form ẋ = f (x, t), t > t0 , y = h(x, t), t ≥ t0 x(t0 ) = x0 (2.2a) (2.2b) angeschrieben werden. Für Systeme der Form (2.2) liefert der folgende Satz eine hinreichende Bedingung für die Existenz und Eindeutigkeit der Lösung [2]. Satz 2.1 (Lokale Existenz und Eindeutigkeit). Es sei f (x, t) stückweise stetig in t und erfülle die Lipschitz–Bedingung kf (x1 , t) − f (x2 , t)k ≤ Lkx1 − x2 k, 0<L<∞ (2.3) für alle x1 , x2 ∈ B := {x ∈ Rn | kx − x0 k ≤ r} für alle t ∈ [t0 , t0 + τ ]. Dann existiert ein δ > 0 so, dass ẋ = f (x, t), t > t0 , x(t0 ) = x0 genau eine Lösung für t ∈ [t0 , t0 + δ] besitzt. Der Beweis dieser Aussage ist beispielsweise in [3, Kapitel 3] zu finden. Der Schlüssel hierzu ist die Lipschitz–Bedingung (2.3) mit der Lipschitz–Konstanten L. Um dies zu illustrieren betrachte man das System 15 16 2 Eigenschaften dynamischer Systeme 2 ẋ = 3x 3 , t > 0, x(0) = x0 = 0. Es ist unmittelbar ersichtlich, dass x(t) = 0 eine Lösung der Differenzialgleichung ist. Darüber hinaus d 3 erfüllt jedoch auch x(t) = t3 die Differenzialgleichung und Anfangsbedingung, da dt t = 3t2 = 3(t3 )2/3 2 mit x(0) = 0. Die offensichtliche Stetigkeit von f (x) = 3x 3 in x impliziert somit nicht die Eindeutigkeit der Lösung. Zudem existiert in einer hinreichend kleinen Umgebung um x0 = 0 keine Lipschitz–Konstante L so, dass (2.3) erfüllt wird. Da f : R → R und somit k · k = | · | kann dies leicht dadurch motiviert werden, dass in diesem Fall (2.3) äquivalent ist zu |f (x1 ) − f (x2 )| ≤L |x1 − x2 | für x1 , x2 ∈ B. Mit der Definition von B und x(0) = x0 = 0 impliziert dies für das betrachtete Beispiel, dass in einer Umgebung des Ursprungs gelten muss, dass d f (x) < ∞, dx x ∈ B. 2 Dies ist offensichtlich für f (x) = 3x 3 nicht erfüllt, weshalb Satz 2.1 nicht angewendet werden kann. Für weitere Möglichkeiten zum Nachweis der Lipschitz–Stetigkeit, d.h. der Existenz einer Lipschitz– Konstanten L ∈ (0, ∞) wird auf die Ausführungen in [3, Kapitel 3] verwiesen. Der Beweis der Existenz beruht dabei im Wesentlichen auf der Anwendung der Picard–Iteration oder der Methode der sukzessiven Approximation nach Picard, deren Konvergenz unter den in Satz 2.1 getroffenen Voraussetzungen nachgewiesen werden kann. Eine Lösung x(t) von (2.2a) genügt der (Volterraschen) Integralgleichung Z t x(t) = x0 + f (x(τ ), τ )dτ. t0 Insbesondere kann für den Fall, dass f (x, t) die Voraussetzungen von Satz 2.1 erfüllt, gezeigt werden, dass die Folge von Funktionen x0 (t) = x0 Z t x1 (t) = x0 + f (x0 (τ ), τ )dτ t0 .. . Z t xk (t) = x0 + f (xk−1 (τ ), τ )dτ t0 gegen die eindeutige Lösung von (2.2a) konvergiert. Es gilt also x(t) = lim xk (t). k→∞ Beispiel 2.1. Beispielhaft wird die Anwendung dieses Schemas anhand der Differenzialgleichung ẋ = αx, t > 0, x(0) = x0 mit α ∈ R illustriert. Es gilt somit x0 (t) = x0 Z x1 (t) = x0 + t αx0 dτ = x0 (1 + αt) 0 2.2 Linearität und Zeitinvarianz Z 17 t t2 αx0 (1 + ατ )dτ = x0 1 + αt + α2 2 t τ k−1 αx0 1 + ατ + . . . + αk−1 dτ. (k − 1)! x2 (t) = x0 + 0 .. . Z xk (t) = x0 + 0 Somit ergibt sich für den Grenzwert k → ∞ die bekannte Lösung der Differenzialgleichung x(t) = lim xk (t) = x0 k→∞ ∞ X k=0 αk tk = x0 eαt . k! Es sei betont, dass Satz 2.1 nur ein hinreichendes und insbesondere lokales Existenz und Eindeutigkeitsresultat darstellt. Eine globale Erweiterung wird erhalten, wenn die Lipschitz–Stetigkeit nicht nur auf Elemente der um den Anfangszustand x0 zentrierten Kugel B beschränkt ist, sondern global gilt. Satz 2.2 (Globale Existenz und Eindeutigkeit). Es sei f (x, t) stückweise stetig in t und erfülle die Lipschitz–Bedingung kf (x1 , t) − f (x2 , t)k ≤ Lkx1 − x2 k, 0<L<∞ für alle x1 , x2 ∈ Rn für alle t ∈ [t0 , t0 + τ ]. Dann existiert genau eine Lösung der Differenzialgleichung ẋ = f (x, t), t > t0 , x(t0 ) = x0 für t ∈ [t0 , t0 + τ ]. Hierbei kann τ beliebig groß sein. Dass die Aussagen sowohl von Satz 2.1 als auch Satz 2.2 nur hinreichend sind kann leicht anhand des Beispiels f (x) = −x3 gezeigt werden. Speziell ist f nicht global Lipschitz– stetig. Andererseits existiert für jede Anfangsbedingung x(0) = x0 eine eindeutige Lösung s x20 x(t) = sign(x0 ) , 1 + 2x20 t die für alle t ≥ 0 wohl definiert ist. 2.2 Linearität und Zeitinvarianz Nach diesem kurzen Exkurs in die Theorie nichtlinearer dynamischer Systeme werden im Weiteren fast ausschließlich lineare, zeitinvariante Systeme betrachtet. Bekannterweise gilt hierbei u.a. das so genannte Superpositionsprinzip, was zur Lösung linearer Differenzialgleichungen eine wichtige Anwendung findet. i(t) i(t) ideal u(t) R Abb. 2.1: Beispiel äquivalenter Schaltungen. ⇔ u(t) R 18 2 Eigenschaften dynamischer Systeme Wie die obige Abbildung 2.1 äquivalenter elektrischer Schaltungen unterstreicht, erfordert die Charakterisierung eines linearen Systems die Formulierung überprüfbarer formal mathematischer Kriterien. Speziell kann aus dem Vorhandensein offensichtlich nichtlinearer Elemente (z.B. Dioden in Abbildung 2.1) nicht unmittelbar darauf geschlossen werden, dass das System nichtlineares Verhalten aufweist. Sei nun ϕ(x0 , u(t), t, t0 ) die Lösung der Differenzialgleichung (2.1a) zum Zeitpunkt t für den Anfangswert x(t0 ) = x0 und die Eingangsgröße u(τ ), t0 < τ < t. Definition 2.1 (Linearität). Das System (2.1) nennt man linear, wenn für alle (zulässigen) Eingangsgrößen u(t) und jeden beliebigen Anfangszeitpunkt t0 ≥ 0 die Ausgangsgröße y(x0 , u(t), t) = h(ϕ(x0 , u(t), t, t0 ), u(t), t) zu jedem Zeitpunkt t ≥ t0 die Bedingungen (i) y(α1 x0,1 + α2 x0,2 , 0, t) = α1 y(x0,1 , 0, t) + α2 y(x0,2 , 0, t) (2.4a) (ii) y(0, β1 u1 + β2 u2 , t) = β1 y(0, u1 , t) + β2 y(0, u2 , t) (2.4b) (iii) y(x0 , u, t) = y(x0 , 0, t) + y(0, u, t) (2.4c) mit α1 , α2 , β1 , β2 ∈ R erfüllt. Hierbei bezeichnet man die Eigenschaft (i) als Superpositionsprinzip oder Zerlegungseigenschaft bezüglich der Anfangswerte (Nulleingangslinearität), (ii) als das Superpositionsprinzip bezüglich der Eingangsgrößen (Nullzustandslinearität) und (iii) als das Superpositionsprinzip bezüglich der Eingangsgrößen mit den Anfangswerten (siehe z.B. [1]). Aufgabe 2.1. Ist das System ẋ(t) = a(t)x(t) + u(t) + 1, t > t0 , x(t0 ) = x0 y(t) = x(t) linear? Begründen Sie Ihre Antwort. Lösung. Das System erfüllt nicht die Eigenschaften (i) und (ii) und ist somit nicht linear. d ∂ d Hinweis: Man betrachte dt y(t) = ∂x h(x, u, t) dt x(t) + h(x, u, t) = x zur Überprüfung der Bedingungen (2.4)). ∂ ∂u h(x, u, t)u(t) + ∂ ∂t h(x, u, t) = ẋ(t) da Zudem sei bemerkt, dass durch die Substitution u(t) = ū(t) − 1 das System die Bedingungen (2.4) mit dem neuen Eingang ū(t) erfüllt. Es gilt der folgende Satz. Satz 2.3. Das System (2.1) ist genau dann linear, wenn es sich in die Form ẋ(t) = A(t)x(t) + B(t)u(t), t > t0 , y(t) = C(t)x(t) + D(t)u(t), t ≥ t0 x(t0 ) = x0 (2.5a) (2.5b) überführen lässt. Die Einträge der (n × n)–Matrix A(t), der (n × m)–Matrix B(t), der (p × n)–Matrix C(t) und der (p × m)–Matrix D(t) dürfen dabei nur von der Zeit t abhängen. Aufgabe 2.2. Sind die Systeme der Abschnitte 1.3.1–1.3.4 linear oder nichtlinear? Ein weitere wichtige Eigenschaft dynamischer Systeme betrifft die Zeitvarianz . Hierzu sei bemerkt, dass in den folgenden Ausführungen mit f (t − T ), T > 0, die um die Zeit T nach rechts verschobene Zeitfunktion f (t) gemeint ist. Definition 2.2 (Zeitinvarianz). Das System (2.1) wird zeitinvariant genannt, wenn für alle (zulässigen) Eingangsgrößen u(t) und jeden beliebigen Anfangszeitpunkt t0 ≥ 0 die nachfolgende Bedingung für 2.3 Linearisierung nichtlinearer Systeme 19 alle t ≥ t0 und alle T ∈ R erfüllt: Sei y(t) die Ausgangsgröße des Systems zum Zeitpunkt t für den Anfangswert x(t0 ) = x0 und die Eingangsgröße u(τ ), t0 ≤ τ ≤ t, dann ist y(t − T ) die Ausgangsgröße des Systems für den Anfangswert x(t0 + T ) = x0 und die Eingangsgröße u(τ − T ), t0 + T ≤ τ ≤ t + T . Aufgabe 2.3. Ist das System ẋ(t) = ax(t) + bu(t), t > 0, x(0) = x0 y(t) = x(t) zeitinvariant? Lösung. Das System ist zeitinvariant. Es gilt der folgende Satz. Satz 2.4. Das System (2.1) ist genau dann linear und zeitinvariant, wenn es sich in die Form ẋ(t) = Ax(t) + Bu(t), t > 0, y(t) = Cx(t) + Du(t), t≥0 x(0) = x0 (2.6a) (2.6b) überführen lässt. Die Einträge der (n × n)–Matrix A, der (n × m)–Matrix B, der (p × n)–Matrix C und der (p × m)– Matrix D sind dabei reelle Zahlen. Es sei hierbei zudem beachtet, dass für lineare, zeitinvariante Systeme ohne Beschränkung der Allgemeinheit für den Anfangszeitpunkt t0 = 0 angenommen werden kann. In der Englischsprachigen Literatur werden Systeme der Form (2.6) auch abkürzend als LTI–Systeme bezeichnet. Aufgabe 2.4. Die mathematische Beschreibung des Transportvorgangs auf einem Förderband der Länge l, das sich mit der konstanten Geschwindigkeit v bewegt, führt auf x(t) = u(t − l/v). Hierbei ist u(t) die am Bandanfang pro Zeiteinheit aufgebrachte Materialmenge während x(t) die am Bandende pro Zeiteinheit abgeworfene Menge darstellt. a) Ist das System linear und zeitinvariant? b) Kann das System in der Form (2.6) dargestellt werden? Lösung. Das System ist linear und zeitinvariant. Es kann nicht in der Form (2.6) angeschrieben werden. 2.3 Linearisierung nichtlinearer Systeme Falls für ein nichtlineares, zeitvariantes System (2.1) nur kleine Auslenkungen um eine Ruhelage bzw. einen Arbeitspunkt betrachtet werden, dann kann das System sehr häufig durch eine lokale Linearisierung um die Ruhelage hinreichend genau approximiert werden. 2.3.1 Ruhelagen nichtlinearer Systeme Der Begriff der Ruhelage wird im Allgemeinen für autonome bzw. freie Systeme definiert während ein Arbeitspunkt zudem vom Wert des Eingangs abhängt. Ein Arbeitspunkt (xR , uR ) eines nichtlinearen Systems (2.1) ist dadurch charakterisiert, dass er einem Fixpunkt der Lösung ϕ(x0 = xR , uR , t, t0 ) der Differenzialgleichung (2.1a) mit der Anfangsbedingung x0 = xR für konstanten Eingang uR entspricht, d.h. es gilt 20 2 Eigenschaften dynamischer Systeme ϕ(xR , uR , t, t0 ) = xR , ∀t ≥ t0 . Für den Fall uR = 0 bzw. für freie Systeme mit f (x, u, t) = f (x, t) wird xR als Fixpunkt der Lösung ϕ(xR , t, t0 ) = xR , ∀t ≥ t0 auch als Ruhelage bezeichnet. Zur praktischen Berechnung der Ruhelagen bzw. Arbeitspunkte werden die folgenden Definitionen herangezogen. Definition 2.3 (Ruhelage). Ein Punkt xR ∈ Rn ist eine Ruhelage von ẋ = f (x, t), t > t0 wenn die Bedingung f (xR , t) = 0 (2.7) für alle Zeiten t ≥ t0 erfüllt ist. Definition 2.4 (Arbeitspunkt). Ein Punkt (xR , uR ) mit xR ∈ Rn und uR ∈ Rm ist ein Arbeitspunkt von ẋ = f (x, u, t), t > t0 wenn die Bedingung f (xR , uR , t) = 0 (2.8) für alle Zeiten t ≥ t0 erfüllt ist. Es sei hierbei bemerkt, dass nichtlineare Systeme im Allgemeinen eine beliebige Anzahl an Ruhelagen bzw. Arbeitspunkten aufweisen können. Beispiel 2.2. Die folgenden nichtlinearen Systeme besitzen eine unterschiedliche Anzahl an Ruhelagen bzw. Arbeitspunkten, die sich unmittelbar aus (2.7) und (2.8) bestimmen lassen: (i) ẋ = (x − a1 )(x − a2 )(x − a3 ) führt auf drei Ruhelagen xj,R = aj , j = 1, 2, 3. (ii) ẋ = x sin(x) besitzt unendlich viele Ruhelagen xj,R = jπ, j ∈ Z. (iii) ẋ = t + x sin(x) besitzt keine Ruhelage. (iv) ẋ = x2 + 1 besitzt keine Ruhelage in R. (v) ẋ1 = x2 exp(−x1 ), ẋ2 = sin(x2 ) besitzt unendlich viele Ruhelagen xR = {x ∈ R2 | x2 = 0 ∧ x1 beliebig}. √ (vi) ẋ = x2 − uR besitzt den Arbeitspunkt ( uR , uR ) für uR ≥ 0. Für uR < 0 existiert kein Arbeitspunkt. Aufgabe 2.5. Bestimmen Sie die Ruhelagen für die Systeme der Abschnitte 1.3.1–1.3.4. Bei linearen, zeitinvarianten, autonomen Systemen der Form ẋ = Ax mit x ∈ Rn und A ∈ Rn×n gibt es entweder genau eine Ruhelage xR = 0 oder unendlich viele Ruhelagen. Die Fälle sind in Tabelle 2.1 zusammengefasst. In analoger Weise erfolgt die Bestimmung der Arbeitspunkte für lineare, zeitinvariante Systeme ẋ = Ax + Bu 2.3 Linearisierung nichtlinearer Systeme Fall 21 ⇒ A ist regulär (det A 6= 0) A ist singulär (det A = 0) Anzahl Ruhelagen xR = 0 ist einzige Ruhelage Unendlich viele Ruhelagen Tabelle 2.1: Ruhelagen für lineare, zeitinvariante, autonome Systeme. für konstanten Eingang u = uR . Die auftretenden Fälle sind in Tabelle 2.2 zusammengefasst. Fall A ist regulär (det A 6= 0) A ist singulär (det A = 0), rang(A) = rang([A, BuR ]) A ist singulär (det A = 0), rang(A) = 6 rang([A, BuR ]) ⇒ Anzahl Arbeitspunkte xR = −A−1 BuR ist einziger Arbeitspunkt Unendlich viele Arbeitspunkte Kein Arbeitspunkt Tabelle 2.2: Arbeitspunkte für lineare, zeitinvariante Systeme. Die Anwendung dieser Kriterien wird in den folgenden Beispielen illustriert. Beispiel 2.3. Betrachtet wird das lineare System d x1 1 a x1 = x b 1 x2 dt 2 mit den reellen Parametern a, b ∈ R. Die Ruhelagen des Systems ergeben sich gemäß Tabelle 2.1 wie folgt: (i) Für ab 6= 1 (A regulär) folgt xR = 0. (ii) Für ab = 1 (A singulär) ergibt sich xR = {x ∈ R2 | x1 = −ax2 mit x2 beliebig}. Beispiel 2.4. Betrachtet wird das lineare System d x1 2 1 x1 a = + u x 6 3 x b dt 2 2 mit den reellen Parametern a, b ∈ R. Die Arbeitspunkte des Systems ergeben sich gemäß Tabelle 2.2 wie folgt (A ist singulär): (i) Für b 6= 3a existiert kein Arbeitspunkt. (ii) Für b = 3a ergeben sich unendlich viele Arbeitspunkte xR = {x ∈ R2 | x2 = −2x1 +auR mit x1 beliebig}. Im Weiteren werden die Begriffe Ruhelage und Arbeitspunkt teilweise synonym verwendet und die Unterscheidung wird durch die zugrunde liegende Systemstruktur (frei oder nichtautonom) impliziert. 2.3.2 Linearisierung um eine Ruhelage Zur Vereinfachung und Verkürzung der Schreibweise werden die nachfolgenden Konventionen vereinbart. Für die partielle Ableitung einer Funktion f(x) : Rn → R nach einer Komponente xj an der Stelle x = xR schreibt man ∂ ∂ f(x) = f(xR ). ∂xj ∂xj x=xR 22 2 Eigenschaften dynamischer Systeme Folglich ist die Ableitung einer Funktion f(x) : Rn → R nach x an der Stelle x = xR der Zeilenvektor ∂ ∂ ∂ ∂ ∂ = f(x) f(xR ) = f(xR ) f(xR ) . . . f(xR ) . ∂x ∂x ∂x1 ∂x2 ∂xn x=xR Damit ergibt sich die Ableitung der vektorwertigen f (x) : Rn → Rn , d.h. die Jacobi–Matrix , an der Stelle x = xR zu ∂ ∂ ∂ f (x ) f (x ) . . . f (x ) 1 R 1 R 1 R ∂x1 ∂x2 ∂xn ∂ ∂ ∂ f2 (xR ) f2 (xR ) . . . f2 (xR ) ∂ ∂ . ∂x ∂x ∂x 2 n = f (x) f (xR ) = 1 .. .. .. ∂x ∂x x=xR . . . ∂ ∂ ∂ fn (xR ) fn (xR ) . . . fn (xR ) ∂x1 ∂x2 ∂xn Die Grundlage der Linearisierung eines nichtlinearen Systems um eine Ruhelage bzw. um einen Arbeitspunkt ist die Formel nach Taylor. Satz 2.5 (Taylor–Formel zweiter Ordnung). Es seien U ⊂ Rn offen, f (x) : U → Rn zweifach stetig differenzierbar und Punkte xR , xR + ∆x ∈ U so gegeben, dass ihre Verbindungsstrecke in U liegt. Dann gilt f (xR + ∆x) = f (xR ) + ∂ f (xR )∆x + r(xR , ∆x), ∂x (2.9) wobei für das Restglied r(xR , ∆x) eine Konstante K so existiert, dass kr(xR , ∆x)k ≤ Kk∆xk2 bzw. kr(xR , ∆x)k = 0. k∆xk k∆xk→0 lim Hiermit lässt sich unmittelbar der folgende Satz zur Linearisierung eines nichtlinearen, zeitinvarianten Systems um eine Ruhelage formulieren. Satz 2.6 (Linearisierung um Ruhelage bzw. Arbeitspunkt). Es sei xR eine Ruhelage des nichtlinearen, zeitinvarianten Systems ẋ = f (x, u), t > 0, y = h(x, u), t≥0 x(0) = x0 (2.10a) (2.10b) für u(t) = uR . Die Änderung der Lösung ∆x(t), ∆y(t) bei hinreichend kleinen Abweichungen ∆u(t) von uR und ∆x0 von xR wird durch das lineare, zeitinvariante System ∆ẋ = A∆x + B∆u, t > 0, ∆y = C∆x + D∆u, t≥0 ∆x(0) = ∆x0 = x0 − xR (2.11a) (2.11b) mit den Matrizen A= ∂ f (xR , uR ), ∂x B= ∂ f (xR , uR ), ∂u C= ∂ h(xR , uR ), ∂x D= ∂ h(xR , uR ) ∂u (2.12) beschrieben. Das System (2.11) wird auch als Linearisierung von (2.10) um die Ruhelage bzw. den Arbeitspunkt (xR , uR ) bezeichnet. Der Nachweis dieses Ergebnisses folgt unmittelbar durch die Nutzung der Taylor–Formel zweiter Ordnung. Da (xR , uR ) nach Voraussetzung ein Arbeitspunkt von (2.10) ist, gilt mit Definition 2.4, dass 2.3 Linearisierung nichtlinearer Systeme 23 f (xR , uR ) = 0, womit sich aus (2.10b) der entsprechende Wert des Ausgangs zu y R = h(xR , uR ) ergibt. Betrachtet man nun kleine Änderungen um den Arbeitspunkt, so können die Größen x(t), u(t) und y(t) in der Form x(t) = xR + ∆x(t), u(t) = uR + ∆u(t), y(t) = y R + ∆y(t) (2.13) angegeben werden, wobei durch ∆ die jeweiligen Abweichungen von der Ruhelage symbolisiert werden. Einsetzen von (2.13) in (2.10a) und (2.10b) liefert ẋ = ẋR +∆ẋ = f (xR + ∆x, uR + ∆u), |{z} =0 y = y R + ∆y = h(xR + ∆x, uR + ∆u), t > 0, x(0) = xR + ∆x(0) t ≥ 0. Mit Satz 2.5 und unter Vernachlässigung der Restglieder führt dies auf ∂ ∂ f (xR , uR ) ∆x + f (xR , uR ) ∆u, ∆ẋ = f (xR , uR ) + | {z } |∂x {z } } |∂u {z =0 =A =B t>0 mit ∆x(0) = ∆x0 = x0 − xR und ∂ ∂ y R + ∆y = h(xR , uR ) + h(xR , uR ) ∆x + h(xR , uR ) ∆u(t), | {z } |∂x {z ∂u } | {z } = yR =C =D t ≥ 0. Satz 2.6 folgt somit durch den Vergleich mit (2.11). Beispiel 2.5. Die Anwendung von Satz 2.6 soll anhand der Zustandsdifferenzialgleichung (1.7) des mathematischen Pendels von Aufgabe 1.5 illustriert werden. Offensichtlich existieren unendlich viele Ruhelagen da ωR =0 − gl sin(ϕR ) für ωR = 0 und ϕR = jπ, j ∈ Z erfüllt wird. Von diesen sind jedoch nur (ϕR , ωR ) = (0, 0) und (ϕR , ωR ) = (0, π) entsprechend der unteren bzw. oberen Ruhelage physikalisch unterscheidbar. Mit Satz 2.6 führt die Linearisierung um eine allgemeine Ruhelage (ϕR , ωR ) auf das linearisierte Modell d ∆ϕ 0 1 ∆ϕ ∆ϕ(0) ∆ϕ0 = , t>0 = g − l cos(ϕR ) 0 ∆ω ∆ω(0) ∆ω0 dt ∆ω ∆y = −l sin(ϕR ). Für die untere Ruhelage (ϕR , ωR ) = (0, 0) liefert dies d ∆ϕ 0 1 ∆ϕ = g − l 0 ∆ω dt ∆ω ∆y = 0 24 2 Eigenschaften dynamischer Systeme Es zeigt sich, dass die Wahl des Ausgangs als Auslenkung der Punktmasse m von der unteren Ruhelage in z–Richtung (vgl. Abbildung 1.8(b)) in der Linearisierung auf ∆y(t) = 0 führt. Somit liefert diese Wahl des Ausgangs keine Auskunft über den Zustand des um die untere Ruhelage linearisierten Systems. Für die obere Ruhelage (ϕR , ωR ) = (0, π) ergibt sich d ∆ϕ 0 1 ∆ϕ = g ∆ω dt ∆ω l 0 ∆y = 0. Es sei abschließend bemerkt, dass die übliche Näherung für kleine Winkel sin(ϕ) ≈ ϕ und cos(ϕ) ≈ 1 nur für Betrachtungen in der Umgebung der Ruhelage ϕ = 0 gültig ist. 2.3.3 Linearisierung um eine Trajektorie Neben der Linearisierung um eine Ruhelage bzw. um einen Arbeitspunkt ist in regelungstechnischen Fragestellungen auch die Linearisierung um eine Trajektorie von Bedeutung. Satz 2.7 (Linearisierung um Trajektorie). Es sei x∗ (t) eine Trajektorie des nichtlinearen, zeitinvarianten Systems ẋ = f (x, u), t > 0, y = h(x, u), t≥0 x(0) = x0 = x∗ (0) (2.14a) (2.14b) für u(t) = u∗ (t). Die Änderung der Lösung ∆x(t), ∆y(t) bei hinreichend kleinen Abweichungen ∆u(t) von u∗ (t) und ∆x0 von x∗ (0) wird durch das lineare, zeitvariante System ∆ẋ = A(t)∆x + B(t)∆u, t > 0, ∆y = C(t)∆x + D(t)∆u, t≥0 ∆x(0) = ∆x0 = x0 − x∗ (0) (2.15a) (2.15b) mit den Matrizen A(t) = ∂ f (x∗ , u∗ ), ∂x B(t) = ∂ f (x∗ , u∗ ), ∂u C(t) = ∂ h(x∗ , u∗ ), ∂x D(t) = ∂ h(x∗ , u∗ ) (2.16) ∂u beschrieben. Das System (2.15) wird auch als Linearisierung von (2.14) um die Trajektorie (x∗ (t), u∗ (t)) bezeichnet. Es ist hierbei zu beachten, dass die Linearisierung eines nichtlinearen, zeitinvarianten Systems der Form (2.14) um eine Ruhelage auf ein lineares, zeitinvariantes System führt, wohingegen die Linearisierung um eine Trajektorie ein lineares, zeitvariantes System ergibt. Der Nachweis von Satz 2.7 erfolgt analog zum vorherigen Abschnitt. Gemäß den Voraussetzungen des Satzes stellt (x∗ (t), u∗ (t)) eine Lösung der Gleichungen (2.14) dar. Folglich gilt ẋ∗ = f (x∗ , u∗ ), t > 0, y ∗ = h(x∗ , u∗ ), t ≥ 0. x∗ (0) = x∗0 Für hinreichend kleine Abweichungen der Eingangsgröße u(t) und des Anfangswertes x0 von u∗ (t) und x∗0 stellen sich (zumindest in einem hinreichend kleinen Zeitintervall t ∈ [0, T ]) nur kleine Abweichungen der Lösung x(t) von x∗ (t) ein. Mit x(t) = x∗ (t) + ∆x(t), u(t) = u∗ (t) + ∆u(t), y(t) = y ∗ (t) + ∆y(t) liefert die Auswertung von (2.14), dass ẋ = ẋ∗ + ∆ẋ = f (x∗ + ∆x, u∗ + ∆u), t > 0, x(0) = x∗0 + ∆x(0) (2.17) Literaturverzeichnis 25 y = y ∗ + ∆y = h(x∗ + ∆x, u∗ + ∆u), t ≥ 0. Mit Satz 2.5 und unter Vernachlässigung der Restglieder führt dies auf ∂ ∂ f (x∗ , u∗ ) ∆x + f (x∗ , u∗ ) ∆u, ẋ∗ + ∆ẋ = f (x∗ , u∗ ) + | {z } |∂x {z ∂u } | {z } = ẋ∗ = A(t) = B(t) t>0 mit ∆x(0) = ∆x0 = x0 − x∗0 und ∂ ∂ h(x∗ , u∗ ) ∆x + h(x∗ , u∗ ) ∆u(t), y ∗ + ∆y = h(x∗ , u∗ ) + | {z } |∂x {z ∂u } {z } | = y∗ = C(t) = D(t) t ≥ 0. Eine Vergleich mit (2.15) führt auf Satz 2.7. Beispiel 2.6. Gegeben ist das nichtlineare, zeitinvariante System ax2 x3 + u1 ẋ = −ax1 x3 + u2 , t > 0 x(0) = x0 u3 y = sin(x1 ), t≥0 mit konstantem Parameter a > 0. Für u(t) = u∗ (t) = [u∗1 (t), u∗2 (t), u∗3 (t)]T = 0 und x0 = x∗0 ergibt sich die Lösung zu ∗ x1,0 cos(ax∗3,0 t) + x∗2,0 sin(ax∗3,0 t) x∗ (t) = −x∗1,0 sin(ax∗3,0 t) + x∗2,0 cos(ax∗3,0 t) . x∗3,0 Die Linearisierung gemäß (2.15) mit (2.17) führt auf das lineare, zeitvariante System 0 ax∗3 (t) ax∗2 (t) 100 ∆x(0) = x0 − x∗0 ∆ẋ = −ax∗3 (t) 0 −ax∗1 (t) ∆x + 0 1 0 ∆u, t > 0, 001 0 0 0 ∗ ∆y = cos(x1 (t)) 0 0 ∆x. Literaturverzeichnis 1. Chen CT (1999) Linear System Theory and Design. Oxford Univ. Press, New York 2. Heuser H (2006) Gewöhnliche Differentialgleichungen, 5th edn. B.G. Teubner, Wiesbaden 3. Khalil H (2002) Nonlinear Systems, 3rd edn. Prentice–Hall, Upper Saddle River (NJ)
© Copyright 2025 ExpyDoc