Eigenschaften dynamischer Systeme

Kapitel 2
Eigenschaften dynamischer Systeme
Im Folgenden werden einige wichtige Grundlagen und Eigenschaften linearer und nichtlinearer dynamischer Systeme zusammengefasst. Diese bilden unmittelbar die Basis für den in den weiteren Kapiteln
ausführlich behandelten Regelungsentwurf für lineare, zeitinvariante Systeme. Der Ausgangspunkt dieser
Ausführungen ist durch die in (1.1) eingeführte mathematische Beschreibung zeitkontinuierlicher dynamischer Systeme gegeben, d.h.
ẋ = f (x, u, t),
t > t0 ,
y = h(x, u, t),
t ≥ t0
x(t0 ) = x0
(2.1a)
(2.1b)
mit dem Zustand x ∈ Rn , dem Eingang u ∈ Rm und dem Ausgang y ∈ Rp .
2.1 Lösungsexistenz und Eindeutigkeit
Eine der grundlegenden mathematischen Fragestellungen für nichtlineare Systeme beschäftigt sich mit
der Existenz und der Eindeutigkeit einer Lösung. Hierzu wird im Weiteren angenommen, dass keine Eingangsgrößen u auf das System (2.1) wirken. Ein solches System wird frei genannt. Ein freies, nichtlineares
System kann somit allgemein in der Form
ẋ = f (x, t),
t > t0 ,
y = h(x, t),
t ≥ t0
x(t0 ) = x0
(2.2a)
(2.2b)
angeschrieben werden. Für Systeme der Form (2.2) liefert der folgende Satz eine hinreichende Bedingung
für die Existenz und Eindeutigkeit der Lösung [2].
Satz 2.1 (Lokale Existenz und Eindeutigkeit). Es sei f (x, t) stückweise stetig in t und erfülle die
Lipschitz–Bedingung
kf (x1 , t) − f (x2 , t)k ≤ Lkx1 − x2 k,
0<L<∞
(2.3)
für alle x1 , x2 ∈ B := {x ∈ Rn | kx − x0 k ≤ r} für alle t ∈ [t0 , t0 + τ ]. Dann existiert ein δ > 0 so, dass
ẋ = f (x, t),
t > t0 ,
x(t0 ) = x0
genau eine Lösung für t ∈ [t0 , t0 + δ] besitzt.
Der Beweis dieser Aussage ist beispielsweise in [3, Kapitel 3] zu finden. Der Schlüssel hierzu ist die
Lipschitz–Bedingung (2.3) mit der Lipschitz–Konstanten L. Um dies zu illustrieren betrachte man das
System
15
16
2 Eigenschaften dynamischer Systeme
2
ẋ = 3x 3 ,
t > 0,
x(0) = x0 = 0.
Es ist unmittelbar ersichtlich, dass x(t) = 0 eine Lösung der Differenzialgleichung ist. Darüber hinaus
d 3
erfüllt jedoch auch x(t) = t3 die Differenzialgleichung und Anfangsbedingung, da dt
t = 3t2 = 3(t3 )2/3
2
mit x(0) = 0. Die offensichtliche Stetigkeit von f (x) = 3x 3 in x impliziert somit nicht die Eindeutigkeit
der Lösung. Zudem existiert in einer hinreichend kleinen Umgebung um x0 = 0 keine Lipschitz–Konstante
L so, dass (2.3) erfüllt wird. Da f : R → R und somit k · k = | · | kann dies leicht dadurch motiviert
werden, dass in diesem Fall (2.3) äquivalent ist zu
|f (x1 ) − f (x2 )|
≤L
|x1 − x2 |
für x1 , x2 ∈ B. Mit der Definition von B und x(0) = x0 = 0 impliziert dies für das betrachtete Beispiel,
dass in einer Umgebung des Ursprungs gelten muss, dass
d
f (x) < ∞,
dx
x ∈ B.
2
Dies ist offensichtlich für f (x) = 3x 3 nicht erfüllt, weshalb Satz 2.1 nicht angewendet werden kann.
Für weitere Möglichkeiten zum Nachweis der Lipschitz–Stetigkeit, d.h. der Existenz einer Lipschitz–
Konstanten L ∈ (0, ∞) wird auf die Ausführungen in [3, Kapitel 3] verwiesen.
Der Beweis der Existenz beruht dabei im Wesentlichen auf der Anwendung der Picard–Iteration oder
der Methode der sukzessiven Approximation nach Picard, deren Konvergenz unter den in Satz 2.1 getroffenen Voraussetzungen nachgewiesen werden kann. Eine Lösung x(t) von (2.2a) genügt der (Volterraschen)
Integralgleichung
Z t
x(t) = x0 +
f (x(τ ), τ )dτ.
t0
Insbesondere kann für den Fall, dass f (x, t) die Voraussetzungen von Satz 2.1 erfüllt, gezeigt werden,
dass die Folge von Funktionen
x0 (t) = x0
Z
t
x1 (t) = x0 +
f (x0 (τ ), τ )dτ
t0
..
.
Z
t
xk (t) = x0 +
f (xk−1 (τ ), τ )dτ
t0
gegen die eindeutige Lösung von (2.2a) konvergiert. Es gilt also
x(t) = lim xk (t).
k→∞
Beispiel 2.1. Beispielhaft wird die Anwendung dieses Schemas anhand der Differenzialgleichung
ẋ = αx,
t > 0,
x(0) = x0
mit α ∈ R illustriert. Es gilt somit
x0 (t) = x0
Z
x1 (t) = x0 +
t
αx0 dτ = x0 (1 + αt)
0
2.2 Linearität und Zeitinvarianz
Z
17
t
t2 αx0 (1 + ατ )dτ = x0 1 + αt + α2
2
t
τ k−1 αx0 1 + ατ + . . . + αk−1
dτ.
(k − 1)!
x2 (t) = x0 +
0
..
.
Z
xk (t) = x0 +
0
Somit ergibt sich für den Grenzwert k → ∞ die bekannte Lösung der Differenzialgleichung
x(t) = lim xk (t) = x0
k→∞
∞
X
k=0
αk
tk
= x0 eαt .
k!
Es sei betont, dass Satz 2.1 nur ein hinreichendes und insbesondere lokales Existenz und Eindeutigkeitsresultat darstellt. Eine globale Erweiterung wird erhalten, wenn die Lipschitz–Stetigkeit nicht nur auf
Elemente der um den Anfangszustand x0 zentrierten Kugel B beschränkt ist, sondern global gilt.
Satz 2.2 (Globale Existenz und Eindeutigkeit). Es sei f (x, t) stückweise stetig in t und erfülle die
Lipschitz–Bedingung
kf (x1 , t) − f (x2 , t)k ≤ Lkx1 − x2 k,
0<L<∞
für alle x1 , x2 ∈ Rn für alle t ∈ [t0 , t0 + τ ]. Dann existiert genau eine Lösung der Differenzialgleichung
ẋ = f (x, t),
t > t0 ,
x(t0 ) = x0
für t ∈ [t0 , t0 + τ ].
Hierbei kann τ beliebig groß sein. Dass die Aussagen sowohl von Satz 2.1 als auch Satz 2.2 nur hinreichend
sind kann leicht anhand des Beispiels f (x) = −x3 gezeigt werden. Speziell ist f nicht global Lipschitz–
stetig. Andererseits existiert für jede Anfangsbedingung x(0) = x0 eine eindeutige Lösung
s
x20
x(t) = sign(x0 )
,
1 + 2x20 t
die für alle t ≥ 0 wohl definiert ist.
2.2 Linearität und Zeitinvarianz
Nach diesem kurzen Exkurs in die Theorie nichtlinearer dynamischer Systeme werden im Weiteren fast
ausschließlich lineare, zeitinvariante Systeme betrachtet. Bekannterweise gilt hierbei u.a. das so genannte
Superpositionsprinzip, was zur Lösung linearer Differenzialgleichungen eine wichtige Anwendung findet.
i(t)
i(t)
ideal
u(t)
R
Abb. 2.1: Beispiel äquivalenter Schaltungen.
⇔
u(t)
R
18
2 Eigenschaften dynamischer Systeme
Wie die obige Abbildung 2.1 äquivalenter elektrischer Schaltungen unterstreicht, erfordert die Charakterisierung eines linearen Systems die Formulierung überprüfbarer formal mathematischer Kriterien.
Speziell kann aus dem Vorhandensein offensichtlich nichtlinearer Elemente (z.B. Dioden in Abbildung
2.1) nicht unmittelbar darauf geschlossen werden, dass das System nichtlineares Verhalten aufweist. Sei
nun ϕ(x0 , u(t), t, t0 ) die Lösung der Differenzialgleichung (2.1a) zum Zeitpunkt t für den Anfangswert
x(t0 ) = x0 und die Eingangsgröße u(τ ), t0 < τ < t.
Definition 2.1 (Linearität). Das System (2.1) nennt man linear, wenn für alle (zulässigen) Eingangsgrößen u(t) und jeden beliebigen Anfangszeitpunkt t0 ≥ 0 die Ausgangsgröße y(x0 , u(t), t) =
h(ϕ(x0 , u(t), t, t0 ), u(t), t) zu jedem Zeitpunkt t ≥ t0 die Bedingungen
(i)
y(α1 x0,1 + α2 x0,2 , 0, t) = α1 y(x0,1 , 0, t) + α2 y(x0,2 , 0, t)
(2.4a)
(ii)
y(0, β1 u1 + β2 u2 , t) = β1 y(0, u1 , t) + β2 y(0, u2 , t)
(2.4b)
(iii)
y(x0 , u, t) = y(x0 , 0, t) + y(0, u, t)
(2.4c)
mit α1 , α2 , β1 , β2 ∈ R erfüllt.
Hierbei bezeichnet man die Eigenschaft (i) als Superpositionsprinzip oder Zerlegungseigenschaft
bezüglich der Anfangswerte (Nulleingangslinearität), (ii) als das Superpositionsprinzip bezüglich der Eingangsgrößen (Nullzustandslinearität) und (iii) als das Superpositionsprinzip bezüglich der Eingangsgrößen
mit den Anfangswerten (siehe z.B. [1]).
Aufgabe 2.1. Ist das System
ẋ(t) = a(t)x(t) + u(t) + 1,
t > t0 ,
x(t0 ) = x0
y(t) = x(t)
linear? Begründen Sie Ihre Antwort.
Lösung. Das System erfüllt nicht die Eigenschaften (i) und (ii) und ist somit nicht linear.
d
∂
d
Hinweis: Man betrachte dt
y(t) = ∂x
h(x, u, t) dt
x(t) +
h(x, u, t) = x zur Überprüfung der Bedingungen (2.4)).
∂
∂u h(x, u, t)u(t)
+
∂
∂t h(x, u, t)
= ẋ(t) da
Zudem sei bemerkt, dass durch die Substitution u(t) = ū(t) − 1 das System die Bedingungen (2.4)
mit dem neuen Eingang ū(t) erfüllt.
Es gilt der folgende Satz.
Satz 2.3. Das System (2.1) ist genau dann linear, wenn es sich in die Form
ẋ(t) = A(t)x(t) + B(t)u(t),
t > t0 ,
y(t) = C(t)x(t) + D(t)u(t),
t ≥ t0
x(t0 ) = x0
(2.5a)
(2.5b)
überführen lässt.
Die Einträge der (n × n)–Matrix A(t), der (n × m)–Matrix B(t), der (p × n)–Matrix C(t) und der
(p × m)–Matrix D(t) dürfen dabei nur von der Zeit t abhängen.
Aufgabe 2.2. Sind die Systeme der Abschnitte 1.3.1–1.3.4 linear oder nichtlinear?
Ein weitere wichtige Eigenschaft dynamischer Systeme betrifft die Zeitvarianz . Hierzu sei bemerkt,
dass in den folgenden Ausführungen mit f (t − T ), T > 0, die um die Zeit T nach rechts verschobene
Zeitfunktion f (t) gemeint ist.
Definition 2.2 (Zeitinvarianz). Das System (2.1) wird zeitinvariant genannt, wenn für alle (zulässigen)
Eingangsgrößen u(t) und jeden beliebigen Anfangszeitpunkt t0 ≥ 0 die nachfolgende Bedingung für
2.3 Linearisierung nichtlinearer Systeme
19
alle t ≥ t0 und alle T ∈ R erfüllt: Sei y(t) die Ausgangsgröße des Systems zum Zeitpunkt t für den
Anfangswert x(t0 ) = x0 und die Eingangsgröße u(τ ), t0 ≤ τ ≤ t, dann ist y(t − T ) die Ausgangsgröße
des Systems für den Anfangswert x(t0 + T ) = x0 und die Eingangsgröße u(τ − T ), t0 + T ≤ τ ≤ t + T .
Aufgabe 2.3. Ist das System
ẋ(t) = ax(t) + bu(t),
t > 0,
x(0) = x0
y(t) = x(t)
zeitinvariant?
Lösung. Das System ist zeitinvariant.
Es gilt der folgende Satz.
Satz 2.4. Das System (2.1) ist genau dann linear und zeitinvariant, wenn es sich in die Form
ẋ(t) = Ax(t) + Bu(t),
t > 0,
y(t) = Cx(t) + Du(t),
t≥0
x(0) = x0
(2.6a)
(2.6b)
überführen lässt.
Die Einträge der (n × n)–Matrix A, der (n × m)–Matrix B, der (p × n)–Matrix C und der (p × m)–
Matrix D sind dabei reelle Zahlen. Es sei hierbei zudem beachtet, dass für lineare, zeitinvariante Systeme
ohne Beschränkung der Allgemeinheit für den Anfangszeitpunkt t0 = 0 angenommen werden kann. In der
Englischsprachigen Literatur werden Systeme der Form (2.6) auch abkürzend als LTI–Systeme bezeichnet.
Aufgabe 2.4. Die mathematische Beschreibung des Transportvorgangs auf einem Förderband der Länge
l, das sich mit der konstanten Geschwindigkeit v bewegt, führt auf x(t) = u(t − l/v). Hierbei ist u(t)
die am Bandanfang pro Zeiteinheit aufgebrachte Materialmenge während x(t) die am Bandende pro
Zeiteinheit abgeworfene Menge darstellt.
a) Ist das System linear und zeitinvariant?
b) Kann das System in der Form (2.6) dargestellt werden?
Lösung. Das System ist linear und zeitinvariant. Es kann nicht in der Form (2.6) angeschrieben
werden.
2.3 Linearisierung nichtlinearer Systeme
Falls für ein nichtlineares, zeitvariantes System (2.1) nur kleine Auslenkungen um eine Ruhelage bzw.
einen Arbeitspunkt betrachtet werden, dann kann das System sehr häufig durch eine lokale Linearisierung
um die Ruhelage hinreichend genau approximiert werden.
2.3.1 Ruhelagen nichtlinearer Systeme
Der Begriff der Ruhelage wird im Allgemeinen für autonome bzw. freie Systeme definiert während ein
Arbeitspunkt zudem vom Wert des Eingangs abhängt. Ein Arbeitspunkt (xR , uR ) eines nichtlinearen
Systems (2.1) ist dadurch charakterisiert, dass er einem Fixpunkt der Lösung ϕ(x0 = xR , uR , t, t0 ) der
Differenzialgleichung (2.1a) mit der Anfangsbedingung x0 = xR für konstanten Eingang uR entspricht,
d.h. es gilt
20
2 Eigenschaften dynamischer Systeme
ϕ(xR , uR , t, t0 ) = xR ,
∀t ≥ t0 .
Für den Fall uR = 0 bzw. für freie Systeme mit f (x, u, t) = f (x, t) wird xR als Fixpunkt der Lösung
ϕ(xR , t, t0 ) = xR ,
∀t ≥ t0
auch als Ruhelage bezeichnet. Zur praktischen Berechnung der Ruhelagen bzw. Arbeitspunkte werden
die folgenden Definitionen herangezogen.
Definition 2.3 (Ruhelage). Ein Punkt xR ∈ Rn ist eine Ruhelage von
ẋ = f (x, t),
t > t0
wenn die Bedingung
f (xR , t) = 0
(2.7)
für alle Zeiten t ≥ t0 erfüllt ist.
Definition 2.4 (Arbeitspunkt). Ein Punkt (xR , uR ) mit xR ∈ Rn und uR ∈ Rm ist ein Arbeitspunkt
von
ẋ = f (x, u, t),
t > t0
wenn die Bedingung
f (xR , uR , t) = 0
(2.8)
für alle Zeiten t ≥ t0 erfüllt ist.
Es sei hierbei bemerkt, dass nichtlineare Systeme im Allgemeinen eine beliebige Anzahl an Ruhelagen
bzw. Arbeitspunkten aufweisen können.
Beispiel 2.2. Die folgenden nichtlinearen Systeme besitzen eine unterschiedliche Anzahl an Ruhelagen
bzw. Arbeitspunkten, die sich unmittelbar aus (2.7) und (2.8) bestimmen lassen:
(i) ẋ = (x − a1 )(x − a2 )(x − a3 ) führt auf drei Ruhelagen xj,R = aj , j = 1, 2, 3.
(ii) ẋ = x sin(x) besitzt unendlich viele Ruhelagen xj,R = jπ, j ∈ Z.
(iii) ẋ = t + x sin(x) besitzt keine Ruhelage.
(iv) ẋ = x2 + 1 besitzt keine Ruhelage in R.
(v) ẋ1 = x2 exp(−x1 ), ẋ2 = sin(x2 ) besitzt unendlich viele Ruhelagen xR = {x ∈ R2 | x2 = 0 ∧
x1 beliebig}.
√
(vi) ẋ = x2 − uR besitzt den Arbeitspunkt ( uR , uR ) für uR ≥ 0. Für uR < 0 existiert kein Arbeitspunkt.
Aufgabe 2.5. Bestimmen Sie die Ruhelagen für die Systeme der Abschnitte 1.3.1–1.3.4.
Bei linearen, zeitinvarianten, autonomen Systemen der Form
ẋ = Ax
mit x ∈ Rn und A ∈ Rn×n gibt es entweder genau eine Ruhelage xR = 0 oder unendlich viele Ruhelagen.
Die Fälle sind in Tabelle 2.1 zusammengefasst.
In analoger Weise erfolgt die Bestimmung der Arbeitspunkte für lineare, zeitinvariante Systeme
ẋ = Ax + Bu
2.3 Linearisierung nichtlinearer Systeme
Fall
21
⇒
A ist regulär (det A 6= 0)
A ist singulär (det A = 0)
Anzahl Ruhelagen
xR = 0 ist einzige Ruhelage
Unendlich viele Ruhelagen
Tabelle 2.1: Ruhelagen für lineare, zeitinvariante, autonome Systeme.
für konstanten Eingang u = uR . Die auftretenden Fälle sind in Tabelle 2.2 zusammengefasst.
Fall
A ist regulär (det A 6= 0)
A ist singulär (det A = 0), rang(A) = rang([A, BuR ])
A ist singulär (det A = 0), rang(A) =
6 rang([A, BuR ])
⇒
Anzahl Arbeitspunkte
xR = −A−1 BuR ist einziger Arbeitspunkt
Unendlich viele Arbeitspunkte
Kein Arbeitspunkt
Tabelle 2.2: Arbeitspunkte für lineare, zeitinvariante Systeme.
Die Anwendung dieser Kriterien wird in den folgenden Beispielen illustriert.
Beispiel 2.3. Betrachtet wird das lineare System
d x1
1 a x1
=
x
b 1 x2
dt 2
mit den reellen Parametern a, b ∈ R. Die Ruhelagen des Systems ergeben sich gemäß Tabelle 2.1 wie
folgt:
(i) Für ab 6= 1 (A regulär) folgt xR = 0.
(ii) Für ab = 1 (A singulär) ergibt sich xR = {x ∈ R2 | x1 = −ax2 mit x2 beliebig}.
Beispiel 2.4. Betrachtet wird das lineare System
d x1
2 1 x1
a
=
+
u
x
6
3
x
b
dt 2
2
mit den reellen Parametern a, b ∈ R. Die Arbeitspunkte des Systems ergeben sich gemäß Tabelle 2.2 wie
folgt (A ist singulär):
(i) Für b 6= 3a existiert kein Arbeitspunkt.
(ii) Für b = 3a ergeben sich unendlich viele Arbeitspunkte xR = {x ∈ R2 | x2 = −2x1 +auR mit x1 beliebig}.
Im Weiteren werden die Begriffe Ruhelage und Arbeitspunkt teilweise synonym verwendet und die
Unterscheidung wird durch die zugrunde liegende Systemstruktur (frei oder nichtautonom) impliziert.
2.3.2 Linearisierung um eine Ruhelage
Zur Vereinfachung und Verkürzung der Schreibweise werden die nachfolgenden Konventionen vereinbart.
Für die partielle Ableitung einer Funktion f(x) : Rn → R nach einer Komponente xj an der Stelle
x = xR schreibt man
∂
∂
f(x)
=
f(xR ).
∂xj
∂xj
x=xR
22
2 Eigenschaften dynamischer Systeme
Folglich ist die Ableitung einer Funktion f(x) : Rn → R nach x an der Stelle x = xR der Zeilenvektor
∂
∂
∂
∂
∂
=
f(x)
f(xR ) =
f(xR )
f(xR ) . . .
f(xR ) .
∂x
∂x
∂x1
∂x2
∂xn
x=xR
Damit ergibt sich die Ableitung der vektorwertigen f (x) : Rn → Rn , d.h. die Jacobi–Matrix , an der
Stelle x = xR zu


∂
∂
∂
f
(x
)
f
(x
)
.
.
.
f
(x
)
1
R
1
R
1
R

 ∂x1
∂x2
∂xn

 ∂
∂
∂


f2 (xR )
f2 (xR ) . . .
f2 (xR ) 

∂
∂
.

∂x
∂x
∂x
2
n
=
f (x)
f (xR ) =  1

..
..
..
∂x
∂x


x=xR
.
.
.



 ∂
∂
∂
fn (xR )
fn (xR ) . . .
fn (xR )
∂x1
∂x2
∂xn
Die Grundlage der Linearisierung eines nichtlinearen Systems um eine Ruhelage bzw. um einen Arbeitspunkt ist die Formel nach Taylor.
Satz 2.5 (Taylor–Formel zweiter Ordnung). Es seien U ⊂ Rn offen, f (x) : U → Rn zweifach
stetig differenzierbar und Punkte xR , xR + ∆x ∈ U so gegeben, dass ihre Verbindungsstrecke in U liegt.
Dann gilt
f (xR + ∆x) = f (xR ) +
∂
f (xR )∆x + r(xR , ∆x),
∂x
(2.9)
wobei für das Restglied r(xR , ∆x) eine Konstante K so existiert, dass
kr(xR , ∆x)k ≤ Kk∆xk2
bzw.
kr(xR , ∆x)k
= 0.
k∆xk
k∆xk→0
lim
Hiermit lässt sich unmittelbar der folgende Satz zur Linearisierung eines nichtlinearen, zeitinvarianten
Systems um eine Ruhelage formulieren.
Satz 2.6 (Linearisierung um Ruhelage bzw. Arbeitspunkt). Es sei xR eine Ruhelage des nichtlinearen, zeitinvarianten Systems
ẋ = f (x, u),
t > 0,
y = h(x, u),
t≥0
x(0) = x0
(2.10a)
(2.10b)
für u(t) = uR . Die Änderung der Lösung ∆x(t), ∆y(t) bei hinreichend kleinen Abweichungen ∆u(t)
von uR und ∆x0 von xR wird durch das lineare, zeitinvariante System
∆ẋ = A∆x + B∆u,
t > 0,
∆y = C∆x + D∆u,
t≥0
∆x(0) = ∆x0 = x0 − xR
(2.11a)
(2.11b)
mit den Matrizen
A=
∂
f (xR , uR ),
∂x
B=
∂
f (xR , uR ),
∂u
C=
∂
h(xR , uR ),
∂x
D=
∂
h(xR , uR )
∂u
(2.12)
beschrieben. Das System (2.11) wird auch als Linearisierung von (2.10) um die Ruhelage bzw. den Arbeitspunkt (xR , uR ) bezeichnet.
Der Nachweis dieses Ergebnisses folgt unmittelbar durch die Nutzung der Taylor–Formel zweiter Ordnung.
Da (xR , uR ) nach Voraussetzung ein Arbeitspunkt von (2.10) ist, gilt mit Definition 2.4, dass
2.3 Linearisierung nichtlinearer Systeme
23
f (xR , uR ) = 0,
womit sich aus (2.10b) der entsprechende Wert des Ausgangs zu
y R = h(xR , uR )
ergibt. Betrachtet man nun kleine Änderungen um den Arbeitspunkt, so können die Größen x(t), u(t)
und y(t) in der Form
x(t) = xR + ∆x(t),
u(t) = uR + ∆u(t),
y(t) = y R + ∆y(t)
(2.13)
angegeben werden, wobei durch ∆ die jeweiligen Abweichungen von der Ruhelage symbolisiert werden.
Einsetzen von (2.13) in (2.10a) und (2.10b) liefert
ẋ = ẋR +∆ẋ = f (xR + ∆x, uR + ∆u),
|{z}
=0
y = y R + ∆y = h(xR + ∆x, uR + ∆u),
t > 0,
x(0) = xR + ∆x(0)
t ≥ 0.
Mit Satz 2.5 und unter Vernachlässigung der Restglieder führt dies auf
∂
∂
f (xR , uR ) ∆x +
f (xR , uR ) ∆u,
∆ẋ = f (xR , uR ) +
| {z } |∂x {z
}
}
|∂u {z
=0
=A
=B
t>0
mit
∆x(0) = ∆x0 = x0 − xR
und
∂
∂
y R + ∆y = h(xR , uR ) +
h(xR , uR ) ∆x +
h(xR , uR ) ∆u(t),
| {z } |∂x {z
∂u
}
|
{z
}
= yR
=C
=D
t ≥ 0.
Satz 2.6 folgt somit durch den Vergleich mit (2.11).
Beispiel 2.5. Die Anwendung von Satz 2.6 soll anhand der Zustandsdifferenzialgleichung (1.7) des mathematischen Pendels von Aufgabe 1.5 illustriert werden. Offensichtlich existieren unendlich viele Ruhelagen da
ωR
=0
− gl sin(ϕR )
für ωR = 0 und ϕR = jπ, j ∈ Z erfüllt wird. Von diesen sind jedoch nur (ϕR , ωR ) = (0, 0) und (ϕR , ωR ) =
(0, π) entsprechend der unteren bzw. oberen Ruhelage physikalisch unterscheidbar. Mit Satz 2.6 führt die
Linearisierung um eine allgemeine Ruhelage (ϕR , ωR ) auf das linearisierte Modell
d ∆ϕ
0
1 ∆ϕ
∆ϕ(0)
∆ϕ0
=
, t>0
=
g
− l cos(ϕR ) 0 ∆ω
∆ω(0)
∆ω0
dt ∆ω
∆y = −l sin(ϕR ).
Für die untere Ruhelage (ϕR , ωR ) = (0, 0) liefert dies
d ∆ϕ
0 1 ∆ϕ
=
g
− l 0 ∆ω
dt ∆ω
∆y = 0
24
2 Eigenschaften dynamischer Systeme
Es zeigt sich, dass die Wahl des Ausgangs als Auslenkung der Punktmasse m von der unteren Ruhelage
in z–Richtung (vgl. Abbildung 1.8(b)) in der Linearisierung auf ∆y(t) = 0 führt. Somit liefert diese Wahl
des Ausgangs keine Auskunft über den Zustand des um die untere Ruhelage linearisierten Systems. Für
die obere Ruhelage (ϕR , ωR ) = (0, π) ergibt sich
d ∆ϕ
0 1 ∆ϕ
= g
∆ω
dt ∆ω
l 0
∆y = 0.
Es sei abschließend bemerkt, dass die übliche Näherung für kleine Winkel sin(ϕ) ≈ ϕ und cos(ϕ) ≈ 1 nur
für Betrachtungen in der Umgebung der Ruhelage ϕ = 0 gültig ist.
2.3.3 Linearisierung um eine Trajektorie
Neben der Linearisierung um eine Ruhelage bzw. um einen Arbeitspunkt ist in regelungstechnischen
Fragestellungen auch die Linearisierung um eine Trajektorie von Bedeutung.
Satz 2.7 (Linearisierung um Trajektorie). Es sei x∗ (t) eine Trajektorie des nichtlinearen, zeitinvarianten Systems
ẋ = f (x, u),
t > 0,
y = h(x, u),
t≥0
x(0) = x0 = x∗ (0)
(2.14a)
(2.14b)
für u(t) = u∗ (t). Die Änderung der Lösung ∆x(t), ∆y(t) bei hinreichend kleinen Abweichungen ∆u(t)
von u∗ (t) und ∆x0 von x∗ (0) wird durch das lineare, zeitvariante System
∆ẋ = A(t)∆x + B(t)∆u,
t > 0,
∆y = C(t)∆x + D(t)∆u,
t≥0
∆x(0) = ∆x0 = x0 − x∗ (0)
(2.15a)
(2.15b)
mit den Matrizen
A(t) =
∂
f (x∗ , u∗ ),
∂x
B(t) =
∂
f (x∗ , u∗ ),
∂u
C(t) =
∂
h(x∗ , u∗ ),
∂x
D(t) =
∂
h(x∗ , u∗ ) (2.16)
∂u
beschrieben. Das System (2.15) wird auch als Linearisierung von (2.14) um die Trajektorie (x∗ (t), u∗ (t))
bezeichnet.
Es ist hierbei zu beachten, dass die Linearisierung eines nichtlinearen, zeitinvarianten Systems der Form
(2.14) um eine Ruhelage auf ein lineares, zeitinvariantes System führt, wohingegen die Linearisierung um
eine Trajektorie ein lineares, zeitvariantes System ergibt.
Der Nachweis von Satz 2.7 erfolgt analog zum vorherigen Abschnitt. Gemäß den Voraussetzungen des
Satzes stellt (x∗ (t), u∗ (t)) eine Lösung der Gleichungen (2.14) dar. Folglich gilt
ẋ∗ = f (x∗ , u∗ ),
t > 0,
y ∗ = h(x∗ , u∗ ),
t ≥ 0.
x∗ (0) = x∗0
Für hinreichend kleine Abweichungen der Eingangsgröße u(t) und des Anfangswertes x0 von u∗ (t) und
x∗0 stellen sich (zumindest in einem hinreichend kleinen Zeitintervall t ∈ [0, T ]) nur kleine Abweichungen
der Lösung x(t) von x∗ (t) ein. Mit
x(t) = x∗ (t) + ∆x(t),
u(t) = u∗ (t) + ∆u(t),
y(t) = y ∗ (t) + ∆y(t)
liefert die Auswertung von (2.14), dass
ẋ = ẋ∗ + ∆ẋ = f (x∗ + ∆x, u∗ + ∆u),
t > 0,
x(0) = x∗0 + ∆x(0)
(2.17)
Literaturverzeichnis
25
y = y ∗ + ∆y = h(x∗ + ∆x, u∗ + ∆u),
t ≥ 0.
Mit Satz 2.5 und unter Vernachlässigung der Restglieder führt dies auf
∂
∂
f (x∗ , u∗ ) ∆x +
f (x∗ , u∗ ) ∆u,
ẋ∗ + ∆ẋ = f (x∗ , u∗ ) +
| {z } |∂x {z
∂u
}
|
{z
}
= ẋ∗
= A(t)
= B(t)
t>0
mit
∆x(0) = ∆x0 = x0 − x∗0
und
∂
∂
h(x∗ , u∗ ) ∆x +
h(x∗ , u∗ ) ∆u(t),
y ∗ + ∆y = h(x∗ , u∗ ) +
| {z } |∂x {z
∂u
}
{z
}
|
= y∗
= C(t)
= D(t)
t ≥ 0.
Eine Vergleich mit (2.15) führt auf Satz 2.7.
Beispiel 2.6. Gegeben ist das nichtlineare, zeitinvariante System


ax2 x3 + u1
ẋ = −ax1 x3 + u2  , t > 0
x(0) = x0
u3
y = sin(x1 ),
t≥0
mit konstantem Parameter a > 0. Für u(t) = u∗ (t) = [u∗1 (t), u∗2 (t), u∗3 (t)]T = 0 und x0 = x∗0 ergibt sich
die Lösung zu

 ∗
x1,0 cos(ax∗3,0 t) + x∗2,0 sin(ax∗3,0 t)
x∗ (t) = −x∗1,0 sin(ax∗3,0 t) + x∗2,0 cos(ax∗3,0 t) .
x∗3,0
Die Linearisierung gemäß (2.15) mit (2.17) führt auf das lineare, zeitvariante System




0
ax∗3 (t) ax∗2 (t)
100
∆x(0) = x0 − x∗0
∆ẋ = −ax∗3 (t) 0 −ax∗1 (t) ∆x + 0 1 0 ∆u, t > 0,
001
0
0
0
∗
∆y = cos(x1 (t)) 0 0 ∆x.
Literaturverzeichnis
1. Chen CT (1999) Linear System Theory and Design. Oxford Univ. Press, New York
2. Heuser H (2006) Gewöhnliche Differentialgleichungen, 5th edn. B.G. Teubner, Wiesbaden
3. Khalil H (2002) Nonlinear Systems, 3rd edn. Prentice–Hall, Upper Saddle River (NJ)