null

可制御�
任意の初期時刻t0に対して状態がx0にある
とき、有限時間t1において任意の状態x1に
システムをもっていくような入力u(t)が存在
すること。行列A,Bによって決定
V =
B
AB
A2 B
· · · An
1
B
の行列がrankV = nであれば可制御
この条件が満たされない場合、状態変数の��
一部が入力u(t)に影響されない�
38
例題�
以下のシステムの可制御性について調べよ�
d
dt
x1 (t)
x2 (t)
=
1
0
x1 (t)
0
1
x2 (t)
+
1
1
制御工学例題10-6
u(t)
39
例題�
状態x(t)は2次元なので
B=
1
1
AB =
1
0
0
1
1
1
=
1
1
より
V =
B
AB
=
1 1
1 1
rank V = 1より、可制御ではない�
40
例題�
Vの中から線形独立な列ベクトルv1を選ぶ
V = 1 1 より v = 1
1
1 1
1
T=[v1 v2]が正則になるようにv2を選ぶ
v = 0 とすれば T = 1 0 T 1 = 1 0
2
1
1 1
1 1
このTにより座標変換を行う
�
制御工学例題10-6
41
例題�
A=T
1
B=T
1
AT =
1
1
1
1
B=
0
1
0
1
1
0
1
1
0
1
=
1
1
0
1
=
1
0
0
1
1
0
座標変換後のシステムは
d
dt
x1 (t)
x2 (t)
=
1
0
x1 (t)
0
1
x2 (t)
d
dt x1 (t)
d
dt x2 (t)
+
1
0
u(t)
= x1 (t) + u(t)
= x2 (t)
状態 x2 (t) は入力 u(t) の影響を受けていない
42
可観測�
入力が既知であるシステムにおいて、初期時
刻t0から任意の時刻t1までの出力y(t)を観
測することによって初期状態x0の状態が
一意に決定できるとき、可観測
x0がわかれば任意の時刻の状態を知ることが
できる
43
可観測�
可観測の条件
C
CA
2
T
CA
N =
..
.
n 1
CA
についてrank N = nの場合
可観測
条件を満たさない場合、状態変数x(t)の一部が
出力y(t)に影響を及ぼさない
44
例題�
以下のシステムの可観測性について調べよ�
d
dt
x1 (t)
x2 (t)
=
y(t) =
1 0
x1 (t)
0 1
x2 (t)
1 1
x1 (t)
x2 (t)
+
1
1
u(t)
制御工学例題10-7
45
例題�
状態x(t)は2次元なので
C=
1
1
CA =
1
1
1
0
0
1
=
1
1
より
C
1 1
T
N =
=
CA
1 1
rank N = 1より、可観測ではない�
46
例題�
NTの中から線形独立な行ベクトルw1Tを選ぶ
w1 T = 1 1
w1 T
W =
が正則になるように w2 を選ぶ
T
w2
T
1 1
1
1
1
w2 = 0 1 とすれば W =
W =
0 1
0 1
このW-1=Tにより座標変換を行う
47
例題�
A=T
1
B=T
1
1
0
AT =
1
0
B=
C = CT =
1
1
1
1
0
1
1
1
1
1
0
1
0
1
1
0
=
1
0
0
1
2
1
=
1
1
1
1
=
1
0
座標変換後のシステムは
d
dt
x1 (t)
x2 (t)
=
y(t) =
1 0
x1 (t)
0 1
x2 (t)
1 0
x1 (t)
x2 (t)
+
2
1
u(t)
= x1 (t)
出力 y(t) は状態 x2 (t) の影響を受けていない
48
状態フィードバック制御�
任意の時刻において、状態x(t)の値が制御
に利用可能であるとする。状態変数にある
適当なゲインFを乗じて制御入力を決定
u(t) = F x(t)
ẋ(t) = Ax(t) + Bu(t) = (A + BF )x(t)
A+BFの固有値を望ましい値になるように������
Fを決定する→極配置法
�
49
例題�
以下の状態方程式で表されるシステム
d
dt
x1 (t)
0
1
x1 (t)
0
=
+
u(t)
x2 (t)
1 1
x2 (t)
1
に対し、システムの極を-1, -2とする状態��
フィードバック行列Fを求めよ�
制御工学例題10-8
50
例題�
状態フィードバック入力を
u(t) = F x(t) = f1 f2
とすると�
d
dt
x1 (t)
x2 (t)
0 1
x1 (t)
1 1
x2 (t)
=
0 1
1 1
x1 (t)
x2 (t)
=
0
1 + f1
=
1
1 + f2
= (A + BF )x(t)
+
+
x(t)
0
1
0
f1
f1
0
f2
f2
x1 (t)
x2 (t)
x1 (t)
x2 (t)
x1 (t)
x2 (t)
51
例題�
状態フィードバックされた閉ループシステムの
特性多項式は
det (sI
(A + BF )) = det
= det
= s2
s
0
0
1
0
s
1 + f1
1 + f2
s
(1 + f1 )
(1 + f2 )s
s
1
(1 + f2 )
(1 + f1 )
= (s + 1)(s + 2)
= s2 + 3s + 2
52
例題�
係数を比較して
(1 + f2 ) = 3
(1 + f1 ) = 2
f1 =
3
f2 =
4
53
極配置問題�
1入力で可制御なシステムであれば、状態
フィードバックにより望ましい極に一致させ、
安定化することが可能
–  導出は省略�
54
最適制御�
•  1入力で可制御なシステムについては、望ましい
システムの極が与えられれば状態フィードバック行
列Fを求めることができる
•  多入力であるシステムの場合、状態フィードバッ
ク行列が一意に決まらない(不良設定問題)
55
例�
以下の状態方程式で表される2入力システム
d
0
x1 (t)
0 1
dt x2 (t)
状態フィードバックが
x2 (t)
x1 (t)
u1 (t)
=
u2 (t) det (sI
1
=
2
0
0
3
(A + BF )) = det
= det
x1 (t)
x2 (t)
+
0
1 0
0
s
0 1
= s2 + 3s + 2
0
u1 (t)
0
1
u2 (t)
であるとき�
s
s+1
0
1
+
2
0
0
3
0
s+2
56
例�
状態フィードバックが
u1 (t)
=
u2 (t) det (sI
3
0
0
2
(A + BF )) = det
= det
x1 (t)
x2 (t)
であるとき�
s
0
1 0
0
s
0 1
s+2
0
+
3
0
0
2
0
s+1
= s2 + 3s + 2
57
例�
状態フィードバックが
u1 (t)
=
u2 (t) 1
2
1
4
x1 (t)
x2 (t)
であるとき
s 0
1 0
1 1
det (sI (A + BF )) = det
+
0 s
0 1
2
4
s
1
= det
2 s+3
= s2 + 3s + 2
状態フィードバックが異なるが、全て同じ特性
方程式になる�
58
最適制御�
•  解を一意にするため、与えられた制御目標に加
えて、ある評価関数を最小にする制御入力を求める
•  通常は制御入力に関する評価関数を加える
1
J=
2
x(t)T Qx(t) + u(t)T Ru(t) dt
0
Q, Rは適当な次元の定数行列、
Qは半正定な対称行列、Rは正定な対称行列�
•  特に、制御量を一定に保つ定値制御が目的であ
る場合を最適レギュレータ問題�
59
最適レギュレータ問題の解�
リカッチ(Riccati)方程式
AT P + P A P BR 1 B T P + Q = 0
この式を満たすn×nの対称行列Pが存在し、さらに
F = R 1 B T P とおくと
u(t) = F x(t) を用いた閉ループ系
ẋ(t) = (A + BF )x(t) が安定になるならば、
この制御ゲイン F を使った閉ループ制御系が
評価関数を最小にする
Pは数値的に解く�
60
拡大系によるサーボ系の構成�
•  サーボ系:出力y(t)をある目標値r(t)に追
従させる閉ループ系
–  目標値r(t)が一定rとする
•  定常偏差を0にするためには、開ループ
伝達関数に積分要素が含まれればよい
•  積分要素を状態変数で表現されたシス
テムに導入する�
61
拡大系によるサーボ系の
状態方程式�
以下のシステムを考える
d
x(t) = Ax(t) + Bu(t)
dt
y(t) = Cx(t)
y(t)∈Rmであり、入力と出力の次数が等し
いとする
積分要素を次のようにする�
d
(t) = r(t)
dt
y(t) = r(t)
Cx(t)
62
拡大系によるサーボ系の
状態方程式�
この積分要素と状態変数x(t)を合わせて
拡大系を作る
x(t)
x̃(t) =
(t)
新しい状態方程式
x(t)
A 0
d
d
=
dt x̃(t) = dt
(t)
C 0
= Ãx̃(t) + B̃1 u(t) + B̃2 r
x(t)
(t)
+
B
0
u(t) +
0
I
r
63
拡大系によるサーボ系の
状態方程式�
この拡大系が可制御かつ
A B
rank
=n+m
C 0
となるとき、状態フィードバックにより安定化
できる
64
例題�
以下のシステムに対してサーボ系を構成
したときに、安定化可能か確認せよ�
d
dt
x1 (t)
x2 (t)
1
=
0
1
x1 (t)
2
x2 (t)
+
1
1
u(t)
= Ax(t) + Bu(t)
y(t) =
1
1
x1 (t)
x2 (t)
= Cx(t)
制御工学例題10-10
65
例題�
•  目標値r(t)が一定値rであるとする
•  次のη(t)を導入して拡大系を構成�
d
(t) = r
dt
=r
y(t) = r
1
1
Cx(t)
x(t)
66
例題�
d
dt
x1 (t)
x2 (t)
(t)
1
=
1
1
0
0
x1 (t)
2 0
1 0
x2 (t)
(t)
1
+
1
0
0
u(t) +
0
1
r
= Ãx̃(t) + B̃1 u(t) + B̃2 r
y(t) =
1 1 0
x1 (t)
x2 (t)
(t)
= C̃ x̃(t)
67
例題�
元のシステムの可制御性を調べる
1
1
rank B AB = rank
=2
1
3
なので可制御。もう一つの条件は
1 0 1
A B
rank
= rank
1
2 1 = 3(= 2 + 1)
C 0
1
1 0
この拡大系は状態フィードバックにより
安定化可能である
68
例題�
拡大系の可制御性を調べる
1
1 1
2
3 7
V
=
B̃
Ã
B̃
Ã
B̃1 = 1
1
1
0
2 4
rank V = 3となるので拡大系は可制御
よって状態フィードバックにより安定化可能
である 69
拡大系における
状態フィードバック�
拡大系を安定化させる状態フィードバック
は極配置や最適制御で求めることができる
システムを安定化する状態フィードバックが
x(t)
u(t) = F K
= F̃ x̃(t)
(t)
で与えられるとする�
70
拡大系における
状態フィードバック�
d
dt
x(t)
(t)
=
=
=
y(t) =
A
0
x(t)
C
0
(t)
A
C
0
0
x(t)
(t)
A + BF
C
C
0
BK
0
+
+
x(t)
(t)
B
F
0
BF
0
+
K
BK
0
0
I
x(t)
+
(t)
x(t)
(t)
0
+
I
0
I
r
r
r
x(t)
(t)
71
拡大系のフィードバック系�
r� +�
-�
η(t)�
+�
K�
+�
u(t)�
x(t)�
C�
B�
+�
y(t)�
+�
A�
F�
•  状態フィードバックにより安定化
–  t→∞でx(t)とη(t)はある値x∞及びη∞に収束
d (t)
lim
=0
t
dt
–  出力y(t)もy∞=Cx∞に収束
72
拡大系のフィードバック系�
状態フィードバックにより安定化
•  t→∞でx(t)とη(t)はある値x∞及びη∞に収束
d (t)
lim
=0
t
dt
•  出力y(t)もy∞=Cx∞に収束
d (t)
lim
=r
t
dt
y
=0
•  従ってy∞=rなので、出力y(t)は目標値rに�
追従する
73
例題�
以下のシステムに対してサーボ系を構成し、
最適制御による状態フィードバックを設計し
て出力が目標値に追従することを確認せよ�
d
dt
x1 (t)
x2 (t)
1
=
0
1
x1 (t)
2
x2 (t)
+
1
1
u(t)
= Ax(t) + Bu(t)
y(t) =
1
1
x1 (t)
x2 (t)
= Cx(t)
制御工学例題10-11
74
例題�
•  先の例題の通り、積分要素を導入して
拡大系を構成した結果�
d
dt
x1 (t)
x2 (t)
(t)
1
=
1
1
0
0
x1 (t)
2 0
1 0
x2 (t)
(t)
1
+
1
0
0
u(t) +
0
1
r
= Ãx̃(t) + B̃1 u(t) + B̃2 r
y(t) =
1 1 0
x1 (t)
x2 (t)
(t)
= C̃ x̃(t)
75
例題�
•  このシステムに対して最適制御則を設定
–  Qを単位行列、�R=[1]とする
1
J=
x(t)T x(t) + u(t)2 dt
2 0
–  フィードバック行列は以下のようになる�
F̃ =
0.686
0.527
1.00
76
目標値r=5の制御結果�
η�
x1�
x2�
状態変数x1, x2, η�
出力y(t)
入力u(t)�
誤差e(t)
77
出力フィードバック�
•  状態変数は直接計測できず、出力から
推定することが多い
–  オブザーバー(状態観測器)を導入して、
推定された状態を用いたフィードバック制御
��可観測であること
78
同一次元オブザーバ�
初期状態x(0) = x0としたシステムを考える
d
x(t) = Ax(t) + Bu(t)
dt
y(t) = Cx(t)
x̂(t) を状態とした次のようなシステムを考える
d
x̂(t) = Ax̂(t) + Bu(t) + K (y(t)
dt
C x̂(t)) ,
x̂(0) = x̂0
2つのシステムの状態の差を取る
e(t) = x(t)
x̂(t)
79
同一次元オブザーバ�
d
d
d
e(t) = x(t)
x̂(t)
dt
dt
dt
= (Ax(t) + Bu(t))
= A (x(t)
= (A
行列 (A
x̂(t)
x̂(t))
KC) e(t)
(Ax̂(t) + Bu(t) + K (Cx(t)
KC (x(t)
C x̂(t)))
x̂(t))
e(0) = x(0)
x̂(0) = x0
x̂0
KC) が安定になるように K を選べば
x(t) となり x̂(t) は x(t) の推定値となる
同一次元状態観測器(オブザーバ)�
80
例題�
以下のシステムについて考える
x1 (t)
0
1
x1 (t)
1
d
=
+
u(t)
dt
x2 (t)
1 1
x2 (t)
1
= Ax(t) + Bu(t)
x1 (t)
y(t) = 0 1
= Cx(t)
x2 (t)
に対して、同一次元オブザーバを構成する�
制御工学例題10-12
81
例題�
d
dt
x̂1 (t)
x̂2 (t)
= Ax̂(t) + Bu(t) + K (y(t)
=
0
1
1
1
x̂1 (t)
x̂2 (t)
+
C x̂(t))
1
1
u(t) + K
y(t)
0 1
x̂1 (t)
x̂2 (t)
このとき、状態と推定値との誤差システム
の極が-1, -2となるオブザーバゲインKを
求めよ�
82
例題�
状態の推定誤差を e(t) =x(t)
de(t)
=
dt
0
1
1
=
= (A
1
0
1
1
1
x1 (t)
x̂1 (t)
x2 (t)
x̂2 (t)
K
0 1
x̂(t) とすると
K
0 1
x1 (t)
x̂1 (t)
x2 (t)
x̂2 (t)
e(t)
KC) e(t)
K=[k1 k2]Tとすると�
A
KC =
=
0
1
1
1
0
1
1 k1
1 k2
k1
k2
0 1
83
例題�
A−KCの固有値を求める
det (sI
(A
KC)) = det
s
= s2 + (k2
�
1
k1 + 1
s
(1
k2 )
1)s + k1 + 1
この極が-1と-2なので
s2 + (k2
1)s + (k1 + 1) = (s + 1)(s + 2)
= s2 + 3s + 2
よってk1=1, k2=4となるので�
K=
1
4
84
オブザーバによる
フィードバック系の安定性�
d
x(t) = Ax(t) + Bu(t)
dt
y(t) = Cx(t)
を安定化する状態フィードバックがu(t)=Fx(t)で
与えられているとする
dx̂(t) = Ax̂(t) + Bu(t) + K (y(t) C x̂(t))
dt
状態 x(t) を推定値 x̂(t) で置き換えた状態
フィードバック
u(t) = F x̂(t)
を用いた時の安定性を考える
85
オブザーバによるフィードバック系�
出力から推定された状態をフィードバックする
u(t)
x(t)
y(t)
+�
C�
B�
+�
A�
x̂(t)
F�
オブザーバ�
A+BFとA-KCが安定となるようにF,Kが選ばれ
ているとする。
86
オブザーバによる
フィードバック系の安定性�
システムとオブザーバを合わせた拡大系は
d�
dt
x(t)
�
x̂(t)
d
dt
x(t)
=
A
KC
0
A
KC
x(t)
x̂(t)
+
B
B
u(t)
u(t) = F x̂(t) を代入
x̂(t)
=
=
A
KC
A
KC
0
x(t)
A
KC
x̂(t)
A
BF
KC + BF
+
BF
BF
x̂(t)
x(t)
x̂(t)
87
オブザーバによる
フィードバック系の安定性�
次のような座標変換を考える
x(t)
x̂(t)
I
=
0
I
x(t)
I
x(t)
x̂(t)
x(t)
=T
e(t)
座標変換を行うと�
�
d
dt
x(t)
e(t)
=T
1
A
KC
=
I
I
0
I
=
A + BF
0
BF
A
KC + BF
A
KC
A
BF
A KC
T
BF
KC + BF
x(t)
e(t)
I
I
0
I
x(t)
e(t)
x(t)
e(t)
88
オブザーバによる
フィードバック系の安定性�
このシステムの安定性を調べるために特
性方程式を求める
det sI
= det
sI
A + BF
0
BF
A
(A + BF )
0
sI
KC
BF
(A KC)
89
オブザーバによる
フィードバック系の安定性�
det
sI
= det (sI
(A + BF )
0
BF
sI
(A + BF )) det (sI
フィードバック系の極�
(A
(A
KC)
KC))
同一次元オブザーバの極�
A+BFとA-KCが安定となるようにF,Kが
選ばれていると仮定しているので、システ
ムは安定である
状態x(t)も推定誤差e(t)も0に収束
90
外乱オブザーバ�
システムに未知の外乱がある場合には、オ
ブザーバによる状態の推定がうまく行かな
い場合がある
外乱まで推定するオブザーバを構成する
����������⇒外乱オブザーバ
91
外乱オブザーバ�
外乱δを一定値とする。システムは
d
x(t) = Ax(t) + Bu(t) + E
dt
y(t) = Cx(t)
これまでの方法でオブザーバを構成�
dx̂(t)
= Ax̂(t) + Bu(t) + K (y(t)
dt
C x̂(t))
92
外乱オブザーバ�
推定誤差e(t)は
de(t)
dx(t) dx̂(t)
=
dt
dt
dt
= (A KC) e(t) + E
となるのでδの影響でe(t)は0に収束しない
回避するために、外乱まで推定する�
93
外乱オブザーバ�
δは未知であるが一定値であるので
d (t)
=0
dt
これを用いて元のシステムをx(t)とδ(t)を
状態とする拡大系で表す
d
dt
x(t)
=
y=
A
E
0
0
C
0
x(t)
+
B
0
u(t)
x(t)
94
外乱オブザーバ�
この拡大系に対するオブザーバを設計
d x̂(t)
A E
x̂(t)
B
=
+
u(t)
ˆ
ˆ
0 0
0
dt
K1
x̂(t)
+
y(t)
C 0
ˆ
K2
状態x(t)とともに外乱δも同時に誤差無く
推定できる
外乱の検出器にもなる�
外乱がゆっくり変化する場合も使える�
95