線形システム論 - Dynamical Systems and Control

4. 可制御性・可観測性
教科書 5章, 8.2
入出力付きシステム
 入出力付きシステム:
x  Ax  Bu
y  Cx  Du
x … 状態ベクトル ( n)
u … 入力ベクトル ( m)
y … 出力ベクトル ( )
A … n  n行列, B … n  m行列, C …   n行列, D …    行列
 通常、D = 0 のケース(直達項が無い場合)を考えることが多い。
D  0 でも、y’ = y - Du という仮想的な出力を考えればよい。
解の公式 (再掲)
 システム
x  Ax  Bu
y  Cx  Du
の解
 x(t) を求める公式:
t
x(t )  e x(0)   e(t - ) A Bu( )d
tA
0
 y(t) を求める公式:
t
y(t )  Ce x(0)  Du(t )  C  e(t - ) A Bu( )d
tA
0
状態の座標変換 (重要)
 状態の定義を変えることによって、入出力の関係を変えずに、別な形のシステ
ムに変換することができる。
 元のシステム
x  Ax  Bu
y  Cx  Du
 座標変換
z  Tx, x  T -1 z
(T は変換行列で正則でなくてはならない)
 新しいシステム
z  Tx  TAx  TBu  TAT -1 z  TBu
y  Cx  Du  CT -1 z  Du
z  A z  B u
y  Cz  Du
A  TAT -1 , B  TB, C  CT -1 , D  D
座標変換後も、
さまざまな性
質が保存され
る。
可制御性・可観測性の概念
 入力 u を直接操作し、システムの状態 x を狙ったように動かすことが、「制御」
 制御すべき x が出力 y から「観測」できることが前提。
○ システムの状態を入力で動かすことができるか? … 可制御性
○ システムの状態を出力から推定することが出来るか? … 可観測性
「安定性との関連」
もし、可制御でなければ、系を安定化できないかも…。
もし、可観測でなければ、出力を安定化しても系の内部状態は発散するかも。
可制御ではない/可観測ではない系とは
 可制御でない系とは….
たとえば、座標変換で次のような形になるシステム
A
x   1
0
A2   B1 
x   u

A3   0 
x1  A1 x1  A2 x2  B1u
x2  A3 x2
閉じているシステム
 可観測でない系とは….
たとえば、座標変換で次のような形になるシステム
 A 0   B1 
x   1
x   u

A
A
3
 B2 
 2
y  C1 0x  Du
x2の影響を受けない
x1  A1 x1  B1u
x2  A2 x1  A3 x2  B2u
y  C1 x1  Du
x1だけが見える
可制御性の定義
 任意の初期点 xs から、原点に有限時間内に到達可能な入力 u(t) が存在すれ
ば、システムは可制御であるという。
 原点から、任意の点 xf に有限時間内に到達する入力 u(t)が存在すれば、シス
テムは可到達であるという。
 連続時間線形系では、
(可制御性) = (可到達性)
 ただし、離散時間線形系(コースによっては3年前期授業で習うはず)では、
(可制御な系)  (可到達な系)
可観測性の定義
 ある時間 tf が存在して、0  t  tf の入出力のデータから、システムの初期値 x0
を一意に定めることが出来るとき、システムは可観測であるという。
 系の線形性より、
「入力が 0 のとき、ある時間 tf が存在して、0  t  tf の出力のデータから、シス
テムの初期値 x0 を一意に定めることが出来るとき、システムは可観測であると
いう。」
と言い換えても良い。
可制御性の条件
[定理] 以下の4つの条件は等価である。
 システム x  Ax  Bu が可制御である。
 可制御性行列がフルランクすなわち

rankGC  rank B
となること。(条件1)
 可制御性グラミアン
t

重要!
AB A2 B  An-1B  n
t
WC (t )   (e B)(e B) d   e BB e
-A
0
が正則であること。 (条件2)
 すべての複素数 l に対して、
ranklI - A B  n
となること。 (条件3)
-A
T
0
-A
T
-AT
d
条件2の十分性
Wc(t1) が正則とする。
そのとき、任意のx1に対し、入力 u(t )  -(etAB)T Wc (t1 )-1 ( x0 - e-t1 A x1 )が存在し、
t1
x(t1 )  e x0 -  e (t1 - ) A B(e -A B)T Wc (t1 ) -1 ( x0 - e -t1 A x1 )d
t1 A
0
 e x0 - e
t1 A
t1 A

t1
0
(e -A B)(e -A B)T d  Wc (t1 ) -1 ( x0 - e -t1 A x1 )
 et1 A x0 - et1 A ( x0 - e -t1 A x1 )  x1
となる。
(条件2) → 可制御性
条件2の必要性
t を固定する。Wc(t) が正則でないなら、非ゼロベクトル z が存在して、Wc(t)z = 0。
よって、
t
2
T
T -A
z Wc (t ) z   z e B d  0
0
となり、zTe-AB = 0 (0   t)。一方、可制御だと仮定すると、入力 u()が存在し、初
期状態 z から、0に移すことができる。
t
0e z e
tA
( t - ) A
0
Bu( )d
t
 z  - e-A Bu( )d
0
したがって、
t
z  z T z  - z T e-A Bu( )d  0
2
0
となるが、これは矛盾であり、可制御ならばWc は正則でなくてはならない。
可制御性 → (条件2)
条件1の十分性
条件2が成り立たないとすると、 s() = zTe-AB = 0 (0   t) 。 これは恒等式なので、
何回微分しても0。
s (0)  z T B  0
s(0)  z T AB  0
s(0)  z T A2 B  0
(dsn -1 / d )(0)  z T An -1 B  0
これをまとめると、


zT B AB A2 B  An-1B  0
よって、可制御性行列のランクはn – 1次以下である。これの対偶をとれば、条件1
が成り立つならば条件2が成り立つことがいえる。
(条件1) → (条件2)
条件1の必要性
可制御性行列がフルランクでないとすると、非ゼロのベクトル z が存在し、
zT B AB A2 B  An-1B  0
となり、ケーリー・ハミルトンの定理より、zTB = 0, zTAB = 0, zTA2B = 0,…。
行列指数関数の定義より、 zTe-tAB = 0。
すると、


t
0

( z T e-A B)(z T e-A B)T d  z TWc (t ) z  0
となり、可制御性グラミアンは非正則となる。これの対偶を取ると、条件2が成り立
つならば条件1が成り立つことがいえる。
(条件2) → (条件1)
座標変換と可制御性
元のシステム
座標変換: z = Tx
変換後のシステム
x  Ax  Bu
z  A z  B u
A  TAT -1 , B  TB
 元のシステムの可制御性の条件:
rank B AB A2 B  An-1B  n


 変換後のシステムの可制御性の条件:

rank B
AB

A 2 B  A n-1B  n
「可制御性は、座標変換に対して不変」
B
AB
 
A 2 B  A n-1B  TB TAB TA2 B  TAn -1B

T B
AB A2 B  An-1B


可観測性の条件
次の4つの条件は同値である。
 システム x  Ax, y  Cx は、可観測である。
 ランク条件
 C 
 CA 
rank GO  rank
n

 n -1 
CA 
を満たす。(条件1)
 可観測性グラミアン
t
WO (t )   eA C T CeAd
T
0
が正則。(条件2)
 全ての複素数 l に対して、
となる。(条件3)
lI - A
rank
n

C


重要!
条件2と可観測性の等価性の証明
y(t) = CetAx0 の左から (CetA)T を掛けて積分すると、

t
0
(CeA )T y( )d  WO (t ) x0
よって、 WO(t) が正則ならば、
x0  WO (t )
-1

t
0
(CeA )T y( )d
と x0 が決定できる。(十分性の証明終わり)
逆にWO(t) が非正則ならば、非零のベクトル z が存在して、 WO(t)z = 0 となる。
t
t
0
0
z TWO (t ) z   (CeA z )T (CeA z )d   CeA z d  0
2
であるから、Cet’Az = 0 (0  t’  t) 。これは、初期値が z であるときに、出力が恒等的
にゼロであることを意味しており、初期値が原点にある場合と区別できず、可観測性
が成り立たない。(必要性の証明終わり)
可観測性グラミアンが正則(条件2)
可観測性
条件1の十分性の証明
WO(t) が非正則なら、非零ベクトル z が存在し、s(t) = CetAz = 0 (t  0)。
s(0)  Cz  0, s(0)  CAz  0, s(0)  CA2 z  0,
(d n -1s / dtn-1 )(0)  CAn-1 z  0
よって、
 C 
 CA 

z  0
 n -1 
CA 
となり、可観測性行列のランクは n 未満である。この対偶を取ると、条件1の十分性
がいえる。
(条件1) →(条件2)
条件1の必要性
可観測性行列のランクが n 未満であると仮定すると、非ゼロのベクトル z が存在し
て、
zT CT (CA)T  (CAn-1 )T  0


となる。ケイリー・ハミルトンの定理より、Cz = 0, CAz = 0, CA2z = 0,…がいえる。した
がって、CeAtz = 0 (t  0)となり、これより、

t
0
t
Ce z d   z e C T CeA zd  z TWO (t ) z  0
A
2
T AT
0
となり、可観測性グラミアンは非正則となる。この対偶をとると、条件1の必要性が
いえる。
(条件2) →(条件1)
可観測性と座標変換
 可制御性と同様に、可観測性も座標変換に関して不変である。
 このことを確かめる。
システム:
可観測性行列:
 C 
 CA 
x  Ax, y  Cx


  
 n -1 
CA 
座標変換: z = Tx
変換後のシステム:
z  A z, y  C z
( A  TAT -1 , C  CT -1 )
変換後の可観測性行列:
 C   CT -1   C 

 
 CA 
-1 
C
A
CAT



T -1
   
   

 n -1   n -1 -1   n -1 
C A  CA T  CA 
ランクが一致
双対システム
 システム
 x  Ax  Bu
(S1) 
 y  Cx  Du
に双対なシステム:
 z  AT z  C T u
(S2) 
T
T
y

B
z

D
u

 (S1)が可制御
 (S1)が可観測
(S2)が可観測
(S2)が可制御
 双対システムの意味は、後で習う伝達関数を計算すれば明らかになる。
 1入力1出力系の場合、双対システムは同じ「入出力関係」を持つ。
双対システムと座標変換
元のシステム
 x  Ax  Bu
(S1) 
 y  Cx  Du
座標変換
x  Tx
 x  A x  B u
(S1)' 
 y  C x  Du
A  TAT -1 , B  TB,
C  CT -1 , D  D
双対システム
 z  AT z  C T u
(S2) 
T
T
y  B z  D u
座標変換
z  (T T ) -1 z
 z  A T z  C T u
(S2)' 
T
T
y

B
z

D
u

A  TAT -1 , B  TB,
C  CT -1 , D  D
可制御正準分解 (教科書にはない)




rank B AB  An-1B  r  n
となっているとしよう。すると、(n - r)  n 行列 P が存在し、
P B AB  An-1B  0
となる。ただし、rank P = n – r である。ケーリー・ハミルトンの定理より、
PA B AB  An-1B  0


が成り立つから、 (n - r)  (n - r) 正則行列 A3 が存在して、 PA = A3P と書ける。
ここで、z2 = Px とおくと、
z2  PAx  PBu  PAx  A3 Px  A3 z2
次の座標変換を考える。
Q 
z  Tx    x
P
ただし、rank T = n となるように Q をとる。すると、変換後のシステムは、
 A A2   B1 
z   1
z   u

0
A
3
0

の形になる。(可制御正準分解)
可制御正準分解されたシステム
 可制御正準分解されたシステム:
 A1
 z1 

A
z

B
u

 
 0
 z2 
A2  z1   B1 
    u

A3  z2   0 
 z1 … 可制御な状態変数 (一意ではない)
 z2 … 不可制御な状態変数
(z2 同士の座標変換の自由度を除いて一意に決まる)
 可制御正準分解されたシステムの可制御性行列
B
AB  A
n -1
 B1
B 
0

A1 B1
0
A12 B1  A1n -1 B1 

0

0 
上の m 行はフルランク
可観測正準分解 (教科書にはない)


rank CT (CA)T  (CAn-1 )T  r  n
とする。すると、r  n フルランク行列 P とnl  r フルランク行列 K が存在し、
T
KP  C T (CA)T  (CAn-1 )T
とできる。ただし、l は出力の次元。ケーリー・ハミルトンの定理より、 r  r 正則行
列 L が存在して、KPA = KLP となる。K はフルランクなので、PA = LP。
次に、座標変換 z = Tx (T は正則) を考える。ここで、T は
P
T    の形をしているものとする。T -1  R S  とすると、 PS = 0 となる。
Q


ただし、S は n  (n – m) 行列。座標変換後のシステムを、
 A1 G   B1 
z  
z   u, y  C1 Dz

 A2 A3   B2 
とおくと、G = PAS = LPS = 0, D = CS = K1PS = 0。ただし、K1 はK の最初の l 行を
取り出した行列。
可観測正準分解:
 A1
z  
 A2
0   B1 
z   u ,

A3   B2 
y  C1 0z
可観測正準分解されたシステム
 可観測正準分解されたシステム:
A
 z1 
   A z  B u   1
 z2 
 A2
0  z1   B1 
    u

A3  z 2   B2 
z 
y  C z  C1 0 1 
 z2 
 z1 … 可観測な状態変数
(z1 同士の座標変換の自由度を除いて一意に決まる)
 z2 … 不可観測な状態変数 (一意には決まらない)
 可観測正準分解されたシステムの可観測性行列
 C   C1

 
C
A

   C1 A1
    


n -1
n -1 
C
A
C
A
1
1



0
0


0
可制御正準形 (重要)
 1入力で可制御なシステム x  Ax  bu を考える。
 p b Ab  An-1b  0  0 1 となる、ベクトル p を考える。
もし p = 0 ならば可制御性と矛盾するので、 p は非ゼロベクトルである。
座標変換行列
 p 
 pA 
T 

変換後の

 n -1 
可制御性行列
 pA 


を考えると、
0  0 1
0
1 *
n -1
rank{T b Ab  A b }  rank
n

*
*


* *
1
であるから T は正則行列 。


可制御正準形 (続き)
z = (z1,…,zn)T = Tx とおくと、
z1  p ( Ax  bu)  pAx  z 2
ただし、i は A の特性多項式の係数で、
det(lI - A)  ln  n-1ln-1   1l  0
z2  pA( Ax  bu)  pA2 x  z3

zn -1  pAn - 2 ( Ax  bu)  pAn -1 x  z n
zn  pAn -1 ( Ax  bu)  pAn x  pAn -1bu
 p (- 0 I - 1 A -  -  n -1 An -1 ) x  pAn -1bu
ケーリー・ハミ
ルトンの定理
 - 0 z1 - 1 z 2 -  -  n -1 z n  u
可制御正準形:
 0

z  
 0
-  0
1

- 1
0   0
 

 z   u
0
1   0
 -  n -1   1 
重要!
可観測正準形 (教科書には無いが重要)
 可制御正準形の相対システムを考える。
 元のシステム (1出力・可観測なシステム):
x  Ax  Bu
y  cx
 座標変換:


-1
z  Tx  s As  An-1s x
T
T
T
n -1 T T
s は非ゼロベクトルで、 c (cA)  (cA ) s  0  0 1
 可観測正準形:
0
1
z  

0
y  0

 0 - 0 
 
 
 z  TBu
 0
 
1 -  n -1 
 0 1z

コンパニオン行列
 コンパニオン行列:
 0


 0

-  0
1


- 1
0 



0
1 

 -  n -1 
0  0 -  0 
1  




あるいは、   0
 


0
1

n -1 

 コンパニオン行列の特性多項式は、
ln  n-1ln-1   1l  0
可制御・可観測正準形の役割
 可制御(可観測)ならば、1通りに定まる。
正準形(canonical form)という言い方ではなく「標準形」ということもある。
 正準形では、特性多項式の係数が現れる。
 可制御正準形は、極配置などで使われる。
 可観測正準形は、オブザーバ設計などで使われる。
 その他、正準形が使われる局面は多い。
しかし、…
 正準形を計算機で扱うとき、数値誤差がたまりやすいことが多々ある。
理論は正準形で考えたほうが都合が良くても、実際の計算は正準形を経由しな
いほうが良い場合が多い。