3. 可制御性・可観測性入出力付きシステム  入出力付きシステム: x  Ax  Bu y  Cx  Du x … 状態ベクトル ( n) u … 入力ベクトル ( m) y … 出力ベクトル ( ) A … n  n行列, B … n  m行列, C …   n行列, D …    行列  通常、D = 0 のケース(直達項が無い場合)を考えることが多い。 D  0 でも、y’ = y - Du という仮想的な出力を考えればよい。解の公式  システム x  Ax  Bu y  Cx  Du の解  x(t) を求める公式: t x(t )  e x(0)   e(t - ) A Bu( )d tA 0  y(t) を求める公式: t y(t )  Ce x(0)  Du(t )  C  e(t - ) A Bu( )d tA 0 状態の座標変換  状態の定義を変えることによって、入出力の関係を変えずに、別な形のシステムに変換することができる。  元のシステム x  Ax  Bu y  Cx  Du  座標変換 z  Tx, x  T -1 z (T は変換行列で正則でなくてはならない)  新しいシステム z  Tx  TAx  TBu  TAT -1 z  TBu y  Cx  Du  CT -1 z  Du z  A z  B u y  Cz  Du A  TAT -1 , B  TB, C  CT -1 , D  D 座標変換後も、さまざまな性質が保存される。可制御性・可観測性の概念  入力 u を直接操作し、システムの状態 x を狙ったように動かすことが、「制御」  制御すべき x が出力 y から「観測」できることが前提。 ○ システムの状態を入力で動かすことができるか? … 可制御性 ○ システムの状態を出力から推定することが出来るか? … 可観測性「安定性との関連」もし、可制御でなければ、系を安定化できないかも…。もし、可観測でなければ、出力を安定化しても系の内部状態は発散するかも。可制御ではない/可観測ではない系とは  可制御でない系とは…. たとえば、座標変換で次のような形になるシステム A x   1 0 A2   B1  x   u  A3   0  x1  A1 x1  A2 x2  B1u x2  A3 x2 閉じているシステム  可観測でない系とは…. たとえば、座標変換で次のような形になるシステム  A 0   B1  x   1 x   u  A A 3  B2   2 y  C1 0x  Du x2の影響を受けない x1  A1 x1  B1u x2  A2 x1  A3 x2  B2u y  C1 x1 x1だけが見える可制御性の定義  任意の初期点 xs から、原点に有限時間内に到達可能な入力 u(t) が存在すれば、システムは可制御であるという。  原点から、任意の点 xf に有限時間内に到達する入力 u(t)が存在すれば、システムは可到達であるという。  連続時間線形系では、 (可制御性) = (可到達性)  ただし、離散時間線形系(3年前期授業で習うはず)では、 (可制御な系)  (可到達な系) 可観測性の定義  ある時間 tf が存在して、0  t  tf の入出力のデータから、システムの初期値 x0 を一意に定めることが出来るとき、システムは可観測であるという。  系の線形性より、「入力が 0 のとき、ある時間 tf が存在して、0  t  tf の出力のデータから、システムの初期値 x0 を一意に定めることが出来るとき、システムは可観測であるという。」と言い換えても良い。可制御性の条件 [定理] 以下の4つの条件は等価である。  システム x  Ax  Buが可制御である。  可制御性行列がフルランクすなわち  rankGC  rank B となること。(条件1)  可制御性グラミアン t  AB A2 B  An-1B  n t WC (t )   (e B)(e B) d   e BB e -A 0 が正則であること。 (条件2)  すべての複素数 l に対して、 ranklI - A B  n となること。 (条件3) -A T 0 -A T -AT d 条件2の十分性 Wc(t1) が正則とする。そのとき、入力 u(t )  -(etAB)T Wc (t1 )-1 ( x0 - e-t1 A x1 ) が存在し、 t1 x(t1 )  e x0 -  e (t1 - ) A B(e -A B)T Wc (t1 ) -1 ( x0 - e -t1 A x1 )d t1 A 0  e x0 - e t1 A t1 A  t1 0 (e -A B)(e -A B)T d  Wc (t1 ) -1 ( x0 - e -t1 A x1 )  et1 A x0 - et1 A ( x0 - e -t1 A x1 )  x1 となる。 (条件2) → 可制御性条件2の必要性 Wc が正則でないならば、非ゼロベクトル z が存在して、Wc(t)z = 0 (t  0)。よって、 t 2 T T -A z Wc (t ) z   z e B d  0 0 となり、zTe-tAB = 0 (t  0)。一方、可制御だと仮定すると、入力 u(t)が存在し、初期状態 z から、0に移すことができる。 t 0e z e tA ( t - ) A 0 Bu( )d t  z  - e-A Bu( )d 0 したがって、 t z  z T z  - z T e-A Bu( )d  0 2 0 となるが、これは矛盾であり、可制御ならばWc は正則でなくてはならない。可制御性 → (条件2) 条件1の十分性条件2が成り立たないとすると、 s(t) = zTe-tAB = 0 (t  0)。これは恒等式なので、何回微分しても0。 s (0)  z T B  0 s(0)  z T AB  0 s(0)  z T A2 B  0 (dsn -1 / dt)(0)  z T An -1 B  0 これをまとめると、   zT B AB A2 B  An-1B  0 よって、可制御性行列のランクはn – 1次以下である。これの対偶をとれば、条件1 が成り立つならば条件2が成り立つことがいえる。 (条件1) → (条件2) 条件１の必要性可制御性行列がフルランクでないとすると、非ゼロのベクトル z が存在し、 zT B AB A2 B  An-1B  0 となり、ケーリー・ハミルトンの定理より、zTB = 0, zTAB = 0, zTA2B = 0,…。行列指数関数の定義より、 zTe-tAB = 0。すると、   t 0  ( z T e-A B)(z T e-A B)T d  z TWc (t ) z  0 となり、可制御性グラミアンは非正則となる。これの対偶を取ると、条件2が成り立つならば条件1が成り立つことがいえる。 (条件2) → (条件1) 座標変換と可制御性元のシステム座標変換: z = Tx 変換後のシステム x  Ax  Bu z  A z  B u A  TAT -1 , B  TB  元のシステムの可制御性の条件: rank B AB A2 B  An-1B  n    変換後のシステムの可制御性の条件:  rank B AB  A 2 B  A n-1B  n 「可制御性は、座標変換に対して不変」 B AB   A 2 B  A n-1B  TB TAB TA2 B  TAn -1B  T B AB A2 B  An-1B   可観測性の条件次の4つの条件は同値である。  システム x  Ax, y  Cx は、可観測である。  ランク条件  C   CA  rank GO  rank n   n -1  CA  を満たす。(条件1)  可観測性グラミアン t WO (t )   eA C T CeAd T 0 が正則。（条件2)  全ての複素数 l に対して、となる。(条件3) lI - A rank n  C   条件2と可観測性の等価性の証明 y(t) = CetAx0 の左から (CetA)T を掛けて積分すると、  t 0 (CeA )T y( )d  WO (t ) x0 よって、 WO(t) が正則ならば、 x0  WO (t ) -1  t 0 (CeA )T y( )d と x0 が決定できる。(十分性の証明終わり) 逆にWO(t) が非正則ならば、非零のベクトル z が存在して、 WO(t)z = 0 となる。 t t 0 0 z TWO (t ) z   (CeA z )T (CeA z )d   CeA z d  0 2 であるから、CetAz = 0 (t  0) 。これは、初期値が z であるときに、出力が恒等的にゼロであることを意味しており、初期値が原点にある場合と区別できず、可観測性が成り立たない。(必要性の証明終わり) 可観測性グラミアンが正則(条件2) 可観測性条件1の十分性の証明 WO(t) が非正則なら、非零ベクトル z が存在し、s(t) = CetAz = 0 (t  0)。 s(0)  Cz  0, s(0)  CAz  0, s(0)  CA2 z  0, (d n -1s / dtn-1 )(0)  CAn-1 z  0 よって、  C   CA   z  0  n -1  CA  となり、可観測性行列のランクは n 未満である。この対偶を取ると、条件1の十分性がいえる。 (条件1) →(条件2) 条件1の必要性可観測性行列のランクが n 未満であると仮定すると、非ゼロのベクトル z が存在して、 zT CT (CA)T  (CAn-1 )T  0   となる。ケイリー・ハミルトンの定理より、Cz = 0, CAz = 0, CA2z = 0,…がいえる。したがって、CeAtz = 0 (t  0)となり、これより、  t 0 t Ce z d   z e C T CeA zd  z TWO (t ) z  0 A 2 T AT 0 となり、可観測性グラミアンは非正則となる。この対偶をとると、条件1の必要性がいえる。 (条件2) →(条件1) 可観測性と座標変換  可制御性と同様に、可観測性も座標変換に関して不変である。  このことを確かめる。システム: 可観測性行列:  C   CA  x  Ax, y  Cx       n -1  CA  座標変換: z = Tx 変換後のシステム: z  A z, y  C z ( A  TAT -1 , C  CT -1 ) 変換後の可観測性行列：  C   CT -1   C      CA  -1  C A CAT    T -1           n -1   n -1 -1   n -1  C A  CA T  CA  ランクが一致双対システム  システム  x  Ax  Bu (S1)   y  Cx  Du に双対なシステム:  z  AT z  C T u (S2)  T T y  B z  D u   (S1)が可制御  (S1)が可観測 (S2)が可観測 (S2)が可制御  双対システムの意味は、後で習う伝達関数を計算すれば明らかになる。  1入力1出力系の場合、双対システムは同じ「入出力関係」を持つ。双対システムと座標変換元のシステム  x  Ax  Bu (S1)   y  Cx  Du 座標変換 x  Tx  x  A x  B u (S1)'   y  C x  Du A  TAT -1 , B  TB, C  CT -1 , D  D 双対システム  z  AT z  C T u (S2)  T T y  B z  D u 座標変換 z  (T T ) -1 z  z  A T z  C T u (S2)'  T T y  B z  D u  A  TAT -1 , B  TB, C  CT -1 , D  D 可制御正準分解     rank B AB  An-1B  r  n となっているとしよう。すると、(n - r)  n 行列 P が存在し、 P B AB  An-1B  0 となる。ただし、rank P = n – r である。ケーリー・ハミルトンの定理より、 PA B AB  An-1B  0   が成り立つから、 (n - r)  (n - r) 正則行列 A3 が存在して、 PA = A3P と書ける。ここで、z2 = Px とおくと、 z2  PAx  PBu  PAx  A3 Px  A3 z2 次の座標変換を考える。 Q  z  Tx    x P ただし、rank T = n となるように Q をとる。すると、変換後のシステムは、  A A2   B1  z   1 z   u  0 A 3 0  の形になる。(可制御正準分解) 可制御正準分解されたシステム  可制御正準分解されたシステム:  A1  z1   A z  B u     0  z2  A2  z1   B1      u  A3  z2   0   z1 … 可制御な状態変数 (一意ではない)  z2 … 不可制御な状態変数 (z2 同士の座標変換の自由度を除いて一意に決まる)  可制御正準分解されたシステムの可制御性行列 B AB  A n -1  B1 B  0  A1 B1 0 A12 B1  A1n -1 B1   0  0  上の m 行はフルランク可観測正準分解   rank CT (CA)T  (CAn-1 )T  r  n とする。すると、r  n フルランク行列 P とnl  r フルランク行列 K が存在し、 T KP  C T (CA)T  (CAn-1 )T とできる。ただし、l は出力の次元。ケーリー・ハミルトンの定理より、 r  r 正則行列 L が存在して、KPA = KLP となる。K はフルランクなので、PA = LP。次に、座標変換 z = Tx (T は正則) を考える。ここで、T は P T    の形をしているものとする。T -1  R S  とすると、 PS = 0 となる。 Q   ただし、S は n  (n – m) 行列。座標変換後のシステムを、  A1 G   B1  z   z   u, y  C1 Dz   A2 A3   B2  とおくと、G = PAS = LPS = 0, D = CS = K1PS = 0。ただし、K1 はK の最初の l 行を取り出した行列。可観測正準分解:  A1 z    A2 0   B1  z   u ,  A3   B2  y  C1 0z 可観測正準分解されたシステム  可観測正準分解されたシステム: A  z1     A z  B u   1  z2   A2 0  z1   B1      u  A3  z 2   B2  z  y  C z  C1 0 1   z2   z1 … 可観測な状態変数 (z1 同士の座標変換の自由度を除いて一意に決まる)  z2 … 不可観測な状態変数 (一意には決まらない)  可観測正準分解されたシステムの可観測性行列  C   C1    C A     C1 A1        n -1 n -1  C A C A 1 1    0 0   0 可制御正準形  1入力で可制御なシステム x  Ax  bu を考える。  p b Ab  An-1b  0  0 1 となる、ベクトル p を考える。もし p = 0 ならば可制御性と矛盾するので、 p は非ゼロベクトルである。座標変換行列  p   pA  T   変換後の   n -1  可制御性行列  pA    を考えると、 0  0 1 0 1 * n -1 rank{T b Ab  A b }  rank n  * *   * * 1 であるから T は正則行列。   可制御正準形 (続き) z = (z1,…,zn)T = Tx とおくと、 z1  p ( Ax  bu)  pAx  z 2 ただし、i は A の特性多項式の係数で、 det(lI - A)  ln  n-1ln-1   1l  0 z2  pA( Ax  bu)  pA2 x  z3  zn -1  pAn - 2 ( Ax  bu)  pAn -1 x  z n zn  pAn -1 ( Ax  bu)  pAn x  pAn -1bu  p (- 0 I - 1 A -  -  n -1 An -1 ) x  pAn -1bu  - 0 z1 - 1 z 2 -  -  n -1 z n  u 可制御正準形:  0  z    0 -  0 1  - 1 0   0     z   u 0 1   0  -  n -1   1  ケーリー・ハミルトンの定理可観測正準形  可制御正準形の相対システムを考える。  元のシステム (1出力・可観測なシステム): x  Ax  Bu y  cx  座標変換:   -1 z  Tx  s As  An-1s x T T T n -1 T T s は非ゼロベクトルで、 c (cA)  (cA ) s  0  0 1  可観測正準形: 0 1 z    0 y  0   0 - 0       z  TBu  0   1 -  n -1   0 1z  コンパニオン行列  コンパニオン形式:  0    0  -  0 1   - 1 0     0 1    -  n -1  0  0 -  0  1       あるいは、   0     0 1  n -1    コンパニオン行列の特性多項式は、 ln  n-1ln-1   1l  0 可制御・可観測正準形の役割  可制御(可観測)ならば、1通りに定まる。正準形(canonical form)という言い方ではなく「標準形」ということもある。  正準形では、特性多項式の係数が現れる。  可制御正準形は、極配置などで使われる。  可観測正準形は、オブザーバ設計などで使われる。  その他、正準形が使われる局面は多い。しかし、…  正準形を計算機で扱うとき、数値誤差がたまりやすいことが多々ある。理論は正準形で考えたほうが都合が良くても、実際の計算は正準形を経由しないほうが良い場合が多い。