4. 可制御性・可観測性 教科書 5章, 8.2 入出力付きシステム 入出力付きシステム: x Ax Bu y Cx Du x … 状態ベクトル ( n) u … 入力ベクトル ( m) y … 出力ベクトル ( ) A … n n行列, B … n m行列, C … n行列, D … 行列 通常、D = 0 のケース(直達項が無い場合)を考えることが多い。 D 0 でも、y’ = y - Du という仮想的な出力を考えればよい。 解の公式 (再掲) システム x Ax Bu y Cx Du の解 x(t) を求める公式: t x(t ) e x(0) e(t - ) A Bu( )d tA 0 y(t) を求める公式: t y(t ) Ce x(0) Du(t ) C e(t - ) A Bu( )d tA 0 状態の座標変換 (重要) 状態の定義を変えることによって、入出力の関係を変えずに、別な形のシステ ムに変換することができる。 元のシステム x Ax Bu y Cx Du 座標変換 z Tx, x T -1 z (T は変換行列で正則でなくてはならない) 新しいシステム z Tx TAx TBu TAT -1 z TBu y Cx Du CT -1 z Du z A z B u y Cz Du A TAT -1 , B TB, C CT -1 , D D 座標変換後も、 さまざまな性 質が保存され る。 可制御性・可観測性の概念 入力 u を直接操作し、システムの状態 x を狙ったように動かすことが、「制御」 制御すべき x が出力 y から「観測」できることが前提。 ○ システムの状態を入力で動かすことができるか? … 可制御性 ○ システムの状態を出力から推定することが出来るか? … 可観測性 「安定性との関連」 もし、可制御でなければ、系を安定化できないかも…。 もし、可観測でなければ、出力を安定化しても系の内部状態は発散するかも。 可制御ではない/可観測ではない系とは 可制御でない系とは…. たとえば、座標変換で次のような形になるシステム A x 1 0 A2 B1 x u A3 0 x1 A1 x1 A2 x2 B1u x2 A3 x2 閉じているシステム 可観測でない系とは…. たとえば、座標変換で次のような形になるシステム A 0 B1 x 1 x u A A 3 B2 2 y C1 0x Du x2の影響を受けない x1 A1 x1 B1u x2 A2 x1 A3 x2 B2u y C1 x1 Du x1だけが見える 可制御性の定義 任意の初期点 xs から、原点に有限時間内に到達可能な入力 u(t) が存在すれ ば、システムは可制御であるという。 原点から、任意の点 xf に有限時間内に到達する入力 u(t)が存在すれば、シス テムは可到達であるという。 連続時間線形系では、 (可制御性) = (可到達性) ただし、離散時間線形系(コースによっては3年前期授業で習うはず)では、 (可制御な系) (可到達な系) 可観測性の定義 ある時間 tf が存在して、0 t tf の入出力のデータから、システムの初期値 x0 を一意に定めることが出来るとき、システムは可観測であるという。 系の線形性より、 「入力が 0 のとき、ある時間 tf が存在して、0 t tf の出力のデータから、シス テムの初期値 x0 を一意に定めることが出来るとき、システムは可観測であると いう。」 と言い換えても良い。 可制御性の条件 [定理] 以下の4つの条件は等価である。 システム x Ax Bu が可制御である。 可制御性行列がフルランクすなわち rankGC rank B となること。(条件1) 可制御性グラミアン t 重要! AB A2 B An-1B n t WC (t ) (e B)(e B) d e BB e -A 0 が正則であること。 (条件2) すべての複素数 l に対して、 ranklI - A B n となること。 (条件3) -A T 0 -A T -AT d 条件2の十分性 Wc(t1) が正則とする。 そのとき、任意のx1に対し、入力 u(t ) -(etAB)T Wc (t1 )-1 ( x0 - e-t1 A x1 )が存在し、 t1 x(t1 ) e x0 - e (t1 - ) A B(e -A B)T Wc (t1 ) -1 ( x0 - e -t1 A x1 )d t1 A 0 e x0 - e t1 A t1 A t1 0 (e -A B)(e -A B)T d Wc (t1 ) -1 ( x0 - e -t1 A x1 ) et1 A x0 - et1 A ( x0 - e -t1 A x1 ) x1 となる。 (条件2) → 可制御性 条件2の必要性 t を固定する。Wc(t) が正則でないなら、非ゼロベクトル z が存在して、Wc(t)z = 0。 よって、 t 2 T T -A z Wc (t ) z z e B d 0 0 となり、zTe-AB = 0 (0 t)。一方、可制御だと仮定すると、入力 u()が存在し、初 期状態 z から、0に移すことができる。 t 0e z e tA ( t - ) A 0 Bu( )d t z - e-A Bu( )d 0 したがって、 t z z T z - z T e-A Bu( )d 0 2 0 となるが、これは矛盾であり、可制御ならばWc は正則でなくてはならない。 可制御性 → (条件2) 条件1の十分性 条件2が成り立たないとすると、 s() = zTe-AB = 0 (0 t) 。 これは恒等式なので、 何回微分しても0。 s (0) z T B 0 s(0) z T AB 0 s(0) z T A2 B 0 (dsn -1 / d )(0) z T An -1 B 0 これをまとめると、 zT B AB A2 B An-1B 0 よって、可制御性行列のランクはn – 1次以下である。これの対偶をとれば、条件1 が成り立つならば条件2が成り立つことがいえる。 (条件1) → (条件2) 条件1の必要性 可制御性行列がフルランクでないとすると、非ゼロのベクトル z が存在し、 zT B AB A2 B An-1B 0 となり、ケーリー・ハミルトンの定理より、zTB = 0, zTAB = 0, zTA2B = 0,…。 行列指数関数の定義より、 zTe-tAB = 0。 すると、 t 0 ( z T e-A B)(z T e-A B)T d z TWc (t ) z 0 となり、可制御性グラミアンは非正則となる。これの対偶を取ると、条件2が成り立 つならば条件1が成り立つことがいえる。 (条件2) → (条件1) 座標変換と可制御性 元のシステム 座標変換: z = Tx 変換後のシステム x Ax Bu z A z B u A TAT -1 , B TB 元のシステムの可制御性の条件: rank B AB A2 B An-1B n 変換後のシステムの可制御性の条件: rank B AB A 2 B A n-1B n 「可制御性は、座標変換に対して不変」 B AB A 2 B A n-1B TB TAB TA2 B TAn -1B T B AB A2 B An-1B 可観測性の条件 次の4つの条件は同値である。 システム x Ax, y Cx は、可観測である。 ランク条件 C CA rank GO rank n n -1 CA を満たす。(条件1) 可観測性グラミアン t WO (t ) eA C T CeAd T 0 が正則。(条件2) 全ての複素数 l に対して、 となる。(条件3) lI - A rank n C 重要! 条件2と可観測性の等価性の証明 y(t) = CetAx0 の左から (CetA)T を掛けて積分すると、 t 0 (CeA )T y( )d WO (t ) x0 よって、 WO(t) が正則ならば、 x0 WO (t ) -1 t 0 (CeA )T y( )d と x0 が決定できる。(十分性の証明終わり) 逆にWO(t) が非正則ならば、非零のベクトル z が存在して、 WO(t)z = 0 となる。 t t 0 0 z TWO (t ) z (CeA z )T (CeA z )d CeA z d 0 2 であるから、Cet’Az = 0 (0 t’ t) 。これは、初期値が z であるときに、出力が恒等的 にゼロであることを意味しており、初期値が原点にある場合と区別できず、可観測性 が成り立たない。(必要性の証明終わり) 可観測性グラミアンが正則(条件2) 可観測性 条件1の十分性の証明 WO(t) が非正則なら、非零ベクトル z が存在し、s(t) = CetAz = 0 (t 0)。 s(0) Cz 0, s(0) CAz 0, s(0) CA2 z 0, (d n -1s / dtn-1 )(0) CAn-1 z 0 よって、 C CA z 0 n -1 CA となり、可観測性行列のランクは n 未満である。この対偶を取ると、条件1の十分性 がいえる。 (条件1) →(条件2) 条件1の必要性 可観測性行列のランクが n 未満であると仮定すると、非ゼロのベクトル z が存在し て、 zT CT (CA)T (CAn-1 )T 0 となる。ケイリー・ハミルトンの定理より、Cz = 0, CAz = 0, CA2z = 0,…がいえる。した がって、CeAtz = 0 (t 0)となり、これより、 t 0 t Ce z d z e C T CeA zd z TWO (t ) z 0 A 2 T AT 0 となり、可観測性グラミアンは非正則となる。この対偶をとると、条件1の必要性が いえる。 (条件2) →(条件1) 可観測性と座標変換 可制御性と同様に、可観測性も座標変換に関して不変である。 このことを確かめる。 システム: 可観測性行列: C CA x Ax, y Cx n -1 CA 座標変換: z = Tx 変換後のシステム: z A z, y C z ( A TAT -1 , C CT -1 ) 変換後の可観測性行列: C CT -1 C CA -1 C A CAT T -1 n -1 n -1 -1 n -1 C A CA T CA ランクが一致 双対システム システム x Ax Bu (S1) y Cx Du に双対なシステム: z AT z C T u (S2) T T y B z D u (S1)が可制御 (S1)が可観測 (S2)が可観測 (S2)が可制御 双対システムの意味は、後で習う伝達関数を計算すれば明らかになる。 1入力1出力系の場合、双対システムは同じ「入出力関係」を持つ。 双対システムと座標変換 元のシステム x Ax Bu (S1) y Cx Du 座標変換 x Tx x A x B u (S1)' y C x Du A TAT -1 , B TB, C CT -1 , D D 双対システム z AT z C T u (S2) T T y B z D u 座標変換 z (T T ) -1 z z A T z C T u (S2)' T T y B z D u A TAT -1 , B TB, C CT -1 , D D 可制御正準分解 (教科書にはない) rank B AB An-1B r n となっているとしよう。すると、(n - r) n 行列 P が存在し、 P B AB An-1B 0 となる。ただし、rank P = n – r である。ケーリー・ハミルトンの定理より、 PA B AB An-1B 0 が成り立つから、 (n - r) (n - r) 正則行列 A3 が存在して、 PA = A3P と書ける。 ここで、z2 = Px とおくと、 z2 PAx PBu PAx A3 Px A3 z2 次の座標変換を考える。 Q z Tx x P ただし、rank T = n となるように Q をとる。すると、変換後のシステムは、 A A2 B1 z 1 z u 0 A 3 0 の形になる。(可制御正準分解) 可制御正準分解されたシステム 可制御正準分解されたシステム: A1 z1 A z B u 0 z2 A2 z1 B1 u A3 z2 0 z1 … 可制御な状態変数 (一意ではない) z2 … 不可制御な状態変数 (z2 同士の座標変換の自由度を除いて一意に決まる) 可制御正準分解されたシステムの可制御性行列 B AB A n -1 B1 B 0 A1 B1 0 A12 B1 A1n -1 B1 0 0 上の m 行はフルランク 可観測正準分解 (教科書にはない) rank CT (CA)T (CAn-1 )T r n とする。すると、r n フルランク行列 P とnl r フルランク行列 K が存在し、 T KP C T (CA)T (CAn-1 )T とできる。ただし、l は出力の次元。ケーリー・ハミルトンの定理より、 r r 正則行 列 L が存在して、KPA = KLP となる。K はフルランクなので、PA = LP。 次に、座標変換 z = Tx (T は正則) を考える。ここで、T は P T の形をしているものとする。T -1 R S とすると、 PS = 0 となる。 Q ただし、S は n (n – m) 行列。座標変換後のシステムを、 A1 G B1 z z u, y C1 Dz A2 A3 B2 とおくと、G = PAS = LPS = 0, D = CS = K1PS = 0。ただし、K1 はK の最初の l 行を 取り出した行列。 可観測正準分解: A1 z A2 0 B1 z u , A3 B2 y C1 0z 可観測正準分解されたシステム 可観測正準分解されたシステム: A z1 A z B u 1 z2 A2 0 z1 B1 u A3 z 2 B2 z y C z C1 0 1 z2 z1 … 可観測な状態変数 (z1 同士の座標変換の自由度を除いて一意に決まる) z2 … 不可観測な状態変数 (一意には決まらない) 可観測正準分解されたシステムの可観測性行列 C C1 C A C1 A1 n -1 n -1 C A C A 1 1 0 0 0 可制御正準形 (重要) 1入力で可制御なシステム x Ax bu を考える。 p b Ab An-1b 0 0 1 となる、ベクトル p を考える。 もし p = 0 ならば可制御性と矛盾するので、 p は非ゼロベクトルである。 座標変換行列 p pA T 変換後の n -1 可制御性行列 pA を考えると、 0 0 1 0 1 * n -1 rank{T b Ab A b } rank n * * * * 1 であるから T は正則行列 。 可制御正準形 (続き) z = (z1,…,zn)T = Tx とおくと、 z1 p ( Ax bu) pAx z 2 ただし、i は A の特性多項式の係数で、 det(lI - A) ln n-1ln-1 1l 0 z2 pA( Ax bu) pA2 x z3 zn -1 pAn - 2 ( Ax bu) pAn -1 x z n zn pAn -1 ( Ax bu) pAn x pAn -1bu p (- 0 I - 1 A - - n -1 An -1 ) x pAn -1bu ケーリー・ハミ ルトンの定理 - 0 z1 - 1 z 2 - - n -1 z n u 可制御正準形: 0 z 0 - 0 1 - 1 0 0 z u 0 1 0 - n -1 1 重要! 可観測正準形 (教科書には無いが重要) 可制御正準形の相対システムを考える。 元のシステム (1出力・可観測なシステム): x Ax Bu y cx 座標変換: -1 z Tx s As An-1s x T T T n -1 T T s は非ゼロベクトルで、 c (cA) (cA ) s 0 0 1 可観測正準形: 0 1 z 0 y 0 0 - 0 z TBu 0 1 - n -1 0 1z コンパニオン行列 コンパニオン行列: 0 0 - 0 1 - 1 0 0 1 - n -1 0 0 - 0 1 あるいは、 0 0 1 n -1 コンパニオン行列の特性多項式は、 ln n-1ln-1 1l 0 可制御・可観測正準形の役割 可制御(可観測)ならば、1通りに定まる。 正準形(canonical form)という言い方ではなく「標準形」ということもある。 正準形では、特性多項式の係数が現れる。 可制御正準形は、極配置などで使われる。 可観測正準形は、オブザーバ設計などで使われる。 その他、正準形が使われる局面は多い。 しかし、… 正準形を計算機で扱うとき、数値誤差がたまりやすいことが多々ある。 理論は正準形で考えたほうが都合が良くても、実際の計算は正準形を経由しな いほうが良い場合が多い。
© Copyright 2024 ExpyDoc