4. 可制御性・可観測性
教科書 5章, 8.2
入出力付きシステム
入出力付きシステム:
x Ax Bu
y Cx Du
x … 状態ベクトル ( n)
u … 入力ベクトル ( m)
y … 出力ベクトル ( )
A … n n行列, B … n m行列, C … n行列, D … 行列
通常、D = 0 のケース(直達項が無い場合)を考えることが多い。
D 0 でも、y’ = y - Du という仮想的な出力を考えればよい。
解の公式 (再掲)
システム
x Ax Bu
y Cx Du
の解
x(t) を求める公式:
t
x(t ) e x(0) e(t - ) A Bu( )d
tA
0
y(t) を求める公式:
t
y(t ) Ce x(0) Du(t ) C e(t - ) A Bu( )d
tA
0
状態の座標変換 (重要)
状態の定義を変えることによって、入出力の関係を変えずに、別な形のシステ
ムに変換することができる。
元のシステム
x Ax Bu
y Cx Du
座標変換
z Tx, x T -1 z
(T は変換行列で正則でなくてはならない)
新しいシステム
z Tx TAx TBu TAT -1 z TBu
y Cx Du CT -1 z Du
z A z B u
y Cz Du
A TAT -1 , B TB, C CT -1 , D D
座標変換後も、
さまざまな性
質が保存され
る。
可制御性・可観測性の概念
入力 u を直接操作し、システムの状態 x を狙ったように動かすことが、「制御」
制御すべき x が出力 y から「観測」できることが前提。
○ システムの状態を入力で動かすことができるか? … 可制御性
○ システムの状態を出力から推定することが出来るか? … 可観測性
「安定性との関連」
もし、可制御でなければ、系を安定化できないかも…。
もし、可観測でなければ、出力を安定化しても系の内部状態は発散するかも。
可制御ではない/可観測ではない系とは
可制御でない系とは….
たとえば、座標変換で次のような形になるシステム
A
x 1
0
A2 B1
x u
A3 0
x1 A1 x1 A2 x2 B1u
x2 A3 x2
閉じているシステム
可観測でない系とは….
たとえば、座標変換で次のような形になるシステム
A 0 B1
x 1
x u
A
A
3
B2
2
y C1 0x Du
x2の影響を受けない
x1 A1 x1 B1u
x2 A2 x1 A3 x2 B2u
y C1 x1 Du
x1だけが見える
可制御性の定義
任意の初期点 xs から、原点に有限時間内に到達可能な入力 u(t) が存在すれ
ば、システムは可制御であるという。
原点から、任意の点 xf に有限時間内に到達する入力 u(t)が存在すれば、シス
テムは可到達であるという。
連続時間線形系では、
(可制御性) = (可到達性)
ただし、離散時間線形系(コースによっては3年前期授業で習うはず)では、
(可制御な系) (可到達な系)
可観測性の定義
ある時間 tf が存在して、0 t tf の入出力のデータから、システムの初期値 x0
を一意に定めることが出来るとき、システムは可観測であるという。
系の線形性より、
「入力が 0 のとき、ある時間 tf が存在して、0 t tf の出力のデータから、シス
テムの初期値 x0 を一意に定めることが出来るとき、システムは可観測であると
いう。」
と言い換えても良い。
可制御性の条件
[定理] 以下の4つの条件は等価である。
システム x Ax Bu が可制御である。
可制御性行列がフルランクすなわち
rankGC rank B
となること。(条件1)
可制御性グラミアン
t
重要!
AB A2 B An-1B n
t
WC (t ) (e B)(e B) d e BB e
-A
0
が正則であること。 (条件2)
すべての複素数 l に対して、
ranklI - A B n
となること。 (条件3)
-A
T
0
-A
T
-AT
d
条件2の十分性
Wc(t1) が正則とする。
そのとき、任意のx1に対し、入力 u(t ) -(etAB)T Wc (t1 )-1 ( x0 - e-t1 A x1 )が存在し、
t1
x(t1 ) e x0 - e (t1 - ) A B(e -A B)T Wc (t1 ) -1 ( x0 - e -t1 A x1 )d
t1 A
0
e x0 - e
t1 A
t1 A
t1
0
(e -A B)(e -A B)T d Wc (t1 ) -1 ( x0 - e -t1 A x1 )
et1 A x0 - et1 A ( x0 - e -t1 A x1 ) x1
となる。
(条件2) → 可制御性
条件2の必要性
t を固定する。Wc(t) が正則でないなら、非ゼロベクトル z が存在して、Wc(t)z = 0。
よって、
t
2
T
T -A
z Wc (t ) z z e B d 0
0
となり、zTe-AB = 0 (0 t)。一方、可制御だと仮定すると、入力 u()が存在し、初
期状態 z から、0に移すことができる。
t
0e z e
tA
( t - ) A
0
Bu( )d
t
z - e-A Bu( )d
0
したがって、
t
z z T z - z T e-A Bu( )d 0
2
0
となるが、これは矛盾であり、可制御ならばWc は正則でなくてはならない。
可制御性 → (条件2)
条件1の十分性
条件2が成り立たないとすると、 s() = zTe-AB = 0 (0 t) 。 これは恒等式なので、
何回微分しても0。
s (0) z T B 0
s(0) z T AB 0
s(0) z T A2 B 0
(dsn -1 / d )(0) z T An -1 B 0
これをまとめると、
zT B AB A2 B An-1B 0
よって、可制御性行列のランクはn – 1次以下である。これの対偶をとれば、条件1
が成り立つならば条件2が成り立つことがいえる。
(条件1) → (条件2)
条件1の必要性
可制御性行列がフルランクでないとすると、非ゼロのベクトル z が存在し、
zT B AB A2 B An-1B 0
となり、ケーリー・ハミルトンの定理より、zTB = 0, zTAB = 0, zTA2B = 0,…。
行列指数関数の定義より、 zTe-tAB = 0。
すると、
t
0
( z T e-A B)(z T e-A B)T d z TWc (t ) z 0
となり、可制御性グラミアンは非正則となる。これの対偶を取ると、条件2が成り立
つならば条件1が成り立つことがいえる。
(条件2) → (条件1)
座標変換と可制御性
元のシステム
座標変換: z = Tx
変換後のシステム
x Ax Bu
z A z B u
A TAT -1 , B TB
元のシステムの可制御性の条件:
rank B AB A2 B An-1B n
変換後のシステムの可制御性の条件:
rank B
AB
A 2 B A n-1B n
「可制御性は、座標変換に対して不変」
B
AB
A 2 B A n-1B TB TAB TA2 B TAn -1B
T B
AB A2 B An-1B
可観測性の条件
次の4つの条件は同値である。
システム x Ax, y Cx は、可観測である。
ランク条件
C
CA
rank GO rank
n
n -1
CA
を満たす。(条件1)
可観測性グラミアン
t
WO (t ) eA C T CeAd
T
0
が正則。(条件2)
全ての複素数 l に対して、
となる。(条件3)
lI - A
rank
n
C
重要!
条件2と可観測性の等価性の証明
y(t) = CetAx0 の左から (CetA)T を掛けて積分すると、
t
0
(CeA )T y( )d WO (t ) x0
よって、 WO(t) が正則ならば、
x0 WO (t )
-1
t
0
(CeA )T y( )d
と x0 が決定できる。(十分性の証明終わり)
逆にWO(t) が非正則ならば、非零のベクトル z が存在して、 WO(t)z = 0 となる。
t
t
0
0
z TWO (t ) z (CeA z )T (CeA z )d CeA z d 0
2
であるから、Cet’Az = 0 (0 t’ t) 。これは、初期値が z であるときに、出力が恒等的
にゼロであることを意味しており、初期値が原点にある場合と区別できず、可観測性
が成り立たない。(必要性の証明終わり)
可観測性グラミアンが正則(条件2)
可観測性
条件1の十分性の証明
WO(t) が非正則なら、非零ベクトル z が存在し、s(t) = CetAz = 0 (t 0)。
s(0) Cz 0, s(0) CAz 0, s(0) CA2 z 0,
(d n -1s / dtn-1 )(0) CAn-1 z 0
よって、
C
CA
z 0
n -1
CA
となり、可観測性行列のランクは n 未満である。この対偶を取ると、条件1の十分性
がいえる。
(条件1) →(条件2)
条件1の必要性
可観測性行列のランクが n 未満であると仮定すると、非ゼロのベクトル z が存在し
て、
zT CT (CA)T (CAn-1 )T 0
となる。ケイリー・ハミルトンの定理より、Cz = 0, CAz = 0, CA2z = 0,…がいえる。した
がって、CeAtz = 0 (t 0)となり、これより、
t
0
t
Ce z d z e C T CeA zd z TWO (t ) z 0
A
2
T AT
0
となり、可観測性グラミアンは非正則となる。この対偶をとると、条件1の必要性が
いえる。
(条件2) →(条件1)
可観測性と座標変換
可制御性と同様に、可観測性も座標変換に関して不変である。
このことを確かめる。
システム:
可観測性行列:
C
CA
x Ax, y Cx
n -1
CA
座標変換: z = Tx
変換後のシステム:
z A z, y C z
( A TAT -1 , C CT -1 )
変換後の可観測性行列:
C CT -1 C
CA
-1
C
A
CAT
T -1
n -1 n -1 -1 n -1
C A CA T CA
ランクが一致
双対システム
システム
x Ax Bu
(S1)
y Cx Du
に双対なシステム:
z AT z C T u
(S2)
T
T
y
B
z
D
u
(S1)が可制御
(S1)が可観測
(S2)が可観測
(S2)が可制御
双対システムの意味は、後で習う伝達関数を計算すれば明らかになる。
1入力1出力系の場合、双対システムは同じ「入出力関係」を持つ。
双対システムと座標変換
元のシステム
x Ax Bu
(S1)
y Cx Du
座標変換
x Tx
x A x B u
(S1)'
y C x Du
A TAT -1 , B TB,
C CT -1 , D D
双対システム
z AT z C T u
(S2)
T
T
y B z D u
座標変換
z (T T ) -1 z
z A T z C T u
(S2)'
T
T
y
B
z
D
u
A TAT -1 , B TB,
C CT -1 , D D
可制御正準分解 (教科書にはない)
rank B AB An-1B r n
となっているとしよう。すると、(n - r) n 行列 P が存在し、
P B AB An-1B 0
となる。ただし、rank P = n – r である。ケーリー・ハミルトンの定理より、
PA B AB An-1B 0
が成り立つから、 (n - r) (n - r) 正則行列 A3 が存在して、 PA = A3P と書ける。
ここで、z2 = Px とおくと、
z2 PAx PBu PAx A3 Px A3 z2
次の座標変換を考える。
Q
z Tx x
P
ただし、rank T = n となるように Q をとる。すると、変換後のシステムは、
A A2 B1
z 1
z u
0
A
3
0
の形になる。(可制御正準分解)
可制御正準分解されたシステム
可制御正準分解されたシステム:
A1
z1
A
z
B
u
0
z2
A2 z1 B1
u
A3 z2 0
z1 … 可制御な状態変数 (一意ではない)
z2 … 不可制御な状態変数
(z2 同士の座標変換の自由度を除いて一意に決まる)
可制御正準分解されたシステムの可制御性行列
B
AB A
n -1
B1
B
0
A1 B1
0
A12 B1 A1n -1 B1
0
0
上の m 行はフルランク
可観測正準分解 (教科書にはない)
rank CT (CA)T (CAn-1 )T r n
とする。すると、r n フルランク行列 P とnl r フルランク行列 K が存在し、
T
KP C T (CA)T (CAn-1 )T
とできる。ただし、l は出力の次元。ケーリー・ハミルトンの定理より、 r r 正則行
列 L が存在して、KPA = KLP となる。K はフルランクなので、PA = LP。
次に、座標変換 z = Tx (T は正則) を考える。ここで、T は
P
T の形をしているものとする。T -1 R S とすると、 PS = 0 となる。
Q
ただし、S は n (n – m) 行列。座標変換後のシステムを、
A1 G B1
z
z u, y C1 Dz
A2 A3 B2
とおくと、G = PAS = LPS = 0, D = CS = K1PS = 0。ただし、K1 はK の最初の l 行を
取り出した行列。
可観測正準分解:
A1
z
A2
0 B1
z u ,
A3 B2
y C1 0z
可観測正準分解されたシステム
可観測正準分解されたシステム:
A
z1
A z B u 1
z2
A2
0 z1 B1
u
A3 z 2 B2
z
y C z C1 0 1
z2
z1 … 可観測な状態変数
(z1 同士の座標変換の自由度を除いて一意に決まる)
z2 … 不可観測な状態変数 (一意には決まらない)
可観測正準分解されたシステムの可観測性行列
C C1
C
A
C1 A1
n -1
n -1
C
A
C
A
1
1
0
0
0
可制御正準形 (重要)
1入力で可制御なシステム x Ax bu を考える。
p b Ab An-1b 0 0 1 となる、ベクトル p を考える。
もし p = 0 ならば可制御性と矛盾するので、 p は非ゼロベクトルである。
座標変換行列
p
pA
T
変換後の
n -1
可制御性行列
pA
を考えると、
0 0 1
0
1 *
n -1
rank{T b Ab A b } rank
n
*
*
* *
1
であるから T は正則行列 。
可制御正準形 (続き)
z = (z1,…,zn)T = Tx とおくと、
z1 p ( Ax bu) pAx z 2
ただし、i は A の特性多項式の係数で、
det(lI - A) ln n-1ln-1 1l 0
z2 pA( Ax bu) pA2 x z3
zn -1 pAn - 2 ( Ax bu) pAn -1 x z n
zn pAn -1 ( Ax bu) pAn x pAn -1bu
p (- 0 I - 1 A - - n -1 An -1 ) x pAn -1bu
ケーリー・ハミ
ルトンの定理
- 0 z1 - 1 z 2 - - n -1 z n u
可制御正準形:
0
z
0
- 0
1
- 1
0 0
z u
0
1 0
- n -1 1
重要!
可観測正準形 (教科書には無いが重要)
可制御正準形の相対システムを考える。
元のシステム (1出力・可観測なシステム):
x Ax Bu
y cx
座標変換:
-1
z Tx s As An-1s x
T
T
T
n -1 T T
s は非ゼロベクトルで、 c (cA) (cA ) s 0 0 1
可観測正準形:
0
1
z
0
y 0
0 - 0
z TBu
0
1 - n -1
0 1z
コンパニオン行列
コンパニオン行列:
0
0
- 0
1
- 1
0
0
1
- n -1
0 0 - 0
1
あるいは、 0
0
1
n -1
コンパニオン行列の特性多項式は、
ln n-1ln-1 1l 0
可制御・可観測正準形の役割
可制御(可観測)ならば、1通りに定まる。
正準形(canonical form)という言い方ではなく「標準形」ということもある。
正準形では、特性多項式の係数が現れる。
可制御正準形は、極配置などで使われる。
可観測正準形は、オブザーバ設計などで使われる。
その他、正準形が使われる局面は多い。
しかし、…
正準形を計算機で扱うとき、数値誤差がたまりやすいことが多々ある。
理論は正準形で考えたほうが都合が良くても、実際の計算は正準形を経由しな
いほうが良い場合が多い。
© Copyright 2026 ExpyDoc