1 Kernel Subspace Method by Stochastic Realization for Learning Nonlinear Dynamical Systems (Neural Information Processing Systems 2006) 東京大学大学院航空宇宙工学専攻 東京大学先端科学技術研究センター 河原 吉伸 矢入 健久,町田 和雄 動的システム学習 • 時系列入出力データから,その生成モデルを推定する – モデルは対象システムの制御や動的特性の解析などに利用 入出力データ {u(t), y(t), t 0, 1,} 動的システム学習 動的モデル 状態空間モデル ARMAモデル x(t 1) Ax(t ) B u(t ) v y(t ) C x(t ) Du(t ) w y(t ) y(t i) u(t i) v i1 i0 などなど… 応用 : 対象システムの制御,動的特性の解析,… 2 状態空間モデル 線形の場合 3 非線形の場合 x(t 1) Ax(t ) B u(t ) v x(t 1) f ( x(t ), u(t )) v y(t ) C x(t ) Du(t ) w y(t ) g ( x(t ),u(t )) w • 直接観測されない状態ベクトルを用いたモデル表現. – 過去の全ての観測に関する十分統計量となっているため,ARMAモデルな どの入出力のみに関するモデルに比べ,正確に動的システムを表現可能 • その他,物理科学などで得られた解析モデルとのアナロジーが得 られやすいなどの特徴があるが,比較的推定は困難. 状態空間学習の分類 入出力データ {u(t), y(t), t 0, 1,} モデル・データ間の距離の最小化 部分空間上での幾何学的演算 予測誤差 ⇒ 予測誤差法 尤 度 ⇒ EMアルゴリズム 直交分解,CCAによる確率実現 ⇒ 部分空間法 システム行列 A, B, C, D, K カルマンフィルター 状態ベクトル 4 x(t ), t 0, 1, ○ 高精度(但し初期値依存) × 局所解の問題,要反復計算 状態ベクトル x(t ), t 0, 1, 最小二乗法 システム行列 A, B, C, D, K ○ 高速で数値的に安定,一意解 × 推定精度はやや劣る Existing Subspace Methods for Learning Nonlinear Dynamical Systems • A nonlinear algorithm is essential for learning complex systems which cannot be expressed sufficiently with linear models. • Existing nonlinear subspace methods – Nonlinear approaches with neural networks ・ Based on embedding and regression with neural nets [VVS00] – Nonlinear approaches with reproducing kernels ・ Method for Hammerstein systems with LS-SVM [GPSM05] ・ Method using Kernel CCA on retarded coordinate vectors [VSB+04] => ・ Operate directly toward input-output data ・ Need additional nonlinear regression frameworks – Other approaches ・ Using a conditional expectation algorithm for nonlinear CCA [LB92] 5 6 再生核ヒルベルト空間(RKHS) … RKHS k 正定値カーネル: k : Ω Ω R 1 : 1 k ( , x ) ( x Ω) - - 対称性 k ( x, y) k ( y, x) - 再生性 f , ( x) f ( x) - 正定値性 in, j 1ci c j k ( xi , x j ) 0 正定値カーネルにより特徴空間内の ・ 関数値 ・ 内積 f ( x) f , ( x) ( x), ( y) k ( x, y) 暗黙的に,高次元の特徴空間内 でのデータ解析が可能となる. が計算可能となる. xj xi xi xi 元のデータ空間 Ω カーネル特徴空間 (RKHS) k 射影定理(1) 7 • ある時刻 tに関して,過去の入出力 p(t )と未来の入力 u (t ) から,未来の出力 f (t )を予測する問題を考える. 未来の入力 u(t ), u(t 1),, u(t l 1) t t に沿った u (t) f (t ) 未来の出力(真) y(t ), y(t 1),, y(t l 1) fˆ (t ) 未来の出力(予測) t への射影行列 0 t に沿った t への射影行列 p(t ) t * 過去の入出力 w(t 1), w(t 2), * 結合過程 w(t ) [u(t )', y(t )' ]' 射影定理(2) • 次の2つの仮定をおく. [仮定1] 出力 y から入力 へのフィードバックが存在しない [仮定2] t が直和分解 t t t を持つ(実用的には,入力 が持続的励起条件を満足していれば十分) u • このとき,次の射影定理が成り立つ事が導かれる. 過去の入出力と未来の入力に基づいた,未来の出力の最適予測は fˆ (t ) f (t ) / p ( t ) u (t ). t t のように与えられる.このとき,各々の射影行列は次式で表される離 散 Wiener-Hopf 型方程式を満たす. pp|u f p|u , uu| p f u| p 条件付き共分散行列 1 ab|c a c, b c ab accc bc 8 特徴空間における射影定理 • 前褐の2つの仮定が成立する場合,正定値カーネルで定まる特 徴空間においても,同様の条件が成立する事が示せる. • 同様の手順で,特徴空間における射影定理が導出できる. 特徴空間における過去の入出力と未来の入力に基づいた,特徴空 間における未来の出力の最適予測は fˆ (t ) f (t ) / p ( t ) u (t ) t t のように与えられる.このとき,各々の射影行列は次式で表される 離散 Wiener-Hopf 型方程式を満たす. p p |u f p |u , u u |p f u |p 9 射影定理から分かる事 10 • 最適予測子に関する方程式 fˆ (t ) p (t ) u (t ) を書き直すと y y(t ) u u(t ) p ( t ) y y(t l 1) u u(t l 1) • 一方,状態空間モデルの観測方程式 y y(t ) u u(t ) x ( t ) D y y(t l 1) u u(t l 1) p(t ) x(t ) となるように x(t ) , などを選択すればよい 状態ベクトル • 次のように,(拡張)可観測行列,(拡張)可制御行列,および状 態ベクトルを定義する. Lf1 f p |u Lp1 U S V T : Lf US1/ 2 , : S1/ 2V T LTp x(t) pp|u p(t) S 1 V T Lp1|u p(t) 1/ 2 – 状態ベクトルが持つべき性質(マルコフ性)を満足する – 前褐の射影定理と状態空間モデルとの関係が成立する. • 特徴空間上の出力に関するモデルが得られる. x ( t 1 ) A x ( t ) B u ( t ) K e (t ) u y ( t ) C x ( t ) D u ( t ) e (t ) u y 11 元の空間上の状態空間モデル 特徴空間における出力に関する状態空間モデル x (t 1) A x (t ) B u u(t ) K e (t ) y ( t ) C x ( t ) D u ( t ) e (t ) u y t t 0 と特徴写像の全単射性から y(t ) / t t C x x(t ) D u u(t ) が導ける 元の空間における出力に関する状態空間モデル x (t 1) A x (t ) B u u(t ) K e (t ) y ( t ) C x ( t ) D u ( t ) e (t ) x u 特徴写像を明示的に含んでいるので計算不可 12 13 カーネルPCAを用いた近似 • 基本的な考え方: 特徴ベクトル z を直接用いる代わりに,カーネ T ル主成分で張られる空間上の特徴ベクトル z Az を用いる – 係数行列 Az は,例えばグラム行列の固有値分解 Gz Az z z1/2 として計算できる z z zT より, ⇒ (近似)特徴ベクトルが明示的に計算可能 z z Tz Az Gz Az • 明示的に計算する事が可能な,状態ベクトルおよび非線形状態 空間モデルが得られる: 経験的共分散行列 1/ 2 T ˆ1 k p(t) 特異値分解 Lˆ1 ˆ Lˆ1 Uˆ Sˆ Vˆ T により計算可 ・ x(t ) Sˆ Vˆ L p f f p| u p T T x (t 1) A x (t ) B Au ku u(t ) K Ae ke e (t ) ・ T T y ( t ) C A k x ( t ) D A k u ( t ) e (t ) x x u u 14 アルゴリズム (1) Step 1. 正則経験的共分散演算子と,その平方根行列を求める: ˆ f f |u (GY I N )2 GY GU (GU I N )2 GU GY Lˆ f LˆTf ˆ p p|u (GW I N )2 GW GU (GU I N )2 GU GW Lˆ p LˆTp ˆ f p|u GY GW GY GU (GU I N )2 GU GW Step 2. 正規化共分散行列の特異値分解を計算する: Lˆf1 ˆ f p|u Lˆp1 Uˆ Sˆ Vˆ T U1 S1 V1T Step 3. 状態ベクトルの推定値を計算する: x(l),, x(l N ) S11/2V1T Lp1 GW 0に近い特異値は無視 アルゴリズム (2) Step 4. グラム行列の固有値分解により係数行列 Au , Au , Ax を計 算し,次式に最小二乗法を適用してシステム行列を求める. Xˆ l 1 A Xˆ l B AuT Gˆu,l w ˆ x,l D AuT G ˆ u,l e Yl|l C AxT G Step 5(カルマンゲインが必要な場合). 残差の共分散行列を計算 し,代数リッカチ方程式(本文参照,MATLABで一発)を解き,そ の安定化解を用いてカルマンゲインを求める. 15 16 数値例(1) • 下記の非線形システムから生成したデータを利用 – 0.05秒毎の4,5次のルンゲ・クッタによるシミュレーション – 600点を用いて学習し,新たな400点により評価* – 入力は 0.5~0.5 の間の均一分布から生成 x1 (t ) x2 (t ) 0.1cos(x1 (t )) (5x1 (t ) 4x13 (t ) x15 (t )) 0.5 cos(x1 (t )) u(t ) x2 (t ) 65x1 (t ) 50x13 (t ) 15x15 (t ) x2 (t ) 100u(t ) y (t ) x1 (t ) *) 評価は主に次式で表されるシミュレーション誤差を利用 [OM96] m s n 100 y i 1 ( yi )c ( y i )c m ( y ) ny c1 i 1 i c シミュレーション値 観測値 数値例(1) 17 獲得モデルを用いた長期予測の結果 線形部分空間同定法 [KP99] 非線形部分空間同定法 (提案手法) シミュレーション誤差 : 45.1 〃 : 40.2 (約10%向上) 数値例(2) • Simulation data of a pH neutralization process in a constant volume stirring tank. – Included in DAISY (DAtasets for the Identification of Systems, which includes several engineering, biological and environmental data). – Inputs: acid solution flow and base solution flow in litters Outputs: pH of the solution in the tank 18 数値例(2) 19 獲得モデルを用いた長期予測の結果 線形部分空間同定法 [KP99] 非線形部分空間同定法 (提案手法) シミュレーション誤差 : 47.0 〃 : 22.7 (約50%向上) Conclusions and future works 20 • A kernel subspace method based on stochastic realization for learning nonlinear dynamical systems is proposed. – The algorithm needs no iterative optimization procedures and can obtain solutions using fast and reliable numerical schemes (SVD, etc.). – However, the parameters involve much time and effort for tuning. • Future works : – To incorporate a scheme for optimizing, automatically, the parameters into the proposed method. – To extend other established subspace methods for learning dynamical systems to nonlinear frameworks as well.
© Copyright 2025 ExpyDoc