多数の疑似システムを用いた システム同定の統計力学 三好 誠司 岡田 真人 神戸高専 東 大, 理 研 1 学習 観測データだけを使って,その背後 にあるデータ生成過程をモデル化 すること 2 学習 女 教師 生徒 3 学習 男 教師 生徒 4 学習 男 教師 生徒 5 学習 女 教師 生徒 6 学習 A Teacher Student J J J 7 学習 • バッチ学習 – – – – 与えられたいくつかの例題を繰り返し使用 すべての例題に正しく答えられる 長い時間が必要 例題を蓄えておくメモリが必要 • オンライン学習 – – – – 一度使った例題は捨ててしまう 過去の例題に必ず正しく答えられるとは限らない 例題を蓄えておくメモリが不要 時間的に変化する教師にも追随 8 適応信号処理(システム同定) 学習 システム同定 Teacher Student + + - 適応アルゴリズム 未知システム 適応フィルタ よく似ている! 入力 9 今回扱うモデル + + - 適応 アルゴリズム 未 知 シ ス テ ム 疑 似 シ ス テ ム 疑 似 シ ス テ ム 疑 似 シ ス テ ム 適 応 フ ィ ル タ A B1 B2 BK J 入力 10 今回扱うモデル 未知システム BK Bk' A B1 Bk 疑似システム • A, B1,B2,・・・ ,J はトランス バーサルフィルタ • J は A の出力を直接観測 することはできない • J は B1,B2,・・・ の出力を順 番に使う J 適応フィルタ 11 目 的 未知システム, K個の疑似システム, 適応フィルタからなるモデル の二乗平均誤差を計算する. BK A B1 Bk' Bk J 特に, 疑似システムの個数K, 疑似システム集団の多様性と 二乗平均誤差の関係について 議論する. 12 トランスバーサルフィルタ N Output Out put J i xi i 1 Σ Tap Weights Inputs J1 J2 x1 x2 JN xN 13 モデル 出力にノイズが乗るトランスバーサルフィルタ BK A B1 Bk' Bk J 14 モデル • • • • 入力: 未知システム: 疑似システム: 適応フィルタの初期値: • N→∞ (熱力学的極限) • 巨視的変数 – 適応フィルタの長さ – 方向余弦 15 未知システム BK A B1 Bk Bk' RB k 疑似システム qkk' RBkJ RJ J 適応フィルタ 16 モデル 二乗誤差 LMSアルゴリズム fkm 適応フィルタはK個の疑似システムの出力を順番に使う 17 二乗平均誤差 • 本研究の目的は二乗平均誤差を理論的に求めること • 二乗平均誤差 = 新しい入力とノイズに関する二乗誤差の平均 18 巨視的変数のダイナミクスを記述する 決定論的連立微分方程式 19 熱力学的極限における自己平均性にもとづき巨視的変数の ダイナミクスを記述する微分方程式を決定論的な形で導出 1.解析を容易にするため補助的巨視的変数を導入 20 モデル 二乗誤差 LMSアルゴリズム fkm 適応フィルタはK個の疑似システムの出力を順番に使う 21 熱力学的極限における自己平均性にもとづき巨視的変数の ダイナミクスを記述する微分方程式を決定論的な形で導出 1.解析を容易にするため補助的巨視的変数を導入 2. Jm+1 = Jm + f1m xm の両辺にAを乗ずる 3. NrJm+1 = NrJm NrJm+2 = NrJm+1 + f1m ym + f2m+1 ym+1 Ndt inputs + NrJm+Ndt = NrJm+Ndt-1 + fkm+Ndt-1 ym+Ndt-1 < >は サンプル平均 を表す 22 巨視的変数のダイナミクスを記述する 決定論的連立微分方程式 23 解析的に得られた巨視的変数 24 二乗平均誤差 • 本研究の目的は二乗平均誤差を理論的に求めること • 二乗平均誤差 = 新しい入力とノイズに関する二乗誤差の平均 25 二乗平均誤差,RJ ,lのダイナミクス 1.2 q=1.00 q=0.80 q=0.60 q=0.49 1.0 0.8 1.0 O r d er P ar a me te r s n E rr o r e n er a liza tio Error G Mean-Squared (η=0.3, K=3, RB=0.7, σA2=0.0, σB2=0.1, σJ2=0.2) Student Adaptive Filter 0.6 0.4 Ensemble False System teachers 0.2 0 5 10 t=m/N 15 20 l 0.8 0.6 RJ 0.4 q=1.00 q=0.80 q=0.60 q=0.49 0.2 0.0 0 5 10 t=m/N 20 15 26 解析的に得られた巨視的変数 27 定常状態の解析 ( t → ∞ ) ・ η<0 あるいは η>2 ならば 二乗平均誤差は発散してしまう ・ 0<η<2 ならば η<1ならば,疑似システムの多様性が豊かであるほど また 疑似シ ステムの数Kが多いほど二乗平均誤差は小さくなる. η>1ならば,疑似システムの多様性が乏しいほど また 疑似システム の数Kが少ないほど二乗平均誤差は小さくなる. 28 二乗平均誤差,RJ の定常値 J (K=3, RB=0.7, σA2=σB2=σJ2=0.0) 29 二乗平均誤差,RJ の定常値 J (q=0.49, RB=0.7, σA2=σB2=σJ2=0.0) 30 まとめ 未知システム,K個の疑似システム,適応フィルタから構成され るモデルのシステム同定について解析した. 適応フィルタの二乗平均誤差を統計力学的手法を用いて理論 的に計算した結果,ステップサイズがη<1 のときには疑似シス テムの個数が多いほど,また,疑似システムの多様性が豊か であるほど適応フィルタの二乗平均誤差は小さくなるが,η>1 の場合には全く逆であるという興味深い結果を得た. K個の疑似システムの多様性が十分に豊かである場合には, そして,そのときに限り, η→0,K→∞において雑音の有無によ らず完全なシステム同定が達成される. 31 The Independence Theory (S.Haykin, Adaptive Filter Theory) • The statistical analysis of the LMS algorithm based on the following fundamental assumption. – The tap-input vectors x1, x2,・・・, xm constitute a sequence of statistically independent vectors. – At time m, the tap-input vector xm is statistically independent of all previous samples of the desired response, namely y1,y2,・・・,ym-1. – At time m, the desired response ym is dependent on the corresponding tap-input vector xm, but statistically independent of all previous samples of the desired response. – The tap-input vector xm and the desired response ym consist of mutually Gaussian-distributed random variables for all m. 32
© Copyright 2024 ExpyDoc