先端研究論文紹介ゼミ 「A model for learning to segment temporal sequences, utilizing a mixture of RNN experts together with adaptive variance」 RNNと適応変化エキスパートの混合を利用した、セグメント時系 列の学習モデル 2010/11/12 B4 福光 宣文 目次 Abstract Introduction Model Numerical simulation Discussion Conclusion Abstract 再帰型ニューラルネットワークのエキスパートモデルの 混合による新しい学習方法の提案 (モデルは動的にエキスパートを切り替えることで希望 の系列を発生させる) 尤度関数を変更するメカニズムによりマルコフ連鎖の切 り替えを学ぶ Introduction 1 1890年半ば以来行われてきた多くの研究にもかかわ ず、複雑な長期の配列パターンでのスケーリングは不 可能と考えられてきた。 長期の場合誤差逆伝搬法による有効な誤差信号を伝 搬できないため Introduction 2 新しい学習システムの提案 RNNとエキスパートモジュールの混合型モデル シーケンスが多くのモジュールを増やすことで安定性の 低下なしで再使用できるブロックに分割されることを許 可 勾配降下アルゴリズムに基づく最大尤推定法の使用 Introduction 3 シミュレーションの流れ モジュールへのブロックの配分のための結合荷重がモ ジュールごとの相違パラメータを適応的に変化している ことを示す。 確立的に複数のパターンを結合することで作られる データから一組のプリミティブを抽出するための学習に より問題に対する適応力を示す。 一般化能力に基づいて従来法と比較する 実ロボットでのモーターの遷移をゲート制御ネットワーク と組み合わせて適応する。 Model1 ここで定義されるモデルは、再帰型ニューラルネット ワーク(RNN)とエキスパートモデルの混合 以下はその更新式 Model2 Nはモジュールの数、eは0<e<1をみたす時定数 XnとYnは、入力と出力ベクトル Uni 、Cni, 、Yniはそれぞれiにおける文脈ノードの内部 ポテンシャル、文脈ノードの値、出力値 行列Wと、ベクトルvはモジュールパラメータです。 Model3 learning method 学習方法はRNNとエキスパートの混合の確立分布に 基づいて定められる (6)式:既知事実において定義される出力の確立密度 関数 (7)式:平均平方エラーを最小にする Model4 (10)式:ベクトルnがN次元ブラウン運動によって決定 されることをあらわす (11)、(12)式:勾配降下法によりトレーニングを行う 提案法と従来法の違い 正規分布の最適化された変化を使用 (15)式:モジュールiの学習速度はσiによる Model5 Numerical simulation1 3-1 Learning 提案法と従来法の比較 9本のリサジュカーブの変化しているマルコフ連鎖に よって発生する二次元シーケンスを学習する Numerical simulation2 結果1(誤差) 開ループ(a)と閉ループ(b)の2つのパターンで実験を 行った いずれの場合も提案法(最適化)のほうが従来型(定 数)よりもいい結果が得られたことがわかる Numerical simulation3 Fig. 3. The parameter under adaptive optimization. Σの最適化による値の収束 Qの値の推移 Fig. 4. The number of elements in Q for each learning step. 誤差が大きいときは増加し誤差が小さくなるにつれ収束する Numerical simulation4 Numerical simulation5 結果2(出力データ) Numerical simulation6 3-2Generalization 10万回の学習ステップ後の誤差と|Q|の値 (Qは系列Yを発生させるために使用するモジュールの数) Numerical simulation7 3-3Practical application 提案方法の実用的な学習 人型ロボットによる実験 立方体が置かれた作業台の前にロボットをセット。 ロボットがいくつかの動作から希望の動作の組み合わ せを自主的に発生させる。 タスク (1)、(2)物体を上下に移動 (3)、(4)物体を左右に移動 (5)、(6)物体を前後に移動 計6つ Numerical simulation6 ロボットの各振る舞いはホームポジションから開始し ホームポジションで終了する トレーニングデータは上図のように3種の振る舞いから なる Numerical simulation7 Fig. 10. Mean square error for closed-loop dynamics for learning of humanoid robot tasks. (a) Learning for expert modules. (b) Learning for a gating network to generate gn in computation of closed-loop dynamics. Numerical simulation8 Discussion 観測可能なデータにおいて、提案された学習方法は非 決定論的なスイッチングを用いデータを分割させること ができることを示した。 マルコフ連鎖によって動的に機能を変えるシステムを示 した。 Conclusion この研究においてRNNとエキスパートの混成の学習シ ステムを提案した。 提案されたシステムによる連続した流れのトレーニング モデルを基関数に分割できることを示した。(従来法で は不可) 一般化能力も従来法よりも優れていることを証明した。 実ロボットにおける実験により、その動作を確認した。 以上から提案法が現実的な 問題の適応できているが証明された ご清聴ありがとうございました。
© Copyright 2024 ExpyDoc