Document

先端研究論文紹介ゼミ
「A model for learning to segment temporal sequences, utilizing
a mixture of RNN experts together with adaptive variance」
RNNと適応変化エキスパートの混合を利用した、セグメント時系
列の学習モデル
2010/11/12
B4 福光 宣文
目次
Abstract
 Introduction
 Model
 Numerical simulation
 Discussion
 Conclusion

Abstract

再帰型ニューラルネットワークのエキスパートモデルの
混合による新しい学習方法の提案
(モデルは動的にエキスパートを切り替えることで希望
の系列を発生させる)

尤度関数を変更するメカニズムによりマルコフ連鎖の切
り替えを学ぶ
Introduction 1
1890年半ば以来行われてきた多くの研究にもかかわ
ず、複雑な長期の配列パターンでのスケーリングは不
可能と考えられてきた。
長期の場合誤差逆伝搬法による有効な誤差信号を伝
搬できないため
Introduction 2
新しい学習システムの提案
RNNとエキスパートモジュールの混合型モデル
シーケンスが多くのモジュールを増やすことで安定性の
低下なしで再使用できるブロックに分割されることを許
可
 勾配降下アルゴリズムに基づく最大尤推定法の使用

Introduction 3
シミュレーションの流れ
 モジュールへのブロックの配分のための結合荷重がモ
ジュールごとの相違パラメータを適応的に変化している
ことを示す。
 確立的に複数のパターンを結合することで作られる
データから一組のプリミティブを抽出するための学習に
より問題に対する適応力を示す。
 一般化能力に基づいて従来法と比較する

実ロボットでのモーターの遷移をゲート制御ネットワーク
と組み合わせて適応する。
Model1
ここで定義されるモデルは、再帰型ニューラルネット
ワーク(RNN)とエキスパートモデルの混合
以下はその更新式
Model2

Nはモジュールの数、eは0<e<1をみたす時定数

XnとYnは、入力と出力ベクトル


Uni 、Cni, 、Yniはそれぞれiにおける文脈ノードの内部
ポテンシャル、文脈ノードの値、出力値
行列Wと、ベクトルvはモジュールパラメータです。
Model3
learning method

学習方法はRNNとエキスパートの混合の確立分布に
基づいて定められる

(6)式:既知事実において定義される出力の確立密度
関数

(7)式:平均平方エラーを最小にする
Model4

(10)式:ベクトルnがN次元ブラウン運動によって決定
されることをあらわす

(11)、(12)式:勾配降下法によりトレーニングを行う
提案法と従来法の違い
正規分布の最適化された変化を使用
(15)式:モジュールiの学習速度はσiによる
Model5
Numerical simulation1
3-1 Learning
提案法と従来法の比較
9本のリサジュカーブの変化しているマルコフ連鎖に
よって発生する二次元シーケンスを学習する
Numerical simulation2
結果1(誤差)
開ループ(a)と閉ループ(b)の2つのパターンで実験を
行った
 いずれの場合も提案法(最適化)のほうが従来型(定
数)よりもいい結果が得られたことがわかる

Numerical simulation3
Fig. 3. The parameter under adaptive optimization.

Σの最適化による値の収束

Qの値の推移
Fig. 4. The number of elements in Q for each learning step.
誤差が大きいときは増加し誤差が小さくなるにつれ収束する
Numerical simulation4
Numerical simulation5
結果2(出力データ)
Numerical simulation6
3-2Generalization
10万回の学習ステップ後の誤差と|Q|の値
(Qは系列Yを発生させるために使用するモジュールの数)
Numerical simulation7
3-3Practical application
提案方法の実用的な学習
人型ロボットによる実験
立方体が置かれた作業台の前にロボットをセット。
ロボットがいくつかの動作から希望の動作の組み合わ
せを自主的に発生させる。
タスク
(1)、(2)物体を上下に移動
(3)、(4)物体を左右に移動
(5)、(6)物体を前後に移動
計6つ
Numerical simulation6
ロボットの各振る舞いはホームポジションから開始し
ホームポジションで終了する
トレーニングデータは上図のように3種の振る舞いから
なる
Numerical simulation7
Fig. 10. Mean square error for closed-loop dynamics for learning of humanoid robot
tasks. (a) Learning for expert modules. (b) Learning for a gating network to generate gn
in computation of closed-loop dynamics.
Numerical simulation8
Discussion

観測可能なデータにおいて、提案された学習方法は非
決定論的なスイッチングを用いデータを分割させること
ができることを示した。

マルコフ連鎖によって動的に機能を変えるシステムを示
した。
Conclusion
この研究においてRNNとエキスパートの混成の学習シ
ステムを提案した。
 提案されたシステムによる連続した流れのトレーニング
モデルを基関数に分割できることを示した。(従来法で
は不可)
 一般化能力も従来法よりも優れていることを証明した。
 実ロボットにおける実験により、その動作を確認した。

以上から提案法が現実的な
問題の適応できているが証明された
ご清聴ありがとうございました。