教師がコミティマシンの場合の アンサンブル学習 三好誠司 原 一之 神戸市立高専 都立工業高専 岡田真人 東大, 理研, 科技機さきがけ 1 背 景 (1) • アンサンブル学習 – 精度の低いルールや学習機械を組み合わせて精度 の高い予測や分類を行う • 教師が1個の単純パーセプトロン で 生徒がK個の単純パーセプトロン の場合の解析 (三好,原,岡田,2003-2004) Teacher Students 1 2 K 2 背 景 (2) • 教師が1個の非単調パーセプトロン で 生徒が1個の単純パーセプトロン の場合の解析 (Inoue & Nishimori, PRE, 1997) (Inoue, Nishimori & Kabashima, TANC-97, cond-mat/9708096, 1997) Teacher Students sg n( ul ) B1 x1 BN xN J1 x1 JN xN 3 • アンサンブル学習の特徴 – 多数決などで生徒を組み合わせることにより,単一の 生徒では表現できない入出力関係を実現できる 目 的 • 教師がコミティマシンで生徒がK個の単純パーセ プトロンの場合のアンサンブル学習をオンライン 学習の枠組みで解析 Students J1 ,J2 , ・・・ ,JK Teacher Bmn sgn( u1 l) J11 x1 1 J1N J21 xN x1 sgn( u2 l) 2 J2N xN sgn(uKl) JK1 x1 K J KN xN 4 モデル(1) Teacher Bmn Students sgn( u1 l) J11 x1 • • • • 1 J1N J21 xN x1 J1 ,J2 , ・・・ ,JK sgn( u2 l) 2 J2N xN sgn(uKl) JK1 x1 K J KN xN 同じ入力 x が同じ順序で提示される 一度使った入力 x は廃棄される(オンライン学習) 独立に学習 多数決 5 モデル(2) • 入力: • 教師: • 生徒: 生徒の長さ 6 汎化誤差 新たな入力に対して教師と異なる答を出す確率 Gaussian 7 教師中間層と生徒の 類似度 生徒間の類似度 8 生徒の長さ 教師と生徒の類似度 l ,R,q を記述する微分方程式 生徒間の類似度 9 ヘブ学習 パーセプトロン学習 アダトロン学習 10 0.5 Gene ralization Error Generali zation Erro r 汎化誤差のダイナミクス(ヘブ学習) K=1 K=3 K=5 K=7 K=9 0.4 0.3 M =9 M =3 0.2 0 10 20 30 Time 理 論 40 50 0.5 K=1 K=3 K=5 K=7 K=9 0.4 0.3 M =9 M =3 0.2 0 10 20 30 40 50 Time 計算機シミュレーション (N=1000) 11 0.5 1 K=1 K=3 K=5 K=7 K=9 0.4 0.3 M =9 M =3 0.2 0 10 20 30 Time 40 q 0.8 Similarity Generali zation Erro r 汎化誤差のダイナミクス(ヘブ学習) 50 0.6 0.4 R (M=3) 0.2 R (M=9) 0 0 10 20 30 40 Time 12 50 0.5 Generalization Erro r Generali zation Erro r 汎化誤差のダイナミクス(パーセプトロン学習) K=1 K=3 K=5 K=7 K=9 0.4 0.3 M=9 M=3 0.2 0 10 20 30 Time 理 論 40 50 0.5 K=1 K=3 K=5 K=7 K=9 0.4 0.3 M =9 M =3 0.2 0 10 20 30 40 50 Time 計算機シミュレーション (N=1000) 13 0.5 1 q (M=3) K=1 K=3 K=5 K=7 K=9 0.4 q (M=9) 0.8 Similarity Generali zation Erro r 汎化誤差のダイナミクス(パーセプトロン学習) 0.3 M=9 M=3 0.2 0.6 0.4 R (M=3) 0.2 R (M=9) 0 0 10 20 30 Time 40 50 0 10 20 30 40 50 Time 14 0.5 Gener aliza tion E rror Gene raliza tion Error 汎化誤差のダイナミクス(アダトロン学習) K=1 K=3 K=5 K=7 K=9 0.4 M=9 0.3 M=3 0 10 20 30 Time 理 論 40 50 0.5 K=1 K=3 K=5 K=7 K=9 0.4 M=9 0.3 0 M=3 10 20 30 40 Time 計算機シミュレーション (N=1000) 15 50 1 0.5 K=1 K=3 K=5 K=7 K=9 0.4 M=9 0.3 M=3 0 10 20 30 Time q 0.8 Similarity Gene raliza tion Error 汎化誤差のダイナミクス(アダトロン学習) 40 50 0.6 0.4 R (M=3) 0.2 R (M=9) 0 0 10 20 30 40 Time 16 50 まとめ • 教師がコミティマシンの場合のアンサンブル 学習をオンライン学習の枠組みで解析・議論 • ヘブ学習 → 生徒が教師中間層の中央に漸近 • パーセプトロン学習 → アンサンブルの効果が残る • アダトロン学習 → 過学習が起こる 17
© Copyright 2024 ExpyDoc