スライド タイトルなし

時間方向アンサンブル学習の解析
- 教師と生徒が線形な場合 -
三好 誠司
上江洌 達也
岡田 真人
神戸市立高専
奈良女子大学
東大, 理研, さきがけ
背 景 (1)
• アンサンブル学習
– 精度の低いルールや学習機械を組み合わせて精度
の高い予測や分類を行う
(Hara & Okada, JPSJ, 2005)
(Miyoshi, Hara & Okada, PRE, 2005)
Teacher
B1
x1
BN
xN
Students
J11
x1
J1N
J21
xN x1
J2N
xN
JK1
x1
J KN
xN
2
背 景 (2)
Teacher
Student
sg n( ul )
B1
x1
BN
xN
J1
x1
JN
xN
(Inoue & Nishimori, PRE, 1997)
(Inoue, Nishimori & Kabashima, TANC-97, cond-mat/9708096, 1997)
• 教師と生徒の出力特性の違いやノイズの存在などの
ため汎化誤差がゼロに漸近しないモデルにおいては
生徒が一方向に収束せず動き続ける場合がある.
(三好,原,岡田,IBIS2004.
三好,原,岡田,信学技報,2005)
3
背 景 (3)
B
J
Learnable Case
B
J
Unlearnable Case
4
背 景 (4)
5
• 空間領域での組合せ→(通常の)アンサンブル学習
• 時間領域での組合せ→時間方向アンサンブル学習
目 的
• 時間方向アンサンブル学習の汎化能力
をオンライン学習の枠組みで統計力学
的手法を用いて解析
6
モデル(1)
生徒の長さ
7
モデル(2)
ノイズあり線形パーセプトロン
教師の出力
生徒の出力
8
モデル(3)
二乗誤差
勾配法
f
9
汎化誤差
多重ガウス分布
誤差
10
巨視的変数のダイナミクスを記述する連立微分方程式
t = m/N
11
巨視的変数のダイナミクスを記述する連立微分方程式
サンプル平均
12
巨視的変数の解析解
13
汎化誤差
多重ガウス分布
誤差
14
ノイズ無し
ノイズ有り
(σB2=σJ2=0.2)
15
(η=1,σB2=σJ2=0.2)
t1
t2
t1
t2
t
t
t1
t2
t1
t2
t
t
16
0.25
( CK=1/K, σJ2=σB2=0.5, t1→∞, tk+1 - tk→∞ )
17
まとめ
• 空間領域での組合せ→(通常の)アンサンブル学習
時間領域での組合せ→時間方向アンサンブル学習
• ノイズ有り線形パーセプトロンの汎化能力をオンライ
ン学習の枠組みで統計力学的手法を用いて解析
• 通常のアンサンブル学習の2倍の効果
18