2015 年 5 月 28 日 正誤表(岡谷貴之著,機械学習プロフェッショナルシリーズ「深層学習」第 1,2 刷) 箇所 誤 正 50 頁最後のパラグ 順伝播計算は,U(1) ≡ X 順伝播計算は,Z(1) ≡ X ラフ 52 頁の 2 番めの式 ∂b(l) = 63 頁第 1 行 { (l) δj 99 頁の 10 行目 ∂b(l) = い(Dy ≤ Dx ) 場合であっても, 65 頁式 (5.4) 96 頁の 1 番目と 2 番めの式 1 (l) ⊤ ∆ 1N N = ··· + い(Dy > Dx ) 場合であっても, ( )} ρ 1−ρ (l) − f ′ (uj ) + ρ̂j 1 − ρ̂j (l) δj z(l) = f (l) (u) z(l) = f (l) (u(l) ) 約 200,000 ミ ニ バッチ,す な わ ち 2 万 × 約 200,000 ミ ニ バッチ,す な わ ち 20 万 × 128/(総学習サンプル=数百万)=約 25 エポッ 128/(総学習サンプル=約百万)=約 25 エ ポック クほど ほど ∑ E(w) = − ··· n 122 頁下から 2 行 { ( )} ρ 1−ρ (l) ··· + β − f ′ (uj ) + ρ̂j 1 − ρ̂j u(l) = W(l) z(l−1) + b(l) E(w) = 119 頁の式 (7.7) の = u(l) = W(l) u(l−1) + b(l) 115 頁の式 (7.1) カッコ内の第 2 項 1 (l) ∆ 1N N ∑ ∑ ··· n ∑ wjj ′ δjt+1 ′ j′ wj ′ j δjt+1 ′ j′ 内部のメモリセルは 内部のメモリセル(図 7.7a)は 目 1 箇所 誤 123 頁の第 2,3,4,6 式 正 utj = ∑ (in) wji xtj + ∑ j′ j ··· = f ∑ ··· = f ··· = f F,in t wji xj wjj ′ zjt−1 I,in t wji xj + O,in t wji xj ∑ j′ + ∑ j′ j ∑ in t wji xi + ∑ j′ i j ∑ ∑ utj = + ∑ j j′ t−1 F wjj ′ zj t−1 I wjj ′ zj O t−1 wjj ′ zj + + + st−1 j ··· = f ∑ sjt−1 ··· = f F,in t wji xi + stj ··· = f I,in t wji xi + i ∑ ∑ j′ i ∑ wjj ′ zjt−1 ′ O,in t wji xi t−1 F wjj ′ zj ′ ∑ j′ + + wjI st−1 j t−1 I wjj ′ zj ′ ∑ i + wjF st−1 j j′ O t−1 wjj ′ zj ′ + wjO stj 123 頁の 10 行目に追加 wjF , fと wjI ,はそれぞれ,メモリセルから忘却ゲートと入力ゲートの値を決めるユニット(図 7.7 の c)への結合の sjt−1 の重みです.これらは下で扱う出力ゲートに関する同様の結合とあわせ て, 「のぞき穴(peephole)」結合とも呼ばれています. 上の 123 頁の訂正およ 最初に提案された LSTM(wjF = wjI = wjO = 0 に相当,文献 [30])では,出力ゲートが閉じて び追加についての備考 いると各ゲートはセルの状態を知ることができず,タスクによってはこれが問題となる場合が ありますが, 「のぞき穴」結合はこれを解決します(参考:F. Gers, N. N. Schraudolph, and J. 124 頁中央からの 3 つ Schmidhuber, Learning Precise Timing with LSTM Recurrent Networks, Journal of Machine Learning Research, 3:115-143, 2002). ∑ out t ∑ zj であり, vkt = j wkj uout,t = j wkj zjt であり, k の式 ∂uout,t k = wkj f ∂uO,t j ′ out ′ O,t = wkj f (uj )f (stj ) となります.もう一つの伝播先の,次時刻の メモリユニットへの総入力についても同様に メモリユニットへの総入力についても同様に 計算でき,したがって gjO,t を出力するユニッ 計算でき,したがって gjO,t を出力するユニッ トのデルタは トのデルタは ∑ wkj δkout,t + k 125 頁の最初の式 行目 ∂uO,t j となります.もう一つの伝播先の,次時刻の ϵtj = 129 頁の 10 行目と 11 ∂vkt t (uO,t j )f (sj ) ∑ wj ′ j δjt+1 ′ ϵtj = ∑ out out,t wkj δk + ∑ k j′ 誤: δjcell,t = δ̃jt + gjF,t+1 ϕt+1 + δjI,t+1 + δjF,t+1 + δjO,t j 正: δjcell,t = δ̃jt + gjF,t+1 δjcell,t+1 + wjI δjI,t+1 + wjF δjF,t+1 + wjO δjO,t wj ′ j δjt+1 ′ j′ p(l|X) = α|L′ |,T + α|L′ |+1,T のように計算でき ます(図 7.8 にもあるように,有効なパスはい p(l|X) = α|l′ |,T + α|l′ |−1,T のように計算でき ます(図 7.8 にもあるように,有効なパスはい つも,最後の時刻 t = T では |L′ | か |L′ | + 1 つも,最後の時刻 t = T では |l′ | か |l′ | − 1 の のいずれかに到達するはずであることから). いずれかに到達するはずであることから). 129 頁最後の式 − ∑ − log p(d|X) n 130 頁下から 4 行目 134 頁の最初の式中 ∑ log p(dn |Xn ) n l̂ = B(π) とする方法です. l̂ = B(π̂) とする方法です. Φ(xn |θ) Φ(xn , θ) 2 箇所 誤 正 139 頁の 2 番めの式 L(θ) = N ∑ p(vn |θ) n=1 141 頁の 7 行目 149 頁の式 (8.20c) 150 頁の 11 行目と 14 行目の式 隠れ変数を指定したときの可視変数の条件付 可視変数を指定したときの隠れ変数の条件付 き分布 p(v|h, θ) は,定義により き分布 p(h|v, θ) は,定義により ( ) (0) (T ) ∆bj = ϵ hj − pj ( ) (0) (T ) ∆bj = ϵ pj − pj σ(x − i + 5) σ(x − i + 0.5) p(h(l) |h(l+1) ) = ∏ (l) σ(bi + i 153 頁の式の最後の項 155 頁の最初の式 ∑ (l+1) (l+1) hj ) wij ∑∑ (l) ∑ j (l) − (l) p(hi = 1|h(l+1) ) = σ(bi + j (l) p(hj |h(l−1) ) = · · · j 154 頁の最後の式 p(vn |θ) n=1 152 頁の最初の式 152 頁の 2 番めの式 N ∏ L(θ) = p(hj = 1|h(l−1) ) = · · · (2) (1) (2) − wij hj hj ∑∑ j k p(vi |h(1) ) = · · · (2) (1) (2) wjk hj hk k p(vi = 1|h(1) ) = · · · (l) (l) p(hj |h(1−1) ) = · · · p(hj = 1|h(l−1) ) = · · · 3 (l+1) (l+1) hj ) wij
© Copyright 2025 ExpyDoc