一般エントリー 思考部分にはUCT(UCB applied to trees)[1]を使用しています. UCTを実行するスレッドを複数作成し合法手を割り当てることで,より多くのプレイアウトを 行えるようにしています. また,多くの棋譜から得られたパターンを用いて,より良いプレイアウトを行うようにしてい ます. 参考文献 [1]Kocsis, L.and Szepesvári, C. : Bandit Based Monte-Carlo Planning, 17thEuropean Conference on Machine Learning (ECML 2006)
© Copyright 2024 ExpyDoc