強化学習(サッカーエージェント).

強化学習(サッカーエージェント)
強化学習とは
• 強化学習とは,試行錯誤を通じて環境に適応
する学習制御の枠組である. 教師付き学習と
は異なり,状態入力に対する正しい行動 出
力を明示的に示す教師が存在しない.かわり
に報酬という情報を 手がかりに学習する.
Q-Learningについて
• 更新式
Q-learningについての上の更新則を言葉で表す
と「時刻tにおける状態とその時にとりうる行動に
おける行動価値を、行動をとった場合にその行
動によって得る報酬と,行動後の状態において最
も高い行動価値を有する行動を選択すると考え
て行動価値を用いて修正する。
Q-Learning2
• もっと簡単に説明すると
例えば、犬が餌をもらうためにお手や、お座りを
するのと同じで、このような(お手やお座り)行動で
エサがもらえるからということを学習した結果が
生み出したもの.
これと同じで、Q-Learningでも何も知らない状態か
らエサ(報酬)がもらえる行動をするように学習が
進んでいく.この場合のエサ(報酬)は自分たちで
設定できる.
現在の研究
• この学習を使用してサッカーエージェントを
使って研究を進めている.
• 動画見てね!!