強化学習(サッカーエージェント) 強化学習とは • 強化学習とは,試行錯誤を通じて環境に適応 する学習制御の枠組である. 教師付き学習と は異なり,状態入力に対する正しい行動 出 力を明示的に示す教師が存在しない.かわり に報酬という情報を 手がかりに学習する. Q-Learningについて • 更新式 Q-learningについての上の更新則を言葉で表す と「時刻tにおける状態とその時にとりうる行動に おける行動価値を、行動をとった場合にその行 動によって得る報酬と,行動後の状態において最 も高い行動価値を有する行動を選択すると考え て行動価値を用いて修正する。 Q-Learning2 • もっと簡単に説明すると 例えば、犬が餌をもらうためにお手や、お座りを するのと同じで、このような(お手やお座り)行動で エサがもらえるからということを学習した結果が 生み出したもの. これと同じで、Q-Learningでも何も知らない状態か らエサ(報酬)がもらえる行動をするように学習が 進んでいく.この場合のエサ(報酬)は自分たちで 設定できる. 現在の研究 • この学習を使用してサッカーエージェントを 使って研究を進めている. • 動画見てね!!
© Copyright 2024 ExpyDoc