2021-03-24から1日間の記事一覧
近況: シンエヴァを2回見た、面白かった*1 SuttonのReinforcement LearningのPart 1: Tabular Solution Methodsを読み直してちょいちょい実装してみた とりあえず自分の理解をまとめると、強化学習には(i)方策を直接計算するか価値関数を推定してから方策を…
近況: シンエヴァを2回見た、面白かった*1 SuttonのReinforcement LearningのPart 1: Tabular Solution Methodsを読み直してちょいちょい実装してみた とりあえず自分の理解をまとめると、強化学習には(i)方策を直接計算するか価値関数を推定してから方策を…