ややプログラム紀行

博士2年のプログラムに関する日記

2021-03-28から1日間の記事一覧

Sarsa

OpenAI Gymの練習と強化学習の理解のためにMountainCar-v0タスクをSarsaと線形回帰の組み合わせで解くプログラムを書いてみた 学習前、適当に行動を選んでいる時の様子↓ 1500ステップ刻みでの学習の様子↓*1 やっぱこういうのは実際に見れる形にした方が盛り…