ややプログラム紀行

博士2年のプログラムに関する日記

Reinforcement Learning

もう少し目的を持った研究を目指そうということで、まずは強化学習界のバイブルを読んだ*1

incompleteideas.net

数式をつらつら書いたり定理の証明をするというより、気持ちの説明に重きを置いていてめちゃくちゃ自分に合ってる本だった*2

いろんな手法のメリット、デメリットを実験と共に比較してすごい分かりやすいし、大御所目線から何が今後の課題なのかとかの説明がなされてて滅茶苦茶オススメできる(さすがバイブル

何よりこれでRL系の論文の話にある程度ついていけるっていうのが嬉しい

ただ、まだ雑にしか読んでなくて、例えばActor-Critic法って何?って聞かれた時にスムーズに説明できる自信がないからいずれもう一度読み直すと思う

 

2週間後に研究室のセミナーで発表しなくちゃいけないのにまだ発表できる内容がなくてヤバイから、ここからしばらくは気合入れて論文の感想とか記事に書けたらいいな

*1:読み終わったのは2週間ほど前だけど例に倣ってだらだらしてたらブログの更新に時間が経った

*2:実はMLPシリーズの強化学習は持ってたんだけど数式が多めで積読してた、今回RL読んで気持ちがわかったから改めて強化学習の方も読んでみようかな