ややプログラム紀行

博士2年のプログラムに関する日記

機械学習

凸関数

youtu.be4D Blank Banshee 昔からなんとなく凸解析や双対全般に対して苦手意識みたいなものがあって、おそらく一番の理由は僕自身が凸関数のことを舐めているからだと思うと言うのも、"凸"関数や"線形"計画法みたいなものは使える状況が限られるような印象が…

Hamiltonian Monte Carlo

何となくHamiltonian Monte Carloの挙動を実際に見てみたかったので実装してみた Hamiltonian Monte Carloについては arxiv.org がわかりやすかった*1 Markov Chain Monte Carlo Hamiltonian Monte Carlo、略してHMCはMarkov Chain Monte Carlo(MCMC)に分子…

Online PCA

最近僕はcontinual learningの文脈でタスクの数に依存せずにリプレイバッファを構築する方法について考えているんだけど、ここら辺を研究しているとなんとなくonline pca、つまりオンライン主成分分析と関連性があるような気がしてくるリプレイバッファとい…

natural gradient

natural gradient descentは見かけるたびに怪しい理解のままスルーしてたので、ちょっとここら辺でちゃんと確認しておくかと思って↓を読んだ arxiv.orgnatural gradient descentといえば勾配にフィッシャー情報行列の逆行列をかけたものを使って更新してく奴…

Avalanche

youtu.be ケミカルブラザーズの久々の新曲、なんだかポップ 半年に一回ほどある研究室の発表が1週間後に迫っているにもかかわらず、進捗が塵ほどしかなくて震えている(毎度お馴染み 急いで色々実験してる訳なんだけど*1、その過程で利用したAvalancheというc…

Sarsa

OpenAI Gymの練習と強化学習の理解のためにMountainCar-v0タスクをSarsaと線形回帰の組み合わせで解くプログラムを書いてみた 学習前、適当に行動を選んでいる時の様子↓ 1500ステップ刻みでの学習の様子↓*1 やっぱこういうのは実際に見れる形にした方が盛り…

Catastrophic Forgetting

近況: シンエヴァを2回見た、面白かった*1 SuttonのReinforcement LearningのPart 1: Tabular Solution Methodsを読み直してちょいちょい実装してみた とりあえず自分の理解をまとめると、強化学習には(i)方策を直接計算するか価値関数を推定してから方策を…

Continual Learning

の勉強を最近していて、来週のセミナーでなんかしら進捗を発表しないといけないんだけど何も産んでいなくてかなりヤバイ 書いているうちにセミナーもとっくに終わって年が明けてた サーベイ論文としては www.sciencedirect.com www.sciencedirect.com arxiv.…

Singularity

新年明けて最初の記事は去年書き残してたcontinual learningに関するクソ雑レビューにしようと思ってたのに、あまりに優先順位が低すぎて順番が崩壊した 正月は友人から github.com というものを紹介されて量子コンピューターについて勉強してた(学部時代に…

Reinforcement Learning

もう少し目的を持った研究を目指そうということで、まずは強化学習界のバイブルを読んだ*1 incompleteideas.net 数式をつらつら書いたり定理の証明をするというより、気持ちの説明に重きを置いていてめちゃくちゃ自分に合ってる本だった*2 いろんな手法のメ…

特異学習理論

soundcloud.com テーマソング(安直 www.coronasha.co.jp を読んだ タイトルの通りそもそもベイズ統計が何かってところから始まって、後半は現実でベイズ統計を行うための方法まで書いてある 自分はそもそもベイズ自体ビミョーにしかわかってなかったから結構…

偏りと分散

SoundCloudのサジェストで結構かっこいいのに遭遇した somadril · 8va コメント欄を見る感じ、1つ目の曲の作者は2018年ごろに死んでしまったらしい Bias-Variance tradeoff 先日たまたまこんな論文を見かけたから読んでみた arxiv.org ニューラルネットワー…

PACベイズ

openreview.net という論文で汎化性能を測るための様々なモデル複雑度の性能が比較されていて、その中でもPAC-Bayesian Theoremに基づく指標たちの性能が良かったらしいのでちょっと勉強した PACベイズ まずPACベイズを知らなかったのでそこから勉強をはじめ…

モデル複雑度

Aphex Twinが前にSound CloudであげてたやつをStian Gjevikがミックスしたものらしい、今更知ったけどかっこいい www.mixcloud.com 最近、double descentについて知りたいということに起因してモデルの複雑度に興味がいってる*1 この論文が様々なモデル複雑…

Double Descent

卒論のスライドを作るときに、over-parametrizationは凄いんだぞ!みたいな軽い気持ちでいわゆるdouble descentのグラフを載せたところ、専門外の人たちには結構衝撃*1だったようで、卒論の内容じゃなくてこれに関する質問が飛んできた生憎その時はちゃんと…

PyTorch

実は殆ど深層学習に触れたことがないので春休みにちょっと慣れてみようと思って大学のサーバーにTensorFlow2.0を導入しようとしていたんですが、ちょっと癖のあるサーバーで悪戦苦闘した挙句、Bazel*1の明らかにバグな挙動にハマって5時間ほど溶かしました …

Neural Tangent Kernel

前回の記事はおそらくNeural Tangent Kernelというものから着想を得ていて、このなんちゃらカーネルが最近のover-parametrization流行を加速させたんじゃないかと思う Neural Tangent Kernel: Convergence and Generalization in Neural Networks [1806.0757…

グラム行列とover-parameterization

今の所卒論ではover-parameterization周りの事をできたらいいな〜と思ってて(理論系書ける気がしないけど)、ちまちまその話題の論文を読んでるのでブログに自分用メモを書いておく*1 over-parameterizationというのはニューラルネットワークにおいてニューロ…

自動微分

自分はtensorflowみたいなフレームワークがどうしても苦手で、このままでは仮に理論系をやるにしても歩き方を知らないで最適な走り方の研究をするようなものなので、まずはそのブラックボックスな部分を理解することにしました github.com ネーミングセンス…