ほとんどのPACベイズ解析は、その証明の根幹にDonsker-Varadhan's variational formulaというものを用いる
任意の確率分布と可測関数*1に対して以下が成り立つ:
ただし、は上の確率分布全ての集合を表す
よって特に、上式の両辺を指数の肩に乗せることで
この補題はPACベイズ解析で次のような使われ方をする;
例えばデータを生成する未知の分布、区間に値をとる損失関数、仮説集合からなる学習問題を考え、今個の訓練データを観測したとする
この時、Donsker-Varadhan's variational formulaにおける可測関数として次のようなものを考えてみる:
すると、は個の独立同分布な確率変数の和になっているので、Hoeffdig's lemmaより
モーメント母関数を評価できると何が嬉しいだろうか?
例えばMarkov's inequalityを利用すると、任意のに対して
Exponential Stochastic Inequality
このように、PACベイズ解析ではモーメント母関数の評価が主な作業であり、まともに数式を書いていこうとすると毎回指数の肩に式を乗せる羽目になるので割と煩雑になりやすい
そこで、近年のPACベイズ解析ではExponential Stochastic Inequality (ESI*2 )という書式が使われることがある
任意のと確率変数に対して
特に、上式右辺の期待値が確率変数についてのものであることを強調したい時はと書く
ESIを用いることで、大抵のPACベイズ解析の流れは次のようにパッケージ化できる:
あるについて、をを満たす確率変数の族とするとき、任意の事前分布と事後分布に対して
が成り立つ
ESIの主要な性質に関しては、例えば[2]が参考になる
最近ブログで数式を書くことが増えてきてはてなブログで記事を書くのが少し大変なので、GitHub Pagesとかに引っ越そうかな〜とか考え始めてる
ブログ形式で数式を書く一番良い方法はなんなんだろか
参考文献
[1] Olivier Catoni. A PAC-Bayesian approach to adaptive classification. 2004.
[2] Mhammedi et al. PAC-Bayes Un-Expected Bernstein Inequality. 2019.