最近研究室が思ったより理論系だと知ってから急いでklenkeさんのprobability theoryを読んでる
この本の中でRegular Conditional Distributionって概念を初めて知ったんだけど、最初何言ってるんだこいつ?ってなったから自分用にまとめてみることにした😤
初等的な条件付き期待値
条件付き期待値(conditional expectation)といえば名前の通り条件が課された時の期待値で、条件を課すっていうのはつまり確率空間で考える対象の標本を制限するってことだから次のような定義ができる(以下確率空間は)
Definition 8.9 Let and . Then we define \begin{align} \mathbf{E}[ X \mid A ] := \int X(\omega) \mathbf{P}[d\omega \mid A ] = \begin{cases} \frac{\mathbf{E}[ 1_A X ]}{\mathbf{P}[A]} & \text{if}\ \mathbf{P}[A] \gt 0 \\ 0. & \text{else}. \end{cases} \end{align}
]で割ってるのは事象に制限した時のの平均を求めたいから
で、上の定義は事象に対してのみ考えた値だけど、場合分けの要領で可算個の互いに素な事象に対する条件付き期待値をまとめて関数を考えることもできる
つまりを可算集合、を互いに素な事象の族でであるとした時、と書くことにすると確率変数に対して関数を \begin{align} \mathbf{E}[ X \mid \mathcal{F} ](\omega) = \mathbf{E}[ X \mid B_i ] \Leftrightarrow \omega \in B_i \end{align} と定義できる*1
測度論的な条件付き期待値
上の定義だと例えば実数値をとる確率変数に対してみたいなのを考えたい時にどうするんや!って話になるけど、測度論的な条件付き期待値を使えば何とかなる
初等的定義だと可算個の互いに素な事象族の条件付き期待値だったけど、測度論的な条件付き期待値だとより一般的に部分-加法族に対して定義される
Definition 8.11 (Conditional expectation) A random variable Y is called a conditional expectation of given , symbolically , if:
- (i) is -measurable.
- (ii) For any , we have .
For , is called a conditional probability of given the -algebra
初等的な定義と比べてだいぶ抽象的になってる気がする*2けど、この2つの条件で十分なことが次の定義でわかる
Theorem 8.12 exists and is unique (up to equality almost surely)
証明はに対してが有限測度かつに対して絶対連続であることからRadon-Nikodym theoremを用いて示される
気持ち的には初等的定義の場合分けをもっと細かくして、部分-加法族を通してどれくらいに関する情報を得られるかみたいな事を表してる(と思ってる)
より細かい事象に関してはからは分からなくて、その部分はあくまで平均の値しかわからないってイメージ
次に今定義した測度論的条件付き期待値を使ってを考えてみる
気持ち的にはが-measurableだから上では全部同じ値になってて、それをの値として採用できれば良さそうだけど、次の補題でそれを正当化できる
Corollary 1.97 (Factorization lemma) Let be a measurable space and let be a nonempty set. Let be a map. A map is --measurable if and only if there is a measurable map such that .
の場合を考えるとと表せるが、よりとなるが存在してとおけばいい
上の補題よりに対してとなるが存在するので、それをと定義する
Regular Conditional Distribution
日本語でなんていうのかよく分からなかったから英語のままにした、正則条件付き期待値かな
初等的な条件付き確率はそれ自体が再び測度になってた訳だけど、の場合は一筋縄ではいかない
というのも測度論的条件付き確率は殆ど至る点でしか定義されてなくて*3、しかもその定義されてない零集合はに依存して決まるから任意の(非可算個あるかもしれない)事象についての零集合を足し合わせた場合にそれが再び零集合になるとは限らないから
しかし、(klenkeの言葉を借りると)もし-加法族が可算個ので十分精度よく近似することが出来れば、その可算個のに対する条件付き確率を組み合わせて測度を構成できるかもしれない、、、という希望がわく
Definition 8.25 (Transition kernel, Markov kernel) Let be measurable spaces. A map is called a (-)finite transition kernel (from to ) if:
- (i) is -measurable for any
- (ii) is a (-)finite measure on for any
If in (ii) the measure is a probability measure for all , then is called a stochastic kernel or a Markov kernel. If in (ii) we also have for any , then is called sub-Markov or substochastic.
このtransition kernelを用いて測度の性質を満たした条件付き確率であるregular conditional distributionを定義する
Definition 8.28 Let be a random variable with values in a measurable space and let be a sub--algebra. A stochastic kernel from to is called a regular conditional distribution of given if \begin{align} \kappa_{Y, \mathcal{F}}(\omega, B) = \mathbf{P}[ \{ Y \in B \} \mid \mathcal{F} ](\omega) \end{align} for -almost all and for all ; that is, if \begin{align} \int 1_B (Y) 1_A d\mathbf{P} = \int \kappa_{Y, \mathcal{F}}( \cdot, B)1_A d\mathbf{P}\quad \text{for all}\ A \in \mathcal{F}, B \in \mathcal{E} \end{align} Consider the special case where for a random variable (with values in an arbitrary measurable space ). Then the stochastic kernel
(the function from the factorization lemma with an arbitrary value for ) is called a regular conditional distribution of given
最後のっていうのはfactorization lemmaにおけるとなるに対して便宜的にと書く記法によるもの*4
結局このtransition kernelとかいうものが存在してくれれば嬉しいんだけど、これはBorel spaceであれば存在する
Theorem 8.37 (Regular conditional distribution) Let be a sub--algebra. Let be a random variable with values in a Borel space (hence, for example, Polish,, etc.). Then there exists a regular conditional distribution of given .
証明の順序としては、まずが実数値確率変数である場合に示して、次にBorel spaceがと同型である事を利用して示す(ここで)
実数での証明はなかなか一言でまとめづらいけど、累積分布関数が可算個の事象を使って十分表せる事を利用する感じ
上の定理に書いてある通り、まぁ少なくとも自分の応用上はまずregular conditional distributionが存在する、つまりが測度であると思っても良さそうかな?
とりあえずRegular conditional distributionに関するお気持ち的なのをまとめてみたけど、少しは頭の中で整理されたと思う
ただ、regularうんたらが存在することが分かっても、具体的にどういう形をしてんだよっ!って疑問はまだ少しある
今回は書かなかったけど、一応本にはが密度関数を持つ時にの密度関数はで表せるよ*5、みたいな話も載ってて、これが思ったより強いのかもしれない
はてなブログで数式書くのしんどすぎた