昔からなんとなく凸解析や双対全般に対して苦手意識みたいなものがあって、おそらく一番の理由は僕自身が凸関数のことを舐めているからだと思う
と言うのも、"凸"関数や"線形"計画法みたいなものは使える状況が限られるような印象が名前から感じられて、今までちゃんと授業なりで勉強をしたことがなかったから*1
ただ、厄介なことにこいつらはたまに必要になる瞬間があって、しかも凸関数/線形計画法は考える問題を限定しているがゆえとても歴史が深く、知識が必要な時にその分野を知っている人と知らない人だとかなり差がつくことになる
例えば、最適輸送の勉強中に次の定理を見かけたことがある*2
(Fenchel-Rockafellar) Let be a normed space and let ] be convex and lower semicontinuous. If there exists such that is continuous in , then
Convex Optimization – Boyd and Vandenbergheを読んだことはあるけど、なんか自分が知ってるのと違うぞ!!
この定理は最適輸送におけるKantorovich-Rubinstein双対を示すために使われていて、この双対は確率分布が離散的ならよくあるLagrange双対から示されることを踏まえると、↑の定理は自分の知っているLagrange双対より一般的な形なんだろなという気はしてくる
当時これを読んだ時はよく分からないけど成り立つんだろう、とスルーしてたけど、最近研究でまた凸関数を見かけることがあって、いい加減このモヤモヤを解消したくなり少し詳し目の凸解析の本を参照してみた
link.springer.com
自分は勉強しててすぐ脇道に外れちゃう癖があるので今回も↑の定理についてだけ調べようと思っていたのだけど、本の書き方が複雑すぎて結局結構読んでしまった気がする...
以降はこの本を読んで分かったことをめちゃくちゃフィーリングで書こうと思う
まず、考える空間は基本的に実ヒルベルト空間で、主な対象はproper lower semicontinuous convexな関数 ]となる
properとは値域にを含まないこと、lower semicontinuousは任意の点でが成り立つことを意味するのだけど、「lower semicontinuous convexである」とは「エピグラフが凸かつ閉である」と言い換えられる
proper lower semicontinuous convexな関数はとても良い性質を持っていて、はaffine minorants、すなわちを下から抑えるような一次関数によって特徴づけられる
幾何的なイメージとしては、凸関数に接する一次関数を考えて、傾きを徐々に大きくしていくことで一次関数が凸関数の下を滑っていくような感じ
このことから、の双対として任意のに対する「傾きの最大のaffine minorants 」が分かればよく、これが所謂Legendre変換、もしくはFenchel共役につながる
を使うことで「傾きの最大のaffine minorants」はとして表せる
面白いことに、convexとは限らない任意の関数 ]に対しては必ずlower semicontinuous convexになり、特にがproper lower semicontinuous convexならばが成り立つ:*3
(Fenchel-Moreau) properな ]に対して、がlower semicontinuous convexであることとは同値
ちなみに、このFenchel-Moreau定理を少し発展させることで、convexとは限らない任意*4のproperな関数 ]についてはのlower semicontinuous convex envelopeになることがわかる:
ここからは今回本を読んで初めて知った
convexと限らない任意の関数 ]について、素直にとすることはできない
ではは何に対応するのだろう?
唐突だがinfimal convolutionと言う概念を導入する: のinfimal convolutionは
infimal convolution自体とても奥が深いものなのだけど、Legendre共役との関連で言うと次の特筆すべき性質を持つ:
任意のについて
proper lower semicontinuous convexながを満たすなら、はconvexでありが成り立つ
ここでは先ほどチラッと出てきたlower semicontinuous convex envelope
前者の性質については、がproper lower semicontinuous convexならであることからとなる
かなり惜しいところまで来ているが絶妙に非対称な関係になっており、これが綺麗にの関係で結ばれるためにはがlower semicontinuousである必要がある
残念なことに(?)、がlower semicontinuousとなるためにはさらに条件が必要となる:
(Attouch-Brezis) proper lower semicontinuous convexなが
を満たすなら
sriはstrong relative interiorの略だが、謎の条件は「のconical hullが閉な線形部分空間である」と言い換えることができる
「の正体が分かったところで何が言えるんだよ!?」となるかもしれないが、この定理から次のように冒頭で述べたFenchel-Rockafellar双対につながっていく
を解きたい主問題とすると、Legendre変換の定義よりこれはを求めるのと同じであることがわかる
すると先ほどのAttouch-Brezis定理より、が満たされるのであればが成り立ち、この右辺はinfimal convolutionの定義よりという双対問題を解こうとしているのに等しい、となるわけである
特にが成り立てばとなることが知られているので、ここまで来てようやく冒頭の定理を復元することができた
主問題/双対問題と聞くと次のような感じのLagrange双対問題を思い浮かべることが多いと思う
関数に対して主問題が
すると、Lagrange双対問題の解は常に主問題の解以下となり(弱双対)、適切な条件、例えばがconvexでSlater条件が成り立つときに両者は一致する(強双対)
実はこのLagrange双対問題の強双対性に関してもAttouch-Brezis定理から示すことができる
具体的な話は長くなってしまうので端折るが、方針としては次のような感じだ:
まず制約を満たす集合をと置き、関数を
すると主問題はとお馴染みの形になり、Slater条件から
最後が少しぼかし気味になったのはLagrange双対問題の形にたどり着くにはsubdifferentialの説明も必要だからで、今回本を読んでその辺りの知識も結構ためになったからいつか機会があればメモしときたい