0.1. モデル
0.1.1. 事後分布の表現
下記のような生成モデルが与えられたとする。
つまり、生成分布として以下が存在
- の確率密度関数
- が与えられた下でのの確率密度関数
- が与えられた下でのの確率密度関数
また、は直交行列でを満たすとする。
この時、は上記の確率密度関数を用いて表現可能。
仮定より$z = Us$であるのでである。また、 であり、右辺の分子については 右辺の分母については 第1項については であるので、まとめると となり、与えられた確率密度関数を用いて表現できる。
0.1.2. 対数尤度関数の最大化
を近似するパラメータによって特徴づけられるエンコーダを用意してJensen's inequalityを用いると以下の式変形から変分下限を求めることが出来る。
0.1.3. 復元誤差の最小化
対数尤度関数の変分下限は下記の式であった。 続いて、右辺の2項目の最大化について考える。
VAEと同じくデコーダーは事前分布を上手く近似できていると考える。
デコーダーが分布を出力する場合
この時モンテカルロ法を用いると右辺は以下のように近似できる。 ただし、は独立にに従っているとする。
ゆえに、損失関数は以下のようにする。
デコーダーが一点分布の場合
損失関数を復元した際の誤差で定める。 ただし、,である。また、は元データと復元データの距離を測る関数で一般にはノルムやノルムの2乗などを用いる。
0.2. Appendix
0.2.1. Lemma1
Let satisfies and where is the -dimensional identity matrix and is the set of -by- symmetric matrices. Then
where means the trace of the matrix .
(proof)
は対称行列なので直交行列が存在して、 と表せる。ここでは対角成分にの固有値をとる対角行列である。
表記の簡略化の為にと定義すると、 と表される。とすると、であるので、任意のに対して、であることに留意すると、
0.2.2. Lemma2
Let satisfies and where is the -dimensional identity matrix and is the set of -by- positive definite matrices. Then
(proof)
であるのでである。ゆえに,に注意すると、Lemma1より
0.2.3. Lemma3
where is the set of -by- positive definite matrices.
(proof)
であるので、任意のに対してであることに注意すると、
0.2.4. Lemma4
Let , , and where represents multivariate normal distribution with its mean vector and covariance matrix .
Then
(proof) 定理3
0.2.5. Lemma5
Let and where represents multivariate normal distribution with its mean vector and covariance matrix . Then
(proof) see this website
ちなみに、が正定値行列であることはLemma3で示している。
0.2.6. Lemma6
Let are independent random vectors having density function and is the function whose domain is .
Then are also independent random vectors.
(proof)
と定義する。 参考資料
0.2.7. Lemma7
Let are independent continuous random vectors having density function , and are also independent continuous random vectors having density function .
Then, the Kullback-Leibler divergence of from is
(proof)
Since are independent, . It is also true for , hence we have
0.2.8. Theorem1
Let , , satisfies , and where represents multivariate normal distribution with its mean vector and covariance matrix .
We define and . Then,
where is the Wasserstein distance.
(proof)
であるので、を示せば十分。Lemma4より である。であることから、であることに注意すると
、はLemma5より ここで、1項目にはであることを用いて、2,3項目にはLemma1を用い、はLemma3より正定値行列であることに注意してLemma2を用いると、