0.1. モデル

0.1.1. 事後分布の表現

下記のような生成モデルが与えられたとする。

つまり、生成分布として以下が存在

  • の確率密度関数
  • が与えられた下でのの確率密度関数
  • が与えられた下でのの確率密度関数

また、は直交行列でを満たすとする。

この時、は上記の確率密度関数を用いて表現可能。

仮定より$z = Us$であるのでである。また、 であり、右辺の分子については 右辺の分母については 第1項については であるので、まとめると となり、与えられた確率密度関数を用いて表現できる。

0.1.2. 対数尤度関数の最大化

を近似するパラメータによって特徴づけられるエンコーダを用意してJensen's inequalityを用いると以下の式変形から変分下限を求めることが出来る。

0.1.3. 復元誤差の最小化

対数尤度関数の変分下限は下記の式であった。 続いて、右辺の2項目の最大化について考える。

VAEと同じくデコーダーは事前分布を上手く近似できていると考える。

デコーダーが分布を出力する場合

この時モンテカルロ法を用いると右辺は以下のように近似できる。 ただし、は独立にに従っているとする。

ゆえに、損失関数は以下のようにする。

デコーダーが一点分布の場合

損失関数を復元した際の誤差で定める。 ただし、,である。また、は元データと復元データの距離を測る関数で一般にはノルムやノルムの2乗などを用いる。

0.2. Appendix

0.2.1. Lemma1

Let satisfies and where is the -dimensional identity matrix and is the set of -by- symmetric matrices. Then

where means the trace of the matrix .

(proof)

は対称行列なので直交行列が存在して、 と表せる。ここでは対角成分にの固有値をとる対角行列である。

表記の簡略化の為にと定義すると、 と表される。とすると、であるので、任意のに対して、であることに留意すると、

0.2.2. Lemma2

Let satisfies and where is the -dimensional identity matrix and is the set of -by- positive definite matrices. Then

(proof)

であるのでである。ゆえに,に注意すると、Lemma1より

0.2.3. Lemma3

where is the set of -by- positive definite matrices.

(proof)

であるので、任意のに対してであることに注意すると、

0.2.4. Lemma4

Let , , and where represents multivariate normal distribution with its mean vector and covariance matrix .

Then

(proof) 定理3

0.2.5. Lemma5

Let and where represents multivariate normal distribution with its mean vector and covariance matrix . Then

(proof) see this website

ちなみに、が正定値行列であることはLemma3で示している。

0.2.6. Lemma6

Let are independent random vectors having density function and is the function whose domain is .

Then are also independent random vectors.

(proof)

と定義する。 参考資料

0.2.7. Lemma7

Let are independent continuous random vectors having density function , and are also independent continuous random vectors having density function .

Then, the Kullback-Leibler divergence of from is

(proof)

Since are independent, . It is also true for , hence we have

0.2.8. Theorem1

Let , , satisfies , and where represents multivariate normal distribution with its mean vector and covariance matrix .

We define and . Then,

where is the Wasserstein distance.

(proof)

であるので、を示せば十分。Lemma4より である。であることから、であることに注意すると

Lemma5より ここで、1項目にはであることを用いて、2,3項目にはLemma1を用い、Lemma3より正定値行列であることに注意してLemma2を用いると、

Last modified by akirat1993 2020-04-11 18:47:14
Created by akirat1993 2020-04-11 18:47:14

results matching ""

    No results matching ""