[TOC]
0.1. 多変量正規分布のKLダイバージェンス
2つのd次元多変量正規分布p(x)=N(x;μ1,Σ1),q(x)=N(x;μ2,Σ2)のKLダイバージェンスKL[P(X)||Q(X)]は以下である.
KL[P(X)||Q(X)]=12(log|Σ2||Σ1|+Tr[Σ−12Σ1]+(μ1−μ2)TΣ−12(μ1−μ2)−d)
参考資料
平均μ,共分散行列Σのd次元多変量正規分布は以下で与えられる.
N(x;μ,Σ)≡|Σ|−1/2(2π)d/2exp(−12(x−μ)TΣ(x−μ))
ここで,p(x)=N(x;μ1,Σ1),q(x)=N(x;μ2,Σ2)の間のKL情報量
KL[P(X)||Q(X)]≡∫p(x)logp(x)q(x)dx
を計算する.まず,logp(x)q(x)を整理する.
logp(x)q(x)=logp(x)−logq(x)=12(log|Σ2||Σ1|+(x−μ2)TΣ−12(x−μ2)−(x−μ1)TΣ−11(x−μ1))
よって,
KL[P(X)||Q(X)]=12(log|Σ2||Σ1|+Ep[(x−μ2)TΣ−12(x−μ2)]−Ep[(x−μ1)TΣ−11(x−μ1)])
となる.
また,Kを体(R),x∈Kn,A∈Kn×nとすると簡単な計算からトレースについてxTAx=Tr[xTAx]=Tr[AxxT]が一般に成立することに注意すると,
Ep[(x−μ2)TΣ−12(x−μ2)]=Ep[Tr[Σ−12(x−μ2)(x−μ2)T]]=Tr[Ep[Σ−12(x−μ2)(x−μ2)T]]=Tr[Σ−12(Ep[xxT]−Ep[xμT2]−Ep[μ2xT]+Ep[μ2μT2])]
また,平均の定義よりEp[x]=μ1であるので,Ep[xμT2]=μ1μT2,Ep[μ2xT]=μ2μT1である.
また,分散の定義より
Σ1≡Ep[(x−μ1)(x−μ1)T]=Ep[xxT]−Ep[xμT1]−Ep[μ1xT]+Ep[μ1μT1]=Ep[xxT]−μ1μT1
であるので,
Ep[(x−μ2)TΣ−12(x−μ2)]=Tr[Σ−12(Ep[xxT]−Ep[xμT2]−Ep[μ2xT]+Ep[μ2μT2])]=Tr[Σ−12(Σ1+μ1μT1−μ1μT2−μ2μT1+μ2μT2)]=Tr[Σ−12(Σ1+(μ1−μ2)(μ1−μ2)T)]=Tr[Σ−12Σ1]+(μ1−μ2)TΣ−12(μ1−μ2)
また第3項についても同様に計算を行うと
Ep[(x−μ1)TΣ−11(x−μ1)]=Ep[Tr[Σ−11(x−μ1)(x−μ1)T]]=Tr[Σ−11Ep[(x−μ1)(x−μ1)T]]=Tr[Σ−11Σ1]=d
ゆえに,
KL[P(X)||Q(X)]=12(log|Σ2||Σ1|+Tr[Σ−12Σ1]+(μ1−μ2)TΣ−12(μ1−μ2)−d)
Let S is a n-by-n symmetric matrix and U is a n-by-n orthogonal matrix.
Then det(S)=det(USUT)
(proof)
Since det(S) is the products of n eigenvalues of S, it is necessary to prove that all eigenvalues of S and USUT are same.
As S is a symmetric matrix, USUT is also symmetric matrix. Hence, there exists a orthogonal matrix Q such that QUSUTQT=QUS(QU)T is the diagonal matrix whose diagonal entries are the eigenvalues of USUT and S.
Last modified by akirat1993 2020-01-24 18:45:17
Created by akirat1993 2019-06-28 20:44:20