[TOC]
1. 異常検知と変化検知(井出剛 杉山将)
1.1. 証明補足
1.1.1. p49(4.12)
∂Ψ(A)∂A=1NXCXT
Proof.
∂Ψ(A)∂A=1∂A(1NN∑n=1∑j∈N(n)((1−μ)d2A(x(n),x(j))+μN∑l=1I[y(l)≠y(n)][1+d2A(x(n),x(j))−d2A(x(n),x(l))]+))
Since
N∑l=1[y(l)≠y(n)][1+d2A(x(n),x(j))−d2A(x(n),x(l))]+=∑l∈Nn,j1+d2A(x(n),x(j))−d2A(x(n),x(l))
and
1∂Ad2A(x(n),x(j))=1∂A(x(n)−x(j))TA(x(n)−x(j))=(x(n)−x(j))(x(n)−x(j))T(∵∂∂XaTXb=abT)=[x(1),…,x(N)](en−ej)(en−ej)T[x(1),…,x(N)]T=XC(n,j)XT
proof of ∂∂XaTXb=abT is here
Then,
=1NX(N∑n=1∑j∈N(n)((1−μ)C(n,j)+μ∑l∈Nn,jC(n,j)−C(n,l)))XT=1NXCXT
1.1.2. 多変量正規分布のベイズ公式p97
平均μ, 分散共分散行列Σの多次元正規分布をN(x∣μ,Σ)と表す.
つまりN次元確率ベクトルXがN(x∣μ,Σ)に従うときXの確率密度関数は
f(x)=|Σ|−1/2(2π)n/2exp(−12(x−μ)TΣ−1(x−μ))
である。ここでn次元確率ベクトルXとm次元確率ベクトルYが以下を満たすと仮定する。
p(y∣x)=N(y∣Ax+b,L−1)p(x)=N(x∣μ,Λ−1)
ただし、A∈Rm×n,b∈Rm, L−1∈Rm×m, μ∈Rn×n,Λ−1∈Rn×n
この時,以下が成り立つ
p(x∣y)=N(x∣M{(ATL(y−b)+Λμ},M)p(y)=N(y∣Aμ+b,L−1+AΛ−1AT)
ただし、M:=(ATLA+Λ)−1
(proof)
xとyの同時分布
z:=(xy)を定義すると, p(z)=p(x)p(y∣x)なので,
lnp(z)=lnp(x)+lnp(y∣x)=−12(x−μ)TΛ(x−μ)−12(y−Ax−b)TL(y−Ax−b)+const=−12{(2nd order of x,y)+−2(xT,yT)(Λμ−ATLbLb)+const}∵(L−1)T=L−1⇒LT=L
x,yの2次の項に対しては
2nd order of x,y=xT(Λ+ATLA)x+yTLy−yTLAx−xTATLy=(xT,yT)(Λ+ATLA−ATL−LAL)(xy)=zTRz
ゆえに,
lnp(z)=−12{zTRz−2zT(Λμ−ATLbLb)}+const
また、シューアの補行列より
R−1=(Λ+ATLA−ATL−LAL)−1=(Λ−1Λ−1ATAΛ−1L−1+AΛ−1AT)
であるので,
p(z)=const⋅exp{−12(zTRz−2zTc)}where c:=(Λμ−ATLbLb)=const⋅exp{−12(z−μz)TR(z−μz)}wehere c=Rμz⇔μz=R−1c
∫dzf(z)=1より
f(z)=|R−1|−1/2(2π)2N/2exp(−12(z−μz)TR(z−μz))
また,
μz=R−1c=(Λ−1Λ−1ATAΛ−1L−1+AΛ−1AT)(Λμ−ATLbLb)=(μAμ+b)
多変数正規分布の分割公式をp(y)に対して用いると
p(y)=(p(xb)=N(xb∣μb,Σbb))=N(y∣Aμ+b,L−1+AΛ−1AT)
同様に
p(x∣y)=N(μx∣y,Σx∣y)
に関しても多変数正規分布の分割公式を用いると,
μx∣y=(=μa−Λ−1aaΛab(xb−μb))=μ−(ATLA+Λ)−1⋅(−ATL)(y−Aμ−b)=(ATLA+Λ)−1(ATL(y−b)−ATLAμ)+μ=(ATLA+Λ)−1(ATL(y−b)+Λμ)−(ATLA+Λ)−1(Λμ+ATLAμ)+μ=(ATLA+Λ)−1(ATL(y−b)+Λμ)Σx∣y=(Σa∣b=Λ−1aa)=(Λ+ATLA)−1
参考文献
1.2. Appendix
1.2.1. 2次形式の微分
Let X be a N×N matrix, and a,b are N-dimensional vectors. Then,
∂∂XaTXb=abTwhere aT is the transpose of a
(Proof)
(A)i,j denotes the (i,j) element of matrix A.
(∂∂XaTXb)ij=∂∂xi,jaTXb=∂∂xi,jN∑k=1(N∑l=1akxk,l)bl=aibj=(abT)i,j
1.2.2. シューアの補行列
シューアの補行列(Schur complement matrix)
Suppose A, B, C, D are respectivesly p×p,p×q,q×p and q×q matrices, and D is invertible. If M=A−BD−1C is invertible, then
(ABCD)−1=(M−1−M−1BD−1−D−1CM−1D−1+D−1CM−1BD−1)
Similarly, if A and R=D−CA−1B are invertible
(ABCD)−1=(A−1+A−1BR−1CA−1−A−1BR−1−R−1CA−1R−1)
Woodbury matrix identity
If we compare partitioned matrices, we get below results.
(A−BD−1C)−1=A−1+A−1B(D−CA−1B)−1CA−1(D−CA−1B)−1=D−1+D−1C(A−BD−1C)−1BD−1(A−BD−1C)−1BD−1=A−1B(D−CA−1B)−1(D−CA−1B)−1CA−1=D−1C(A−BD−1C)−1
(proof)
If we use LDU decomposition, we have shown that
(ABCD)=(IpBD−10Iq)(A−BD−1C00D)(Ip0D−1CIq)
Generally, it is true that det(AB)=det(A)det(B), so
(ABCD)=det(A−BD−1C)det(D)≠0
Therefore,
(ABCD)−1=(Ip0−D−1CIq)((A−BD−1C)−100D−1)(Ip−BD−10Iq)=((A−BD−1C)−1−(A−BD−1C)−1BD−1−D−1C(A−BD−1C)−1D−1+D−1C(A−BD−1C)−1BD−1)−1=(M−1−M−1BD−1−D−1CM−1D−1+D−1CM−1BD−1)
Similarly,
(ABCD)=(I0CA−1I)(A00D−CA−1B)(IA−1B0I)
Reference
detail of Schur Complement
1.2.3. 多変数正規分布の分割公式
N次元正規分布の確率密度関数を
N(x∣μ,Σ)=|Σ|−1/2(2π)N/2exp(−12(x−μ)TΣ−1(x−μ))
と表すことにする.このとき,xが次のように分割されたとする.
x=(xaxb)
これに対応して, μ,ΣとΛ:=Σ−1が次のように分割されているとする.
μ=(μaμb)Σ=(ΣaaΣabΣbaΣbb)Λ=(ΛaaΛabΛbaΛbb)
このとき, p(xa),p(xa∣xb)は以下に従う.
p(xb)=N(xb∣μb,Σbb)=N(xb∣μb,[Λbb−ΛbaΛ−1aaΛab]−1)
p(xa|xb)=N(xa∣μa∣b,Σa∣b)
ただし,
μa∣b=μa+ΣabΣ−1bb(xb−μb)=μa−Λ−1aaΛab(xb−μb)
Σa∣b=Σaa−ΣabΣ−1bbΣba=Λ−1aa
(Proof)
まず, 以下を示す
ΛTab=Λba,ΛTaa=Λaa,ΛTbb=Λbb
Σは正定値対称行列より、任意の首座行列式が正であるので、Σaaに逆行列が存在する。シューアの補行列(Schur complement matrixを用いると,
Λab=−Σ−1aaΣabR−1RT=(Σbb−ΣbaΣ−1aaΣab)T=Σbb−ΣbaΣ−1aaΣab(∵ΣT=Σ)=RΛTab=−R−1ΣbaΣ−1aa=Λba
Λにシューアの補行列を当てはめると, 公式中において
AT=ADT=DBT=C
である。
よって, 公式中において
RT=(D−CA−1B)T=D−CA−1B=R
より,ΛTbb=Λbb
また、公式中において
(−A−1BR−1)T=−R−1CA−1
であるので、ΛTaa=Λaa
よって、(11)は示された. 続いて本題に戻る.(11)を用いると
(x−μ)TΣ−1(x−μ)=(yayb)T(ΛaaΛabΛbaΛbb)(yayb)where ya=xa−μa,yb=xb−μb=yaTΛaaya+2yaTΛabyb+ybTΛbbyb=(ya+Λ−1aaΛabyb)TΛaa(ya+Λ−1aaΛabyb)+ybT(Λbb−ΛbaΛ−1aaΛab)xb=(xa−(μa−Λ−1aaΛab(xb−μb))TΛaa(xa−(μa−Λ−1aaΛab(xb−μb))+ybT(Λbb−ΛbaΛ−1aaΛab)yb
であり,
p(xb)=∫dxap(x)=const⋅exp{−12ybT(Λbb−ΛbaΛ−1aaΛab)yb}+∫dxaexp{−12(xa−(μa−Λ−1aaΛab(xb−μb))TΛaa(xa−(μa−Λ−1aaΛab(xb−μb))}=const⋅exp{−12(xb−μb)T(Λbb−ΛbaΛ−1aaΛab)(xb−μb)}
∫dxbp(xb)=1であるので,
p(xb)=N(xb∣μb,[Λbb−ΛbaΛ−1aaΛab]−1)
また, Σは正定値対称行列より,Λも正定値対称行列であることを踏まえシューアの補行列をΛに対して用いると,
Σbb=(Λbb−ΛbaΛ−1aaΛab)−1
が示せる.また、
p(xa∣xb)=p(x)p(xb)
であるので,
lnp(xa∣xb)=lnp(x)−lnp(xb)=−12{(xa−(μa−Λ−1aaΛab(xb−μb))TΛaa(xa−(μa−Λ−1aaΛab(xb−μb))+ybT(Λbb−ΛbaΛ−1aaΛab)yb}+12{ybT(Λbb−ΛbaΛ−1aaΛab)yb}+const=−12{(xa−(μa−Λ−1aaΛab(xb−μb))TΛaa(xa−(μa−Λ−1aaΛab(xb−μb))}+const
ゆえに, ∫dxap(xa∣xb)=1であることを考慮すると,
μa∣b=μa−Λ−1aaΛab(xb−μb)Σa∣b=Λ−1aa
ただし,
μa∣b=μa−Λ−1aaΛab(xb−μb)Σa∣b=Λ−1aa
シューアの補行列をΣに対して用いると, p
Λ−1aa=(M=A−BD−1C)=Σaa−ΣabΣ−1bbΣba
Λ−1aaΛab=(M⋅(−M)BD−1=−BD−1)=−ΣabΣ−1bb
ただし式変形で公式に対応するものは()でくくった.
よって、μa∣b,Σa∣bは以下のように変形出来る.
μa∣b=μa−Λ−1aaΛab(xb−μb)=μa+ΣabΣ−1bb(xb−μb)Σa∣b=Λ−1aa=Σaa−ΣabΣ−1bbΣba
Last modified by akirat1993 2019-12-28 16:30:03
Created by akirat1993 2019-05-26 02:56:51