[TOC]

1. 異常検知と変化検知(井出剛杉山将)

1.1. 証明補足

1.1.1. p49(4.12)

$\frac{\partial Ψ (A)}{\partial A} = \frac{1}{N} X C X^{T}$

Proof. $\begin{matrix} \frac{\partial Ψ (A)}{\partial A} = & \frac{1}{\partial A} (\frac{1}{N} N \sum n = 1 \sum j \in N^{(n)} ((1 - μ) d_{A}^{2} (x^{(n)}, x^{(j)}) + μ N \sum l = 1 I [y^{(l)} \neq y^{(n)}] [1 + d_{A}^{2} (x^{(n)}, x^{(j)}) - d_{A}^{2} (x^{(n)}, x^{(l)})]_{+})) \end{matrix}$ Since $N \sum l = 1 [y^{(l)} \neq y^{(n)}] [1 + d_{A}^{2} (x^{(n)}, x^{(j)}) - d_{A}^{2} (x^{(n)}, x^{(l)})]_{+} = \sum l \in N_{n, j} 1 + d_{A}^{2} (x^{(n)}, x^{(j)}) - d_{A}^{2} (x^{(n)}, x^{(l)})$ and $\begin{matrix} \frac{1}{\partial A} d_{A}^{2} (x^{(n)}, x^{(j)}) = & \frac{1}{\partial A} (x^{(n)} - x^{(j)})^{T} A (x^{(n)} - x^{(j)}) = & (x^{(n)} - x^{(j)}) (x^{(n)} - x^{(j)})^{T} (∵ \frac{\partial}{\partial X} a^{T} X b = a b^{T}) = & [x^{(1)}, \dots, x^{(N)}] (e_{n} - e_{j}) (e_{n} - e_{j})^{T} [x^{(1)}, \dots, x^{(N)}]^{T} = & X C^{(n, j)} X^{T} \end{matrix}$ proof of $\frac{\partial}{\partial X} a^{T} X b = a b^{T}$ is here

Then, $\begin{matrix} = \frac{1}{N} X (N \sum n = 1 \sum j \in N^{(n)} ((1 - μ) C^{(n, j)} + μ \sum l \in N_{n, j} C^{(n, j)} - C^{(n, l)})) X^{T} = \frac{1}{N} X C X^{T} \end{matrix}$

1.1.2. 多変量正規分布のベイズ公式p97

平均 $μ$ , 分散共分散行列 $Σ$ の多次元正規分布を $N (x ∣ μ, Σ)$ と表す. つまり $N$ 次元確率ベクトル $X$ が $N (x ∣ μ, Σ)$ に従うとき $X$ の確率密度関数は $f (x) = \frac{| Σ |^{- 1 / 2}}{(2 π)^{n / 2}} exp (- \frac{1}{2} (x - μ)^{T} Σ^{- 1} (x - μ))$

である。ここで $n$ 次元確率ベクトル $X$ と $m$ 次元確率ベクトル $Y$ が以下を満たすと仮定する。 $\begin{matrix} p (y ∣ x) & = N (y ∣ A x + b, L^{- 1}) p (x) & = N (x ∣ μ, Λ^{- 1}) \end{matrix}$

ただし、 $A \in R^{m \times n}$ , $b \in R^{m}$ , $L^{- 1} \in R^{m \times m}$ , $μ \in R^{n \times n}, Λ^{- 1} \in R^{n \times n}$

この時,以下が成り立つ $\begin{matrix} p (x ∣ y) & = N (x ∣ M {(A^{T} L (y - b) + Λ μ}, M) p (y) & = N (y ∣ A μ + b, L^{- 1} + A Λ^{- 1} A^{T}) \end{matrix}$

ただし、 $M := (A^{T} L A + Λ)^{- 1}$

(proof) $x$ と $y$ の同時分布 $z := (\begin{matrix} x y \end{matrix})$ を定義すると, $p (z) = p (x) p (y ∣ x)$ なので, $\begin{matrix} ln p (z) & = ln p (x) + ln p (y ∣ x) = - \frac{1}{2} (x - μ)^{T} Λ (x - μ) - \frac{1}{2} (y - A x - b)^{T} L (y - A x - b) + const = - \frac{1}{2} {(2nd order of x, y) + - 2 (x^{T}, y^{T}) (\begin{matrix} Λ μ - A^{T} L b L b \end{matrix}) + const} ∵ (L^{- 1})^{T} = L^{- 1} \Rightarrow L^{T} = L \end{matrix}$ $x, y$ の2次の項に対しては $\begin{matrix} 2nd order of x, y & = x^{T} (Λ + A^{T} L A) x + y^{T} L y - y^{T} L A x - x^{T} A^{T} L y = (x^{T}, y^{T}) (\begin{matrix} Λ + A^{T} L A & - A^{T} L - L A & L \end{matrix}) (\begin{matrix} x y \end{matrix}) = z^{T} R z \end{matrix}$ ゆえに, $\begin{matrix} ln p (z) = - \frac{1}{2} {z^{T} R z - 2 z^{T} (\begin{matrix} Λ μ - A^{T} L b L b \end{matrix})} + const \end{matrix}$ また、シューアの補行列より $\begin{matrix} R^{- 1} = {(\begin{matrix} Λ + A^{T} L A & - A^{T} L - L A & L \end{matrix})}^{- 1} = (\begin{matrix} Λ^{- 1} & Λ^{- 1} A^{T} A Λ^{- 1} & L^{- 1} + A Λ^{- 1} A^{T} \end{matrix}) \end{matrix}$ であるので, $\begin{matrix} p (z) & = const \cdot exp {- \frac{1}{2} (z^{T} R z - 2 z^{T} c)} where c := (\begin{matrix} Λ μ - A^{T} L b L b \end{matrix}) = const \cdot exp {- \frac{1}{2} (z - μ_{z})^{T} R (z - μ_{z})} wehere c = R μ_{z} \Leftrightarrow μ_{z} = R^{- 1} c \end{matrix}$ $\int d z f (z) = 1$ より $f (z) = \frac{| R^{- 1} |^{- 1 / 2}}{(2 π)^{2 N / 2}} exp (- \frac{1}{2} (z - μ_{z})^{T} R (z - μ_{z}))$ また, $μ_{z} = R^{- 1} c = (\begin{matrix} Λ^{- 1} & Λ^{- 1} A^{T} A Λ^{- 1} & L^{- 1} + A Λ^{- 1} A^{T} \end{matrix}) (\begin{matrix} Λ μ - A^{T} L b L b \end{matrix}) = (\begin{matrix} μ A μ + b \end{matrix})$ 多変数正規分布の分割公式を $p (y)$ に対して用いると $\begin{matrix} p (y) & = (p (x_{b}) = N (x_{b} ∣ μ_{b}, Σ_{b b})) = N (y ∣ A μ + b, L^{- 1} + A Λ^{- 1} A^{T}) \end{matrix}$ 同様に $\begin{matrix} p (x ∣ y) = N (μ_{x ∣ y}, Σ_{x ∣ y}) \end{matrix}$ に関しても多変数正規分布の分割公式を用いると, $\begin{matrix} μ_{x ∣ y} & = (= μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b})) = μ - (A^{T} L A + Λ)^{- 1} \cdot (- A^{T} L) (y - A μ - b) = (A^{T} L A + Λ)^{- 1} (A^{T} L (y - b) - A^{T} L A μ) + μ = (A^{T} L A + Λ)^{- 1} (A^{T} L (y - b) + Λ μ) - (A^{T} L A + Λ)^{- 1} (Λ μ + A^{T} L A μ) + μ = (A^{T} L A + Λ)^{- 1} (A^{T} L (y - b) + Λ μ) Σ_{x ∣ y} & = (Σ_{a ∣ b} = Λ_{a a}^{- 1}) = (Λ + A^{T} L A)^{- 1} \end{matrix}$ 参考文献

1.2. Appendix

1.2.1. 2次形式の微分

Let $X$ be a $N \times N$ matrix, and $a, b$ are $N$ -dimensional vectors. Then, $\frac{\partial}{\partial X} a^{T} X b = a b^{T}$ where $a^{T}$ is the transpose of $a$

(Proof)

$(A)_{i, j}$ denotes the $(i, j)$ element of matrix $A$ . $\begin{matrix} (\frac{\partial}{\partial X} a^{T} X b)_{i j} & = \frac{\partial}{\partial x_{i, j}} a^{T} X b = \frac{\partial}{\partial x_{i, j}} N \sum k = 1 (N \sum l = 1 a_{k} x_{k, l}) b_{l} = a_{i} b_{j} = (a b^{T})_{i, j} \end{matrix}$

1.2.2. シューアの補行列

シューアの補行列(Schur complement matrix) Suppose A, B, C, D are respectivesly $p \times p, p \times q, q \times p$ and $q \times q$ matrices, and $D$ is invertible. If $M = A - B D^{- 1} C$ is invertible, then

$\begin{matrix} {(\begin{matrix} A & B C & D \end{matrix})}^{- 1} = (\begin{matrix} M^{- 1} & - M^{- 1} B D^{- 1} - D^{- 1} C M^{- 1} & D^{- 1} + D^{- 1} C M^{- 1} B D^{- 1} \end{matrix}) \end{matrix}$

Similarly, if $A$ and $R = D - C A^{- 1} B$ are invertible

$\begin{matrix} {(\begin{matrix} A & B C & D \end{matrix})}^{- 1} = (\begin{matrix} A^{- 1} + A^{- 1} B R^{- 1} C A^{- 1} & - A^{- 1} B R^{- 1} - R^{- 1} C A^{- 1} & R^{- 1} \end{matrix}) \end{matrix}$

Woodbury matrix identity If we compare partitioned matrices, we get below results.

$\begin{matrix} (A - B D^{- 1} C)^{- 1} & = A^{- 1} + A^{- 1} B (D - C A^{- 1} B)^{- 1} C A^{- 1} (D - C A^{- 1} B)^{- 1} & = D^{- 1} + D^{- 1} C (A - B D^{- 1} C)^{- 1} B D^{- 1} (A - B D^{- 1} C)^{- 1} B D^{- 1} & = A^{- 1} B (D - C A^{- 1} B)^{- 1} (D - C A^{- 1} B)^{- 1} C A^{- 1} & = D^{- 1} C (A - B D^{- 1} C)^{- 1} \end{matrix}$

(proof) If we use LDU decomposition, we have shown that $\begin{matrix} (\begin{matrix} A & B C & D \end{matrix}) = (\begin{matrix} I_{p} & B D^{- 1} 0 & I_{q} \end{matrix}) (\begin{matrix} A - B D^{- 1} C & 0 0 & D \end{matrix}) (\begin{matrix} I_{p} & 0 D^{- 1} C & I_{q} \end{matrix}) \end{matrix}$ Generally, it is true that $det (A B) = det (A) det (B)$ , so

$\begin{matrix} (\begin{matrix} A & B C & D \end{matrix}) = det (A - B D^{- 1} C) det (D) \neq 0 \end{matrix}$ Therefore, $\begin{matrix} {(\begin{matrix} A & B C & D \end{matrix})}^{- 1} & = (\begin{matrix} I_{p} & 0 - D^{- 1} C & I_{q} \end{matrix}) (\begin{matrix} (A - B D^{- 1} C)^{- 1} & 0 0 & D^{- 1} \end{matrix}) (\begin{matrix} I_{p} & - B D^{- 1} 0 & I_{q} \end{matrix}) = {(\begin{matrix} (A - B D^{- 1} C)^{- 1} & - (A - B D^{- 1} C)^{- 1} B D^{- 1} - D^{- 1} C (A - B D^{- 1} C)^{- 1} & D^{- 1} + D^{- 1} C (A - B D^{- 1} C)^{- 1} B D^{- 1} \end{matrix})}^{- 1} = (\begin{matrix} M^{- 1} & - M^{- 1} B D^{- 1} - D^{- 1} C M^{- 1} & D^{- 1} + D^{- 1} C M^{- 1} B D^{- 1} \end{matrix}) \end{matrix}$ Similarly, $\begin{matrix} (\begin{matrix} A & B C & D \end{matrix}) = (\begin{matrix} I & 0 C A^{- 1} & I \end{matrix}) (\begin{matrix} A & 0 0 & D - C A^{- 1} B \end{matrix}) (\begin{matrix} I & A^{- 1} B 0 & I \end{matrix}) \end{matrix}$ Reference detail of Schur Complement

1.2.3. 多変数正規分布の分割公式

$N$ 次元正規分布の確率密度関数を

$N (x ∣ μ, Σ) = \frac{| Σ |^{- 1 / 2}}{(2 π)^{N / 2}} exp (- \frac{1}{2} (x - μ)^{T} Σ^{- 1} (x - μ))$

と表すことにする.このとき, $x$ が次のように分割されたとする.

$x = (\begin{matrix} x_{a} x_{b} \end{matrix})$

これに対応して, $μ, Σ$ と $Λ := Σ^{- 1}$ が次のように分割されているとする.

$μ = (\begin{matrix} μ_{a} μ_{b} \end{matrix}) Σ = (\begin{matrix} Σ_{a a} & Σ_{a b} Σ_{b a} & Σ_{b b} \end{matrix}) Λ = (\begin{matrix} Λ_{a a} & Λ_{a b} Λ_{b a} & Λ_{b b} \end{matrix})$

このとき, $p (x_{a}), p (x_{a} ∣ x_{b})$ は以下に従う.

$\begin{matrix} p (x_{b}) = N (x_{b} ∣ μ_{b}, Σ_{b b}) = N (x_{b} ∣ μ_{b}, [Λ_{b b} - Λ_{b a} Λ_{a a}^{- 1} Λ_{a b}]^{- 1}) \end{matrix}$

$\begin{matrix} p (x_{a} | x_{b}) = N (x_{a} ∣ μ_{a ∣ b}, Σ_{a ∣ b}) \end{matrix}$

ただし,

$\begin{matrix} μ_{a ∣ b} = μ_{a} + Σ_{a b} Σ_{b b}^{- 1} (x_{b} - μ_{b}) = μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b}) \end{matrix}$

$\begin{matrix} Σ_{a ∣ b} = Σ_{a a} - Σ_{a b} Σ_{b b}^{- 1} Σ_{b a} = Λ_{a a}^{- 1} \end{matrix}$

(Proof)

まず, 以下を示す $\begin{matrix} Λ_{a b}^{T} = Λ_{b a}, Λ_{a a}^{T} = Λ_{a a}, Λ_{b b}^{T} = Λ_{b b} \end{matrix}$ $Σ$ は正定値対称行列より、任意の首座行列式が正であるので、 $Σ_{a a}$ に逆行列が存在する。シューアの補行列(Schur complement matrixを用いると, $\begin{matrix} Λ_{a b} & = - Σ_{a a}^{- 1} Σ_{a b} R^{- 1} R^{T} & = (Σ_{b b} - Σ_{b a} Σ_{a a}^{- 1} Σ_{a b})^{T} = Σ_{b b} - Σ_{b a} Σ_{a a}^{- 1} Σ_{a b} (∵ Σ^{T} = Σ) = R Λ_{a b}^{T} & = - R^{- 1} Σ_{b a} Σ_{a a}^{- 1} = Λ_{b a} \end{matrix}$ $Λ$ にシューアの補行列を当てはめると, 公式中において $\begin{matrix} A^{T} = A D^{T} = D B^{T} = C \end{matrix}$ である。よって,　公式中において $\begin{matrix} R^{T} = (D - C A^{- 1} B)^{T} = D - C A^{- 1} B = R \end{matrix}$ より, $Λ_{b b}^{T} = Λ_{b b}$ また、公式中において $\begin{matrix} (- A^{- 1} B R^{- 1})^{T} = - R^{- 1} C A^{- 1} \end{matrix}$ であるので、 $Λ_{a a}^{T} = Λ_{a a}$ よって、(11)は示された. 続いて本題に戻る.(11)を用いると $\begin{matrix} (x - μ)^{T} Σ^{- 1} (x - μ) = & {(\begin{matrix} y_{a} y_{b} \end{matrix})}^{T} (\begin{matrix} Λ_{a a} & Λ_{a b} Λ_{b a} & Λ_{b b} \end{matrix}) (\begin{matrix} y_{a} y_{b} \end{matrix}) where y_{a} = x_{a} - μ_{a}, y_{b} = x_{b} - μ_{b} = & {y_{a}}^{T} Λ_{a a} y_{a} + 2 {y_{a}}^{T} Λ_{a b} y_{b} + {y_{b}}^{T} Λ_{b b} y_{b} = & (y_{a} + Λ_{a a}^{- 1} Λ_{a b} y_{b})^{T} Λ_{a a} (y_{a} + Λ_{a a}^{- 1} Λ_{a b} y_{b}) + {y_{b}}^{T} (Λ_{b b} - Λ_{b a} Λ_{a a}^{- 1} Λ_{a b}) x_{b} = & (x_{a} - (μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b}))^{T} Λ_{a a} (x_{a} - (μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b})) + {y_{b}}^{T} (Λ_{b b} - Λ_{b a} Λ_{a a}^{- 1} Λ_{a b}) y_{b} \end{matrix}$ であり, $\begin{matrix} p (x_{b}) = & \int d x_{a} p (x) = & const \cdot exp {- \frac{1}{2} {y_{b}}^{T} (Λ_{b b} - Λ_{b a} Λ_{a a}^{- 1} Λ_{a b}) y_{b}} + \int d x_{a} exp {- \frac{1}{2} (x_{a} - (μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b}))^{T} Λ_{a a} (x_{a} - (μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b}))} = & const \cdot exp {- \frac{1}{2} (x_{b} - μ_{b})^{T} (Λ_{b b} - Λ_{b a} Λ_{a a}^{- 1} Λ_{a b}) (x_{b} - μ_{b})} \end{matrix}$ $\int d x_{b} p (x_{b}) = 1$ であるので, $p (x_{b}) = N (x_{b} ∣ μ_{b}, [Λ_{b b} - Λ_{b a} Λ_{a a}^{- 1} Λ_{a b}]^{- 1})$ また, $Σ$ は正定値対称行列より, $Λ$ も正定値対称行列であることを踏まえシューアの補行列を $Λ$ に対して用いると, $\begin{matrix} Σ_{b b} = (Λ_{b b} - Λ_{b a} Λ_{a a}^{- 1} Λ_{a b})^{- 1} \end{matrix}$ が示せる.また、 $\begin{matrix} p (x_{a} ∣ x_{b}) = \frac{p (x)}{p (x_{b})} \end{matrix}$ であるので, $\begin{matrix} ln p (x_{a} ∣ x_{b}) = & ln p (x) - ln p (x_{b}) = & - \frac{1}{2} {(x_{a} - (μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b}))^{T} Λ_{a a} (x_{a} - (μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b})) + {y_{b}}^{T} (Λ_{b b} - Λ_{b a} Λ_{a a}^{- 1} Λ_{a b}) y_{b}} + \frac{1}{2} {{y_{b}}^{T} (Λ_{b b} - Λ_{b a} Λ_{a a}^{- 1} Λ_{a b}) y_{b}} + const = & - \frac{1}{2} {(x_{a} - (μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b}))^{T} Λ_{a a} (x_{a} - (μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b}))} + const \end{matrix}$ ゆえに, $\int d x_{a} p (x_{a} ∣ x_{b}) = 1$ であることを考慮すると, $\begin{matrix} μ_{a ∣ b} & = μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b}) Σ_{a ∣ b} & = Λ_{a a}^{- 1} \end{matrix}$ ただし, $\begin{matrix} μ_{a ∣ b} & = μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b}) Σ_{a ∣ b} & = Λ_{a a}^{- 1} \end{matrix}$ シューアの補行列を $Σ$ に対して用いると, p $\begin{matrix} Λ_{a a}^{- 1} & = (M = A - B D^{- 1} C) = Σ_{a a} - Σ_{a b} Σ_{b b}^{- 1} Σ_{b a} \end{matrix}$

$\begin{matrix} Λ_{a a}^{- 1} Λ_{a b} & = (M \cdot (- M) B D^{- 1} = - B D^{- 1}) = - Σ_{a b} Σ_{b b}^{- 1} \end{matrix}$

ただし式変形で公式に対応するものは()でくくった. よって、 $μ_{a ∣ b}, Σ_{a ∣ b}$ は以下のように変形出来る. $\begin{matrix} μ_{a ∣ b} & = μ_{a} - Λ_{a a}^{- 1} Λ_{a b} (x_{b} - μ_{b}) = μ_{a} + Σ_{a b} Σ_{b b}^{- 1} (x_{b} - μ_{b}) Σ_{a ∣ b} & = Λ_{a a}^{- 1} = Σ_{a a} - Σ_{a b} Σ_{b b}^{- 1} Σ_{b a} \end{matrix}$

Last modified by akirat1993 2019-12-28 16:30:03

Created by akirat1993 2019-05-26 02:56:51

異常検知と変化検知

1. 異常検知と変化検知(井出剛杉山将)

1.1. 証明補足

1.1.1. p49(4.12)

1.1.2. 多変量正規分布のベイズ公式p97

1.2. Appendix

1.2.1. 2次形式の微分

1.2.2. シューアの補行列

1.2.3. 多変数正規分布の分割公式

results matching ""

No results matching ""

1. 異常検知と変化検知(井出剛 杉山将)

1.1. 証明補足

1.1.1. p49(4.12)

1.1.2. 多変量正規分布のベイズ公式p97

1.2. Appendix

1.2.1. 2次形式の微分

1.2.2. シューアの補行列

1.2.3. 多変数正規分布の分割公式

results matching ""

No results matching ""

1. 異常検知と変化検知(井出剛杉山将)