[TOC]

0.1. 重みの初期値

Xavierの初期値->重み=randn*(層のノードの数によって変化させる係数) SSDのextra_netのConv層のweightで使われていた.ただし,biasではconstが使われている.

0.2. パラメータ調整

ハイパーパラメータのopunaの自動枝刈りの機能が強力そう. 深層学習において,ここでいう枝刈りとは最初に指定したepoch数に達してなくても「学習率がこれ以上下がらなそうだったり」、「lossが大きすぎる場合」は途中で学習を終了し,別のハイパーパラメータを探索することをいう.

枝刈りの様子を視覚的に描写

Optunaの公式サイト実際に使う時

0.3. ネットワークの可視化

https://github.com/HarisIqbal88/PlotNeuralNet

0.3.1. データセットについて

CPUでデータを読み込んで訓練時にGPUを使用する場合はtorch.utils.data.DataLoaderのpin_memory=TrueとすることでデータをGPUに移動することきの時間が短縮される参考文献

0.4. データセットについて

0.5. アノテーション形式について

VOCフォーマット<xmin>は1始まりでWまで

1. 理論

1.1. 複数の特徴量をまとめる関数

$f$ は任意の ${x_{i}}_{i = 1}^{n} \subset R^{m}$ と任意の $n$ 次の置換 $ρ$ に対して, $f (x_{1}, \dots, x_{n}) = f (x_{ρ (1)}, \dots, x_{ρ (n)})$ を満たしている.

この時, $f$ は任意の ${x_{i}}_{i = 1}^{n} \subset R^{m}$ と任意の $n$ 次の置換 $ρ, σ$ に対して, $f (x_{σ (1)}, \dots, x_{σ (n)}) = f (x_{ρ (1)}, \dots, x_{ρ (n)})$ が成立することを示せ.

線形関数では複数の特徴量をまとめる関数は実質的に構成できない.

$x_{i}$ : $i$ 番目の細胞の特徴量とする

任意の ${x_{i}}_{i = 1}^{n} \subset R^{m}$ ただし $x_{i} = (x_{i 1}, \dots, x_{i m})^{T} \in R^{m}$ ,任意の $n$ 次の置換 $σ, ρ$ に対して, $f (x_{σ (1)}, \dots, x_{σ (n)}) = f (x_{ρ (1)}, \dots, x_{ρ (n)})$ を満たす関数 $f : R^{n \times m} \to R$ を求めたい.上記は $f (x_{1}, \dots, x_{n}) = f (x_{ρ (1)}, \dots, x_{ρ (n)})$ を満たす $f$ を求めることと同値であることは容易に分かる.

まず, $f$ を深層学習でよく用いられている線形結合の形に限定して考える.つまり $f (x_{1}, \dots, x_{n}) = \sum 1 \leq i \leq n, 1 \leq j \leq m a_{i j} x_{i j} + b_{i j}$ とする.

この時,任意の ${x_{i}}_{i = 1}^{n} \subset R^{m}$ ,任意の $n$ 次の置換 $σ$ に対して仮定より $\begin{matrix} \sum 1 \leq i \leq n, 1 \leq j \leq m a_{i j} x_{i j} + b_{i j} = \sum 1 \leq i \leq n, 1 \leq j \leq m a_{i j} x_{σ (i) j} + b_{i j} \\ (*1) \end{matrix}$ が成立する. $1 \leq i_{1} < i_{2} \leq n$ , $1 \leq j_{0} \leq m$ を任意に固定し, $i_{1}$ と $i_{2}$ を入れ替える互換を $σ$ とする.このとき, $\begin{matrix} x_{i j} = {\begin{matrix} 1 & if i = i_{1}, j = j_{0} 0 & otherwise \end{matrix} \end{matrix}$ とする. (*1)より $a_{i_{1} j_{0}} = a_{i_{2} j_{0}}$ が成立.よって $a_{j} \equiv a_{1 j} = \dots = a_{n j}$ , $b = \frac{\sum_{i = 1}^{n} \sum_{j = 1}^{m} b_{i j}}{n m}$ $\begin{matrix} f (x_{1}, \dots, x_{n}) & = \sum 1 \leq i \leq n, 1 \leq j \leq m a_{j} x_{i j} + b = \sum 1 \leq i \leq n (\sum 1 \leq j \leq m a_{j} x_{i j} + b_{i j}) \end{matrix}$ となる.

Last modified by akirat1993 2019-05-26 02:56:51

Created by akirat1993 2019-05-26 02:56:51

全般メモ