JA EN

プーリング

読み: ぷーりんぐ

特徴マップの空間解像度を縮小し、計算量を削減しつつ位置ずれに対する頑健性を高めるダウンサンプリング操作。

プーリング (Pooling) は、畳み込みニューラルネットワーク (CNN) において特徴マップの空間サイズを縮小する操作である。指定したウィンドウ (カーネル) 内の値を 1 つの代表値に集約することで、パラメータ数と計算量を削減し、特徴の微小な位置変動に対する不変性を獲得する。

最も一般的なのは 2x2 ウィンドウ・ストライド 2 のマックスプーリングで、各領域の最大値を選択する。これにより特徴マップの幅と高さがそれぞれ半分になり、空間解像度は 1/4 に縮小される。VGG-16 では 5 回のマックスプーリングにより 224x224 の入力を 7x7 まで段階的に縮小する。

近年のアーキテクチャではプーリング層を排除しストライド畳み込みに置き換える傾向があるが、GAP は全結合層の代替として依然として標準的に使用されている。セグメンテーションタスクでは空間情報の損失が深刻な問題となるため、プーリングインデックスの保存やアトラスプーリング (Dilated Pooling) などの工夫が施される。

関連用語

関連記事