JA EN

CNN

読み: しーえぬえぬ

畳み込みニューラルネットワーク。畳み込み層とプーリング層で画像の空間的特徴を階層的に抽出し、画像認識の標準アーキテクチャとなった深層学習モデル。

CNN (Convolutional Neural Network / 畳み込みニューラルネットワーク) は、画像の空間的な局所パターンを効率的に学習するために設計されたニューラルネットワークアーキテクチャである。全結合層では画像の空間構造が失われるのに対し、CNN は畳み込み演算によって近傍ピクセル間の関係性を保持したまま特徴を抽出する。

CNN の主要な構成要素は以下のとおりである。

代表的な CNN アーキテクチャの進化を示す。

CNN は画像分類だけでなく、物体検出 (YOLO、SSD)、セマンティックセグメンテーション (U-Net、DeepLab)、姿勢推定、画像生成の特徴抽出器としても広く活用されている。近年は Vision Transformer が台頭しているが、軽量モデルやエッジデバイス向けでは CNN が依然として主力である。

関連用語

関連記事