セグメンテーション
読み: せぐめんてーしょん
画像を意味のある領域 (物体、背景、部位など) に分割する処理。ピクセル単位で各領域にラベルを割り当てる画像解析の中核技術。
セグメンテーション (Segmentation) とは、画像を構成する各ピクセルに対して意味的なラベルを割り当て、画像全体を複数の領域に分割する処理である。物体検出が矩形のバウンディングボックスで位置を示すのに対し、セグメンテーションはピクセル単位の精密な境界を提供する。
セグメンテーションは目的に応じて以下のように分類される。
- セマンティックセグメンテーション: 各ピクセルにクラスラベル (人、車、道路など) を割り当てる。同一クラスの個体は区別しない
- インスタンスセグメンテーション: セマンティックに加え、同一クラスの個体を個別に識別する。例えば画像内の人物 A と人物 B を区別する
- パノプティックセグメンテーション: セマンティックとインスタンスを統合し、背景クラスと前景インスタンスの両方を同時に処理する
古典的な手法と深層学習ベースの手法を比較する。
- 古典的手法: 閾値処理、領域成長法、Watershed アルゴリズム、Graph Cut。計算コストが低いが複雑なシーンでは精度が限定的
- 深層学習手法: FCN (Fully Convolutional Network)、U-Net、DeepLab、Mask R-CNN。大規模データセットで学習し、高精度なセグメンテーションを実現
応用分野は多岐にわたる。自動運転では道路・歩行者・車両の領域分割、医療画像では臓器や腫瘍の輪郭抽出、衛星画像では土地利用分類、動画編集では背景除去やグリーンバック合成に活用される。評価指標には IoU (Intersection over Union) や Dice 係数が標準的に使用される。