Segmentación

Proceso de dividir una imagen en regiones significativas (objetos, fondo, partes) asignando etiquetas a cada píxel, una técnica central en el análisis de imágenes.

La segmentación asigna una etiqueta semántica a cada píxel de una imagen, dividiéndola en regiones significativas. A diferencia de la detección de objetos con cuadros delimitadores, la segmentación proporciona límites precisos a nivel de píxel para una comprensión detallada de la escena.

Categorías de segmentación:

Segmentación semántica: Asigna etiquetas de clase (persona, coche, carretera) a cada píxel sin distinguir instancias individuales
Segmentación de instancias: Identifica objetos individuales por separado, distinguiendo persona A de persona B
Segmentación panóptica: Unifica ambas, manejando clases de fondo e instancias de primer plano simultáneamente

Enfoques clásicos versus aprendizaje profundo:

Clásicos: Umbralización, crecimiento de regiones, Watershed, Graph Cut. Eficientes pero limitados para escenas complejas
Aprendizaje profundo: FCN, U-Net, DeepLab, Mask R-CNN. Alcanzan precisión de vanguardia en diversos dominios

Las aplicaciones incluyen conducción autónoma (delimitación de carreteras y peatones), imagen médica (extracción de órganos y tumores), teledetección (clasificación de uso del suelo) y edición de vídeo (eliminación de fondo). Las métricas estándar son IoU (Intersección sobre Unión) y el coeficiente Dice.

Segmentación

Términos relacionados

Artículos relacionados