Segmentación
Proceso de dividir una imagen en regiones significativas (objetos, fondo, partes) asignando etiquetas a cada píxel, una técnica central en el análisis de imágenes.
La segmentación asigna una etiqueta semántica a cada píxel de una imagen, dividiéndola en regiones significativas. A diferencia de la detección de objetos con cuadros delimitadores, la segmentación proporciona límites precisos a nivel de píxel para una comprensión detallada de la escena.
Categorías de segmentación:
- Segmentación semántica: Asigna etiquetas de clase (persona, coche, carretera) a cada píxel sin distinguir instancias individuales
- Segmentación de instancias: Identifica objetos individuales por separado, distinguiendo persona A de persona B
- Segmentación panóptica: Unifica ambas, manejando clases de fondo e instancias de primer plano simultáneamente
Enfoques clásicos versus aprendizaje profundo:
- Clásicos: Umbralización, crecimiento de regiones, Watershed, Graph Cut. Eficientes pero limitados para escenas complejas
- Aprendizaje profundo: FCN, U-Net, DeepLab, Mask R-CNN. Alcanzan precisión de vanguardia en diversos dominios
Las aplicaciones incluyen conducción autónoma (delimitación de carreteras y peatones), imagen médica (extracción de órganos y tumores), teledetección (clasificación de uso del suelo) y edición de vídeo (eliminación de fondo). Las métricas estándar son IoU (Intersección sobre Unión) y el coeficiente Dice.