Espacio de escalas
Marco continuo para representar imágenes en distintos niveles de detalle. Variando el parámetro sigma del desenfoque gaussiano, las estructuras de la imagen pueden analizarse uniformemente a través de resoluciones.
El espacio de escalas es un marco teórico que describe cómo evolucionan las estructuras de una imagen cuando se observan a diferentes niveles de detalle. Introducido por Witkin en 1983 y formalizado axiomáticamente por Lindeberg, proporciona la base matemática para el análisis de imágenes multiescala. Se ha demostrado que el kernel gaussiano es el único kernel lineal que satisface los axiomas del espacio de escalas.
La representación en espacio de escalas L(x, y, σ) se define como la convolución de la imagen original I(x, y) con un kernel gaussiano G(x, y, σ). A medida que σ aumenta, las estructuras de escala fina se suprimen progresivamente, dejando solo características globales gruesas. En σ = 0 la representación es igual a la imagen original, y cuando σ tiende a infinito, la imagen converge a un valor uniforme.
- Por qué gaussiano: El gaussiano es el único kernel que satisface causalidad (no se crean estructuras espurias), isotropía y linealidad, los tres axiomas fundamentales del espacio de escalas lineal
- Diferencia de Gaussianas (DoG): Restar imágenes con desenfoque gaussiano en valores de σ adyacentes aproxima el Laplaciano del Gaussiano y detecta eficientemente características a escalas específicas. Este es el mecanismo central en la detección de puntos clave SIFT
- Selección automática de escala: La escala característica de una feature se determina encontrando el σ en el que la respuesta normalizada del LoG (Laplaciano del Gaussiano) alcanza un máximo, permitiendo la detección de características invariante a la escala
La teoría del espacio de escalas sustenta prácticamente todos los algoritmos modernos de detección de características. SIFT, SURF y ORB dependen de la detección de extremos en el espacio de escalas para localizar puntos clave invariantes a cambios en la distancia de observación y nivel de zoom.