Convolución
Una operación fundamental de procesamiento de imágenes que desliza un kernel (matriz pequeña) sobre la imagen, calculando sumas ponderadas en cada posición para desenfoque, detección de bordes y nitidez.
La convolución es la operación central del filtrado espacial de imágenes: una pequeña matriz llamada kernel se desliza sobre la imagen, calculando una suma ponderada de los píxeles circundantes en cada posición. Prácticamente todos los filtros espaciales (desenfoque, nitidez, detección de bordes, relieve) se implementan como convoluciones.
El procedimiento de convolución:
- Deslizar el kernel (ej. 3×3) sobre la imagen de arriba-izquierda a abajo-derecha, un píxel a la vez
- En cada posición, multiplicar cada elemento del kernel por el valor del píxel correspondiente
- Sumar todos los productos para producir el valor del píxel de salida
- Repetir para cada píxel de la imagen
Kernels representativos y sus efectos:
- Filtro de caja: Todos los elementos iguales a
1/9en un kernel 3×3. Produce un desenfoque de promediado simple - Filtro gaussiano: Los pesos siguen una distribución gaussiana. Crea un desenfoque natural y es óptimo para la reducción de ruido
- Filtro Sobel: Detecta bordes horizontales y verticales aproximando derivadas de primer orden
- Filtro laplaciano: Detecta bordes en todas las direcciones mediante derivadas de segundo orden. Los cruces por cero indican las ubicaciones de los bordes
- Máscara de enfoque: Resta una versión desenfocada del original para mejorar la nitidez. Un recurso habitual en impresión y fotografía
Computacionalmente, aplicar un kernel N×N a una imagen M×M requiere O(M²N²) operaciones. Para kernels grandes, convertir a multiplicación en el dominio de frecuencia (FFT) es más rápido. Los kernels separables como el gaussiano pueden descomponerse en dos pasadas 1D, reduciendo la complejidad a O(M²N).
Las CNN (Redes Neuronales Convolucionales) de aprendizaje profundo usan la misma operación de convolución, pero aprenden los valores del kernel automáticamente mediante entrenamiento en lugar de diseño manual.