Mapa de disparidad
Una imagen que registra el desplazamiento horizontal en píxeles (disparidad) entre puntos correspondientes en un par de imágenes estéreo. La profundidad puede calcularse a partir de la disparidad mediante triangulación, siendo una representación intermedia para la reconstrucción 3D.
Un mapa de disparidad es la salida del emparejamiento estéreo, almacenando para cada píxel el desplazamiento horizontal (disparidad) entre su posición en la imagen izquierda y su posición correspondiente en la imagen derecha. La relación entre la disparidad d y la profundidad Z viene dada por Z = f * B / d, donde f es la distancia focal en píxeles y B es la distancia de línea base entre cámaras.
Los mapas de disparidad se visualizan comúnmente como imágenes en escala de grises donde los píxeles más brillantes indican mayor disparidad (más cerca de la cámara). Se almacenan como enteros de 16 bits o valores de punto flotante para precisión subpíxel. StereoBM y StereoSGBM de OpenCV devuelven valores escalados por 16 (punto fijo), por lo que la disparidad real requiere dividir por 16.
- Relación no lineal con la profundidad: Dado que la disparidad es inversamente proporcional a la profundidad, la resolución de profundidad es alta a corta distancia pero se degrada rápidamente a distancia. Con una línea base de 12cm y distancia focal de 700px, un cambio de 1 píxel de disparidad corresponde a aproximadamente 2mm a 1m pero 14cm a 10m
- Manejo de oclusiones: Las regiones visibles en una imagen pero ocluidas en la otra no pueden tener valores de disparidad válidos. Las verificaciones de consistencia izquierda-derecha detectan estos píxeles inválidos, que luego se rellenan por interpolación de valores vecinos válidos
- Postprocesamiento: El filtrado WLS (Mínimos Cuadrados Ponderados) y el filtrado de mediana eliminan ruido preservando los bordes de profundidad. OpenCV proporciona
cv2.ximgproc.createDisparityWLSFilter()para el suavizado con preservación de bordes de mapas de disparidad
Los mapas de disparidad son esenciales en conducción autónoma (detección de obstáculos y estimación de distancia), AR/VR (comprensión de escenas y manejo de oclusiones) y robótica (planificación de agarre y navegación). Cámaras de profundidad comerciales como Intel RealSense y Stereolabs ZED calculan internamente mapas de disparidad mediante emparejamiento estéreo acelerado por hardware antes de convertir a profundidad.