Vídeo 3D

Televisión
Plan 2010 ETSIT-UPM - Curso 2014-2015
Trabajos propuestos sobre Vídeo 3D
Escoger uno de los siguientes trabajos:
Trabajos bibliográficos:
1. Algoritmos de estimación de profundidad a partir de imágenes estéreo o multicámara. ¿Qué diferencias hay en el caso de configuraciones de cámaras paralelas o configuraciones no paralelas (caso
general)? Describir qué opciones hay para: a) los algoritmos de estimación inicial (block matching,
segmentación etc.), y b) las técnicas globales de optimización.
2. Buscar dispositivos de generación/adquisición de mapas de profundidad. Enunciar sus tecnologías y
características (especificaciones). ¿Qué rango de profundidades son capaces de capturar y con qué
precisión? ¿En qué aplicaciones se utilizan estos dispositivos? ¿De qué forma se almacena/entrega la
información de profundidad?, etc.
3. Describir el algoritmo de síntesis de vistas virtuales a partir de imágenes de textura/color y profundidad: DIBR (Depth Image Based Rendering) o 3D warping. ¿Qué tipo de problemas relacionados con
oclusiones/agujeros se generan en la vista virtual? ¿Cómo se pueden solucionar estos problemas utilizando varios puntos de vista originales? ¿Qué técnicas existen para rellenar los agujeros no solucionables en el paso anterior (in-painting, etc.)?
Trabajo de implementación:
4. Implementar en Matlab un algoritmo de estimación de disparidad/profundidad básico:
Pasos a seguir:
i.
ii.
iii.
iv.
v.
vi.
Leer las dos imágenes (izquierda y derecha), extraer la luminancia y pasarla a double.
Inicializar una imagen de disparidad de la misma resolución de las imágenes originales.
Recorrer la imagen derecha por bloques
Para cada bloque de la imagen derecha:
a. Buscar, en la misma fila de bloques de la imagen izquierda, el bloque con menor error
(MSE) con respecto al bloque de referencia de la imagen derecha.
b. Guardar el valor de desplazamiento en píxeles entre los dos bloques (el encontrado en
la imagen izquierda y el de referencia de la imagen derecha) para todos los píxeles de
la posición del bloque de referencia en la imagen de disparidad.
Cuantificar la imagen obtenida en valores de 0 a 255 (0 corresponde al menor valor de disparidad y 255 al máximo).
Guardar la imagen de disparidad obtenida sin compresión.
Notas: Para evitar valores de disparidad negativos que no tienen sentido en una configuración paralela
de cámaras, en la búsqueda del bloque correspondiente, buscar sólo en la misma posición o posiciones a
la derecha del bloque de referencia. Para el último bloque de cada fila (el más a la derecha) usar el valor
de disparidad 0.
Pruebas con las imágenes de http://www.gti.ssr.upm.es/tv/pix/cams.rar (cam1 es la cámara más
a la izquierda y cam4 la más a la derecha):
i.
ii.
Probar con distintos tamaños de bloque: 4x4, 8x8, 16x16 y 32x32.
Probar con diferentes valores de baseline (distancia entre cámaras): cam1-cam4, cam2-cam4,
cam3-cam4.
Entregar:
i.
ii.
Código Matlab.
Documento explicativo que incluya:
a. Resultados (imágenes de disparidad) obtenidos en cada caso y explicación de su relación con el tamaño de bloque y el valor de baseline.
b. Valores mínimo y máximo de disparidad (en píxeles) para cada caso.
c. Comentarios sobre las analogías y diferencias del algoritmo de estimación de disparidad con respecto a uno de estimación de movimiento.
En los trabajos se deben indicar las referencias bibliográficas consultadas.
Fecha límite de entrega  09/04/2015