El procesamiento digital de imágenes es una disciplina que desarrolla las bases teóricas y algorítmicas para extraer automáticamente información del mundo real, a partir de una imagen observada, de un conjunto o de una secuencia de imágenes. Tal información puede relacionarse con el reconocimiento de objetos, las descripciones tridimensionales de los mismos, la posición y la orientación de objetos o la medición de cualquier propiedad espacial, tal como la distancia entre dos puntos bien definidos o la sección transversal de un objeto.
Es posible citar una gran cantidad de ejemplos donde el procesamiento de imágenes ayuda a analizar, deducir y tomar decisiones. Entre otras áreas en las cuales se han desarrollado herramientas de gran utilidad podemos mencionar las siguientes: Robótica, Medicina, Fisiología, Biometría, Astronomía, Ciencias Ambientales, Robótica, Metalúrgica, Física, Electrónica, Biología y el Reconocimiento de Caracteres (OCR).
Como aplicaciones típicas se pueden mencionar: la detección de la presencia de objetos, la reconstrucción tridimensional de objetos, localización y mapeo simultáneos - SLAM, reconocimiento de rostros y posturas humanas, la inspección visual automática, la medición de características geométricas y de color de objetos, la clasificación de objetos, la restauración de imágenes y el mejoramiento de la calidad de imágenes.
Las principales líneas de investigación se pueden dividir en tres grandes áreas:
Proyectos recientes y prospectivos.
En este proyecto se propone emplear métodos adaptativos para mejorar diversas etapas de SLAM visual basado en múltiples cámaras RGB-D. Al identificar las mejores marcas visuales, se puede reducir el tiempo de procesamiento de las etapas de correspondencia y de refinamiento de la posición, así como en las etapas de la detección del cierre del circuito y optimización del grafo de posiciones.
El proyecto tiene como objetivo el desarrollo de métodos de reconocimiento, clasificación y seguimiento de rostros en 3D utilizando cámaras RGB-D. Los métodos de reconocimiento se basan en correspondencia de superficies faciales que sea robusto a expresiones, cambios de iluminación y variaciones de postura. Los métodos de clasificación de expresiones faciales se basan en técnicas de aprendizaje profundo. El seguimiento facial tradicionalmente se realiza en 2-D. En este proyecto se desarrollarán métodos para el seguimiento de rostros en 3-D basado en la calculación de matrices de orientación y vectores de traslación en 3-D, así como la predicción de la posición del objeto en 3-D para el siguiente punto en el tiempo.
Las características de los animales a menudo se miden manualmente, el procedimiento requiere mucho tiempo, es caro y estresante tanto para el granjero como para el animal. Los avances recientes en la tecnología de sensores tridimensionales proporcionan herramientas innovadoras para el diseño de sistemas automatizados sin contacto para evaluar la condición corporal del animal. El objetivo de este proyecto es diseñar un sistema automatizado de visión por computadora capaz de generar un modelo tridimensional preciso de ganado vivo. El sistema se basa en una reconstrucción de forma tridimensional no rígida que utilizando cámaras RGB-D.