En esta materia de posgrado el estudiante aprenderá las bases de la visión computacional así como diversas técnicas relevantes en dicha área. Al finalizar el curso el estudiante deberá ser capaz de comprender los alcances y limitaciones de la visión computacional, además de adquirir habilidad en la implementación de las técnicas más recientes.
Temario actualizado:
Parte 1: Vision Geométrica
- Introdución
vision_01_introduccion_22a
Tareas de la visión
vision_01_tasks_22a - Geometría e implementación
vision_02_geometry (20A) - Filtrado
vision_03_filtering_22a - Bordes y Contornos
vision_04_edges_22a - Regiones
vision_05_regions_22a - Imágenes Binarias
vision_06_ImagenesBinarias - Transformada de Hough
vision_07_Lines (20A) - Puntos caracteristicos
vision_07_features - Reconocimiento de Objetos
vision_09_classification (20A)
Parte 2: Visión basada en Aprendizaje Profundo (Deep Learning)
- Introducción
- Red Neuronal Simple
cv2_02_simple_nn - Red Neuronal multicapa
cv2_03_multilayer_nn - Clasificación
cv2_04_tensorflow - Redes Neuronales Profundas
- Redes Neuronales Convolucionales
- Transferencia de conocimiento
Parte 3: Visión para Mapeo y Localización Simultánea (SLAM)
- Filtro de Histograma
- Filtro de Kalman
- Tracking
Ejercicios
Lista de ejercicios: ejercicios_vision
Bibliografía
- Jain Kasturi Schunck, Machine Vision, Mac Graw Hill.
Libro online - Szeliski, R. (2010). Computer vision: algorithms and applications. Springer Science & Business Media.
- Enrique Sucar and Giovani Gómez. Visión Computacional.
- Joshi, P., Escrivá, D. M., & Godoy, V. (2016). OpenCV By Example. Packt Publishing Ltd.
- Enrique Sucar, Notas de Probabilidad, INAOE c2-prob
- Sucar, L. E, Probabilistic Graphical Models, Springer 2015.
- I Goodfellow, Y Bengio, A Courville, Y Bengio Deep learning. https://www.deeplearningbook.org/
Lecturas
- Bendig, J., Yu, K., Aasen, H., Bolten, A., Bennertz, S., Broscheit, J., … & Bareth, G. (2015). Combining UAV-based plant height from crop surface models, visible, and near infrared vegetation indices for biomass monitoring in barley. International Journal of Applied Earth Observation and Geoinformation, 39, 79-87.
- https://mattmaulion.medium.com/template-matching-image-processing-6eb1d5425248
- Canny, J. (1986). A computational approach to edge detection. IEEE Transactions on pattern analysis and machine intelligence, (6), 679-698.
- Assidiq, Abdulhakam AM, et al. “Real time lane detection for autonomous vehicles.” 2008 International Conference on Computer and Communication Engineering. IEEE, 2008.
- LeCun, Y., Bottou, L., Bengio, Y., & Haffner, P. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11), 2278-2324.
- Dumoulin, V., & Visin, F. (2016). A guide to convolution arithmetic for deep learning. arXiv preprint arXiv:1603.07285.
Metodología del curso
- Leer sobre el tema en la bibliografía
- Tomar la clase (video)
- Aclarar dudas en sesión en tiempo real.
- Despúes de la clase:
- Lecturas selectas
- Actividades, tareas y programas
- Eventualmente se dejará un mini-proyecto. Los reportes se entregan para cada mini-proyecto. El formato es IEEE a doble columna. De preferencia se debe editar el reporte en latex. El envio de los reportes se deben enviar antes de finalizar la fecha de entrega a mi correo. Cada reporte deberá estar nombrado de la siguiente forma: [apellido]_reporte_vision_[número].pdf. Por ejemplo: ‘vasquez_reporte_vision_01.pdf’
Recursos
- Repositorio de ejercicios de la parte de visión geométrica:
https://github.com/irvingvasquez/vision_programas - Repositorio de ejercicios de la parte de aprendizaje profundo:
https://github.com/irvingvasquez/practicas_pytorch - Ambiente de conda:
https://github.com/irvingvasquez/vision_environment - Instalación de GPU
- Fomato de diseño de experimentos: Formato_DOE