En esta materia de posgrado el estudiante aprenderá las bases de la visión computacional así como diversas técnicas relevantes en dicha área. Al finalizar el curso el estudiante deberá ser capaz de comprender los alcances y limitaciones de la visión computacional, además de adquirir habilidad en la implementación de las técnicas más recientes.
Temario CIDETEC:
visionartificial
Temario actualizado:
Parte 1: Vision Geométrica
- Introdución
- Motivación
vision_01_introduccion (20B) - Tareas de la visión
cv_01_01_21a (21A)
- Motivación
- Geometría e implementación
vision_02_geometry (20A) - Filtrado
vision_03_filtering (20A) - Bordes y Contornos
vision_04_edges (20A) - Transformada de Hough
vision_07_Lines (20A) - Regiones
vision_05_regions (20A) - Imágenes Binarias
vision_06_ImagenesBinarias - Puntos caracteristicos
vision_07_features - Reconocimiento de Objetos
vision_09_classification (20A)
Parte 2: Visión basada en Aprendizaje Profundo (Deep Learning)
- Introducción
- Red Neuronal Simple
cv2_02_simple_nn - Red Neuronal multicapa
cv2_03_multilayer_nn - Clasificación
cv2_04_tensorflow - Redes Neuronales Profundas
- Redes Neuronales Convolucionales
- Transferencia de conocimiento
Parte 3: Visión para Mapeo y Localización Simultánea (SLAM)
- Filtro de Histograma
- Filtro de Kalman
- Tracking
Bibliografía
- Jain Kasturi Schunck, Machine Vision, Mac Graw Hill.
Libro online - Szeliski, R. (2010). Computer vision: algorithms and applications. Springer Science & Business Media.
- Enrique Sucar and Giovani Gómez. Visión Computacional.
- Joshi, P., Escrivá, D. M., & Godoy, V. (2016). OpenCV By Example. Packt Publishing Ltd.
- Enrique Sucar, Notas de Probabilidad, INAOE c2-prob
- Sucar, L. E, Probabilistic Graphical Models, Springer 2015.
- I Goodfellow, Y Bengio, A Courville, Y Bengio Deep learning. https://www.deeplearningbook.org/
Lecturas
- Bendig, J., Yu, K., Aasen, H., Bolten, A., Bennertz, S., Broscheit, J., … & Bareth, G. (2015). Combining UAV-based plant height from crop surface models, visible, and near infrared vegetation indices for biomass monitoring in barley. International Journal of Applied Earth Observation and Geoinformation, 39, 79-87.
- Canny, J. (1986). A computational approach to edge detection. IEEE Transactions on pattern analysis and machine intelligence, (6), 679-698.
- Assidiq, Abdulhakam AM, et al. “Real time lane detection for autonomous vehicles.” 2008 International Conference on Computer and Communication Engineering. IEEE, 2008.
- LeCun, Y., Bottou, L., Bengio, Y., & Haffner, P. (1998). Gradient-based learning applied to document recognition. Proceedings of the IEEE, 86(11), 2278-2324.
Metodología del curso
La calificación se asigna de la siguiente forma:
- 60% por las tareas con reporte.
- 40% por el proyecto final (presentación y reporte).
Los reportes se entregan para cada mini-proyecto. El formato es IEEE a doble columna. De preferencia se debe editar el reporte en latex. El envio de los reportes se deben enviar antes de finalizar la fecha de entrega a mi correo. Cada reporte deberá estar nombrado de la siguiente forma: [apellido]_reporte_vision_[número].pdf. Por ejemplo: ‘vasquez_reporte_vision_01.pdf’
Recursos
- Repositorio de ejercicios de la parte de visión geométrica:
https://github.com/irvingvasquez/vision_programas - Repositorio de ejercicios de la parte de aprendizaje profundo:
https://github.com/irvingvasquez/practicas_pytorch - Ambiente de conda:
https://github.com/irvingvasquez/vision_environment - Instalación de GPU