Irving Vasquez

Robotics and Computer Vision Researcher

Visión Computacional

En esta materia de posgrado el estudiante aprenderá las bases de la visión computacional así como diversas técnicas relevantes en dicha área.  Al finalizar el curso el estudiante deberá ser capaz de comprender los alcances y limitaciones de la visión computacional, además de adquirir habilidad en la implementación de las técnicas más recientes.

Temario CIDETEC:
visionartificial

Temario actualizado:

Parte 1: Vision Geométrica

  1. Introdución
    vision_01_introduccion
  2. Geometría e implementación
    vision_02_geometry
  3. Filtrado
    vision_03_filtering
  4. Bordes
    vision_04_edges
  5. Regiones
    vision_05_regions
  6. Imágenes Binarias
    vision_06_ImagenesBinarias
  7. Puntos caracteristicos
    vision_07_features
  8. Reconocimiento de Objetos

Parte 2: Visión basada en Aprendizaje Profundo (Deep Learning)

  1. Introducción
  2. Red Neuronal Simple
    cv2_02_simple_nn
  3. Red Neuronal multicapa
    cv2_03_multilayer_nn
  4. Clasificación
    cv2_04_tensorflow
  5. Redes Neuronales Profundas
  6. Redes Neuronales Convolucionales
  7. Transferencia de conocimiento

Parte 3: Visión para Mapeo y Localización Simultánea (SLAM)

  1. Filtro de Histograma
  2. Filtro de Kalman
  3. Tracking

Bibliografía:

  • Jain Kasturi Schunck, Machine Vision, Mac Graw Hill.
    Libro online
  • Szeliski, R. (2010). Computer vision: algorithms and applications. Springer Science & Business Media.
  • Enrique Sucar and Giovani Gómez. Visión Computacional.
  • Joshi, P., Escrivá, D. M., & Godoy, V. (2016). OpenCV By Example. Packt Publishing Ltd.
  • Enrique Sucar, Notas de Probabilidad, INAOE c2-prob
  • Sucar, L. E, Probabilistic Graphical Models, Springer 2015.
  • I Goodfellow, Y Bengio, A Courville, Y Bengio Deep learning.  https://www.deeplearningbook.org/

Recursos:

Metodología del curso.

La calificación se asigna de la siguiente forma:

  • 60% por las tareas con reporte.
  • 40% por el proyecto final (presentación y reporte).

Los reportes se entregan para cada mini-proyecto. El formato es IEEE a doble columna. De preferencia se debe editar el reporte en latex. El envio de los reportes se deben enviar antes de finalizar la fecha de entrega a mi correo. Cada reporte deberá estar nombrado de la siguiente forma: [apellido]_reporte_vision_[número].pdf. Por ejemplo: ‘vasquez_reporte_vision_01.pdf’

Posibles proyectos finales:

  • Reconocimiento de un objeto con un sistema embebido movil.
  • Conceptualizacion de un objeto 3D a traves de un conjunto de puntos caracteristicos.

 

A %d blogueros les gusta esto: