Introducción a visión computacional

Visión general
Programa
Instructor

La visión computacional es un campo multidisciplinario de la inteligencia artificial que busca que las computadoras “vean” y entiendan el mundo visual de forma similar a los humanos. Para ello, desarrolla algoritmos y sistemas capaces de procesar, analizar y tomar decisiones a partir de imágenes y videos. En este curso aprenderás los fundamentos que sostienen a la visión computacional y explorarás técnicas clave como filtrado, detección, segmentación, seguimiento y, de forma introductoria, métodos basados en aprendizaje profundo.

Nuestro enfoque será 100% práctico: trabajaremos con programas interactivos en Python usando OpenCV, ejecutados directamente en Google Colab. Esto significa que podrás correr todos los notebooks desde tu navegador, sin instalar nada en tu computadora. Verás los efectos de cada algoritmo en tiempo real (por ejemplo, al mover deslizadores para cambiar umbrales, tamaños de kernel o parámetros de detección), lo que te ayudará a construir intuición y a depurar tus soluciones de manera ágil.

Al finalizar, serás capaz de:

Comprender los alcances y limitaciones de la visión computacional en distintos escenarios.
Implementar pipelines básicos con OpenCV (carga de imágenes, preprocesamiento, extracción de características, detección/segmentación/seguimiento y visualización).
Experimentar y evaluar con métricas simples la calidad de tus resultados, ajustando parámetros de forma interactiva.
Conectar conceptos teóricos con aplicaciones reales (por ejemplo, conteo de objetos, análisis de movimiento o segmentación de regiones de interés).

En resumen, saldrás con una base sólida y práctica, lista para aplicar en proyectos reales, prototipos de investigación y desarrollos más avanzados.

Programa

5 secciones
20 lecciones
18 semanas

Expandir todas las seccionesPlegar todas las secciones

Introducción
Iniciemos comprendiendo por qué es importante la visión computacional en nuestros días.
8
Filtrado
El filtrado permite contrarestar el ruido en las imágenes
4
Bordes
Los bordes son características de las imágenes que nos permiten encontrar la frontera entre dos regiones diferentes.
3
Regiones e imágenes binarias
Las regiones son un conjunto de pixeles que tienen una propiedad en común. En esta lección tendremos un acercamiento hacia las regiones des un punto de vista clásico.
4
Detección de líneas
Los modelos paramétricos nos permiten representar diversos fenómenos como pueden ser las líneas rectas en un carrir vehicular. En esta sección estudiaremos diversos métodos para hallar dichos modelos.
1
- 5.1
  Transformada de Hough
  36 minutos

Prof. Vasquez

Soy un investigador científico apasionado por comprender los algoritmos de visión activa, área que comprende la intersección entre la robótica y la visión computacional. Mi formación como ingeniero en computación me ha permitido llevar las teorías a la solución de problemas prácticos como la reconstrucción tridimensional o la planificación de rutas para vehículos aéreos no tripulados. Recientemente he investigado técnicas de aprendizaje profundo ‘deep learning’ para resolver problemas de reconocimiento de patrones en visión computacional.

Juan Irving Vasquez

Robotics and Computer Vision Researcher

Introducción a visión computacional

Programa

Prof. Vasquez

Introducción a visión computacional

Programa

Prof. Vasquez

Modal title