La visión computacional es un campo multidisciplinario de la inteligencia artificial que busca que las computadoras “vean” y entiendan el mundo visual de forma similar a los humanos. Para ello, desarrolla algoritmos y sistemas capaces de procesar, analizar y tomar decisiones a partir de imágenes y videos. En este curso aprenderás los fundamentos que sostienen a la visión computacional y explorarás técnicas clave como filtrado, detección, segmentación, seguimiento y, de forma introductoria, métodos basados en aprendizaje profundo.
Nuestro enfoque será 100% práctico: trabajaremos con programas interactivos en Python usando OpenCV, ejecutados directamente en Google Colab. Esto significa que podrás correr todos los notebooks desde tu navegador, sin instalar nada en tu computadora. Verás los efectos de cada algoritmo en tiempo real (por ejemplo, al mover deslizadores para cambiar umbrales, tamaños de kernel o parámetros de detección), lo que te ayudará a construir intuición y a depurar tus soluciones de manera ágil.
Al finalizar, serás capaz de:
- Comprender los alcances y limitaciones de la visión computacional en distintos escenarios.
- Implementar pipelines básicos con OpenCV (carga de imágenes, preprocesamiento, extracción de características, detección/segmentación/seguimiento y visualización).
- Experimentar y evaluar con métricas simples la calidad de tus resultados, ajustando parámetros de forma interactiva.
- Conectar conceptos teóricos con aplicaciones reales (por ejemplo, conteo de objetos, análisis de movimiento o segmentación de regiones de interés).
En resumen, saldrás con una base sólida y práctica, lista para aplicar en proyectos reales, prototipos de investigación y desarrollos más avanzados.
Programa
- 5 secciones
- 20 lecciones
- 18 semanas
- IntroducciónIniciemos comprendiendo por qué es importante la visión computacional en nuestros días.8
- 1.1Introducción a la visión computacional27 minutos
- 1.2Temario y material12 minutos
- 1.3Instalar ejercicios de programacion8 minutos
- 1.4Tareas a resolver en visión15 minutos
- 1.5Definición de imagen20 minutos
- 1.6Programa: OpenCV30 minutos
- 1.7Operaciones básicas (opencv)15 minutos
- 1.8Proyecto 1: Índice NDI120 minutos
- FiltradoEl filtrado permite contrarestar el ruido en las imágenes4
- BordesLos bordes son características de las imágenes que nos permiten encontrar la frontera entre dos regiones diferentes.3
- Regiones e imágenes binariasLas regiones son un conjunto de pixeles que tienen una propiedad en común. En esta lección tendremos un acercamiento hacia las regiones des un punto de vista clásico.4
- Detección de líneasLos modelos paramétricos nos permiten representar diversos fenómenos como pueden ser las líneas rectas en un carrir vehicular. En esta sección estudiaremos diversos métodos para hallar dichos modelos.1
