Quedé muy satisfecho con las presentaciones finales del curso Laboratorio de Inteligencia Computacional y Robótica, que dicto junto a Martín Adams. Este curso está dirigido a estudiantes de último año de la carrera, quienes lo toman como electivo. Para este semestre diseñamos un proyecto final particularmente desafiante, en el cual los estudiantes debían abordar dos problemas clásicos de visión por computador apoyados por modelos de lenguaje multimodales: OCR (reconocimiento óptico de caracteres) e Image Captioning, es decir, la generación automática de descripciones textuales a partir de imágenes. Para ello, cada grupo tuvo que instalar, evaluar y comparar distintos modelos de LLM con capacidades visuales, enfocándose tanto en la descripción automática del contenido de imágenes como en la extracción de texto. Un aspecto distintivo de esta edición fue el uso de una base de datos propia, compuesta por 30 imágenes seleccionadas de mi biblioteca personal. Esta decisión añadió un nivel adicional de complejidad y realismo al desafío, alejándose de los datasets estándar comúnmente utilizados en este tipo de proyectos.

Figura 1: Resumen de la base de datos utilizada. (Primeras 15 fotos OCR, segundas 15 IC)
Las presentaciones comenzaron puntualmente y, al finalizar, entregué retroalimentación personalizada a cada grupo, especialmente orientada a mejorar la claridad y solidez de sus exposiciones. Espero que estos comentarios les sean de utilidad cuando llegue el momento de defender sus memorias de título.

Figura 2: Los protagonistas de las presentaciones de hoy.
Quiero aprovechar la oportunidad para agradecer a los estudiantes que presentaron hoy sus resultados, a Karina Avila, Cynthia Muñoz y al cuerpo docente (Matias Carvajal y Francisco Soto) quienes hicieron posible el buen desarrollo del curso, y a mis colegas Jorge Zambrano y Juan Pablo Pérez, con quienes diseñamos esta experiencia. Juntos buscamos actualizar los proyectos del curso y ofrecer a los estudiantes una oportunidad real de explorar el estado del arte en inteligencia artificial.