¿Pueden los modelos de inteligencia artificial entender una historia contada con imágenes?

En esta plática exploraremos cómo los sistemas que combinan lenguaje y visión aprenden a razonar visualmente, conectando información a lo largo de secuencias de imágenes. Me enfocaré en dos proyectos recientes, ImageChain y MuSeD, que muestran cómo estos avances permiten analizar contenido visual complejo y contribuir a aplicaciones orientadas al bien social. Finalmente, hablaré de los retos abiertos para desarrollar modelos capaces de generar explicaciones confiables.

Organiza: 
División Académica de Ciencias de la Computación
Ubicación: 
OTRA
Correo electrónico: 
Extensión o teléfono: 
55 5628 4000, ext. 3614
Organiza - OTRO: 
Departamento Académico de Computación
Ubicación - OTRO: 
Salón 304