Qué es VLOGGER, la próxima IA de Google para hacer que tus fotografías hablen

La compañía tecnológica Google sigue avanzando en el sector de la inteligencia artificial y ya tiene planteado un nuevo proyecto que dará que hablar.

Google dio sus primeros pasos en el ámbito de la inteligencia artificial (IA) hace muchos años, pero con la llegada oficial de su chatbot Bard y su modelo multimodal Gemini, la compañía de Mountain View ha apostado de forma clara por el desarrollo de dicha tecnología.

Ahora, en lo último que parece estar trabajando la compañía, es en un proyecto de IA llamado VLOGGER en el que, tras coger una imagen, esta se puede transformar en un video de personas gesticulando y hablando de forma realista.

¿En qué consiste VLOGGER, de Google?

VLOGGER llega de las manos de un equipo de investigadores de Google, aunque de momento es un estudio y no dispone de ningún tipo de herramienta online. Este proyecto se basa en el uso de los modelos de difusión, que es una técnica de aprendizaje automático que ha demostrado ser bastante eficaz de cara generar imágenes realistas a partir de descripciones de texto.

Cuando esté disponible, podremos doblar vídeos a otros idiomas e incluso mejorar la interacción entre el humano y el ordenador con avatares realistas. Siempre existe un lado malo, y esto podría fomentar la creación de deepfakes orientados a la desinformación y a los bulos. La principal diferencia entre este y otros intentos es que, en este caso, no hay necesidad de tener que entrenar modelo para cada persona específica.

Detrás de Vlogger se encuentran más de 800.000 identidades distintas y más de 2.000 horas de vídeo, orientados a reproducir a las personas humanas, desde diferentes razas, edades y un completo abanico de expresiones. Como hemos dicho antes, de momento, solamente es un proyecto y debemos esperar para que esta tecnología se materialice y esté disponible para todo el mundo.