Revolución en inteligencia artificial: Genie 3 puede crear mundos virtuales

Genie 3 , aún en fase de investigación y aún no disponible para el público, combina las capacidades de sus predecesores, el Genie 2, y su modelo de producción de video, el Veo 3. El nuevo modelo de IA puede crear entornos 3D interactivos de varios minutos de duración a 24 fotogramas por segundo y una resolución de 720p. Esto supone un avance significativo respecto a las escenas de 10 a 20 segundos que podía producir el Genie 2.
El aspecto más sorprendente del modelo es su capacidad para recordar imágenes generadas previamente por Genie 3 y, con base en ellas, decidir lógicamente cómo se desarrollarán los eventos. La compañía enfatiza que esta consistencia no está codificada artificialmente; aprende por sí sola. «No entrenamos este modelo para imitar el mundo real, tomando decisiones según las leyes de la física», afirma Shlomi Fruchter, investigadora de DeepMind . «Aprendió esta consistencia por sí sola».
Genie 3 puede cambiar de escenario según las órdenes del usuario. Por ejemplo, cuando un personaje de IA en medio de un almacén recibe una orden como "acércate al compactador de basura verde" o "camina hacia la carretilla elevadora roja", Genie 3 crea el entorno y el personaje actúa en él. Según las pruebas de DeepMind, estas tareas se completaron correctamente.
Sin embargo, Genie 3 tiene sus limitaciones. Por ejemplo, se observó que la nieve no reaccionaba de forma realista en una escena donde un esquiador se deslizaba cuesta abajo. Además, el modelo aún es insuficiente para simular las complejas interacciones de múltiples personajes independientes, y las simulaciones limitadas a unos pocos minutos no son suficientes para horas de entrenamiento.
Aun así, los expertos dicen que esta tecnología acerca a la IA un paso más a imitar comportamientos específicos de los humanos, como planificar, explorar su entorno, navegar en lo desconocido y mejorar a través de la experiencia.
milliyet