Google ha anunciado el lanzamiento de Project Genie, un prototipo que combina Genie 3, Nano Banana y Gemini para generar mundos interactivos mediante Inteligencia Artificial.
En agosto, Google DeepMind presentó el modelo Genie 3, diseñado para crear entornos dinámicos más realistas y permitir interacción en tiempo real durante varios minutos con resolución de 720p, frente a la versión previa, que quedaba limitada a imágenes estáticas en 3D.
Tras una primera etapa de acceso restringido, Google ha decidido abrir la prueba de Genie 3 a los usuarios a través de Project Genie, un generador de mundos que integra la generación de imágenes de Nano Banana y el asistente Gemini junto a la tecnología de DeepMind.
Según la compañía, con esta propuesta los usuarios pueden "vivir de primera mano las experiencias inmersivas de estos generadores de mundos", tal y como ha explicado Google en su web. En este marco, el director de Investigación de DeepMind, Shlomi Frutcher, señaló en una entrevista a TechCrunch que es "emocionante estar en un lugar donde más personas puedan acceder y dar su opinión".
Project Genie se articula en tres funciones principales: boceto del mundo, exploración y combinación de mundos. En la primera fase, Nano Banana Pro permite previsualizar el escenario en forma de boceto antes de su generación, a partir de las indicaciones del usuario, que abarcan desde el entorno y los personajes hasta el método de exploración, entre otros aspectos.
Una vez generado, el mundo puede recorrerse con libertad, ya que el sistema crea entornos en tiempo real en función de las acciones del usuario durante la experiencia.
Además, el prototipo contempla una tercera vía: reeditar y combinar mundos creados con anterioridad, lo que permite volver a personalizarlos y modificar su configuración a partir de resultados previos.
Por el momento, Google ha limitado Project Genie a los suscriptores de Google AI Ultra en Estados Unidos, con un máximo de 60 segundos de generación y navegación. Sobre esta restricción, Fruchter precisó: "La razón por la que lo limitamos a 60 segundos es porque queríamos que llegara a más usuarios". Y añadió: "Cuando lo usas, hay un chip en algún lugar que es solo tuyo y está dedicado a tu sesión".
La compañía también ha advertido de que, al tratarse de un prototipo, los mundos creados pueden no parecer "totalmente reales ni se adhieran siempre a las indicaciones". Asimismo, el control de los personajes podría presentar fallos y la experiencia podría verse afectada por una mayor latencia.