OpenAI ha lanzado ChatGPT Images 2.0, un generador de imágenes capaz de crear revistas completas con texto legible, una capacidad que hasta ahora había sido uno de los principales escollos de la Inteligencia Artificial generativa.
El nuevo modelo resuelve el problema que ha perseguido a los generadores de imágenes: insertar texto dentro de las imágenes sin que resulte ilegible o distorsionado. A diferencia de versiones anteriores como GPT-Image-1.5, ChatGPT Images 2.0 maneja el texto con precisión, desde pequeñas etiquetas hasta párrafos completos.
Durante su fase de prueba en LM Arena bajo el nombre en clave "duct tape", usuarios reportaron que el modelo genera imágenes de hasta 2K de resolución y crea capturas de pantalla prácticamente idénticas a las reales. Varios testers destacaron su capacidad para reproducir portadas de revistas e interfaces de aplicaciones enteras sin errores visuales.
OpenAI asegura que el modelo puede diseñar revistas completas, infografías, mapas y carteles listos para imprimir. Una función adicional permite generar hasta ocho imágenes a partir de una sola instrucción manteniendo coherencia en personajes y objetos, lo que facilita la creación de storyboards y cómics sin necesidad de indicaciones repetidas.
La herramienta se ofrece en dos versiones: Instant, que genera imágenes rápidamente para usos casuales, e Thinking, reservada a suscriptores de pago. Esta última razona antes de crear, verifica información y consulta la web para incorporar datos actualizados, aunque tarda varios minutos en completar infografías complejas.
Otro avance importante es el soporte para alfabetos no latinos. El modelo maneja con fluidez el japonés, coreano, hindi, bengalí y chino, idiomas que han causado problemas en generadores anteriores. Ahora produce material editorial en estos idiomas sin que el texto se convierta en ruido visual.
Desde hoy, ChatGPT Images 2.0 está disponible para todos los usuarios de ChatGPT, aunque el modo Thinking requiere suscripción de pago. Los desarrolladores pueden acceder al modelo a través de la API con precios variables según resolución y calidad. OpenAI planea integrar la herramienta en Codex, su aplicación para desarrolladores en Mac.