Alibaba ha presentado Qwen-Image-2.0, una nueva versión de su modelo de Inteligencia Artificial para generar imágenes que pone el foco en mejorar el renderizado de texto y en elevar el realismo de las escenas, incluidas aquellas en las que aparecen personas, hasta alcanzar resultados fotorrealistas.
La compañía explica que Qwen-Image-2.0 integra generación y edición de imágenes y que puede trabajar tanto con indicaciones en texto como con otras imágenes como punto de partida, con el objetivo de ofrecer acabados realistas y de aspecto profesional. En este contexto, Alibaba subraya que el sistema destaca en las pruebas al lograr "un rendimiento superior".
Otro de los avances señalados es el seguimiento de instrucciones, especialmente en composiciones divididas por áreas, donde el modelo es capaz de representar los elementos solicitados y, al mismo tiempo, preservar la coherencia global de la escena.
Alibaba también ha puesto el acento en la precisión ante instrucciones complejas, algo que vincula con la posibilidad de emplear prompts de hasta mil tokens, lo que permite a los usuarios describir con mayor nivel de detalle lo que esperan obtener en la imagen final.
Según se recoge en el comunicado difundido en el blog de Qwen, los resultados buscan combinar exactitud, acabado profesional y calidad estética. Este enfoque se traslada de manera especial a las piezas que mezclan texto e imagen, un ámbito en el que el modelo admite distintos estilos tipográficos y se orienta a usos como carteles, cómics e infografías.
El realismo figura entre los elementos que Alibaba destaca de esta actualización, no solo en la construcción de escenas, sino también en la representación de personas, naturaleza y arquitectura, con un tratamiento más consistente de lo que aparece en el encuadre.
Para lograrlo, Qwen-Image-2.0 tiene en cuenta aspectos como las propiedades de los materiales y la orientación espacial, y mantiene la iluminación, los reflejos y la perspectiva. En la búsqueda del fotorrealismo, el modelo también persigue recrear con naturalidad acciones, expresiones, texturas y colores.