OpenAI ha dado un nuevo paso adelante en el desarrollo de Inteligencia Artificial avanzada con el lanzamiento de dos innovadores modelos: o3 y o4-mini.
Estas nuevas incorporaciones a la serie "o" están diseñadas específicamente para realizar tareas complejas de razonamiento, como programar, navegar por internet y generar imágenes, con un enfoque centrado en la autonomía y la comprensión visual.
La familia de modelos "o", que ahora se actualiza con o3 y o4-mini, se caracteriza por su capacidad para razonar durante más tiempo antes de generar una respuesta. Esto les permite ofrecer soluciones más reflexivas y detalladas. De hecho, los nuevos modelos pueden resolver problemas de múltiples pasos utilizando de forma autónoma las herramientas del propio ChatGPT, entre ellas la navegación web, la programación en Python y la comprensión y generación de contenido visual.
Según explica la compañía en su blog oficial, "estos modelos están entrenados para razonar sobre cuándo y cómo usar herramientas para ofrecer respuestas completas en los formatos adecuados, generalmente en menos de un minuto".
Una de las características más destacadas de o3 y o4-mini es su capacidad para “pensar con imágenes”. Esto significa que los modelos pueden interpretar visualmente cualquier imagen, independientemente de su calidad, e integrarla en su proceso de razonamiento para mejorar la calidad y precisión de sus respuestas.
Los modelos ya se encuentran disponibles para los usuarios de ChatGPT Plus, Pro y Team, en sus variantes o3, o4-mini y o4-mini-high. También están accesibles a través de API mediante Chat Completions y Responses API. Con esta actualización, se reemplazan las versiones anteriores o1, o3-mini y o3-mini-high.
OpenAI destaca que o3 se ha convertido en su modelo de razonamiento más potente hasta la fecha, con un rendimiento sobresaliente en áreas como la programación, las matemáticas, la ciencia y la percepción visual. Comparado con o1, comete un 20 % menos de errores importantes en tareas del mundo real.
Por su parte, o4-mini, más ligero y eficiente, está especialmente optimizado para ejecutar tareas rápidas de razonamiento, en campos como las matemáticas, la programación y el análisis visual. Además, ofrece mayores límites de uso en comparación con o3, lo que lo convierte en una opción rentable para necesidades de gran escala.
Junto a estos modelos, OpenAI ha presentado Codex CLI, un agente de programación ligero, de código abierto y con funcionamiento local. Esta herramienta está diseñada para facilitar el desarrollo y la automatización directamente desde el dispositivo del usuario, sin depender de conexiones en la nube.