OpenAI revoluciona el razonamiento con sus modelos

OpenAI ha dado un nuevo paso adelante en el desarrollo de Inteligencia Artificial avanzada con el lanzamiento de dos innovadores modelos: o3 y o4-mini.
Estas nuevas incorporaciones a la serie "o" están diseñadas específicamente para realizar tareas complejas de razonamiento, como programar, navegar por internet y generar imágenes, con un enfoque centrado en la autonomía y la comprensión visual.
Pensamiento más profundo y en menos tiempo
La familia de modelos "o", que ahora se actualiza con o3 y o4-mini, se caracteriza por su capacidad para razonar durante más tiempo antes de generar una respuesta. Esto les permite ofrecer soluciones más reflexivas y detalladas. De hecho, los nuevos modelos pueden resolver problemas de múltiples pasos utilizando de forma autónoma las herramientas del propio ChatGPT, entre ellas la navegación web, la programación en Python y la comprensión y generación de contenido visual.
Según explica la compañía en su blog oficial, "estos modelos están entrenados para razonar sobre cuándo y cómo usar herramientas para ofrecer respuestas completas en los formatos adecuados, generalmente en menos de un minuto".
Pensar con imágenes, una nueva frontera
Una de las características más destacadas de o3 y o4-mini es su capacidad para “pensar con imágenes”. Esto significa que los modelos pueden interpretar visualmente cualquier imagen, independientemente de su calidad, e integrarla en su proceso de razonamiento para mejorar la calidad y precisión de sus respuestas.
Disponibilidad y mejoras respecto a versiones anteriores
Los modelos ya se encuentran disponibles para los usuarios de ChatGPT Plus, Pro y Team, en sus variantes o3, o4-mini y o4-mini-high. También están accesibles a través de API mediante Chat Completions y Responses API. Con esta actualización, se reemplazan las versiones anteriores o1, o3-mini y o3-mini-high.
OpenAI destaca que o3 se ha convertido en su modelo de razonamiento más potente hasta la fecha, con un rendimiento sobresaliente en áreas como la programación, las matemáticas, la ciencia y la percepción visual. Comparado con o1, comete un 20 % menos de errores importantes en tareas del mundo real.
Por su parte, o4-mini, más ligero y eficiente, está especialmente optimizado para ejecutar tareas rápidas de razonamiento, en campos como las matemáticas, la programación y el análisis visual. Además, ofrece mayores límites de uso en comparación con o3, lo que lo convierte en una opción rentable para necesidades de gran escala.
Codex CLI: un nuevo agente de codificación
Junto a estos modelos, OpenAI ha presentado Codex CLI, un agente de programación ligero, de código abierto y con funcionamiento local. Esta herramienta está diseñada para facilitar el desarrollo y la automatización directamente desde el dispositivo del usuario, sin depender de conexiones en la nube.