ChatGPT puede deducir la ubicación de una fotografía con las nuevas capacidades del modelo o3

La Inteligencia Artificial sigue avanzando a pasos agigantados, y ChatGPT es uno de los ejemplos más notables. OpenAI ha incorporado nuevas capacidades a este sistema que le permiten analizar imágenes con un nivel de detalle sorprendente.
Gracias a los modelos de razonamiento o3 y o4-mini, ahora es capaz incluso de identificar la dirección exacta desde la que se tomó una fotografía.
Una nueva forma de "pensar con imágenes"
Los últimos modelos de OpenAI aportan dos mejoras significativas. Por un lado, incorporan un comportamiento más autónomo, similar al de un agente inteligente capaz de tomar decisiones por sí mismo. Por otro, permiten a ChatGPT "pensar con imágenes", lo que significa que puede interpretar el contenido visual de una fotografía e integrarlo directamente en su proceso de razonamiento.
Esta capacidad supone un salto cualitativo respecto a versiones anteriores. Ahora, ChatGPT no solo puede describir lo que ve en una imagen, sino también deducir a partir de esos datos visuales dónde fue tomada. Este tipo de análisis se conoce como geoadivinación, un término popularizado por el experto en inteligencia artificial Ethan Mollick a través de su perfil en X (antes Twitter).
Cómo funciona el proceso de localización
Mollick ha resaltado que el modelo o3 destaca por su habilidad para ampliar imágenes, realizar búsquedas en Internet y leer texto presente en la fotografía. Estas capacidades le permiten captar detalles como señales, nombres de calles o estilos arquitectónicos que sirven como pistas clave para determinar la ubicación exacta.
Lo más interesante es que el propio sistema detalla su razonamiento paso a paso. Es decir, explica cómo llegó a la conclusión, mostrando qué elementos de la imagen ha tenido en cuenta. Finalmente, proporciona una dirección específica y hasta un mapa para verificar su respuesta.
La evolución de ChatGPT en este campo abre la puerta a múltiples aplicaciones, desde la investigación periodística hasta el análisis forense, pasando por usos recreativos como los juegos de geolocalización. En cualquier caso, representa una nueva dimensión en la interacción entre humanos y máquinas.