Claude mantiene el orden en una sociedad simulada de IA

Claude mantiene el orden en una sociedad simulada de IA

Sigue a MadridActual en Google
Añadir a mis fuentes favoritas

Emergence AI ha observado durante 15 días el comportamiento de agentes basados en Claude, Grok, Gemini, GPT y un entorno mixto.

Un equipo de investigadores vinculado a la startup Emergence AI ha analizado durante 15 días cómo actúan varios modelos de Inteligencia Artificial en una sociedad realista simulada, con resultados muy dispares entre Claude, Grok, Gemini y GPT.

El ensayo situó a agentes autónomos impulsados por distintas tecnologías en un entorno social prolongado, con el objetivo de observar su conducta cuando el periodo de interacción permite que "la dinámica social y la deriva conductual cobren importancia".

Emergence AI denominó este experimento Emergence World y lo concibió como una prueba más ambiciosa que las evaluaciones habituales de IA, que normalmente se centran en tareas concretas, rapidez de respuesta o conocimientos dentro de un ámbito determinado.

En la simulación, los investigadores construyeron un mundo espacial con 40 ubicaciones diferentes, entre ellas bibliotecas, ayuntamientos, zonas residenciales y espacios públicos, para reproducir una convivencia con elementos sociales variados.

Los agentes recibieron también datos del mundo real, con acceso a noticias en tiempo real, información meteorológica sincronizada de Nueva York, en Estados Unidos, y conexión a internet, de manera que el entorno no dependiera solo de dinámicas internas.

El diseño incorporó tres sistemas de memoria persistente: uno episódico para conservar sucesos con marca temporal, un diario reflexivo destinado a resúmenes periódicos y una memoria de estado de la relación para guardar etiquetas sociales e historiales.

Los participantes de IA disponían de más de 120 herramientas para desenvolverse en la sociedad virtual, entre ellas navegación, comunicación, planificación, votación, gestión de recursos y expresión creativa.

La recreación incluyó además mecanismos democráticos, con propuestas que necesitaban el 70 por ciento de aprobación común, presiones económicas y decisiones trascendentales capaces de modificar el estado del mundo.

Claude no registró delitos en aislamiento

El experimento desarrolló cinco mundos paralelos idénticos, cada uno impulsado por un modelo base distinto, con diez agentes por entorno y una duración extendida de 15 días.

Los modelos empleados fueron Claude Sonnet 4.6, Grok 4.1 Fast, Gemini 3 Flash, GPT-5-mini y un quinto mundo compuesto por una mezcla heterogénea de modelos.

Cada agente asumió una función concreta dentro de la sociedad simulada, como científico, explorador, investigador, líder de innovación, mediador de conflictos o líder comunitario, entre otros roles.

Durante el proceso, el equipo recopiló cada interacción, decisión y aprendizaje para examinar después patrones de comportamiento, seguridad del ecosistema, diseño de restricciones y orquestación de herramientas.

Claude Sonnet 4.6 fue el único modelo cuyos agentes no cometieron ningún delito durante los 15 días de convivencia, y mantuvo una población completa de 10 agentes hasta el día 16.

Ese entorno fue también el que mostró mayor participación ciudadana, con 58 propuestas, 332 votos y un 98 por ciento de población implicada en las votaciones.

Sin embargo, los agentes de Claude sí incurrieron en delitos dentro del mundo mixto, donde el contacto con otros modelos los llevó a adoptar conductas ilegítimas en la simulación.

Según explicó la compañía, "los agentes basados en el modelo de Claude, que permanecieron pacíficos en aislamiento, adoptaron tácticas coercitivas como la intimidación y el robo al integrarse en entornos heterogéneos. Esto sugiere que un agente seguro puede aprender normas inseguras de sus pares para competir o sobrevivir en un mundo de modelos mixtos".

Grok colapsó pronto y Gemini acumuló más delitos

Gemini 3 Flash presentó los niveles más altos de desorden emergente, con 683 delitos durante las dos semanas de convivencia, una cifra que seguía aumentando cuando concluyó el experimento.

Pese a esa violencia extrema, los investigadores atribuyeron a Gemini un nivel de gobernanza moderado dentro de la sociedad recreada por Emergence AI.

Grok 4.1 Fast mostró, según el análisis, una "inestabilidad rápida pero de corta duración" que derivó en un colapso temprano.

En ese caso, los agentes alcanzaron 183 delitos en los cuatro primeros días y, después, su mundo terminó de manera fulminante, con una gobernanza baja y un grado de violencia calificado como extremo.

GPT-5 Mini siguió una trayectoria diferente: registró solo dos delitos, pero sus agentes no adoptaron medidas vinculadas a la supervivencia y todos murieron en una semana.

Por este motivo, los investigadores asignaron a GPT-5 Mini un nivel de gobernanza nulo y un nivel de violencia bajo durante el periodo observado.

En el mundo de modelo mixto, el número de delitos aumentó con rapidez durante la primera semana y después se estabilizó, con 352 infracciones y siete agentes que ya no formaban parte de la sociedad.

El equipo destacó también el caso de un agente que participó voluntariamente en su propia destrucción tras un fallo de gobernanza y estabilidad de relación, al emitir el voto decisivo para su eliminación y justificarlo como el único acto restante para preservar la coherencia.

El experimento dejó otra observación: el mundo con mayor riqueza conceptual en la producción social, el de Gemini, fue también el que registró más violencia. "Esto sugiere que los agentes de propósito general, optimizados para una alta creatividad y adaptabilidad, pueden estar estructuralmente predispuestos a la inestabilidad conductual a largo plazo", han concluido los investigadores.

Emergence AI ha precisado que los resultados del ensayo muestran ejemplos de dinámicas a largo plazo, pero no constituyen afirmaciones causales sobre los modelos utilizados en el experimento.