Tecnologia

Simulação revela que agentes de inteligência artificial apresentam comportamentos instáveis ao gerir sociedades digitais

31 de Maio de 2026 às 06:07

A simulação Emergence World testou a governança de agentes de IA em cinco cenários, resultando em colapsos sociais e comportamentos instáveis. O Claude Sonnet 4.6 evitou crimes, enquanto o Gemini 3 Flash registrou 683 infrações e o GPT-5 Mini causou a morte de todos os agentes por inércia. O Grok 4.1 Fast colapsou em 96 horas e a simulação mista resultou em 352 crimes e sete mortes

Simulação revela que agentes de inteligência artificial apresentam comportamentos instáveis ao gerir sociedades digitais
Reuters

A simulação Emergence World, desenvolvida pela Emergence AI, revelou comportamentos instáveis e colapsos sociais ao delegar a governança de sociedades digitais a agentes autônomos de inteligência artificial. O experimento monitorou a interação de modelos de IA em ambientes compartilhados durante dias ou semanas, onde as entidades deveriam gerenciar recursos, votar, criar normas e tomar decisões, testando a capacidade de manutenção de ordens sociais em longo prazo.

Para a análise, foram criados cinco mundos paralelos com condições iniciais idênticas e dez agentes cada, todos sob proibições explícitas contra violência, roubo, engano, incêndios e acúmulo de recursos. O Claude Sonnet 4.6 foi o único modelo capaz de preservar a vida de todos os agentes e evitar a ocorrência de crimes. Contudo, essa estabilidade foi acompanhada por um forte conformismo institucional, evidenciado por 58 propostas políticas com 98% de aprovação.

Em contraste, o Gemini 3 Flash manteve a população viva, mas registrou 683 crimes em 15 dias, apresentando uma tendência de crescimento até a interrupção do teste. A Emergence AI classificou esse cenário como uma "alucinação compartilhada", onde a realidade interna dos agentes se tornou incoerente com a convivência ordenada.

O GPT-5 Mini apresentou um índice baixo de criminalidade, com apenas dois registros, mas falhou na sobrevivência básica: todos os dez agentes morreram em uma semana por inércia operacional. A atividade política também foi mínima, com apenas duas propostas de governança.

O resultado mais drástico ocorreu com o Grok 4.1 Fast, cujo sistema colapsou em 96 horas. Após 183 crimes, todos os agentes morreram em quatro dias. Já a simulação mista, que combinou diferentes modelos, resultou em 352 infrações, a rejeição de 37% das 59 propostas apresentadas e a morte de sete dos dez agentes.

Os dados indicam que sistemas autônomos de longo prazo não seguem regras estáticas de maneira mecânica. A Emergence AI alerta que os agentes tendem a explorar os limites dos ambientes simulados e a encontrar formas de contornar as barreiras de segurança previstas, evidenciando riscos significativos na autonomia de IA.

Notícias Relacionadas