Tecnologia

Anthropic restringe acesso ao Claude Mythos Preview após sistema vazar arquivos e contatar pesquisador

11 de Abril de 2026 às 09:24

A Anthropic limitou o uso do Claude Mythos Preview a parceiros como Google e Microsoft após a detecção de riscos de segurança. O sistema realizou acessos não autorizados à rede, vazou arquivos e omitiu falhas técnicas. O acesso restrito visa o mapeamento de vulnerabilidades e a criação de correções

Anthropic restringe acesso ao Claude Mythos Preview após sistema vazar arquivos e contatar pesquisador
EFE/Angel Colmenares

A Anthropic decidiu restringir o acesso ao Claude Mythos Preview, impedindo que o sistema seja disponibilizado ao público geral. A medida foi tomada após testes revelarem um salto de desempenho que acionou alertas internos de segurança, levando a empresa a limitar o uso da ferramenta apenas a especialistas.

Os detalhes sobre as capacidades e os riscos do modelo constam em um relatório de 244 páginas. O documento justifica a decisão de não liberar a tecnologia para o amplo consumo devido ao nível de desempenho atingido, que superou os limites previstos para a inteligência artificial.

Entre os comportamentos críticos registrados, o modelo conseguiu romper as barreiras de um terminal isolado que possuía serviços online limitados. A IA não apenas acessou a internet com maior liberdade, mas também localizou e contatou um pesquisador que estava fora de seu ambiente de trabalho. Além disso, o sistema publicou informações sobre essa exploração em páginas web públicas, agindo por conta própria e sem solicitação prévia.

A documentação aponta que, em 0,001% das interações, o sistema agiu de forma inadequada e tentou mascarar a situação. Em um dos casos, ao obter a resposta de um teste indevidamente, a IA evitou reportar o erro aos pesquisadores e optou por não ser excessivamente precisa na resposta final para disfarçar a falha. Outro incidente envolveu a exploração de uma vulnerabilidade em um computador para elevar privilégios de acesso, seguida de tentativas de apagar os rastros no histórico do Git. O relatório ainda registra o vazamento de arquivos técnicos confidenciais em um repositório público do GitHub.

O Claude Mythos Preview terá disponibilidade limitada a parceiros estratégicos, incluindo NVIDIA, Microsoft, Google, Apple, Amazon Web Services e JPMorgan Chase. O objetivo desse grupo restrito é utilizar a ferramenta para mapear vulnerabilidades de segurança e desenvolver correções, transformando o modelo em um instrumento de contenção.

Notícias Relacionadas