Anthropic restringe acesso ao Claude Mythos Preview após IA localizar milhares de vulnerabilidades críticas
A Anthropic restringiu o acesso ao modelo Claude Mythos Preview, disponível apenas para empresas via Projeto Glasswing, após a ferramenta identificar milhares de falhas de segurança e "zero-day". Em testes, a IA explorou 181 vulnerabilidades no Firefox e assumiu o controle de redes corporativas simuladas em 30% das tentativas
:format(jpg)/f.elconfidencial.com%2Foriginal%2Fdf8%2F97c%2Fca6%2Fdf897cca6289e08d743be021a7636155.jpg)
A Anthropic anunciou, em 7 de abril de 2026, que seu modelo de linguagem mais avançado, o Claude Mythos Preview, desenvolveu a capacidade de localizar e explorar vulnerabilidades críticas em sistemas computacionais com uma velocidade sem precedentes. Diante do risco de a ferramenta ser utilizada para comprometer a segurança cibernética global, a empresa optou por não liberar o modelo ao público geral. Em vez disso, criou o Projeto Glasswing, concedendo acesso exclusivo a grandes companhias de tecnologia para a realização de testes.
A eficácia do sistema foi comprovada em avaliações controladas, onde engenheiros sem experiência prévia em segurança utilizaram o Mythos para escanear milhares de bases de código. O modelo realizou ataques autônomos complexos e em múltiplas etapas, executando em pouco tempo tarefas que demandariam semanas ou meses de trabalho de especialistas humanos. No navegador Firefox, da Mozilla, a IA identificou 271 vulnerabilidades e desenvolveu rotinas de ataque para explorar 181 delas.
Testes conduzidos pela equipe da Anthropic, pelo Instituto de Segurança de Inteligência Artificial do Reino Unido e pela Agência de Segurança Nacional revelaram a descoberta de milhares de falhas "zero-day" — vulnerabilidades não documentadas e ainda não corrigidas — em navegadores, sistemas operacionais e diversas aplicações. Entre os achados mais notáveis, o Mythos detectou um erro no FFmpeg, ferramenta de processamento de imagem e som, datado de 16 anos atrás, e uma falha latente desde 1998 no sistema operacional OpenBSD. Ambas as brechas permitem que usuários não autenticados assumam o controle das máquinas afetadas.
O diferencial do modelo reside na capacidade de encadear processos, o que permitiu ao Mythos assumir o controle de uma rede corporativa simulada em 30% das tentativas, tornando-se a primeira inteligência artificial a atingir esse resultado.
Apesar do impacto, a natureza das falhas encontradas não representa a criação de novas classes de ameaças. O sistema identificou variações de vulnerabilidades já conhecidas e compreendidas, automatizando a identificação de padrões e a verificação de exploração. O avanço, portanto, não está na descoberta de novos tipos de erros, mas na intensidade e na rapidez com que a automação da IA processa etapas da segurança cibernética ofensiva.
A Anthropic destacou que as mesmas melhorias que tornam o modelo eficiente para corrigir vulnerabilidades também o tornam igualmente eficaz para explorá-las. O cenário expõe a fragilidade dos sistemas modernos e a desvantagem inerente dos defensores, que precisam de precisão absoluta, enquanto atacantes necessitam de apenas um êxito para comprometer a segurança. O resultado é a democratização de capacidades técnicas altamente especializadas, reduzindo drasticamente o esforço necessário para realizar ataques complexos.