Governo dos EUA ordena desativação dos modelos Claude Fable 5 e Mythos 5 da Anthropic

Inteligência Artificial·13 de junho de 2026·porHogrid

Em uma decisão sem precedentes que sacudiu o setor de inteligência artificial, o governo dos Estados Unidos ordenou nesta sexta-feira, 12 de junho de 2026, que a Anthropic desative imediatamente o acesso global aos seus dois modelos de linguagem mais avançados: o Claude Fable 5 e o Claude Mythos 5. A justificativa oficial aponta para preocupações com segurança nacional ligadas a uma suposta vulnerabilidade de jailbreak. A empresa discordou publicamente da medida.

A diretiva chegou à Anthropic às 17h21, horário do leste dos EUA, exigindo ação imediata e global. Com isso, um modelo recém-lançado ao mercado e outro que estava disponível apenas para dezenas de organizações altamente selecionadas foram retirados de circulação de um só golpe. O episódio levanta questões profundas sobre os limites da regulação governamental sobre IA e sobre as consequências inesperadas de estratégias de marketing baseadas em discurso de segurança.

Benchmarks de modelos de IA mostrando desempenho do Claude Fable 5 — Comparativo de benchmarks de modelos de IA – Foto: Vals AI / TechCrunch

Os modelos afetados

O Claude Fable 5 havia sido lançado apenas três dias antes da ordem de desativação. Posicionado como o modelo de IA de uso geral mais capaz publicamente disponível, o Fable 5 chegou ao mercado com guardrails específicos que bloqueavam respostas em áreas sensíveis como cibersegurança e biologia. De acordo com análises da plataforma Vals AI, o modelo superava todos os concorrentes em benchmarks públicos disponíveis no momento do lançamento.

Já o Claude Mythos 5 era um produto de outra natureza: um modelo extremamente restrito, nunca lançado ao público geral. Apresentado em abril deste ano, o Mythos foi disponibilizado apenas para aproximadamente 50 organizações cuidadosamente vetadas por meio do chamado Projeto Glasswing, uma iniciativa de acesso controlado da Anthropic. Entre as organizações participantes estavam gigantes como Amazon, Apple, Google, Microsoft e a empresa de cibersegurança CrowdStrike. O objetivo era avaliar as capacidades e os riscos do modelo em ambientes controlados antes de uma eventual distribuição mais ampla.

A vulnerabilidade alegada

A preocupação central do governo americano gira em torno de uma vulnerabilidade identificada como um jailbreak que permite, por meio de instruções específicas, que os modelos analisem bases de código e identifiquem falhas em softwares de infraestrutura crítica. Segundo fontes familiarizadas com o assunto, a técnica envolve instruir o modelo a analisar codebases específicos e apontar vulnerabilidades exploráveis.

O raciocínio governamental é de que essa capacidade representa um risco direto à segurança nacional: nas mãos erradas, um modelo capaz de identificar falhas em sistemas críticos poderia ser usado para planejar ataques cibernéticos de larga escala. A lógica é compreensível, mas ignora um fato importante que a própria indústria aponta: essa capacidade não é exclusiva dos modelos da Anthropic.

A posição da Anthropic

A empresa respondeu publicamente com uma nota que expressa discordância clara em relação à decisão governamental. Em comunicado oficial, a Anthropic declarou: “Discordamos que a identificação de um jailbreak potencial e específico seja motivo para retirar do ar um modelo comercial implantado para centenas de milhões de pessoas.”

A postura da Anthropic é de que o problema identificado é pontual e tratável, e que a resposta desproporcional do governo cria mais riscos do que resolve – tanto para os usuários que dependem desses modelos quanto para a competitividade americana no setor de inteligência artificial. A empresa não informou se pretende recorrer da decisão por vias legais ou negociar condições para a reativação dos modelos.

A ironia do marketing de segurança

Um dos aspectos mais intrigantes desse episódio é a possibilidade de que a própria estratégia de comunicação da Anthropic tenha contribuído para precipitar a ação governamental. Ao longo dos últimos anos, a empresa construiu sua identidade e reputação em torno de um discurso explicitamente voltado para segurança de IA. A Anthropic se apresenta publicamente como uma empresa que leva a sério os riscos existenciais da inteligência artificial avançada, e isso foi um diferencial competitivo importante.

O problema é que esse mesmo discurso pode ter enviado um sinal muito específico para reguladores e formuladores de políticas públicas: se a própria empresa afirma estar construindo sistemas potencialmente perigosos com capacidades que precisam ser controladas, os governos têm base concreta para agir. Sam Altman, CEO da OpenAI, antecipou essa ironia em abril deste ano com um comentário que ficou registrado: “É claramente um marketing incrível dizer: ‘Construímos uma bomba. Estávamos prestes a jogá-la na sua cabeça.'”

A declaração de Altman era uma crítica velada à estratégia da Anthropic, e agora ela ressoa com uma conotação profética. Ao enfatizar tanto os riscos dos próprios modelos, a Anthropic pode ter convencido o governo de que esses riscos eram reais o suficiente para justificar intervenção direta e imediata, sem aguardar qualquer processo regulatório formal.

O contexto da indústria

Especialistas em cibersegurança apontam que a capacidade de análise de código vulnerável não é uma exclusividade dos modelos da Anthropic. O GPT-5.5, da OpenAI, possui recursos semelhantes e é utilizado rotineiramente por profissionais de segurança ofensiva e defensiva ao redor do mundo. Red teams corporativos e pesquisadores independentes já usam modelos de linguagem avançados para identificar vulnerabilidades de software há mais de um ano.

Isso coloca a decisão governamental em uma perspectiva estrategicamente questionável: ao desativar os modelos da Anthropic enquanto mantém operacionais ferramentas equivalentes de outros fornecedores americanos e internacionais, o governo pode estar criando uma desvantagem competitiva sem de fato eliminar a ameaça que alega querer conter. O risco, dizem os críticos, simplesmente migra para outras plataformas, incluindo aquelas fora do alcance da regulação americana.

Implicações para o setor

A ordem de desativação dos modelos da Anthropic representa um momento de inflexão para toda a indústria de IA. Pela primeira vez, o governo americano exerceu um poder regulatório direto e imediato sobre modelos de IA comerciais em plena operação, baseando-se em uma avaliação de segurança nacional – e não em legislação aprovada pelo Congresso ou em um processo regulatório formal com ampla participação da indústria.

Para as demais empresas do setor, o sinal é claro: modelos com capacidades avançadas estão agora no radar de reguladores com poderes de agir rapidamente e sem aviso prévio. A corrida pelo desenvolvimento de inteligência artificial cada vez mais poderosa pode passar a enfrentar obstáculos não apenas técnicos ou de mercado, mas políticos e de segurança nacional, redefinindo as regras do jogo para todos os players.

Para a Anthropic especificamente, o desafio é duplo. A empresa precisa lidar com a interrupção operacional imediata causada pela desativação dos modelos – que afeta tanto usuários individuais quanto as dezenas de organizações parceiras do Projeto Glasswing, incluindo algumas das maiores empresas de tecnologia do mundo. E precisa, ao mesmo tempo, recalibrar seu discurso público de segurança para evitar que argumentos construídos para justificar cautela se tornem, paradoxalmente, argumentos governamentais para intervenção.

A tensão entre inovação, segurança e regulação nunca foi tão concreta no setor de IA. O episódio com a Anthropic pode marcar o início de uma nova fase da governança de inteligência artificial nos Estados Unidos, com implicações que vão muito além de dois modelos desativados em uma tarde de sexta-feira.

Fonte original: TechCrunch – Anthropic’s safety warnings may have just backfired: the government has pulled the plug on its most powerful AI