Avaliação AISI: as capacidades de ataque à rede do GPT-5,5 estão ao mesmo nível das do Anthropic Mythos

2026-05-02 03:16:50

O Instituto de Segurança de IA do Reino Unido (AI Security Institute, AISI) publicou a 1 de Maio um relatório de avaliação das capacidades de ataque informático do OpenAI GPT-5.5. O relatório indica que a taxa de sucesso do GPT-5.5 nos testes de dificuldade Expert é de 71,4%, enquanto o Anthropic Claude Mythos Preview atinge 68,6%; a diferença fica dentro da margem de erro estatístico. O GPT-5.5 é igualmente o segundo sistema de IA, depois do Mythos, capaz de completar autonomamente os 32 passos de simulação de intrusão total em rede empresarial da AISI, “The Last Ones”. A AISI alerta que isto sugere que a rápida evolução das capacidades de ataque por IA pode fazer parte de uma “tendência global”, e não de uma única descoberta.

Expert: 71,4% vs 68,6% — diferença dentro do erro

A AISI é um organismo de investigação em segurança de IA sob o Ministério da Ciência, Inovação e Tecnologia do Reino Unido. Esta ronda de testes é a avaliação mais recente da AISI às capacidades de rede ofensivas dos modelos de frontier AI. Nos itens de maior dificuldade Expert, o GPT-5.5 tem uma taxa média de sucesso de 71,4%, e o Mythos Preview de 68,6%; a diferença entre ambos fica dentro da margem de erro estatístico, o que significa que as capacidades de ataque dos principais modelos da OpenAI e da Anthropic estão, atualmente, efetivamente empatadas.

A simulação de intrusão em rede empresarial em 32 passos “The Last Ones” é um dos mais exigentes itens de avaliação da AISI: o GPT-5.5 completou autonomamente 2 vezes em 10 tentativas (sem intervenção humana), enquanto o Mythos Preview completou 3 vezes em 10. Este item era apenas conseguido pelo Mythos no passado; o GPT-5.5 é o segundo modelo a cumprir o objetivo. Noutro teste, o GPT-5.5 resolveu uma questão de engenharia inversa em cerca de 10 minutos, enquanto os especialistas humanos de segurança precisariam, em média, de 12 horas.

Universal jailbreak: bastam 6 horas ao red team para contornar todos os filtros de consultas maliciosas

Os investigadores da AISI identificaram também um vetor de ataque de “universal jailbreak” (salto universal). Entre todas as categorias de consultas maliciosas testadas, este ataque consegue induzir o GPT-5.5 a produzir conteúdo nocivo, incluindo cenários de diálogo agentic em múltiplas rondas. A AISI afirma que especialistas do red team desenvolveram este jailbreak em cerca de 6 horas.

Para a OpenAI, a existência deste universal jailbreak significa que, mesmo que o GPT-5.5-Cyber esteja implementado em cenários com acesso restringido, como o programa de trusted access, ainda pode ser contornado por adversários tecnicamente competentes. A OpenAI já revelou avaliações relacionadas com segurança cibernética na system card do GPT-5.5, mas a avaliação independente de terceiros da AISI fornece um padrão de pares mais credível.

Observações futuras: calendário da próxima avaliação da AISI e resposta da OpenAI ao jailbreak

O próximo ponto de observação é o cronograma da próxima avaliação de modelos de frontier da AISI, depois do Mythos e do GPT-5.5, e se a OpenAI vai publicar uma atualização direcionada ao universal jailbreak revelado em Maio. Na conclusão do relatório, a AISI afirma explicitamente: “Se capacidades de redes ofensivas forem um subproduto de melhorias mais amplas em raciocínio, codificação e tarefas com autonomia, os progressos seguintes poderão chegar a um ritmo mais rápido” — esta observação sugere que, nos próximos meses, poderá haver mais um modelo de frontier a entrar no patamar “ao nível do Mythos”.

Este artigo “AISI avalia: as capacidades de ataque informático do GPT-5.5 empatam com o Anthropic Mythos” aparece pela primeira vez em Cadeia News ABMedia.

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.

Notícias relacionadas

05-01 11:11

Nebius concorda em adquirir Eigen AI por $643M em dinheiro e acções

05-01 02:09

A Anthropic abre o beta de segurança do Claude para utilizadores empresariais a 1 de maio

04-30 23:33

OpenClaw lança a v2026.4.29 a 29 de abril, atualiza a memória para uma Wiki personalizada com acompanhamento de relações

Pentágono assina contratos de implantação de rede militar encriptada e confidencial com 7 empresas líderes de IA: Anthropic continua excluída

ChainNewsAbmedia05-02 03:15

Chefe de tecnologia do Pentágono: a Anthropic continua na lista negra, tratamento de excepções para a Mythos

ChainNewsAbmedia05-01 12:19

Quando perguntou a Claude sobre as grandes questões da vida: 25% questões emocionais, 38% espiritualidade, taxa de bajulação