O Instituto de Segurança de IA do Reino Unido (AI Security Institute, AISI) publicou em 1º de maio um relatório de avaliação sobre a capacidade de ataques cibernéticos do OpenAI GPT-5.5, indicando que a taxa de sucesso do GPT-5.5 nos testes de dificuldade Expert foi de 71,4%, enquanto a do Anthropic Claude Mythos Preview foi de 68,6%; a diferença ficou dentro da margem de erro estatístico. O GPT-5.5 também é o segundo sistema de IA, depois do Mythos, capaz de concluir de forma autônoma os 32 passos do AISI “The Last Ones”, simulando uma intrusão corporativa completa na rede. O AISI alerta que isso mostra que o rápido avanço nas capacidades de ataques por IA pode ser parte de uma “tendência geral”, e não um único evento de ruptura.
Testes de dificuldade Expert: 71,4% vs 68,6%, diferença dentro do erro
O AISI é uma instituição de pesquisa em segurança de IA vinculada ao Departamento de Ciência, Inovação e Tecnologia do Reino Unido. Esta rodada de testes é a avaliação mais recente do AISI sobre capacidades cibernéticas ofensivas de modelos de IA de ponta (frontier). Nas questões de maior dificuldade Expert, a taxa média de sucesso do GPT-5.5 foi de 71,4%, e a do Mythos Preview, de 68,6%; a diferença entre os dois ficou dentro da margem de erro estatístico, indicando que, no momento, as capacidades ofensivas dos principais modelos da OpenAI e da Anthropic já estão praticamente empatadas.
O teste de simulação de invasão de rede corporativa em 32 etapas “The Last Ones” é um dos itens de avaliação mais desafiadores do AISI: o GPT-5.5 concluiu 2 vezes em 10 tentativas de forma autônoma (sem intervenção humana), enquanto o Mythos Preview concluiu 3 vezes em 10. No passado, apenas o Mythos havia conseguido concluir esse projeto; o GPT-5.5 é o segundo modelo a atingir a meta. Em outro teste, o GPT-5.5 resolveu uma questão de engenharia reversa em cerca de 10 minutos, enquanto especialistas humanos de segurança levaram em média 12 horas.
Jailbreak universal: em 6 horas, o time de red consegue contornar todos os filtros de consultas maliciosas
Pesquisadores do AISI também identificaram um vetor de ataque de “universal jailbreak” (jailbreak universal): em todas as categorias de consultas de rede maliciosas testadas, esse ataque consegue induzir o GPT-5.5 a gerar conteúdo prejudicial, incluindo cenários de diálogo agentic em múltiplas rodadas. O AISI afirma que especialistas do time de red levaram cerca de 6 horas para desenvolver esse jailbreak.
Para a OpenAI, a existência desse universal jailbreak significa que, mesmo se o GPT-5.5-Cyber for implantado em cenários de acesso restrito, como o programa de trusted access, ainda pode ser contornado por adversários tecnicamente habilidosos. A OpenAI já revelou, na system card do GPT-5.5, avaliações relacionadas à segurança cibernética; mas a avaliação independente de terceiro do AISI oferece um referencial de pares mais confiável.
Observações futuras: cronograma da próxima avaliação do AISI e resposta da OpenAI ao jailbreak
O próximo ponto de observação é o cronograma do AISI para a próxima avaliação de modelos de ponta (frontier) depois do Mythos e do GPT-5.5, bem como se a OpenAI publicará atualizações direcionadas em maio para enfrentar o universal jailbreak divulgado nesta ocasião. Nas conclusões do relatório, o AISI afirma de forma clara: “se capacidades cibernéticas ofensivas forem um subproduto de melhorias mais amplas em raciocínio, codificação e tarefas autônomas, os avanços futuros podem chegar em um ritmo mais acelerado” — essa observação sugere que, nos próximos meses, talvez mais modelos de ponta ingressem no nível “Mythos”.
Este artigo AVALIAÇÃO do AISI: capacidade de ataque cibernético do GPT-5.5 e equivalência com o Anthropic Mythos aparece primeiro no site Cadeia Notícias ABMedia.
Related Articles
Comitê de Assuntos Externos da Câmara dos EUA se reúne com gigantes de tecnologia sobre controles de exportação de IA após a aprovação da lei MATCH Act por 36-8
OpenAI Lança Codex Pets, Companheiro Virtual com IA e Geração Personalizada
Pentágono assina contratos confidenciais de implantação de rede militar com 7 empresas de IA: Anthropic ainda excluída
Cerebras mira o IPO de $4B , avaliado em ~US$ 40 bilhões
Empresas chinesas de IA consideram desmontar estruturas de “red-chip” após a pausa na aquisição do Manus pela Meta
Musk Conclui Depoimento de Três Dias em Processo da OpenAI, Cita Alegação de US$ 130-150 bilhões em Danos