Avaliação AISI: as capacidades de ataque à rede do GPT-5,5 estão ao mesmo nível das do Anthropic Mythos

O Instituto de Segurança de IA do Reino Unido (AI Security Institute, AISI) publicou a 1 de Maio um relatório de avaliação das capacidades de ataque informático do OpenAI GPT-5.5. O relatório indica que a taxa de sucesso do GPT-5.5 nos testes de dificuldade Expert é de 71,4%, enquanto o Anthropic Claude Mythos Preview atinge 68,6%; a diferença fica dentro da margem de erro estatístico. O GPT-5.5 é igualmente o segundo sistema de IA, depois do Mythos, capaz de completar autonomamente os 32 passos de simulação de intrusão total em rede empresarial da AISI, “The Last Ones”. A AISI alerta que isto sugere que a rápida evolução das capacidades de ataque por IA pode fazer parte de uma “tendência global”, e não de uma única descoberta.

Expert: 71,4% vs 68,6% — diferença dentro do erro

A AISI é um organismo de investigação em segurança de IA sob o Ministério da Ciência, Inovação e Tecnologia do Reino Unido. Esta ronda de testes é a avaliação mais recente da AISI às capacidades de rede ofensivas dos modelos de frontier AI. Nos itens de maior dificuldade Expert, o GPT-5.5 tem uma taxa média de sucesso de 71,4%, e o Mythos Preview de 68,6%; a diferença entre ambos fica dentro da margem de erro estatístico, o que significa que as capacidades de ataque dos principais modelos da OpenAI e da Anthropic estão, atualmente, efetivamente empatadas.

A simulação de intrusão em rede empresarial em 32 passos “The Last Ones” é um dos mais exigentes itens de avaliação da AISI: o GPT-5.5 completou autonomamente 2 vezes em 10 tentativas (sem intervenção humana), enquanto o Mythos Preview completou 3 vezes em 10. Este item era apenas conseguido pelo Mythos no passado; o GPT-5.5 é o segundo modelo a cumprir o objetivo. Noutro teste, o GPT-5.5 resolveu uma questão de engenharia inversa em cerca de 10 minutos, enquanto os especialistas humanos de segurança precisariam, em média, de 12 horas.

Universal jailbreak: bastam 6 horas ao red team para contornar todos os filtros de consultas maliciosas

Os investigadores da AISI identificaram também um vetor de ataque de “universal jailbreak” (salto universal). Entre todas as categorias de consultas maliciosas testadas, este ataque consegue induzir o GPT-5.5 a produzir conteúdo nocivo, incluindo cenários de diálogo agentic em múltiplas rondas. A AISI afirma que especialistas do red team desenvolveram este jailbreak em cerca de 6 horas.

Para a OpenAI, a existência deste universal jailbreak significa que, mesmo que o GPT-5.5-Cyber esteja implementado em cenários com acesso restringido, como o programa de trusted access, ainda pode ser contornado por adversários tecnicamente competentes. A OpenAI já revelou avaliações relacionadas com segurança cibernética na system card do GPT-5.5, mas a avaliação independente de terceiros da AISI fornece um padrão de pares mais credível.

Observações futuras: calendário da próxima avaliação da AISI e resposta da OpenAI ao jailbreak

O próximo ponto de observação é o cronograma da próxima avaliação de modelos de frontier da AISI, depois do Mythos e do GPT-5.5, e se a OpenAI vai publicar uma atualização direcionada ao universal jailbreak revelado em Maio. Na conclusão do relatório, a AISI afirma explicitamente: “Se capacidades de redes ofensivas forem um subproduto de melhorias mais amplas em raciocínio, codificação e tarefas com autonomia, os progressos seguintes poderão chegar a um ritmo mais rápido” — esta observação sugere que, nos próximos meses, poderá haver mais um modelo de frontier a entrar no patamar “ao nível do Mythos”.

Este artigo “AISI avalia: as capacidades de ataque informático do GPT-5.5 empatam com o Anthropic Mythos” aparece pela primeira vez em Cadeia News ABMedia.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

Comissão de Assuntos Externos da Câmara dos Representantes dos EUA reúne-se com gigantes tecnológicos sobre controlos de exportação de IA após aprovação da lei MATCH Act por 36-8

De acordo com Beating, os membros da Comissão de Relações Externas da Câmara dos Representantes dos EUA vão viajar para o Vale do Silício na próxima semana para se reunirem com representantes da Google, Anthropic, Meta, Tesla, Intel, Applied Materials e Nvidia, para discutir a inteligência artificial e os controlos de exportação. Uma mesa-redonda do setor é s

GateNews42m atrás

A OpenAI Lança o Codex Pets, um Companheiro Virtual com IA e Geração Personalizada

Segundo o Beating, a OpenAI adicionou uma nova funcionalidade “Codex Pets” à aplicação de ambiente de trabalho do Codex, permitindo aos utilizadores gerar e interagir com um companheiro virtual animado. Os utilizadores podem ativar um animal de estimação escrevendo /pet no editor. A funcionalidade funciona como um indicador do estado do agente, mostrando a

GateNews46m atrás

Pentágono assina contratos de implantação de rede militar encriptada e confidencial com 7 empresas líderes de IA: Anthropic continua excluída

O Departamento de Defesa dos EUA anunciou em maio que celebrou contratos militares de redes confidenciais com sete empresas, incluindo a SpaceX, a OpenAI, a Google, a NVIDIA, a Reflection e a Microsoft e a Amazon Web Services, tendo ainda juntado a Oracle para passar a ser a 8.ª. O contrato permite executar modelos nos níveis mais altos de confidencialidade Impact Level 6/7, com foco em três grandes aplicações: integração de dados, decisões de operações e perceção da situação no campo de batalha, sublinhando a redução de riscos e a evitação do bloqueio a fornecedores. A Anthropic foi incluída numa lista negra por recusar barreiras de segurança para o Exército e não obteve assinatura. A AMD não foi incluída diretamente, sendo as GPU fornecidas por empresas como a NVIDIA. Acompanhar, de seguida, se a Anthropic ceder e qual será o papel dos novos selecionados, como a Reflection.

ChainNewsAbmedia2h atrás

A Cerebras mira o $4B IPO, avaliada em ~40 mil milhões de dólares

O fabricante de chips de IA Cerebras Systems, sediado em Sunnyvale, Califórnia, está a tentar angariar até 4 mil milhões de dólares num IPO que poderia valorizar a empresa em aproximadamente 40 mil milhões de dólares, segundo a Bloomberg. A divulgação formal poderá começar logo a partir de 4 de maio, com bancos a receberem mais de 10 mil milhões de dólares em indicações de

CryptoFrontier2h atrás

Empresas chinesas de IA consideram desmontar estruturas “red-chip” na sequência da suspensão da aquisição de Manus pela Meta

Segundo Beating, a Comissão Nacional de Desenvolvimento e Reforma da China suspendeu a aquisição de 2 mil milhões de dólares da Meta da empresa de agentes de IA Manus, levando a Comissão Reguladora de Valores Mobiliários da China a apertar a aprovação para listagens de IPO em Hong Kong por empresas de red-chip (empresas chinesas que detêm ativos domésticos) th

GateNews3h atrás

Musk Conclui Depoimento de Três Dias no Processo da OpenAI, Cita uma Alegação de Danos de 130-150 mil milhões de dólares

De acordo com vários relatos da comunicação social, Elon Musk concluiu três dias de depoimento no seu processo contra a OpenAI, nos dias 28 a 30 de abril, com um depoimento acumulado superior a 7 horas. Musk, que co-fundou a OpenAI em 2015 com um investimento inicial de 38 milhões de dólares, alegou que a empresa abandonou a sua missão sem fins lucrativos m

GateNews4h atrás
Comentar
0/400
Nenhum comentário