ME News mensagem, 23 de abril (UTC+8), segundo monitorização da Beating, a equipa UCSB Yu Feng, em colaboração com a fuzz.land e outras instituições, propôs o AgentFlow, que sintetiza automaticamente múltiplos harnesses de agente (programas que orquestram a divisão de papéis dos agentes, transmissão de informações, atribuição de ferramentas e lógica de retry) para descoberta de vulnerabilidades. O artigo aponta que, mantendo o modelo inalterado, apenas alterar o harness pode fazer a taxa de sucesso variar várias vezes, mas as soluções atuais são maioritariamente escritas manualmente ou apenas exploram o espaço de design local. O AgentFlow utiliza um DSL de grafo tipado para unificar as cinco dimensões do harness (papéis, topologia, padrão de mensagens, ligação de ferramentas, protocolo de coordenação) num programa de grafo editável, permitindo adicionar ou modificar agentes, topologia, prompt e conjunto de ferramentas num único passo. O loop externo identifica os passos falhados a partir de sinais de runtime como cobertura do programa alvo e relatórios de sanitizer, substituindo o feedback binário de aprovação/reprovação. No TerminalBench-2, combinado com Claude Opus 4.6, atinge 84,3% (75/89), a pontuação mais alta da sua categoria nesse ranking. Na base de código do Chrome (35 milhões de linhas de C/C++), o sistema sintetizou um harness composto por mais de 300 agentes, onde instruções de agente evoluídas automaticamente se especializam em vulnerabilidades de memória C++, exigindo verificação de crashes com ASAN/UBSAN, e múltiplos agentes evitam duplicação através de documentos partilhados e bloqueio de ficheiros. Utilizando o modelo open-source Kimi K2.5 em 192 GPUs H100 durante 7 dias, descobriu 10 vulnerabilidades zero-day, todas confirmadas pelo Chrome VRP. 6 receberam identificadores CVE, abrangendo WebCodecs, Proxy, Network, Codecs, Rendering, com tipos incluindo UAF, integer overflow e heap buffer overflow, sendo que CVE-2026-5280 e CVE-2026-6297 são de nível Critical e envolvem fuga da sandbox. O cofundador da fuzz.land, Shou Chaofan, afirmou que algumas vulnerabilidades foram inicialmente descobertas com MiniMax M2.5, e que MiniMax M2.5 e Opus 4.6 também conseguem descobrir a maioria. O AgentFlow foi lançado como open-source. (Fonte: BlockBeats)

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

Recompensa
gostar
Comentar
Republicar
Partilhar

Comentar

Adicionar um comentário

Nenhum comentário

Tópicos em destaque
Ver mais
#
SKHynixTopsKOSPIByMarketCap
1,55M Popularidade
#
MicronEarningsBeatExpectationsSharesRise
212,06K Popularidade
#
IsraelStrikesIranBTCPlunges
63,79K Popularidade
#
WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷
327,18K Popularidade
#
USMayPCEInflationRisesTo4.1%HighestIn3Years
557,27K Popularidade

Fixado

AgentFlow sintetiza 300 Agentes para descobrir 10 vulnerabilidades zero-day do Chrome, incluindo escape de sandbox.

Tópicos em destaque

SKHynixTopsKOSPIByMarketCap

MicronEarningsBeatExpectationsSharesRise

IsraelStrikesIranBTCPlunges

WorldCup🏴󠁧󠁢󠁳󠁣󠁴󠁿vs🇧🇷

USMayPCEInflationRisesTo4.1%HighestIn3Years

Fixado