A Google Research lança o ReasoningBank: agentes de IA aprendem estratégias de raciocínio com sucesso e falha

Mensagem do Gate News, 22 de abril — A Google Research lançou o ReasoningBank, um framework de memória do agente que permite que agentes orientados por grandes modelos de linguagem aprendam continuamente após o deploy. O framework extrai estratégias universais de raciocínio tanto de experiências bem-sucedidas como falhadas em tarefas, guardando-as num banco de memória para recuperação e execução em tarefas futuras semelhantes. O artigo associado foi publicado na ICLR, e o código foi disponibilizado em open-source no GitHub.

O ReasoningBank melhora duas abordagens existentes: a Synapse, que regista trajectórias completas de acções, mas tem capacidade de transferência limitada devido à granularidade fina, e a Agent Workflow Memory, que só aprende com casos bem-sucedidos. O ReasoningBank introduz duas alterações-chave: armazenar “padrões de raciocínio” em vez de “sequências de acções”, com cada memória contendo campos estruturados para título, descrição e conteúdo; e incorporar trajectórias de falha na aprendizagem. O framework usa um modelo para autoavaliar trajectórias de execução, transformando experiências de falha em regras anti-erro. Por exemplo, a regra “clicar no botão Carregar mais quando o vir” evolui para “verificar primeiro o identificador da página actual, evitar ciclos de scroll infinito e, em seguida, clicar em carregar mais.”

O artigo também introduz Memory-aware Test-time Scaling (MaTTS), que aloca compute adicional durante a inferência para explorar múltiplas trajectórias e guardar os resultados no banco de memória. A expansão em paralelo executa múltiplas trajectórias distintas para a mesma tarefa, refinando estratégias mais robustas através de auto-comparação; a expansão sequencial refina iterativamente uma única trajectória, guardando raciocínio intermédio em memória.

Em tarefas de browser do WebArena e tarefas de codificação SWE-Bench-Verified usando Gemini 2.5 Flash como agente ReAct, o ReasoningBank alcançou uma taxa de sucesso 8,3% superior no WebArena e 4,6% superior no SWE-Bench-Verified em comparação com uma linha de base sem memória, reduzindo em aproximadamente 3 o número médio de passos por tarefa. Adicionar MaTTS com expansão em paralelo (k=5) melhorou ainda mais a taxa de sucesso no WebArena em 3 pontos percentuais e reduziu os passos em mais 0,4.

Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.

Related Articles

O agente de IA Manfred forma a empresa e recebe uma carteira de criptomoedas antes do lançamento das negociações em maio

O agente de IA Manfred constituiu a sua própria empresa e obteve uma carteira de criptomoedas e credenciais empresariais, embora não comece a negociar criptomoedas até ao final de maio. O agente está agora equipado para contratar pessoal, efetuar pagamentos e conduzir negócios.

GateNews4h atrás

A MoonPay lança o MoonAgents Card, uma Mastercard virtual para agentes de IA e utilizadores, na sexta-feira

Segundo a The Block, a MoonPay lançou a MoonAgents Card, um cartão de débito Mastercard virtual para agentes de IA e utilizadores, na sexta-feira. O cartão converte stablecoins em moeda fiduciária no momento do pagamento e pode ser utilizado em qualquer comerciante online a nível global que aceite Mastercard. Emitido através da Monavate, um pagamento regulado

GateNews8h atrás

A MoonPay Lança o Cartão MoonAgents na Rede Mastercard Sexta-feira

De acordo com a The Block, a MoonPay lançou a MoonAgents Card na sexta-feira — um cartão de débito virtual Mastercard que permite a agentes de IA e aos utilizadores gastar stablecoins diretamente a partir de carteiras onchain. O cartão é emitido através da Monavate, uma plataforma global de pagamentos regulamentada e membro principal da Mastercard, em

GateNews10h atrás

A 137 Ventures fecha $700M em novos fundos, AUM atinge 15 mil milhões de dólares

De acordo com o ChainCatcher, a 137 Ventures, um dos primeiros investidores na SpaceX, concluiu recentemente a recolha de fundos para dois novos fundos, num total superior a 700 milhões de dólares, elevando os seus activos sob gestão para mais de 15 mil milhões de dólares. O novo capital vai apoiar investimentos em agentes de IA, robótica e propulsão espacial

GateNews11h atrás

O Reddit regista um aumento de 16% com fortes perspetivas para o 2.º trimestre; a Apple enfrenta falta de Macs à medida que a procura por IA supera a oferta

As acções da Reddit subiram 16% antes da abertura do mercado na sexta-feira, depois de a empresa ter divulgado uma previsão de receitas para o próximo trimestre superior ao esperado. Os visitantes diários ativos cresceram 17% para 126,8 milhões, enquanto a receita média por utilizador a nível mundial disparou 44%, impulsionada por IA alimentada por

GateNews11h atrás

A Visa lança em Hong Kong, a 1 de maio, o programa Agentic Ready, permitindo pagamentos com agentes de IA

De acordo com a comunicação social de Hong Kong Ming Pao, a Visa lançou o programa Visa Agentic Ready em Hong Kong a 1 de maio, permitindo pagamentos com agentes de IA. O programa tira partido da tokenização, verificação de identidade, gestão de risco e mecanismos de autorização. Os participantes iniciais incluem

GateNews14h atrás
Comentar
0/400
Nenhum comentário