Google Research publie ReasoningBank : les agents IA apprennent des stratégies de raisonnement grâce à la réussite et à l’échec

Message de Gate News, 22 avril — Google Research a publié ReasoningBank, un cadre de mémoire d’agent qui permet à des agents pilotés par de grands modèles de langage d’apprendre en continu après leur déploiement. Le cadre extrait des stratégies universelles de raisonnement à partir d’expériences de tâches à la fois réussies et échouées, les stockant dans une banque de mémoire pour la récupération et l’exécution sur des tâches futures similaires. L’article associé a été publié à l’ICLR, et le code a été open-sourcé sur GitHub.

ReasoningBank améliore deux approches existantes : Synapse, qui enregistre des trajectoires d’action complètes mais dispose d’une transférabilité limitée en raison d’une granularité trop fine, et Agent Workflow Memory, qui n’apprend que des cas réussis. ReasoningBank apporte deux changements clés : stocker des « modèles de raisonnement » au lieu de « séquences d’action », chaque mémoire contenant des champs structurés pour le titre, la description et le contenu ; et intégrer des trajectoires d’échec à l’apprentissage. Le cadre utilise un modèle pour s’auto-évaluer sur les trajectoires d’exécution, transformant les expériences d’échec en règles anti-pièges. Par exemple, la règle « cliquer sur le bouton Charger plus lorsqu’il est visible » évolue vers « vérifier d’abord l’identifiant de la page actuelle, éviter les boucles de défilement infini, puis cliquer sur charger plus. »

L’article introduit également Memory-aware Test-time Scaling (MaTTS), qui alloue une puissance de calcul supplémentaire pendant l’inférence afin d’explorer plusieurs trajectoires et de stocker les résultats dans la banque de mémoire. L’expansion parallèle exécute plusieurs trajectoires distinctes pour la même tâche, en affinant des stratégies plus robustes grâce à une auto-comparaison ; l’expansion séquentielle affine itérativement une seule trajectoire, en stockant un raisonnement intermédiaire en mémoire.

Sur les tâches de navigateur WebArena et les tâches de codage SWE-Bench-Verified en utilisant Gemini 2.5 Flash comme agent ReAct, ReasoningBank a atteint un taux de réussite supérieur de 8,3 % sur WebArena et de 4,6 % sur SWE-Bench-Verified par rapport à une référence sans mémoire, en réduisant d’environ 3 le nombre moyen d’étapes par tâche. L’ajout de MaTTS avec expansion parallèle (k=5) a encore amélioré le taux de réussite sur WebArena de 3 points de pourcentage et réduit les étapes d’un supplément de 0,4.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

L’agent d’IA Manfred fonde l’entreprise, obtient un portefeuille crypto avant le lancement des échanges fin mai

L’agent d’IA Manfred a créé sa propre entreprise et obtenu un portefeuille crypto ainsi que des identifiants pour recruter du personnel, effectuer des paiements et mener des activités commerciales. L’agent n’est pas prévu pour commencer à trader des crypto avant la fin de

GateNewsIl y a 1h

MoonPay lance la carte MoonAgents, une carte bancaire de débit adossée à des stablecoins pour les agents IA sur Mastercard

MoonPay a annoncé vendredi le lancement de la MoonAgents Card, une carte de débit Mastercard virtuelle qui convertit les stablecoins en monnaie fiduciaire au moment du paiement, tant pour les agents d’IA que pour les utilisateurs. La carte, émise via Monavate (une plateforme mondiale de paiements réglementée et membre principal de Mastercard), relie

GateNewsIl y a 1h

L’agent IA Manfred fonde une entreprise et obtient un portefeuille crypto avant le lancement des transactions en mai

L’agent d’IA Manfred a créé sa propre société et obtenu un portefeuille crypto ainsi que des informations d’identification professionnelles, bien qu’il ne commencera à négocier des cryptomonnaies qu’à la fin du mois de mai. L’agent est désormais équipé pour embaucher du personnel, effectuer des paiements et mener des activités commerciales

GateNewsIl y a 7h

MoonPay lance la carte MoonAgents, une Mastercard virtuelle pour les agents d’IA et les utilisateurs, vendredi

D’après The Block, MoonPay a lancé MoonAgents Card, une carte de débit Mastercard virtuelle pour les agents d’IA et les utilisateurs, vendredi. La carte convertit des stablecoins en monnaie fiduciaire au moment du paiement et peut être utilisée auprès de tout commerçant en ligne dans le monde qui accepte Mastercard. Émise via Monavate, un prestataire de paiement réglementé

GateNewsIl y a 11h

MoonPay lance la carte MoonAgents sur le réseau Mastercard vendredi

D’après The Block, MoonPay a lancé MoonAgents Card vendredi : une carte de débit virtuelle Mastercard permettant aux agents IA et aux utilisateurs de dépenser des stablecoins directement depuis des portefeuilles onchain. La carte est émise via Monavate, une plateforme mondiale de paiements réglementée et membre principal de Mastercard, en

GateNewsIl y a 13h

137 Ventures clôture $700M dans de nouveaux fonds, l'actif sous gestion atteint 15 milliards de dollars

Selon ChainCatcher, 137 Ventures, un investisseur précoce de SpaceX, a récemment finalisé une levée de fonds pour deux nouveaux fonds totalisant plus de 700 millions de dollars, portant ses actifs sous gestion à plus de 15 milliards de dollars. Le nouveau capital servira à financer des investissements dans les agents d’IA, la robotique et la propulsion spatiale

GateNewsIl y a 14h
Commentaire
0/400
Aucun commentaire