Google Research publica ReasoningBank: los agentes de IA aprenden estrategias de razonamiento del éxito y del fracaso

Mensaje de Gate News, 22 de abril — Google Research publicó ReasoningBank, un marco de memoria para agentes que permite a los agentes impulsados por modelos de lenguaje aprender continuamente después del despliegue. El marco extrae estrategias universales de razonamiento a partir de experiencias tanto de tareas exitosas como fallidas, almacenándolas en un banco de memoria para su recuperación y ejecución en tareas futuras similares. El artículo asociado se publicó en ICLR, y el código se ha publicado como código abierto en GitHub.

ReasoningBank mejora dos enfoques existentes: Synapse, que registra trayectorias completas de acciones, pero tiene una transferibilidad limitada debido a la gran granularidad, y Agent Workflow Memory, que solo aprende de casos exitosos. ReasoningBank realiza dos cambios clave: almacenar “patrones de razonamiento” en lugar de “secuencias de acciones”, con cada memoria que contiene campos estructurados para título, descripción y contenido; e incorporar trayectorias de fallo en el aprendizaje. El marco utiliza un modelo para autoevaluar las trayectorias de ejecución, transformando las experiencias de fallo en reglas anti-errores. Por ejemplo, la regla “hacer clic en el botón Load More cuando se vea” evoluciona a “verificar primero el identificador de la página actual, evitar bucles infinitos de desplazamiento y luego hacer clic en load more.”

El artículo también introduce Memory-aware Test-time Scaling (MaTTS), que asigna cómputo adicional durante la inferencia para explorar múltiples trayectorias y almacenar hallazgos en el banco de memoria. La expansión en paralelo ejecuta múltiples trayectorias distintas para la misma tarea, refinando estrategias más robustas mediante auto-comparación; la expansión secuencial refina iterativamente una sola trayectoria, almacenando el razonamiento intermedio en memoria.

En tareas de navegador WebArena y tareas de codificación SWE-Bench-Verified usando Gemini 2.5 Flash como agente ReAct, ReasoningBank logró una tasa de éxito 8.3% más alta en WebArena y 4.6% más alta en SWE-Bench-Verified en comparación con una línea base sin memoria, reduciendo los pasos promedio por tarea en aproximadamente 3. Al agregar MaTTS con expansión en paralelo (k=5), la tasa de éxito en WebArena mejoró aún en 3 puntos porcentuales y los pasos se redujeron en 0.4 adicionales.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

El agente de IA Manfred forma una empresa y obtiene una wallet de criptomonedas antes del lanzamiento del trading a finales de mayo

El agente de IA Manfred ha formado su propia empresa y ha obtenido una wallet de criptomonedas junto con credenciales para contratar personal, realizar pagos y hacer negocios. El agente no tiene previsto comenzar a operar con criptomonedas hasta finales de

GateNewshace2h

MoonPay lanza la tarjeta MoonAgents, una tarjeta de débito con stablecoin para agentes de IA en Mastercard

MoonPay anunció el viernes el lanzamiento de MoonAgents Card, una tarjeta de débito Mastercard virtual que convierte stablecoins en moneda fiduciaria en el momento del pago tanto para agentes de IA como para usuarios. La tarjeta, emitida a través de Monavate (una plataforma de pagos global regulada y miembro principal de Mastercard), vincula

GateNewshace2h

El agente de IA Manfred funda una empresa, obtiene una billetera de criptomonedas antes del lanzamiento de las operaciones de mayo

El agente de IA Manfred ha formado su propia empresa y ha obtenido una cartera de criptomonedas y credenciales comerciales, aunque no comenzará a operar con criptomonedas hasta finales de mayo. El agente ya está equipado para contratar personal, realizar pagos y llevar a cabo actividades comerciales

GateNewshace8h

MoonPay lanza la tarjeta MoonAgents, una Mastercard virtual para agentes de IA y usuarios, el viernes

De acuerdo con The Block, MoonPay lanzó MoonAgents Card, una tarjeta de débito Mastercard virtual para agentes de IA y usuarios, el viernes. La tarjeta convierte stablecoins en fiat en el punto de pago y puede usarse en cualquier comerciante en línea a nivel mundial que acepte Mastercard. Emitida a través de Monavate, un pago regulado

GateNewshace12h

MoonPay lanza la tarjeta MoonAgents en la red Mastercard este viernes

Según The Block, MoonPay lanzó la MoonAgents Card el viernes, una tarjeta virtual de débito Mastercard que permite que los agentes de IA y los usuarios gasten stablecoins directamente desde carteras onchain. La tarjeta se emite a través de Monavate, una plataforma global de pagos regulada y miembro principal de Mastercard, en

GateNewshace14h

137 Ventures cierra $700M en nuevos fondos; AUM alcanza 15.000 millones de USD

Según ChainCatcher, 137 Ventures, un inversor inicial en SpaceX, recientemente completó la recaudación de fondos para dos nuevos fondos con un total de más de 700 millones de dólares, elevando sus activos bajo gestión a más de 15 mil millones de dólares. El nuevo capital se destinará a inversiones en agentes de IA, robótica y propulsión espacial

GateNewshace15h
Comentar
0/400
Sin comentarios