Gate 新聞訊息,4 月 22 日 — Google Research 發布 ReasoningBank:一種代理記憶框架,可讓由大型語言模型驅動的代理在部署後持續學習。該框架從成功與失敗的任務經驗中提取通用推理策略,並將其存入記憶庫,以便在未來相似任務中進行檢索與執行。相關論文已發表於 ICLR,程式碼也已在 GitHub 上開源。
ReasoningBank 優於兩種既有方法:Synapse 會記錄完整的動作軌跡,但由於粒度較細,因而可遷移性有限;Agent Workflow Memory 只會從成功案例中學習。ReasoningBank 做出兩項關鍵改變:改為存放「推理模式」,而非「動作序列」——每個記憶都包含用於標題、描述與內容的結構化欄位;並將失敗軌跡納入學習。該框架使用模型對執行軌跡進行自我評估,將失敗經驗轉化為防陷阱規則。例如,規則「看到就點擊『載入更多』按鈕」會演變為「先驗證目前頁面識別符,避免無限捲動迴圈,然後再點擊載入更多」。
該論文也提出了具備記憶感知的測試階段縮放 (MaTTS),它會在推論期間配置額外算力,以探索多條軌跡並將發現存入記憶庫。並行擴展會為同一任務生成多條不同的軌跡,透過自我比較來強化更穩健的策略;序列擴展則以迭代方式精煉單一軌跡,並將中間推理存入記憶。
在使用 Gemini 2.5 Flash 作為 ReAct 代理的 WebArena 瀏覽任務與 SWE-Bench-Verified 編碼任務中,ReasoningBank 相較於不使用記憶的基準,WebArena 的成功率提升 8.3%,SWE-Bench-Verified 的成功率提升 4.6%,且每個任務的平均步數降低約 3。將 MaTTS 搭配並行擴展 (k=5) 進一步使 WebArena 的成功率提升 3 個百分點,並使步數再降低 0.4。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
MoonPay 於週五在 Mastercard 網路推出 MoonAgents 卡
根據 The Block,MoonPay 於週五推出 MoonAgents Card——一款虛擬 Mastercard 借記卡,讓 AI 代理與使用者可直接從鏈上錢包支出穩定幣。該卡由 Monavate 發行;Monavate 是一家受監管的全球支付平台,也是 Mastercard 的主要會員,並且
GateNews1小時前
137 Ventures 在新資金中完成 $700M ,管理資產(AUM)達到 150 億美元
根據 ChainCatcher,早期投資 SpaceX 的 137 Ventures 近期完成了兩檔新基金的募資,總額超過 7 億美元,將其管理資產提高至超過 150 億美元。這筆新資本將用於投資 AI 代理、機器人以及太空推進
GateNews1小時前
Reddit 第 16% 飆升,因 Q2 展望強勁;蘋果面臨 Mac 缺貨,因 AI 需求超過供應
Reddit 的股價在週五美股開盤前上漲 16%,原因是該公司發布了高於預期的未來一季營收展望。日活躍訪客成長 17% 至 1.268 億,且全球每位用戶平均營收跳升 44%,由 AI 驅動
GateNews2小時前
Visa 於 5 月 1 日在香港推出可代理的就緒計畫(Agentic Ready Program),使 AI 代理付款成為可能
根據香港媒體《明報》,Visa 於 5 月 1 日在香港推出 Visa Agentic Ready 計畫,讓 AI 代理付款成為可能。該計畫運用代幣化、身分驗證、風險管理與授權機制。初始參與者包括
GateNews4小時前
OpenClaw 於 2026.4.29 版本在 4 月 29 日發布,將記憶體升級為具備關係追蹤的個人化 Wiki
根據 Beating,開源 AI 助手 OpenClaw(GitHub 367K 星)於 4 月 29 日發布了 v2026.4.29,標誌著其在兩天內的第二次更新。其記憶系統已從單純的檢索式回憶演進為個人化維基,使代理能夠自動建立角色檔案並追蹤 r
GateNews14小時前
谷歌執行長皮查伊透露利用 Gemini AI 洞悉人性建立更真誠的溝通
皮查伊表示在重要會議前,他用 Gemini 的觀點分析預測對方心理,藉此增進同理心與更真誠的溝通。AI 代理也能自動整理郵件、排程與摘要,使日常瑣事更高效。另以開放共創為核心的AI平台正在興起,Gemini 4 等開源技術降低門檻;同時強調建立 AI 治理框架,政界與社會需參與以解決網安、深偽與永續等挑戰。
鏈新聞abmedia17小時前