Google Research Merilis ReasoningBank: Agen AI Belajar Strategi Penalaran dari Keberhasilan dan Kegagalan

Berita Gate, 22 April — Google Research merilis ReasoningBank, sebuah kerangka memori agen yang memungkinkan agen yang digerakkan oleh model bahasa besar untuk terus belajar setelah penerapan. Kerangka ini mengekstrak strategi penalaran universal dari pengalaman tugas yang berhasil maupun yang gagal, menyimpannya dalam bank memori untuk diambil dan dieksekusi pada tugas-tugas serupa di masa depan. Makalah terkait dipublikasikan di ICLR, dan kodenya telah dirilis sumber terbukanya di GitHub.

ReasoningBank ditingkatkan dibandingkan dua pendekatan yang sudah ada: Synapse, yang merekam lintasan aksi lengkap tetapi memiliki keterpindahan yang terbatas karena granularitas yang terlalu terperinci, dan Agent Workflow Memory, yang hanya belajar dari kasus yang berhasil. ReasoningBank membuat dua perubahan kunci: menyimpan “pola penalaran” alih-alih “urutan aksi,” dengan setiap memori berisi bidang terstruktur untuk judul, deskripsi, dan konten; serta memasukkan lintasan kegagalan ke dalam pembelajaran. Kerangka ini menggunakan sebuah model untuk menilai sendiri lintasan eksekusi, mengubah pengalaman kegagalan menjadi aturan anti-jebakan. Misalnya, aturan “klik tombol Muat Lebih saat terlihat” berevolusi menjadi “verifikasi terlebih dahulu pengidentifikasi halaman saat ini, hindari loop gulir tak berujung, lalu klik muat lebih.”

Makalah ini juga memperkenalkan Memory-aware Test-time Scaling (MaTTS), yang mengalokasikan komputasi tambahan selama inferensi untuk mengeksplorasi beberapa lintasan dan menyimpan temuan di bank memori. Ekspansi paralel menjalankan beberapa lintasan berbeda untuk tugas yang sama, menyempurnakan strategi yang lebih andal melalui perbandingan diri; ekspansi berurutan menyempurnakan satu lintasan secara iteratif, menyimpan penalaran antara di memori.

Pada tugas browser WebArena dan tugas pengkodean SWE-Bench-Verified menggunakan Gemini 2.5 Flash sebagai agen ReAct, ReasoningBank mencapai tingkat keberhasilan 8,3% lebih tinggi di WebArena dan 4,6% lebih tinggi di SWE-Bench-Verified dibandingkan baseline tanpa memori, dengan mengurangi rata-rata langkah per tugas sekitar 3. Menambahkan MaTTS dengan ekspansi paralel (k=5) selanjutnya meningkatkan tingkat keberhasilan WebArena sebesar 3 poin persentase dan mengurangi langkah sebesar tambahan 0,4.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

AI Agent Manfred Membentuk Perusahaan, Mendapat Dompet Kripto Sebelum Peluncuran Perdagangan Mei

Agen AI Manfred telah membentuk perusahaannya sendiri dan memperoleh dompet kripto serta kredensial bisnis, meskipun belum akan mulai memperdagangkan cryptocurrency hingga akhir Mei. Kini agen tersebut sudah siap untuk merekrut staf, melakukan pembayaran, dan menjalankan bisnis

GateNews2jam yang lalu

MoonPay Meluncurkan Kartu MoonAgents, Virtual Mastercard untuk Agen AI dan Pengguna pada Jumat

Menurut The Block, MoonPay meluncurkan MoonAgents Card, kartu debit Mastercard virtual untuk agen AI dan pengguna, pada Jumat. Kartu ini mengonversi stablecoin menjadi mata uang fiat saat pembayaran dan dapat digunakan di setiap merchant online di seluruh dunia yang menerima Mastercard. Diterbitkan melalui Monavate, sebuah pembayaran yang teregulasi

GateNews6jam yang lalu

MoonPay Meluncurkan Kartu MoonAgents di Jaringan Mastercard pada Jumat

Menurut The Block, MoonPay meluncurkan MoonAgents Card pada hari Jumat—kartu debit virtual Mastercard yang memungkinkan agen AI dan pengguna untuk membelanjakan stablecoin langsung dari dompet berbasis onchain. Kartu ini diterbitkan melalui Monavate, platform pembayaran global yang teregulasi dan anggota principal Mastercard, di

GateNews8jam yang lalu

137 Ventures Menutup $700M dalam Dana Baru, AUM Mencapai $15B

Menurut ChainCatcher, 137 Ventures, investor awal di SpaceX, baru-baru ini menyelesaikan penggalangan dana untuk dua dana baru senilai lebih dari 700 juta dolar AS, sehingga aset kelolanya kini melebihi 15 miliar dolar AS. Modal baru ini akan mendukung investasi pada agen AI, robotika, dan pendorong ruang angkasa

GateNews9jam yang lalu

Reddit Melonjak 16% di Tengah Prospek Kuartal II yang Kuat; Apple Menghadapi Kekurangan Mac karena Permintaan AI Melebihi Pasokan

Saham Reddit naik 16% sebelum pasar dibuka pada Jumat setelah perusahaan mengeluarkan panduan pendapatan untuk kuartal mendatang yang lebih tinggi dari perkiraan. Pengunjung aktif harian tumbuh 17% menjadi 126,8 juta, sementara pendapatan rata-rata per pengguna secara global melonjak 44%, didorong oleh AI-powered

GateNews9jam yang lalu

Visa Meluncurkan Program Agentic Ready di Hong Kong pada 1 Mei, Memungkinkan Pembayaran oleh Agen AI

Menurut media Hong Kong Ming Pao, Visa meluncurkan program Visa Agentic Ready di Hong Kong pada 1 Mei, memungkinkan pembayaran menggunakan agen AI. Program ini memanfaatkan tokenisasi, verifikasi identitas, manajemen risiko, dan mekanisme otorisasi. Peserta awal mencakup

GateNews12jam yang lalu
Komentar
0/400
Tidak ada komentar