推送新闻消息,4 月 23 日——Perplexity 的研究团队发布了一篇技术文章,详细介绍其用于网页搜索代理的后训练方法。该方法使用两个开源的 Qwen3.5 模型 (Qwen3.5-122B-A10B 和 Qwen3.5-397B-A17B),并采用两阶段流水线:先进行监督微调 (SFT),以建立指令遵循与语言一致性,然后通过在线强化学习 (RL) 来优化搜索准确性与工具使用效率。
RL 阶段采用 GRPO 算法,并使用两种数据来源:其自有的多跳可验证问答数据集——由内部种子查询构建,要求进行 2–4 跳的推理,并通过多求解器验证;以及基于评分标准的通用对话数据——将部署需求转化为客观可检查的原子条件,以防止 SFT 行为退化。
奖励设计采用门控聚合——只有在达到基线正确性时((question-answer match 或所有评分标准条件均满足)),偏好分数才会生效,从而避免高偏好信号掩盖事实错误。效率惩罚采用组内锚定:对工具调用以及生成长度中超过同组正确答案基线的部分施加平滑惩罚。
评估显示,Qwen3.5-397B-SFT-RL 在各类搜索基准上实现同类最佳表现。在 FRAMES 上,单次工具调用的准确率为 57.3%,比 GPT-5.4 高 5.7 个百分点,比 Claude Sonnet 4.6 高 4.7 个百分点。在适度预算 (四次工具调用) 下,它以每次查询 $0.02 实现 73.9% 的准确率;相比之下,GPT-5.4 为 67.8%(每次查询 $0.085),Sonnet 4.6 为 62.4%(每次查询 $0.153)。成本数据基于各提供方的公开 API 定价,并不包含缓存优化。
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Platform Keuangan AI Rogo Menggalang $160M di Seri D yang Dipimpin Kleiner Perkins dalam Kurang dari 3 Bulan
Menurut Beating, platform AI Rogo yang dirancang untuk skenario keuangan berfrekuensi tinggi menyelesaikan putaran pendanaan Seri D sebesar $160 juta pada April 2026, dipimpin oleh Kleiner Perkins dengan partisipasi dari Sequoia, Thrive Capital, Khosla Ventures, dan J.P. Morgan. Pendanaan tersebut datang kurang dari tiga bulan
GateNews11menit yang lalu
Beberapa CEX Meluncurkan Protokol Pembayaran Agen yang Mendukung 4 Mode Pembayaran, 9 Mitra Termasuk Ethereum Foundation
Menurut sumber resmi, sebuah bursa kripto besar telah meluncurkan Protokol Pembayaran Agen (APP), standar pembayaran terbuka untuk transaksi komersial Agen AI pada 29 April. Protokol ini memungkinkan Agen AI memproses pembayaran tunggal, pembayaran batch, pembayaran berbasis penggunaan, dan pembayaran escrow
GateNews29menit yang lalu
Tiongkok Menghalangi Akuisisi AI Manus yang Didukung Meta pada 29 April, Mengutip Kekhawatiran Keamanan Teknologi dan Data
Menurut PANews, pada 29 April, kantor tinjauan keamanan investasi Komisi Pembangunan dan Reformasi Nasional Tiongkok melarang akuisisi asing atas proyek Manus dan mengharuskan transaksi tersebut dihentikan. Manus, yang dipromosikan sebagai agen kecerdasan buatan umum pertama di dunia, telah
GateNews34menit yang lalu
Mainnet KITE AI Diluncurkan di Avalanche pada 29 April sebagai Blockchain Agen AI yang Dibangun Khusus untuk Tujuan Tersebut
Menurut Altcoin Buzz, mainnet KITE AI diluncurkan di Avalanche pada 29 April, memperkenalkan blockchain Layer 1 khusus yang dirancang untuk agen AI otonom. Platform ini mengintegrasikan kemampuan identitas dan pembayaran native untuk memungkinkan agen AI beroperasi, bertransaksi, dan berkembang tanpa hambatan.
Avalanch
GateNews3jam yang lalu
B.AI dan deBridge Bermitra untuk Membangun Infrastruktur Lintas-Rantai bagi AI Agent
Menurut ChainCatcher, B.AI dan deBridge mengumumkan kemitraan strategis pada 29 April untuk mengembangkan infrastruktur lintas-rantai yang digerakkan oleh intent. Kolaborasi ini bertujuan untuk menyediakan eksekusi lintas-rantai yang mulus untuk ekonomi AI Agent yang dapat diskalakan. Model 0-TVL deBridge dan teknologi lintas-rantai tanpa gas akan mendukung pengembangan sistem perdagangan otonom yang efisien dan aman, sehingga mempercepat eksekusi lintas-rantai di era AI Agent.
GateNews5jam yang lalu
Parallel Milik Parag Agrawal Menggalang $100M Seri B untuk Infrastruktur Pencarian Agen AI
Menurut Beating, Parallel Web Systems, yang didirikan oleh mantan CEO Twitter Parag Agrawal, telah menyelesaikan putaran Seri B $100 juta yang dipimpin oleh Sequoia Capital, menilai perusahaan tersebut pada $2 miliar. Kleiner Perkins, Index Ventures, dan Khosla Ventures turut berpartisipasi. Pendanaan ini datang enam bulan setelah perusahaan tersebut mengumpulkan juta dalam Seri A dengan valuasi juta, hampir tiga kali lipat valuasinya.
GateNews5jam yang lalu