Gate News 消息,4 月 23 日——Perplexity 的研究团队发布了一篇技术文章,详细说明其针对网页搜索代理的后训练方法。该方法使用两个开源的 Qwen3.5 模型 (Qwen3.5-122B-A10B 和 Qwen3.5-397B-A17B),并采用两阶段流水线:先进行监督微调 (SFT),以建立指令遵循与语言一致性;随后进行在线强化学习 (RL),以优化搜索准确率与工具使用效率。
强化学习阶段使用 GRPO 算法,并结合两种数据源:一种专有的多跳可验证问答数据集,由内部种子查询构建而成,要求推理 2–4 跳,并通过多求解器验证;以及基于评分标准的通用对话数据,将部署需求转换为客观可检验的原子条件,从而防止 SFT 行为退化。
奖励设计采用门控聚合——只有在达到基线正确性时,偏好分数才会计入 (question-answer 匹配或满足所有评分标准),从而避免高偏好信号掩盖事实错误。效率惩罚使用组内锚定:对工具调用以及生成长度施加平滑惩罚,且该基线以同一组中正确答案的长度为准。
评估结果表明,Qwen3.5-397B-SFT-RL 在各项搜索基准上实现同级最佳表现。在 FRAMES 上,它在单次工具调用时达到 57.3% 准确率,较 GPT-5.4 高 5.7 个百分点;较 Claude Sonnet 4.6 高 4.7 个百分点。在中等预算 (四次工具调用) 条件下,它以每次查询 $0.02 实现 73.9% 准确率;相比之下,GPT-5.4 为每次查询 $0.085 且准确率 67.8%,Sonnet 4.6 为每次查询 $0.153 且准确率 62.4%。成本数据基于各提供方公开的 API 定价,并不包含缓存优化。
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Nền tảng Tài chính AI Rogo huy động $160M ở vòng Series D do Kleiner Perkins dẫn dắt trong chưa đầy 3 tháng
Theo Beating, nền tảng AI Rogo được thiết kế cho các kịch bản tài chính tần suất cao đã hoàn tất vòng gọi vốn Series D trị giá $160 triệu vào tháng 4 năm 2026, do Kleiner Perkins dẫn dắt với sự tham gia của Sequoia, Thrive Capital, Khosla Ventures và J.P. Morgan. Khoản đầu tư này đến chưa đầy ba tháng
GateNews13phút trước
Một số CEX ra mắt Giao thức Thanh toán của Agent hỗ trợ 4 phương thức thanh toán, 9 đối tác bao gồm Ethereum Foundation
Theo các nguồn tin chính thức, một sàn giao dịch tiền mã hóa lớn đã ra mắt Giao thức Thanh toán của Agent (APP), một tiêu chuẩn thanh toán mở cho các giao dịch thương mại của AI Agent vào ngày 29 tháng 4. Giao thức cho phép AI Agents xử lý thanh toán đơn lẻ, thanh toán theo lô, thanh toán theo mức sử dụng và thanh toán ký quỹ
GateNews31phút trước
Trung Quốc chặn thương vụ mua lại AI Manus do Meta hậu thuẫn vào ngày 29 tháng 4, với lý do lo ngại về bảo mật công nghệ và dữ liệu
Theo PANews, vào ngày 29 tháng 4, Văn phòng thẩm tra an ninh đầu tư của Ủy ban Cải cách và Phát triển Quốc gia Trung Quốc đã cấm việc một bên nước ngoài mua lại dự án Manus và yêu cầu chấm dứt giao dịch. Manus, được quảng bá là tác nhân trí tuệ nhân tạo tổng quát đầu tiên trên thế giới, đã
GateNews36phút trước
Mainnet KITE AI ra mắt trên Avalanche vào ngày 29 tháng 4 như một blockchain tác nhân AI được thiết kế cho mục đích đó
Theo Altcoin Buzz, mainnet KITE AI đã ra mắt trên Avalanche vào ngày 29 tháng 4, giới thiệu một blockchain Layer 1 dành riêng cho các tác nhân AI tự chủ. Nền tảng tích hợp năng lực nhận diện và thanh toán gốc để cho phép các tác nhân AI vận hành, giao dịch và mở rộng quy mô mà không gặp trở ngại.
Avalanch
GateNews3giờ trước
B.AI và deBridge Hợp tác Xây dựng Hạ tầng Liên chuỗi cho AI Agents
Theo ChainCatcher, B.AI và deBridge đã công bố quan hệ đối tác chiến lược vào ngày 29 tháng 4 để phát triển hạ tầng liên chuỗi dựa trên ý định. Sự hợp tác nhằm cung cấp việc thực thi liên chuỗi liền mạch cho một nền kinh tế AI Agent có khả năng mở rộng. Mô hình 0-TVL của deBridge và công nghệ liên chuỗi không phí gas sẽ hỗ trợ việc phát triển các hệ thống giao dịch tự động hiệu quả, an toàn của quan hệ đối tác, đẩy nhanh việc thực thi liên chuỗi trong kỷ nguyên AI Agent.
GateNews5giờ trước
Parallel của Parag Agrawal huy động $100M Series B cho hạ tầng tìm kiếm tác nhân AI
Theo Beating, Parallel Web Systems được thành lập bởi cựu CEO Twitter Parag Agrawal, đã hoàn tất vòng Series B trị giá $100 triệu USD do Sequoia Capital dẫn dắt, định giá công ty ở mức $2 tỷ USD. Kleiner Perkins, Index Ventures và Khosla Ventures cũng tham gia. Khoản tài trợ này xuất hiện sáu tháng sau khi công ty huy động triệu USD ở vòng Series A với mức định giá triệu USD, gần như gấp ba lần định giá của mình.
GateNews5giờ trước