阿里巴巴 PAI 发布开源 AgenticQwen 模型:8B 版本通过双数据飞轮实现接近 235B 的性能

GateNews

Gate News 消息,4月27日——阿里巴巴的 PAI 团队已发布并开源 AgenticQwen,这是一款面向工业级工具调用应用的小规模代理式语言模型。该模型提供两个版本:8B 和 30B-A3B。通过创新的“双数据飞轮”强化学习框架训练,AgenticQwen 在大幅降低推理成本的同时,实现了接近“万亿级参数规模”的模型层级代理能力。

双数据飞轮机制解决了传统合成数据中的同质化问题。推理飞轮会从模型错误中自动生成更难的变体,而代理式飞轮会将简单的线性工作流 (例如单次预订流程)扩展为带约束的多分支行为树,包含拒绝与对抗条件,模拟真实世界的复杂决策场景。基准测试显示,AgenticQwen-8B 在真实工具环境基准 (TAU-2 和 BFCL-V4) 上得分为 47.4,远超基础 Qwen3-8B (23.8),并接近 Qwen3-235B (52.0)。AgenticQwen-30B-A3B (仅激活 3B 参数) 达到 50.2。

该模型已部署在类似 Manus 的内部生产系统中,端到端推理时间方面显著缩小了与 235B 模型的差距。不过,该模型受原生上下文长度 40K tokens 的限制,这会制约其在深度搜索任务上的表现。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

AI 代理 Manfred 组建公司,并在 5 月交易启动前取得加密钱包

AI 代理 Manfred 已成立自己的公司,并获得了一个加密钱包和商业资质,尽管它将在 5 月底之前不会开始交易加密货币。该代理现在已具备雇佣员工、进行付款以及开展业务的条件

GateNews2小时前

MoonPay 将于周五推出 MoonAgents 卡,一种面向 AI 代理和用户的虚拟万事达卡

据 The Block 称,MoonPay 于周五推出了 MoonAgents Card,一种面向 AI 代理和用户的虚拟万事达借记卡。该卡可在支付时将稳定币兑换为法币,并可在全球任何接受万事达卡的线上商户处使用。由 Monavate 发行,这是一家受监管的支付

GateNews5小时前

MoonPay 将于周五在 Mastercard 网络上推出 MoonAgents 卡

据 The Block 称,MoonPay 于周五推出 MoonAgents Card——一款虚拟万事达借记卡,使 AI 代理与用户能够直接从链上钱包中使用稳定币进行消费。该卡由 Monavate(一个受监管的全球支付平台,并且是万事达主要成员)发行,in

GateNews8小时前

137 Ventures 在新资金中完成 $700M ,管理资产(AUM)达到 150 亿美元

据 ChainCatcher 报道,137 Ventures,这家是 SpaceX 的早期投资者,最近已完成两只新基金的募资,总计超过 7 亿美元,使其管理资产规模提升至超过 150 亿美元。新资金将支持在 AI 代理、机器人和太空推进方面的投资

GateNews9小时前

Reddit 在强劲的 Q2 展望带动下飙升 16%;苹果面临 Mac 供应短缺,因 AI 需求超过供给

Reddit 的股价在周五开盘前上涨了 16%,原因是该公司发布了高于预期的未来一个季度营收展望。日活跃访问者增长 17% 至 1.268 亿人次,而全球人均营收跃升 44%,受 AI 驱动的

GateNews9小时前

Visa 于 5 月 1 日在香港推出面向具备代理能力的计划(Agentic Ready Program),使 AI 代理支付成为可能

据香港媒体明报称,Visa 于 5 月 1 日在香港推出 Visa Agentic Ready 计划,支持 AI 代理支付。该计划利用代币化、身份验证、风险管理和授权机制。首批参与者包括

GateNews12小时前
评论
0/400
暂无评论