DeepSeek V4 在 Putnam-2025 上取得满分成绩,与 Axiom 在形式化数学推理中并列第一

Gate News 消息,4月24日——DeepSeek V4 已发布来自形式化数学推理评测的结果,在 Putnam-2025 上获得满分 120/120,与 Axiom 并列第一。

在使用 LeanExplore 和受约束采样的实际模式下,V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00,显著优于 Seed-2.0-Prover (35.50)、Gemini 3 Pro (26.50) 和 Seed-1.5-Prover (26.50)。前沿模式的结果显示,V4 在 Seed-1.5-Prover (110/120) 与 Aristotle (100/120) 之前。

V4 采用混合的形式化-非形式化推理方法:非形式化推理生成候选自然语言解答,自我验证用于筛选结果,而形式化智能体在 Lean 中完成严格证明。前沿结果采用了大规模计算扩展,而实际模式分数更能反映标准部署能力。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

中国 AI 公司考虑在 Meta 的 Manus 收购叫停后拆解红筹结构

据 Beating 称,中国国家发展和改革委员会叫停了 Meta 对 AI 代理公司 Manus 的 20 亿美元收购,促使中国证券监督管理委员会加强对红筹公司(持有境内资产的中国公司)在香港 IPO 上市的批准要求

GateNews1小时前

马斯克完成 OpenAI 诉讼中为期三天的作证,援引 130-1500 亿美元的损害赔偿主张

据多家媒体报道,埃隆·马斯克在针对 OpenAI 的诉讼中,于 4 月 28 日至 30 日完成了三天的作证,其累计作证时间超过 7 小时。马斯克于 2015 年与最初投资 3800 万美元共同创立 OpenAI,他声称该公司放弃了其非营利

GateNews1小时前

Meta 于 5 月 1 日收购机器人 AI 初创公司 Assured Robot Intelligence

据彭博社报道,Meta 于 5 月 1 日收购了 Assured Robot Intelligence,这是一家总部设在圣迭戈和纽约的人工智能机器人创业公司。被收购团队(包括联合创始人 Lerrel Pinto 和 Xiaolong Wang)将加入 Meta 超级智能实验室,并与 Meta Robotics Studio 合作。财务

GateNews1小时前

与 OpenAI 相关的组织向网红每条 TikTok 支付 5,000 美元,用于传播“中国 AI 威胁”信息

根据 WIRED,隶属于超级政治行动委员会 Leading the Future 的非营利组织 Build American AI 一直在通过营销机构 SM4 系统性地招募社交媒体网红,以在 TikTok 和 Instagram 上传播“China threatens U.S. AI”的信息。该组织

GateNews1小时前

Nebius 以 $643M to 购买 Eigen AI,以加速 AI 模型部署

据《经济时报》报道,5月1日,总部位于阿姆斯特丹的 AI 基础设施公司 Nebius 宣布,它将以约 6.43 亿美元现金和 A 类股份收购 Eigen AI。Eigen AI 由前 MIT 研究人员创立,专注于推理和优化技术。Nebius 计划将其

GateNews1小时前

五角大楼与 8 家公司签署 AI 合作协议,拒绝 Anthropic 访问秘密级网络

据 Beating News 称,五角大楼宣布与 8 家科技公司达成协议,以在美国军队的绝密级(IL6)和顶级绝密(IL7)网络上部署其 AI 工具与基础设施。新签署的公司包括 Nvidia、Microsoft、AWS、Reflection AI,以及此前

GateNews1小时前
评论
0/400
暂无评论