DeepSeek 推出 V4 开源预览版,技术评分 3206 超越 GPT-5.4

Market Whisper

DeepSeek V4開源預覽版

DeepSeek 于 4 月 24 日正式推出 V4 预览版系列,以 MIT 许可协议开源,模型权重已同步上线 Hugging Face 及 ModelScope。根据 DeepSeek V4 技术报告,V4-Pro-Max(最高推理力度模式)在 Codeforces 基准取得 3206 分,超越 GPT-5.4。

两款 MoE 模型架构规格

根据 DeepSeek V4 技术报告,V4 系列包含两款混合专家(MoE)模型:

V4-Pro:总参数 1.6T,每 token 激活 49B,支持 1M token 上下文

V4-Flash:总参数 284B,每 token 激活 13B,同样支持 1M token 上下文

根据技术报告,V4-Pro 在 1M 上下文下的单 token 推理 FLOPs 仅为 V3.2 的 27%,KV 缓存降至 V3.2 的 10%,主要得益于混合注意力机制(压缩稀疏注意力 CSA + 重度压缩注意力 HCA)的架构升级。预训练数据规模超过 32T token;训练优化器更新为 Muon。

后训练方法论:在线策略蒸馏取代混合强化学习

根据 DeepSeek V4 技术报告,V4 后训练的核心更新在于以在线策略蒸馏(On-Policy Distillation,OPD)完全取代 V3.2 的混合强化学习(mixed RL)阶段。新流程分为两步:首先针对数学、代码、Agent 及指令跟随等领域分别训练领域专家(SFT + GRPO 强化学习);随后以多教师 OPD 将十余个专家的能力蒸馏至统一模型,通过 logit 对齐避免传统方法中常见的能力冲突。

报告同时引入生成式奖励模型(Generative Reward Model,GRM),针对难以用规则验证的任务,以少量多样化人工标注数据训练,让模型同时承担生成与评估功能。

基准测试成绩:编码领先,知识推理仍有差距

根据 DeepSeek V4 技术报告,V4-Pro-Max 与 Opus 4.6 Max、GPT-5.4 xHigh 及 Gemini 3.1 Pro High 的对比结果(不含近期发布的 GPT-5.5 及 Opus 4.7):

Codeforces:3206(GPT-5.4:3168 / Gemini 3.1 Pro:3052)→ 全场最高

LiveCodeBench:93.5 → 全场最高

SWE Verified:80.6,落后 Opus 4.6 的 80.8 差 0.2 个百分点

GPQA Diamond:90.1,落后 Gemini 3.1 Pro 的 94.3

SimpleQA-Verified:57.9,落后 Gemini 3.1 Pro 的 75.6

HLE:37.7,落后 Gemini 3.1 Pro 的 44.4

技术报告同时指出,上述对比不含最近发布的 GPT-5.5 及 Opus 4.7,V4 与最新一代闭源模型的差距有待第三方评测验证。

常见问题

DeepSeek V4 预览版的开源许可条款为何,可在哪里取得?

根据 DeepSeek 4 月 24 日的官方公告,V4 系列以 MIT 许可协议开源,模型权重已上线 Hugging Face 及 ModelScope,适用于商业与学术用途。

DeepSeek V4-Pro 与 V4-Flash 的参数规模有何差异?

根据 DeepSeek V4 技术报告,V4-Pro 总参数为 1.6T,每 token 激活 49B;V4-Flash 总参数为 284B,每 token 激活 13B,两款均支持 1M token 上下文。

DeepSeek V4-Pro-Max 与 GPT-5.4 及 Gemini 3.1 Pro 的基准比较结果为何?

根据 DeepSeek V4 技术报告,V4-Pro-Max 在 Codeforces(3206 分)及 LiveCodeBench(93.5)两项基准超越 GPT-5.4 及 Gemini 3.1 Pro,但在知识密集型基准(GPQA Diamond、SimpleQA-Verified、HLE)上仍落后 Gemini 3.1 Pro;比较组不含 GPT-5.5 及 Opus 4.7。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

美国国防部与包括 OpenAI、Google 和 Microsoft 在内的 7 家 AI 公司达成协议

据美国国防部称,该机构今天(5 月 1 日)与七家领先的人工智能公司签署了协议:SpaceX、OpenAI、Google、Nvidia、Reflection、Microsoft 和亚马逊云服务(AWS)。这些协议旨在加速军事转型并建立 t

GateNews2 分钟前

Datavault AI 与 King Mining Capital 在 $150M Gold 代币化计划上达成合作

据 Businesswire 称,5 月 1 日,纳斯达克上市公司 Datavault AI 宣布与 King Mining Capital 达成战略合作,以推出 GoldVault,该金牌代币化计划规模超过 1.5 亿美元。根据该协议,Datavault AI 将收购 King Mining Capital 5% 的股权份额,并且

GateNews27 分钟前

Nebius 同意以 $643M 的现金与股票收购 Eigen AI

据 Nebius 称,这家 AI 基础设施公司已同意于 5 月 1 日以约 6.43 亿美元现金和 A 类股份收购 Eigen AI。交易价值基于 Nebius 在签署前的 30 天加权平均股价计算,并将进行符合惯例的调整。Eigen AI

GateNews42 分钟前

Meta 发债 250 亿美元支撑 AI:2026 资本支出冲 1,450 亿美元

Meta 于 4/30 完成 250 亿美元六批债发行,最长期至 2066 年,初价较美国国债高约 180 个基点,认购约 960 亿但低于上次。同步将 2026 年资本支出上修至 1,250–1,450 亿美元,创办人亦坦承尚无逐项 AI 产品计划。财报后股价下跌 7%,显示市场对 AI 投入“变现”仍存疑。若 ROI 未明朗,未来 12 个月科技巨头债发行潮与利差扩大风险并存。

鏈新聞abmedia1小时前

华为 AI 芯片或增 60% 至 120 亿:抢 NVIDIA 中国订单

华为预计 2026 年 AI 晶片营收达 120 亿美元,比 2025 年的 75 亿增长 60%,主因为 Ascend950PR 自 2026 年 3 月量产并稳定拿下大多数订单,950DT 预计 Q4 上市。客户包括 DeepSeek、阿里云、腾讯云;950PR 采用 7nm SMIC 制程,因美国管制无法使用 5nm/3nm。此增长显示中国市场地位与出口管制影响,NVIDIA 在中国市占可能被侵蚀。后续观察包括实际出货、制程供应与管制变化。

鏈新聞abmedia1小时前

你问 Claude 人生大事时:感情问题 25%、灵性 38% 諂媚率

Anthropic 的研究顯示,在百万條 Claude 对話中,约 6% 的用戶把 AI 当作人生顾问,四大领域为健康、職涯、感情、财務。感情諂媚率 25%、靈性 38%最高。为降低諂媚,Opus 4.7 与 Mythos Preview 已再降半。研究转为訓練资料,隐私受保護,建议用戶在感情议題採取反向提问。来源 ABMedia

鏈新聞abmedia2小时前
评论
0/400
暂无评论