Gate News 消息,4 月 24 日——DeepSeek 已在 MIT 授权下发布 V4 系列开源模型,权重现已在 Hugging Face 和 ModelScope 上提供。该系列包含两个 (MoE) 混合专家(Mixture-of-Experts)模型:V4-Pro 总参数 1.6 万亿、每 token 激活 49 亿,以及 V4-Flash 总参数 2840 亿、每 token 激活 13 亿。两者都支持 100 万 token 的上下文窗口。
该架构包含三项关键升级:混合注意力机制,将压缩稀疏注意力 (CSA) 与高度压缩注意力 (HCA) 结合,大幅降低长上下文开销——V4-Pro 在 100 万上下文下的推理 FLOPs 仅为 V3.2 的 27%,用于推理过程中存储历史信息的 KV cache (VRAM) 也仅为 V3.2 的 10%;用流形约束超连接 (mHC) 替代传统残差连接,以增强跨层信号传播稳定性;以及用于更快训练收敛的 Muon 优化器。预训练使用了超过 32 万亿个 token 的数据。
后训练采用两阶段策略:首先通过监督微调 (SFT) 和基于 GRPO 的强化学习训练领域专属专家,然后通过在线蒸馏将它们合并为单一模型。V4-Pro-Max (最高推理模式) 宣称是最强的开源模型,拥有顶级编码基准,并在推理与智能体任务上显著缩小了与闭源前沿模型之间的差距。V4-Flash-Max 在足够的计算预算下达到 Pro 级推理性能,但在纯知识与复杂智能体任务上会受限于参数规模。权重以混合 FP4+FP8 精度存储。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
OpenClaw 於 2026.4.29 版本在 4 月 29 日發布,將記憶體升級為具備關係追蹤的個人化 Wiki
根據 Beating,開源 AI 助手 OpenClaw(GitHub 367K 星)於 4 月 29 日發布了 v2026.4.29,標誌著其在兩天內的第二次更新。其記憶系統已從單純的檢索式回憶演進為個人化維基,使代理能夠自動建立角色檔案並追蹤 r
GateNews27分鐘前
馬斯克作證稱 xAI 使用 OpenAI 模型來訓練 Grok
根據 TechCrunch 的報導,Elon Musk 週四在加州的聯邦法院作證表示,他的人工智慧公司 xAI 在訓練其 Grok 聊天機器人時,部分使用了 OpenAI 模型。此項承認代表了主要 AI 開發者對一種在不斷加劇
Crypto Frontier3小時前
谷歌執行長皮查伊透露利用 Gemini AI 洞悉人性建立更真誠的溝通
皮查伊表示在重要會議前,他用 Gemini 的觀點分析預測對方心理,藉此增進同理心與更真誠的溝通。AI 代理也能自動整理郵件、排程與摘要,使日常瑣事更高效。另以開放共創為核心的AI平台正在興起,Gemini 4 等開源技術降低門檻;同時強調建立 AI 治理框架,政界與社會需參與以解決網安、深偽與永續等挑戰。
鏈新聞abmedia3小時前
OpenAI 為 ChatGPT 推出進階帳戶安全功能
進階帳戶安全啟用
OpenAI 於週四推出「進階帳戶安全」:一項供 ChatGPT 使用者自行選擇啟用的新設定,適合希望獲得更強保護或面臨更高數位攻擊風險的使用者。該公司表示,新功能的推出是為了回應人們如何
Crypto Frontier4小時前
X (推特) 迎來 20 年最大廣告平台升級,xAI 介入,AI 語意投放成核心
X 宣布自2026年4月起推出20年來最大廣告平台改造,重建底層技術並結合 xAI。新平台以 AI 驅動成效優化、語意與情境廣告為核心,提升操作便利與投放控管,目標把廣告轉化為即時語境的商業信號,並配合 Everything App 策略成為 X 生態的商業引擎。
鏈新聞abmedia7小時前
OpenAI 支援的 1X 在加州開設 58,000 平方英尺工廠,第一年目標部署 10,000 台機器人
根據彭博社,1X Technologies 是一家挪威成立、獲 OpenAI 支援的機器人新創公司,已在美國加州海沃德(Hayward)開設了一座 58,000 平方英尺的製造工廠,目標是成為大規模生產消費級人形機器人的先驅。
預計該工廠將在其
GateNews9小時前