小米的 MiMo-V2.5 系列开源:1T 参数,相较 GPT-5.4 令牌效率更优

Gate News message, April 27 — Xiaomi’s MiMo team has open-sourced the MiMo-V2.5 series of large language models under MIT license, supporting commercial deployment, continued training, and fine-tuning. Both models feature a 1 million token context window. MiMo-V2.5-Pro is a pure-text mixture-of-experts (MoE) model with 1.02 trillion total parameters and 42 billion active parameters, while MiMo-V2.5 is a native multimodal model with 310 billion total parameters and 15 billion active parameters, supporting text, image, video, and audio understanding.

MiMo-V2.5-Pro targets complex agent and programming tasks. In ClawEval benchmarks, it achieved 64% Pass@3 while consuming approximately 70,000 tokens per task trajectory—40% to 60% fewer tokens than Claude Opus, Gemini 3.1 Pro, and GPT-5.4. The model scored 78.9 on SWE-bench Verified. In a demonstration, V2.5-Pro independently implemented a complete SysY-to-RISC-V compiler for a Peking University compiler course project in 4.3 hours with 672 tool calls, achieving a perfect score of 233/233 on hidden test sets.

MiMo-V2.5 is designed for multimodal agent scenarios, equipped with a dedicated vision encoder (729 million parameters) and audio encoder (261 million parameters), scoring 62.3 on the Claw-Eval general subset. Both models employ a hybrid architecture combining sliding window attention (SWA) and global attention (GA), paired with a 3-layer multi-token prediction (MTP) module for accelerated inference. Model weights are available on Hugging Face.

Alongside the open-source release, the MiMo team launched the “Orbit Quadrillion Token Creator Incentive Program,” offering 100 quadrillion tokens free over 30 days to global users. Individual developers, teams, and enterprises can apply via the program page with an evaluation cycle of approximately 3 business days; approved benefits are distributed as Token Plans or direct credits, compatible with tools like Claude Code and Cursor.

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

OpenClaw 于 2026.4.29 版本在 4 月 29 日发布,将内存升级为带关系追踪的个性化 Wiki

根据 Beating,开源 AI 助手 OpenClaw(GitHub 36.7 万个星标)于 4 月 29 日发布 v2026.4.29,标志着它在两天内的第二次更新。其记忆系统从基于检索的简单回忆演进为个性化 wiki,使得智能体能够自动构建角色画像并追踪 r

GateNews47 分钟前

马斯克作证称 xAI 使用 OpenAI 模型来训练 Grok

埃隆·马斯克周四在加州联邦法院作证称,据 TechCrunch 报道,他的人工智能公司 xAI 在训练其 Grok 聊天机器人时部分使用了 OpenAI 模型。该承认代表了大型 AI 开发者对一种做法罕见的公开认可,而这种做法正日益受到

Crypto Frontier3小时前

Google 执行长皮查伊透露利用 Gemini AI 洞悉人性建立更真诚的沟通

皮查伊表示,在重要会议前,他用 Gemini 的观点分析预测对方心理,以此增进同理心与更真诚的沟通。AI 代理也能自动整理邮件、排程与摘要,使日常琐事更高效。另以开放共创为核心的 AI 平台正在兴起,Gemini 4 等开源技术降低门槛;同时强调建立 AI 治理框架,政界与社会需参与以解决网安、深伪与永续等挑战。

鏈新聞abmedia3小时前

OpenAI 为 ChatGPT 推出先进的账户安全功能

高级账户安全发布 OpenAI 于周四推出了高级账户安全,这是 ChatGPT 的一项新的可选设置,面向希望获得更强保护或面临更高数字攻击风险的用户。该公司表示,新功能是为了回应人们的情况如何

Crypto Frontier4小时前

X(推特)迎来 20 年最大广告平台升级,xAI 介入,AI 语义投放成为核心

X 宣布自 2026 年 4 月起推出 20 年来最大广告平台改造,重建底层技术并结合 xAI。新平台以 AI 驱动成效优化、语意与情境广告为核心,提升操作便利与投放控管,目标把广告转化为即时报文语境的商业信号,并配合 Everything App 策略成为 X 生态的商业引擎。

鏈新聞abmedia7小时前

OpenAI 背书的 1X 在加利福尼亚开设 58,000 平方英尺工厂,首年目标部署 10,000 台机器人

据彭博社报道,总部位于挪威、由 OpenAI 支持的机器人初创公司 1X Technologies 已在加利福尼亚州海沃德开设了一座占地 58,000 平方英尺的制造工厂,目标是引领量产面向消费者的类人机器人。 该工厂预计将生产 10,000 台机器人,随后在其产能范围内持续推进。

GateNews10小时前
评论
0/400
暂无评论