Gate News 消息,3 月 19 日,小米今日凌晨正式發布 MiMo-V2 系列 AI 模型,涵蓋旗艦推理模型 Pro、全模態基座 Omni 和語音合成 TTS 三款產品。
MiMo-V2-Pro 總參數量超 1 萬億(42B 激活參數),支持 100 萬 Token 超長上下文,專為 Agent 工作場景設計。在 Artificial Analysis 排行榜位列全球第八、國內第二,在 PinchBench 和 ClawEval 評測中均居全球第三。整體性能超越 Claude Sonnet 4.6、逼近 Opus 4.6,但定價僅為後者 1/5:256K 上下文以內輸入 $1、輸出 $3/百萬 tokens,1M 上下文以內輸入 $2、輸出 $6/百萬 tokens。MiMo Claw 模塊已打通金山 WebOffice 生态,WPS 靈犀同步接入。
MiMo-V2-Omni 為全模態基座,支持文本、圖像、音頻、視頻四路輸入,256K 上下文,定價輸入 $0.4、輸出 $2/百萬 tokens。音頻方面支持超 10 小時連續長音頻理解,綜合評測超越 Gemini 3 Pro;圖像理解超越 Claude Opus 4.6、逼近 Gemini 3 Pro。
MiMo-V2-TTS 基於自研 Audio Tokenizer,經上億小時語音數據預訓練,支持從整體風格到局部情緒的多粒度控制,可合成高質量歌聲,方言覆蓋東北話、四川話、河南話、粵語和台灣腔。
三款模型現已接入 Xiaomi miclaw、MiMo Studio、金山辦公和小米瀏覽器,並可通過 OpenClaw、OpenCode、KiloCode、Blackbox、Cline 五大 Agent 開發框架調用,限時免費一周。