Gate 新聞訊息,4 月 24 日——小米大型語言模型團隊負責人 羅福立 在一場深入採訪中披露,MiMo-V2-Pro 模型總計擁有 1 兆(trillion)參數,訓練過程需要數千台 GPU。她指出,1T 規模代表達成性能接近 Claude Opus 4.6 等級所需的最低門檻,並取得下一階段 AI 代理的競爭性入場票。
技術層面,Pro 版本採用極致稀疏注意力機制,將全域注意力與滑動視窗注意力的比例設為 7:1,以控制長上下文處理的推論成本。模型也保留了 MTP (Multi-Token Prediction) 架構,利用剩餘算力以實現更快的推論。
在管理方面,100 人規模的 MiMo 團隊中,只有 30-40 人直接參與核心迭代。團隊運作不設正式階層,也沒有明確的分組或交付截止期限。當遇到不穩定的數值問題,例如訓練損失激增時,團隊會優先考慮暫停訓練以便調查,即使這意味著停止運作一到兩週,並因此產生數百萬美元的算力成本。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
輝達投資瑞典 AI 法律科技新創 Legora,裘德·洛為全球品牌代言人
輝達對 Legora 進行 Series D 擴增投資5,000萬美元,使 Legora 總募資達6億美元、估值56億美元,Atlassian、Adams Street Partners、Insight Partners 參與。 Legora 專注 AI 法律科技,提供自動化審查、合約分析與法律研究等工具,ARR 超過1億美元,員工由40增至400。Jude Law 成為全球品牌代言人,廣告口號為 Law just got more attractive。
鏈新聞abmedia1分鐘前
Anthropic 於 5 月 1 日向企業用戶開放 Claude 安全性 Beta
根據 BlockBeats,5 月 1 日,Anthropic 宣布 Claude Security(代碼安全工具)已向使用 Claude Enterprise 的用戶開放公開測試(public beta)。該工具會掃描程式碼倉庫以找出安全漏洞,並進行二次驗證以降低誤報,同時自動執行
GateNews6分鐘前
美國勞工局啟動 AI 學徒入口網站幫助企業培訓人才
美國勞工局於全國學徒週啟動 AI 學徒入口網站,提供一站式培訓資源,透過 AI 素養框架轉為實務技能,設多產業模組與彈性路徑,協助企業把 AI 培訓融入註冊學徒計畫,提升人力與產業競爭力。
鏈新聞abmedia30分鐘前
X 將於 2026 年 4 月推出重建的 AI 驅動廣告平台,20 年來最大規模的改版
根據 X,該平台於 2026 年 4 月開始分階段推出重建的廣告平台。隨著公司將更多廣告工具轉向 AI,這項變動標誌著其約 20 年來最大規模的廣告系統改版。新的 Ads Manager 使用基於 AI 的定向與排名,並根據
GateNews1小時前
英特爾在 4 月因強勁財報與 AI 樂觀情緒上漲 114%
根據 CNBC,英特爾(Intel)的股價在 4 月飆升 114%,創下史上最佳單月表現,原因是季度財報表現更強勁,以及投資人對其與 AI 相關的復甦重新燃起樂觀情緒。在 4 月 24 日,執行長 Lip-Bu Tan 宣布季度營收成長超過 7% 後,股價上漲了 24%,而
GateNews1小時前
Marathon Digital Holdings 將以 15 億美元收購 Long Ridge Energy,擴建 AI 資料中心
Marathon Digital Holdings 正在以 15 億美元收購 Long Ridge Energy,以擴大全其 AI 資料中心的產能。該交易包括一座 505 MW 的天然氣發電廠,以及俄亥俄州 1,600 英畝土地,將提供超過 1 GW 的發電能力,以支援未來的 AI 與 IT 基礎設施
GateNews1小時前