XiaomiがMiMo-V2-Proの学習詳細を公開:1Tモデルパラメータ、数千のGPUを投入

Gate Newsメッセージ、4月24日――Xiaomiの大規模言語モデルチームリードであるロウ・フーリが、詳細なインタビューの中で、MiMo-V2-Proモデルは合計1兆パラメータを持ち、学習には数千のGPUが必要だったことを明らかにした。彼女は、1T規模は、Claude Opus 4.6に近い性能を達成し、次の段階のAIエージェントに向けた競争力のある参加チケットを確保するための最低ラインだと述べた。

技術面では、Pro版は、グローバル注意とスライディングウィンドウ注意の比率を7:1とする極端なスパース注意メカニズムを採用しており、長文コンテキスト処理における推論コストを制御している。モデルはまた、より高速な推論のために余剰の計算能力を活用するMTP (Multi-Token Prediction)アーキテクチャも保持している。

運営面では、100人規模のMiMoチームのうち、コアとなる反復作業に直接携わっているのは30〜40人しかいない。チームは正式な階層や明確なサブグループの区分、納期の期限がない状態で運営されている。学習損失の急騰といった不安定な数値問題に遭遇した場合、たとえ1〜2週間の稼働停止を意味し、計算コストとして数百万ドルの損失を被ることになっても、調査のために学習を止めることを優先する。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

xAIは、入力トークン100万あたり1.25ドルで、1Mトークンのコンテキストウィンドウを備えたGrok 4.3 APIを提供開始

BlockBeatsによると、xAIは5月1日にGrok 4.3 APIをローンチしました。新しいモデルは100万トークンのコンテキストウィンドウに対応し、テキストの入力/出力、マルチモーダル機能、ツール呼び出し機能を提供します。Grok 4.3 APIは、入力100万あたり1.25ドルの価格です

GateNews12分前

米国のテック大手は2026年にAIインフラへの$700B 投資を行う予定で、中国の1,050億ドルを大きく上回る

サウスチャイナ・モーニングポストによると、米国のテック大手は今年、AIインフラに対して7000億ドル超を投じる見通しで、中国の同業他社を大きく上回る。Google、Microsoft、Meta、Amazonがその大半を占めており、一方でモルガン・スタンレーは、中国のクラウド提供事業者が約105億ドルを投じると推計している。

GateNews18分前

ファーウェイは、2026年のAIチップ売上が120億ドルに達すると予想しており、2025年から60%増となる見込みです

ロイターによると、ファーウェイは2026年のAIチップ売上が約120億ドルに達すると見込んでおり、2025年の75億ドルから少なくとも60%以上の増加に相当します。今年の受注の大半は、3月に量産を開始したAscend 950PRプロセッサ向けです。同社は(これから)ローンチする予定です。

GateNews48分前

NVIDIA投資のスウェーデンAI法務テック新興企業Legora、ジュード・ロウが世界的なブランドアンバサダーに就任

NVIDIA が Legora への Series D の増資として 5,000 万米ドルを投資し、Legora の累計調達額を 6 億米ドル、評価額を 56 億米ドルに引き上げました。Atlassian、Adams Street Partners、Insight Partners が参加しています。Legora は AI 法律テックに注力しており、自動化された審査、契約分析、法務調査などのツールを提供しています。ARR は 1 億米ドルを超え、従業員数は 40 から 400 に増加しました。Jude Law が世界的なブランドアンバサダーとなり、広告スローガンは「Law just got more attractive」です。

ChainNewsAbmedia1時間前

Anthropicは5月1日に企業向けユーザー向けにClaudeセキュリティβを公開

BlockBeatsによると、5月1日にAnthropicが、コードセキュリティツールであるClaude SecurityがClaude Enterpriseユーザー向けにパブリックベータテストを開始したと発表した。このツールはコードリポジトリをスキャンしてセキュリティ上の脆弱性を検出し、誤検知を減らすために二次的な検証を行い、さらに自動的にg

GateNews1時間前
コメント
0/400
コメントなし