Xiaomi Reveals MiMo-V2-Pro Training Details: 1T Model Parameters, Thousands of GPUs Deployed

Gate News message, April 24 — Xiaomi’s large language model team lead Luo Fuli disclosed in an in-depth interview that the MiMo-V2-Pro model has 1 trillion parameters in total and required thousands of GPUs for training. She noted that the 1T scale represents the minimum threshold to achieve performance approaching Claude Opus 4.6 level and secure a competitive entry ticket for the next phase of AI agents.

Technically, the Pro version employs an extreme sparse attention mechanism with a 7:1 ratio between global attention and sliding window attention, controlling inference costs for long-context processing. The model also retains the MTP (Multi-Token Prediction) architecture to leverage surplus compute power for faster inference.

On the management side, the 100-person MiMo team has only 30-40 people directly engaged in core iterations. The team operates without formal hierarchies or explicit sub-group divisions and delivery deadlines. When encountering unstable numerical issues such as training loss spikes, the team prioritizes halting training for investigation, even if it means stopping operations for one or two weeks and incurring millions of dollars in compute costs.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

OpenClaw випускає v2026.4.29 29 квітня та оновлює пам’ять до персоналізованої вікі з відстеженням зв’язків

За даними Beating, відкритий AI-допоміжник OpenClaw (GitHub 367 тис. зірок) випустив v2026.4.29 29 квітня, що стало другим оновленням за два дні. Система пам’яті еволюціонувала від простого відтворення на основі запиту до персоналізованої wiki, дозволяючи агентам автоматично створювати профілі персонажів і відстежувати r

GateNews45хв. тому

Маск свідчить, що xAI використовувала моделі OpenAI для навчання Grok

У четвер Ілон Маск дав свідчення в федеральному суді США в Каліфорнії, заявивши, що його компанія з кібернетичного інтелекту xAI частково використовувала моделі OpenAI під час навчання чатбота Grok, повідомляє TechCrunch. Це визнання є рідкісним публічним підтвердженням практики, яка дедалі більше…

CryptoFrontier3год тому

Генеральний директор Google Пічаї розкрив, що за допомогою Gemini AI він прагне осягнути людську природу та вибудувати більш щирі комунікації

Пічай заявив, що перед важливими зустрічами він, спираючись на підхід Gemini, аналізує ймовірні думки співрозмовника, щоб підвищити рівень емпатії та вести більш щире спілкування. Також AI-агенти можуть автоматично впорядковувати листи, планувати розклад і створювати підсумки, роблячи щоденні дрібниці ефективнішими. Окрім того, зростає кількість AI-платформ, побудованих на відкритій співтворчості: такі відкриті технології, як Gemini 4, знижують поріг входу. Водночас наголошується на необхідності створення рамок AI-управління, і що владі та суспільству слід долучитися, щоб вирішувати виклики на кшталт кібербезпеки, deepfake та сталого розвитку.

ChainNewsAbmedia3год тому

OpenAI запускає розширену безпеку акаунтів для ChatGPT

Запуск розширеної безпеки акаунта У четвер OpenAI представила Advanced Account Security — нове налаштування з можливістю добровільного ввімкнення для ChatGPT, призначене для користувачів, які прагнуть посилити захист або стикаються з вищими ризиками цифрових атак. Компанія заявила, що нова функція була створена у відповідь на те, як люди є

CryptoFrontier4год тому

X (Twitter) отримав найбільше за 20 років оновлення рекламної платформи, xAI втрутилася, а AI-семантичний таргетинг став ключовим

X оголосив про запуск із квітня 2026 року найбільшої за 20 років модернізації рекламної платформи: перебудову базових технологій і поєднання з xAI. Нова платформа робить ставку на AI-керовану оптимізацію ефективності, семантичну та контекстну рекламу, щоб підвищити зручність керування й контроль під час розміщення. Її мета — перетворити рекламу на комерційні сигнали в реальному контексті, а в поєднанні зі стратегією Everything App — стати бізнес-движком екосистеми X.

ChainNewsAbmedia7год тому

Підтримуваний OpenAI проєкт 1X відкриває 58 000 кв. футів фабрики в Каліфорнії та планує 10 000 роботів у перший рік

Згідно з Bloomberg, 1X Technologies — стартап у сфері робототехніки, підтримуваний OpenAI, заснований у Норвегії, — відкрив виробничий об’єкт площею 58 000 квадратних футів у Гейворді (Каліфорнія), прагнучи стати лідером у масовому виробництві споживчих гуманоїдних роботів. Очікується, що на підприємстві вироблятимуть 10 000 роботів у своєму

GateNews10год тому
Прокоментувати
0/400
Немає коментарів