Серія Xiaomi MiMo-V2.5 виходить у відкритий доступ: 1T параметрів із вищою ефективністю токенів порівняно з GPT-5.4

Повідомлення Gate News, 27 квітня — команда Xiaomi MiMo оприлюднила з відкритим кодом серію MiMo-V2.5 великих мовних моделей під ліцензією MIT, що підтримує комерційне розгортання, подальше навчання та доопрацювання. Обидві моделі мають контекстне вікно розміром 1 мільйон токенів. MiMo-V2.5-Pro — це модель суміші експертів із чистим текстом (MoE) з 1,02 трильйонами загальних параметрів і 42 мільярдами активних параметрів, тоді як MiMo-V2.5 — нативна мультимодальна модель із 310 мільярдами загальних параметрів і 15 мільярдами активних параметрів, що підтримує розуміння тексту, зображень, відео та аудіо.

MiMo-V2.5-Pro орієнтована на складні агентні та програмістські задачі. У бенчмарках ClawEval вона досягла 64% Pass@3, споживаючи приблизно 70 000 токенів на траєкторію задачі — на 40%–60% менше токенів, ніж Claude Opus, Gemini 3.1 Pro та GPT-5.4. Модель набрала 78,9 на SWE-bench Verified. У демонстрації V2.5-Pro самостійно реалізувала повний компілятор SysY-to-RISC-V для проєкту курсу компіляторів Пекінського університету за 4,3 години, використавши 672 виклики інструментів, і досягла ідеального результату 233/233 на прихованих тестових наборах.

MiMo-V2.5 призначена для сценаріїв мультимодальних агентів, оснащена виділеним візуальним енкодером (729 мільйонів параметрів) та аудіоенкодером (261 мільйон параметрів), набравши 62,3 на Claw-Eval загальному піднаборі. Обидві моделі використовують гібридну архітектуру, що поєднує sliding window attention (SWA) та глобальну увагу (GA), разом із модулем 3-шарової багатотокенної передбачуваності (MTP) для прискореного виведення. Ваги моделі доступні на Hugging Face.

Поряд із випуском із відкритим кодом команда MiMo запустила «Orbit Quadrillion Token Creator Incentive Program», пропонуючи 100 квадрильйонів токенів безкоштовно протягом 30 днів для користувачів у всьому світі. Окремі розробники, команди та підприємства можуть подати заявку через сторінку програми, з циклом оцінювання приблизно 3 робочих дні; схвалені переваги розподіляються як Token Plans або прямі кредити, сумісні з інструментами на кшталт Claude Code та Cursor.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

xAI запускає API Grok 4.3 із контекстним вікном на 1 млн токенів за $1,25 за мільйон вхідних токенів

За даними BlockBeats, xAI запустила API Grok 4.3 1 травня. Нова модель підтримує контекстне вікно на 1 мільйон токенів і пропонує текстові введення/виведення, мультимодальні можливості та функції виклику інструментів. API Grok 4.3 коштує 1,25 долара за мільйон вхідних токенів

GateNews12хв. тому

Американські техгіганти планують витратити $700B на інфраструктуру для ШІ у 2026 році, що суттєво перевищить $105 млрд Китаю

За даними South China Morning Post, американські технологічні гіганти мають витратити понад $700 мільярдів на інфраструктуру ШІ цього року, що значно перевищує китайських конкурентів. Google, Microsoft, Meta та Amazon формують більшу частину цієї суми, тоді як Morgan Stanley оцінив, що китайські хмарні провайдери витратять приблизно $105 мільярдів

GateNews18хв. тому

Huawei очікує, що виручка від AI-чипів у 2026 році сягне 12 мільярдів доларів, що на 60% більше, ніж у 2025 році

За даними Reuters, Huawei очікує, що виручка від її AI-чипів у 2026 році досягне приблизно $12 мільярдів, що становить щонайменше 60% зростання порівняно з $7,5 мільярда у 2025 році. Більшість замовлень цього року стосуються процесора Ascend 950PR, який вийшов на масове виробництво в березні. Компанія планує запустити

GateNews48хв. тому

Nvidia інвестує в шведську AI-юридичну tech-стартап-компанію Legora, а Джуд Лоу став глобальним амбасадором бренду

NVIDIA здійснила розширювальну інвестицію в рамках Series D у Legora на 50 млн доларів США, внаслідок чого загальне залучення коштів Legora досягло 600 млн доларів США, а оцінка — 5,6 млрд доларів США. Участь взяли Atlassian, Adams Street Partners та Insight Partners. Legora спеціалізується на AI-юридичних технологіях, надаючи інструменти для автоматизованої перевірки, аналізу контрактів і правових досліджень тощо; ARR перевищує 100 млн доларів США, а кількість співробітників зросла з 40 до 400. Jude Law став глобальним амбасадором бренду, а рекламний слоган звучить: Law just got more attractive.

ChainNewsAbmedia1год тому

Anthropic відкриває бета-версію безпеки для Claude для корпоративних користувачів 1 травня

За даними BlockBeats, 1 травня Anthropic оголосила, що Claude Security — інструмент для безпеки коду — відкрив публічне бета-тестування для користувачів Claude Enterprise. Інструмент сканує репозиторії коду на наявність вразливостей безпеки, виконує додаткову перевірку, щоб зменшити кількість хибних спрацювань, і автоматично g

GateNews1год тому
Прокоментувати
0/400
Немає коментарів