Повідомлення Gate News, 27 квітня — команда Xiaomi MiMo оприлюднила з відкритим кодом серію MiMo-V2.5 великих мовних моделей під ліцензією MIT, що підтримує комерційне розгортання, подальше навчання та доопрацювання. Обидві моделі мають контекстне вікно розміром 1 мільйон токенів. MiMo-V2.5-Pro — це модель суміші експертів із чистим текстом (MoE) з 1,02 трильйонами загальних параметрів і 42 мільярдами активних параметрів, тоді як MiMo-V2.5 — нативна мультимодальна модель із 310 мільярдами загальних параметрів і 15 мільярдами активних параметрів, що підтримує розуміння тексту, зображень, відео та аудіо.

MiMo-V2.5-Pro орієнтована на складні агентні та програмістські задачі. У бенчмарках ClawEval вона досягла 64% Pass@3, споживаючи приблизно 70 000 токенів на траєкторію задачі — на 40%–60% менше токенів, ніж Claude Opus, Gemini 3.1 Pro та GPT-5.4. Модель набрала 78,9 на SWE-bench Verified. У демонстрації V2.5-Pro самостійно реалізувала повний компілятор SysY-to-RISC-V для проєкту курсу компіляторів Пекінського університету за 4,3 години, використавши 672 виклики інструментів, і досягла ідеального результату 233/233 на прихованих тестових наборах.

MiMo-V2.5 призначена для сценаріїв мультимодальних агентів, оснащена виділеним візуальним енкодером (729 мільйонів параметрів) та аудіоенкодером (261 мільйон параметрів), набравши 62,3 на Claw-Eval загальному піднаборі. Обидві моделі використовують гібридну архітектуру, що поєднує sliding window attention (SWA) та глобальну увагу (GA), разом із модулем 3-шарової багатотокенної передбачуваності (MTP) для прискореного виведення. Ваги моделі доступні на Hugging Face.

Поряд із випуском із відкритим кодом команда MiMo запустила «Orbit Quadrillion Token Creator Incentive Program», пропонуючи 100 квадрильйонів токенів безкоштовно протягом 30 днів для користувачів у всьому світі. Окремі розробники, команди та підприємства можуть подати заявку через сторінку програми, з циклом оцінювання приблизно 3 робочих дні; схвалені переваги розподіляються як Token Plans або прямі кредити, сумісні з інструментами на кшталт Claude Code та Cursor.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

04-27 09:33

Kimi K3 від Moonshot AI готується до запуску в Q3 2026: понад 2,5 трлн параметрів і контекст на 1 млн токенів у тестуванні

04-27 06:31

DeepSeek знижує ціни на V4-Pro на 75% і скорочує витрати на кеш API до однієї десятої

04-27 05:17

GPT-5.5 повертається на передній край у кодуванні, але OpenAI змінює бенчмарки після поразки від Opus 4.7

04-27 03:21

OpenAI співпрацює з MediaTek і Qualcomm для розробки AI-процесора для смартфонів, Foxconn Connector розпочне виробництво у 2028 році

04-26 09:00

Baidu Qianfan запустила підтримку Day 0 для DeepSeek-V4 із API-сервісами

Поглиблений аналіз