Gate News повідомляє, 17 березня компанія Rakuten Group оголосила про випуск Rakuten AI 3.0 під назвою «Найпотужніша високопродуктивна модель штучного інтелекту в Японії», яка є відкритим програмним забезпеченням за ліцензією Apache 2.0. Ця модель побудована на архітектурі MoE (змішаний експерт), має 671 мільярд параметрів, активується 37 мільярдами під час кожного висновку, з контекстним вікном 128K, оптимізована для японської мови і перевершує GPT-4o у кількох японських бенчмарках. Модель є результатом спільного проекту GENIAC, ініційованого Міністерством економіки, торгівлі та промисловості Японії та Агентством розвитку нових енергетичних технологій (NEDO), з частковим фінансуванням обчислювальних ресурсів уряду Японії. У своєму оголошенні Rakuten описала базову модель як «максимально використовуючи досягнення відкритої спільноти», не назвавши конкретну модель. Спільнота швидко перевірила файли моделі на HuggingFace і виявила, що у файлі config.json чітко вказано model_type: deepseek_v3 та architectures: DeepseekV3ForCausalLM, що знову підтверджує, що ця модель є модифікацією DeepSeek V3, доопрацьованою на основі японських даних.