DeepSeek выпускает модели V4-Pro и V4-Flash при стоимости на 98% ниже, чем у OpenAI GPT-5.5 Pro

Gate News сообщение, 25 апреля — DeepSeek выпустила предварительные версии V4-Pro и V4-Flash 24 апреля; обе — модели с открытыми весами и контекстным окном на один миллион токенов. V4-Pro включает 1,6 трлн общих параметров, но активирует только 49 млрд за один проход инференса, используя архитектуру Mixture-of-Experts. V4-Flash включает 284 млрд общих параметров с 13 млрд активными.

Цены заметно ниже, чем у конкурентов: V4-Pro стоит $1.74 за миллион токенов входных данных и $3.48 за миллион токенов выходных данных — примерно на 98% меньше, чем OpenAI GPT-5.5 Pro ($30 input, $180 output), и примерно в одну двадцатую раза дешевле, чем Claude Opus 4.7. V4-Flash стоит $0.14 на вход и $0.28 на выход за миллион токенов. Обе модели — с открытым исходным кодом по лицензии MIT, и их можно бесплатно запускать локально.

DeepSeek добилась прироста эффективности за счет двух новых механизмов внимания: Compressed Sparse Attention и Heavily Compressed Attention, которые снижают вычислительные затраты до 27% от предшественника V4-Pro (V3.2) и до 10% для V4-Flash. Компания частично обучала V4 на чипах Huawei Ascend, обходя ограничения США на экспорт продвинутых процессоров Nvidia. DeepSeek заявила, что после запуска 950 новых суперузлов в конце 2026 года цены снизятся еще сильнее.

По результатам тестов на производительность, V4-Pro-Max занимает первое место на Codeforces в конкурентном программировании (3,206 балла, располагаясь примерно на 23-м месте среди участников-людей) и набирая 90.2% на задачах математики Apex Shortlist против 85.9% у Claude Opus 4.6. Однако на тестах на многозадачность он уступает: MMLU-Pro (87.5% против 91.0% у Gemini-3.1-Pro) и Humanity’s Last Exam (37.7% против 44.4%). В задачах с длинным контекстом V4-Pro лидирует среди моделей с открытым исходным кодом, но уступает Claude Opus 4.6 в тестах извлечения MRCR.

V4-Pro вводит «interleaved thinking» («перемежающееся мышление»), позволяя агентским сценариям сохранять контекст рассуждений в процессе множества вызовов инструментов без «сброса» между шагами. Обе модели поддерживают интеграции для кодинга с Claude Code и OpenCode. Согласно опросу разработчиков DeepSeek среди 85 пользователей, 52% заявили, что V4-Pro готов быть их агентом по умолчанию для написания кода, а 39% склоняются к внедрению. Старые endpoints deepseek-chat и deepseek-reasoner будут сняты 24 июля 2026 года.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Оценка AISI: возможности GPT-5.5 в сетевых атаках и Anthropic Mythos на одном уровне

AISI в мае опубликовала оценку возможностей GPT-5.5 по сетевым атакам: сложность для эксперта 71,4%, Mythos Preview 68,6% — разница в пределах погрешности, без изменений. GPT-5.5 стала вторым после Mythos системой, которая может автоматически завершать «The Last Ones» — 32-шаговое корпоративное проникновение. Также обнаружен universal jailbreak: разработка занимает около 6 часов, он способен обходить фильтрацию вредоносных запросов. В дальнейшем будут наблюдать сроки следующей волны оценок и реакцию OpenAI на это обновление.

ChainNewsAbmedia27м назад

Пентагон заключил секретный контракт на развертывание военной сети с 7 компаниями-разработчиками ИИ: Anthropic по-прежнему исключена

В мае Министерство обороны США объявило о подписании секретных контрактов на военное развертывание сети с семью компаниями, включая SpaceX, OpenAI, Google, NVIDIA, Reflection, Microsoft и Amazon Web Services, а также добавило Oracle, став восьмой стороной. Контракт позволяет запускать модели на самом высоком уровне секретности Impact Level 6/7; ключевые три направления применения — интеграция данных, решения для боевого управления и осведомлённость о ситуации на поле боя, при этом подчёркиваются снижение рисков и недопущение привязки к поставщикам. Anthropic попала в чёрный список из-за отказа принять военные меры безопасности и не получила контракт. AMD напрямую не указана: графические процессоры поставляют NVIDIA и другие. В дальнейшем следует отслеживать, пойдёт ли Anthropic на уступки, а также роль новых участников вроде Reflection.

ChainNewsAbmedia29м назад

Cerebras нацелена на IPO $4B с оценкой около $40 млрд

Базирующаяся в Силликон-Вэлли (Калифорния) компания по производству ИИ-чипов Cerebras Systems ищет до 4 миллиардов долларов в рамках IPO, которое может оценить компанию примерно в 40 миллиардов долларов, сообщает Bloomberg. Формальный маркетинг может начаться уже 4 мая, при этом банкам поступили более 10 миллиардов долларов в виде заявок от институциональных инвесторов на...

CryptoFrontier32м назад

Китайские компании в сфере ИИ рассматривают демонтаж «красных фишек» после остановки приобретения Manus компанией Meta

По данным Beating, Национальная комиссия по развитию и реформам Китая остановила сделку по приобретению Meta за 2 миллиарда долларов компании Manus — разработчика AI-агентов, что побудило Комиссию по регулированию ценных бумаг Китая ужесточить требования к одобрению листинга в Гонконге для компаний с red-chip структурой (китайских компаний, владеющих внутренними активами th

GateNews2ч назад

Маск завершает трёхдневные показания в судебном иске против OpenAI, ссылаясь на требование о возмещении ущерба в размере 130—150 млрд долларов

По сообщениям нескольких СМИ, Илон Маск завершил три дня дачи показаний в своем иске против OpenAI 28–30 апреля, при этом суммарная длительность его показаний составила более 7 часов. Маск, который в 2015 году вместе с сооснователями основал OpenAI при первоначальных инвестициях в 38 миллионов долларов, заявил, что компания отказалась от своей некоммерческой m

GateNews2ч назад

Meta приобретает робототехнический стартап по ИИ Assured Robot Intelligence 1 мая

По данным Bloomberg, Meta приобрела Assured Robot Intelligence — стартап в сфере AI-робототехники с офисами в Сан-Диего и Нью-Йорке — 1 мая. Приобретённая команда, включая сооснователей Lerrel Pinto и Xiaolong Wang, присоединится к Meta Superintelligence Labs и будет работать с Meta Robotics Studio. Финансовые

GateNews2ч назад
комментарий
0/400
Нет комментариев