DeepSeek випускає моделі V4-Pro і V4-Flash із 98% нижчою вартістю, ніж у GPT-5.5 Pro від OpenAI

Повідомлення Gate News, 25 квітня — DeepSeek випустила прев’ю-версії V4-Pro та V4-Flash 24 квітня; обидві — моделі з відкритими вагами з контекстними вікнами на один мільйон токенів. V4-Pro має 1,6 трильйона загальних параметрів, але активує лише 49 мільярдів за один прохід виведення, використовуючи архітектуру Mixture-of-Experts. V4-Flash має 284 мільярди загальних параметрів із 13 мільярдами активними.

Ціни суттєво нижчі, ніж у конкурентів: V4-Pro коштує $1,74 за мільйон вхідних токенів і $3,48 за мільйон вихідних токенів — приблизно на 98% менше, ніж GPT-5.5 Pro від OpenAI ($30 input, $180 output), і приблизно у двадцяту частину вартості Claude Opus 4.7. V4-Flash коштує $0,14 за вхід і $0,28 за вихід на мільйон токенів. Обидві моделі є відкритим кодом під ліцензією MIT і можуть працювати локально безкоштовно.

DeepSeek досягла приросту ефективності завдяки двом новим механізмам уваги: Compressed Sparse Attention і Heavily Compressed Attention, які знижують обчислювальні витрати до 27% від попередника V4-Pro (V3.2) та до 10% для V4-Flash. Компанія частково навчала V4 на чипах Huawei Ascend, обходячи обмеження на експорт передових процесорів Nvidia зі США. DeepSeek заявила, що після виходу на роботу 950 нових супервузлів у другій половині 2026 року ціни знижуватимуться ще далі.

На бенчмарках продуктивності V4-Pro-Max посідає перше місце в Codeforces competitive programming (3,206 score, що ставить його приблизно на 23-тє місце серед людських учасників) і дає 90,2% за задачами з математики Apex Shortlist проти 85,9% у Claude Opus 4.6. Однак він відстає на бенчмарках багатозадачності: MMLU-Pro (87,5% проти 91,0% у Gemini-3.1-Pro) та 37,7% у Humanity’s Last Exam ( проти 44,4%). У задачах із довгим контекстом V4-Pro лідирує серед моделей з відкритим кодом, але програє Claude Opus 4.6 у тестах MRCR з пошуку.

V4-Pro додає «interleaved thinking», що дозволяє агентним робочим процесам зберігати контекст міркувань упродовж кількох викликів інструментів без очищення між кроками. Обидві моделі підтримують інтеграції для програмування з Claude Code та OpenCode. Згідно з опитуванням розробників DeepSeek серед 85 користувачів, 52% заявили, що V4-Pro готовий бути їхнім агентом для програмування за замовчуванням, а 39% схилялися до впровадження. Старі кінцеві точки deepseek-chat і deepseek-reasoner буде припинено 24 липня 2026 року.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Оцінка AISI: можливості GPT-5.5 щодо мережевих атак на рівні з Anthropic Mythos

AISI у травні оприлюднила оцінку мережевих атак, які може виконувати GPT-5.5: рівень складності для Expert — 71,4%, Mythos Preview — 68,6%. Різниця перебуває в межах похибки, показники рівні. GPT-5.5 стала другим після Mythos автоматично здатним завершувати «The Last Ones» — систему з 32 кроків для атак на підприємства. Також виявили universal jailbreak: його можна розробити приблизно за 6 годин і він здатний обходити фільтри для шкідливих запитів. У майбутньому стежитимуть за наступним раундом оцінювання та оновленнями OpenAI щодо цього.

ChainNewsAbmedia31хв. тому

Пентагон підписав конфіденційний контракт із 7 компаніями AI на розгортання військової мережі: Anthropic знову виключили

Міністерство оборони США у травні оголосило про підписання секретних контрактів на розгортання військових мереж із SpaceX, OpenAI, Google, NVIDIA, Reflection, Microsoft, Amazon Web Services — загалом із 7 компаніями, а також додало Oracle як 8-му. Контракт дозволяє запускати моделі на найвищих рівнях конфіденційності Impact Level 6/7; ключові три застосунки — інтеграція даних, бойові рішення та розпізнавання обстановки на полі бою. Підкреслюється зниження ризиків і уникнення прив’язки до конкретного постачальника. Anthropic потрапила до чорного списку через відмову від запровадження вимог безпеки для військових, контракт не отримала. AMD напряму не включили, а GPU постачають, зокрема, NVIDIA. Далі стежитимуть, чи Anthropic піде на поступки, а також яку роль відіграватимуть нові обрані, зокрема Reflection.

ChainNewsAbmedia33хв. тому

Cerebras націлюється на $4B IPO, оцінена в ~$40B

Компанія Cerebras Systems, виробник AI-чипів із Саннівейла (штат Каліфорнія), намагається залучити до 4 млрд доларів США через IPO, яке може оцінити компанію приблизно в 40 млрд доларів США, повідомляє Bloomberg. Формальний маркетинг може розпочатися вже 4 травня, а банки отримають понад 10 млрд доларів США в індикативних заявках на

CryptoFrontier36хв. тому

Китайські компанії в сфері ШІ розглядають демонтаж «червоно-чипових» структур після зупинки зупинки придбання рукопису Meta

За даними Beating, Національна комісія з розвитку та реформи Китаю зупинила угоду Meta з придбання компанії Manus, яка розробляє AI-агентів, на $2 мільярда, через що Комісія з цінних паперів Китаю посилила вимоги до схвалення IPO у Гонконзі для компаній з «червоними фішками» (китайських компаній, що утримують вітчизняні активи th

GateNews2год тому

Маск завершує триденні свідчення у судовому процесі проти OpenAI, посилається на заяву про збитки на суму $130-150B

За повідомленнями кількох медіа, Ілон Маск завершив три дні допитів у своєму позові проти OpenAI 28–30 квітня, а сукупна тривалість допитів перевищила 7 годин. Маск, який у 2015 році разом із колегами заснував OpenAI, вклавши початково $38 мільйонів, стверджував, що компанія відмовилася від своєї неприбуткової місі

GateNews2год тому

Meta придбала робототехнічний AI-стартап Assured Robot Intelligence 1 травня

За даними Bloomberg, Meta придбала Assured Robot Intelligence — стартап у сфері AI-робототехніки з офісами в Сан-Дієго та Нью-Йорку — 1 травня. Придбана команда, зокрема співзасновники Lerrel Pinto та Xiaolong Wang, приєднається до Meta Superintelligence Labs і працюватиме з Meta Robotics Studio. Фінансові

GateNews2год тому
Прокоментувати
0/400
Немає коментарів