18 апреля несколько источников из сферы венчурного капитала подтвердили, что DeepSeek начала свой первый раунд внешнего финансирования, сообщает (Pail News) со ссылкой на 澎湃新闻. Компания нацелена на оценку, превышающую $10 миллиардов, и планирует привлечь как минимум $300 миллионов для укрепления своих денежных резервов на фоне роста затрат в конкурентной борьбе в сфере ИИ — об этом говорится в сообщениях со ссылкой на осведомлённые источники.
Ранее DeepSeek получила признание в отрасли за отказ делать упор на коммерциализацию: компания опиралась на основателя Ляна Вэньфэна и поддержку со стороны Phantasm Capital. У компании имелись сильные технические возможности в сферах количественного трейдинга и интеллектуальных финансов, и она входила в число первых в Китае компаний, работающих с крупным модельным кластером из 10,000 карточных GPU.
Несмотря на то, что DeepSeek стала заметной после её вирусного успеха во время китайского Нового года в прошлом году, компания столкнулась с существенными потерями талантов. По данным репортажа 澎湃新闻, с прошлого года ушли несколько ключевых исследователей, преимущественно молодые учёные «поколения пост-95s»:
Исследователь мультимодальной модели: 12 апреля компания YuanRong Autonomous Driving, занимающаяся беспилотными автомобилями, публично подтвердила, что Жуань Цун, один из ключевых участников мультимодальной модели DeepSeek, присоединился в качестве Главного учёного (Chief Scientist) и впервые выйдет на публику на Пекинском автосалоне.
Автор LLM первого поколения: Ван Бинсюань, ключевой автор первой большой языковой модели DeepSeek, недавно объявил о присоединении к Tencent.
Автор серии OCR: Вэй Хаоран, ключевой автор серии DeepSeek-OCR, покинул компанию примерно в период китайского Нового года в этом году, но не раскрыл публично своего нового работодателя.
Исследователь алгоритма GRPO: 16 апреля бывшего ключевого исследователя DeepSeek Го Дая, как сообщается, приняли в ByteDance, при этом сообщаемая зарплата составляет сотни миллионов юаней. Согласно связанным раскрытиям, Го Дая присоединился к организации Seed в ByteDance, отвечающей за исследования и разработку больших моделей, в качестве одного из ведущих по направлению (intelligent agent) на уровне L8. Го Дая идентифицируют как крупного вкладчика в алгоритм GRPO, который лежит в основе методологии тренировки рассуждений DeepSeek-R1. В тот же день Вице-президент группы ByteDance Ли Лян ответил, что репортаж неточен, и что компания в последнее время не нанимала сотрудников на ежегодные оклады на уровне почти ста миллионов юаней. Однако, по данным нескольких источников, подтверждённых 澎湃新闻, Го Дая действительно присоединился к ByteDance.
Исследователь в области deep learning: 12 ноября бывший ключевой исследователь DeepSeek Ло Фули публично объявила о присоединении к Xiaomi MiMo, указав в посте в социальных сетях: «Интеллект в итоге перейдёт от языка к физическому миру. Я нахожусь в Xiaomi MiMo, работаю вместе с группой креативных, талантливых и по-настоящему увлечённых исследователей, чтобы построить это будущее и добиваться AGI, которого мы себе представляем». Согласно открытой информации, Ло Фули окончила программу «Компьютерные науки» Пекинского педагогического университета и получила степень магистра в области вычислительной лингвистики в Пекинском университете. После получения степени магистра она присоединилась к Академии DAMO компании Alibaba в качестве исследователя лаборатории машинного интеллекта, разрабатывавшей многоязычную модель предварительного обучения VECO и продвигавшей open-source работу AliceMind. В 2022 году Ло Фули присоединилась к Phantasm Quantitative (родительская компания DeepSeek) для работ по deep learning, позже работала в качестве исследователя deep learning в DeepSeek и принимала участие в разработке моделей, включая DeepSeek-V2.
На основе вышеуказанной информации DeepSeek столкнулась с потерями ключевых талантов в нескольких доменах, включая базовые большие языковые модели (LLM), интеллектуальных агентов (Agent), оптическое распознавание символов (OCR) и мультимодальные технологии.
По данным отраслевых источников, уровень зарплат и компенсаций DeepSeek находится в середине рынка, а не является самым высоким. Однако сейчас хэдхантеры ускоряют переманивание талантов из команды DeepSeek — предлагая зарплаты в 2–3 раза выше и опции по доле в компании, тем самым ускоряя потери персонала.
8 апреля на DeepSeek были замечены обновления интерфейса: поле ввода теперь отображает варианты «Quick Mode» и «Expert Mode». Согласно отображению на веб-странице, Quick Mode подходит для ежедневных разговоров с немедленными ответами и поддерживает распознавание текста с изображений и файлов, тогда как Expert Mode лучше справляется со сложными задачами. Это знаменует собой первое внедрение многоуровневых режимов на официальной веб-странице DeepSeek.
Эти обновления вновь вызвали предположения о релизе DeepSeek V4. На основе сообщений внешних медиа и информации из социальных сетей, а также данных из нескольких источников, ожидается, что DeepSeek официально запустит V4 в апреле. Согласно внешним ожиданиям, если этот релиз V4 должен повторить феномен китайского Нового года прошлого года, то ему, несомненно, придётся столкнуться с более серьёзными вызовами, а потери персонала неизбежно повлияют на релиз V4.