DeepSeek публикует TileKernels с открытым исходным кодом — библиотеку GPU-ядeр для обучения и вывода больших моделей

Сообщение Gate News, 23 апреля — DeepSeek опубликовал TileKernels с открытым исходным кодом под лицензией MIT. Это библиотека GPU-ядeр, написанная на TileLang для обучения и вывода больших языковых моделей. TileLang — предметно-ориентированный язык, разработанный командой tile-ai для выражения высокопроизводительных GPU-ядeр на Python. DeepSeek заявил, что большинство ядер в библиотеке уже приблизились к предельным значениям производительности по плотности вычислений и пропускной способности памяти; при этом отдельные части уже развернуты во внутренних операциях обучения и вывода.

Библиотека включает шесть категорий ядер: MoE (mixture of experts) — механизмы gating и маршрутизации, включая выбор экспертов Top-k, сопоставление токенов с экспертами, а также объединенные expand/shrink с нормализацией весов; квантование, поддерживающее форматы FP8, FP4 и E5M6, с квантованием по токену, по блокy и по каналу, включая объединенные операции SwiGLU+квантование; пакетную транспозицию; Engram gating с объединенным прямым/обратным распространением RMSNorm и редукцией градиента весов; Manifold HyperConnection с нормализацией Sinkhorn и смешанным split/apply; а также высокоуровневые интерфейсы autograd, которые оборачивают низкоуровневые ядра в обучаемые слои.

Engram и Manifold HyperConnection являются проприетарными компонентами архитектуры модели DeepSeek; детали реализации впервые раскрыты публично. Библиотека требует графические процессоры архитектуры NVIDIA SM90 или SM100 (H100/H200 или серии Blackwell), CUDA Toolkit 13.1 или выше, а также PyTorch 2.10 или выше.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Fluent запускает мейннет Ethereum уровня 2 и токен BLEND с $50M ликвидностью на первый день

Сообщение Gate News, 24 апреля — Fluent, сеть уровня 2 на базе Ethereum, в пятницу активировала свой мейннет и нативный токен BLEND, запустившись с $50 миллиона в привлечённой ликвидности на первый день. Сеть использует среду «смешанного выполнения», которая позволяет приложениям, написанным для разных виртуальных м

GateNews56м назад

COTI сотрудничает с Sayfer, чтобы усилить безопасность протокола приватности

Новостное сообщение Gate, 24 апреля — COTI объявила о партнерстве с Sayfer, компанией по блокчейн-безопасности, основанной в 2019 году, чтобы усилить систему безопасности, поддерживающую ее ориентированную на приватность экосистему. Sayfer будет выступать в качестве долгосрочного консультанта по безопасности для COTI, поддерживая проект по мере того, как он готовится к

GateNews3ч назад

CoW Swap запускает обновления инфраструктуры солверов, чтобы усилить механизм торгов

Сообщение Gate News, 24 апреля — CoW Swap развернула два обновления инфраструктуры солверов, чтобы усилить механизмы торгов и оптимизировать процессы исполнения, согласно CoW DAO. Первое обновление — «скрытые заявки до дедлайна» — не позволяет солверам видеть котировки друг друга во время аукционов, требуя слепого участия в торгах до дедлайна. Это сохраняет независимость торговой стратегии и улучшает результаты расчетов для пользователей. Второе обновление убирает ограничение UCP Uniform Clearing Price, которое команда сочла добавляющим системные ограничения без предоставления дополнительных выгод пользователям. Удаление этого ограничения упрощает логику солверов и позволяет оптимальным решениям конкурировать более эффективно, сохраняя согласованность цен для пользователей, торгующих одной и той же парой.

GateNews3ч назад

SHIB 持币者基础增至 157.3 万:新增 10,000 个钱包,Shibarium 突破 10 亿笔交易

Gate News 消息,4 月 24 日——在 2026 年 4 月 19 日至 4 月 22 日期间,柴犬(Shiba Inu)的持币者基础大幅扩张:新增超过 10,000 个以太坊(Ethereum)钱包加入网络,使总数突破 157.3 万。Etherscan 数据将这次增长记录为今年最快的短期扩张之一

GateNews5ч назад

Smart Allocator USDD превзошёл $16M по совокупным инвестиционным доходам

Сообщение Gate News от 24 апреля — Smart Allocator USDD накопил более $16 миллионов долларов США инвестиционных доходов, демонстрируя сильную способность к самообразованию и укрепляя свою долгосрочную конкурентоспособность в секторе стейблкоинов. Smart Allocator — это механизм распределения дохода USDD, который генерирует возвраты

GateNews5ч назад
комментарий
0/400
Нет комментариев