DeepSeek开源TileKernels:面向大模型训练与推理的GPU内核库

Gate 新闻消息,4月23日——DeepSeek已在MIT许可证下开源TileKernels,这是一套用TileLang编写的GPU内核库,面向大语言模型的训练与推理。TileLang是tile-ai团队开发的一种领域专用语言,用于在Python中表达高性能GPU内核。DeepSeek表示,该库中的大多数内核在计算密度和内存带宽方面已接近硬件性能上限,其中部分内核已部署在内部的训练与推理操作中。

该库包含六类内核:MoE (专家混合) 的门控与路由,包括Top-k专家选择、从token到专家的映射,以及融合的expand/shrink并配合权重归一化;支持FP8、FP4和E5M6格式的量化,提供逐token、逐块与逐通道量化,并包含融合的SwiGLU+量化操作;批量转置;Engram门控,融合RMSNorm的前向/反向传播与权重梯度归约;Manifold HyperConnection,采用Sinkhorn归一化并进行混合的split/apply;以及高层autograd接口,将底层内核封装为可训练的层。

Engram和Manifold HyperConnection是DeepSeek模型架构中的专有组件,首次公开披露了实现细节。该库需要NVIDIA SM90或SM100架构的GPU (H100/H200或Blackwell系列)、CUDA Toolkit 13.1或更高,以及PyTorch 2.10或更高。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

Lido Proposes Allocating 2,500 stETH to Address Kelp Exploit Shortfall

Gate News message, April 24 — Lido Labs is seeking DAO approval to allocate up to 2,500 staked Ethereum (stETH), worth approximately $5.8 million, to help reduce the rsETH deficit caused by the recent Kelp exploit, according to a proposal posted Thursday. The Kelp DAO rsETH bridge exploit last

GateNewsمنذ 12 د

OristaPay 在 Telegram 上推出 AI 驱动的支付系统,可实现 TON 上的即时 USDT 结算

Gate News 信息,4 月 24 日 — OristaPay,一家在 RD Technologies 旗下运营的品牌,宣布了一条完整的支付路径,使 AI 代理能够在香港 Web3 文化节期间于 Telegram 生态中执行交易。该系统允许用户通过自然语言交互发起数字资产交易,而无需离开聊天界面。通过

GateNewsمنذ 25 د

سونك تبني بلوكتشين جاهزة للكمّ بممرّ أبسط في البنية

تقوم Sonic بإعادة تصميم بنية بلوكشين الخاصة بها لتسهيل عملية الانتقال إلى التشفير المقاوم للتهديدات الكمية. وتتجنب هذه المقاربة تجميع التواقيع المعقد الذي تستخدمه معظم شبكات إثبات الحصة (proof-of- stake). النتائج الرئيسية Sonic يعيد تصميم إثبات الحصة لتجنب تجميع Boneh–Lynn–Shacham، مما يسهّل الانتقال الكمومي

Coinpediaمنذ 1 س

DeBox 宣布其 vBOX 服务将于 4 月 30 日停止

Gate News 消息,4 月 24 日——Web3 社交平台 DeBox 宣布,由于平台业务调整,其 vBOX 服务将于 2026 年 4 月 30 日 23:59 关闭。用户必须在截止日期之前通过原系统渠道免费领取其积分。从 5 月 1 日起,自动提币渠道将永久关闭,未领取的积分将被冻结。 从 5 月 1 日起,用户只能申请手动提币,这将产生额外费用,并且处理时间更长。

GateNewsمنذ 1 س

摩根士丹利为发行方和投资者推出稳定币储备组合基金

Gate News 消息,4 月 24 日——摩根士丹利的投资管理部门已推出 Stablecoin Reserves Portfolio(稳定币储备组合),这是一项专为稳定币发行方设计的全新产品,旨在让发行方将储备资产存入该公司的货币市场基金,同时赚取利息。该基金作为摩根“

GateNewsمنذ 2 س

Succinct Labs تطلق تطبيق iPhone ZCAM باستخدام التشفير لمكافحة الوسائط المُولَّدة بالذكاء الاصطناعي

رسالة أخبار البوابة، 24 أبريل — كشفت Succinct Labs، المدعومة من Paradigm، النقاب عن ZCAM يوم الخميس، وهي تطبيق آيفون يستخدم التشفير لبصمة الصور والفيديوهات بهدف مكافحة الوسائط المُولَّدة بالذكاء الاصطناعي والملفّقة. يوقّع التطبيق الصور والفيديوهات في لحظة الالتقاط، منتجًا سجلًا لا يمكن العبث به

GateNewsمنذ 3 س
تعليق
0/400
لا توجد تعليقات