DeepSeek phát hành mã nguồn mở TileKernels, thư viện kernel GPU cho đào tạo và suy luận mô hình lớn

Tin tức cổng, ngày 23 tháng 4 — DeepSeek đã phát hành mã nguồn mở TileKernels theo giấy phép MIT, một thư viện kernel GPU được viết bằng TileLang cho đào tạo và suy luận mô hình ngôn ngữ lớn. TileLang là ngôn ngữ chuyên biệt do nhóm tile-ai phát triển để diễn đạt các kernel GPU hiệu năng cao trong Python. DeepSeek cho biết hầu hết các kernel trong thư viện đã tiến gần đến giới hạn hiệu năng phần cứng về mật độ tính toán và băng thông bộ nhớ, với một phần đã được triển khai trong các tác vụ đào tạo và suy luận nội bộ.

Thư viện gồm sáu nhóm kernel: MoE (hỗn hợp các chuyên gia) phân luồng và định tuyến, bao gồm chọn chuyên gia Top-k, ánh xạ token sang chuyên gia, và mở rộng/thu gộp kèm chuẩn hoá trọng số; lượng tử hoá hỗ trợ các định dạng FP8, FP4 và E5M6 với lượng tử hoá theo từng token, theo từng block và theo từng kênh, bao gồm các tác vụ lượng tử hoá gộp SwiGLU+; chuyển vị theo lô (batch transpose); Engram gating với lan truyền xuôi/ngược RMSNorm gộp và giảm gradient trọng số; Manifold HyperConnection với chuẩn hoá Sinkhorn và tách/áp dụng trộn; và các giao diện autograd cấp cao bọc các kernel mức thấp thành các lớp có thể huấn luyện.

Engram và Manifold HyperConnection là các thành phần độc quyền trong kiến trúc mô hình của DeepSeek, với chi tiết triển khai lần đầu tiên được công bố công khai. Thư viện yêu cầu GPU thuộc kiến trúc NVIDIA SM90 hoặc SM100 (H100/H200 hoặc dòng Blackwell), CUDA Toolkit 13.1 trở lên và PyTorch 2.10 trở lên.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

Fluent ra mắt mainnet Ethereum Layer 2 và token BLEND với $50M thanh khoản ngày đầu tiên

Tin từ Gate, ngày 24 tháng 4 — Fluent, một mạng L2 dựa trên Ethereum, đã kích hoạt mainnet và token BLEND gốc của mình vào thứ Sáu, ra mắt với $50 triệu thanh khoản cam kết trong ngày đầu tiên. Mạng lưới có môi trường “thực thi gộp” cho phép các ứng dụng được viết cho các máy ảo khác nhau vận hành trong cùng trạng thái chuỗi. Fluent sử dụng rWasm, một biểu diễn trung gian mức thấp, để mô phỏng hành vi của EVM, SVM và Wasm cho việc thực thi. Không giống các cách tiếp cận đaVM truyền thống giữ môi trường tách biệt, thực thi gộp hợp nhất các máy ảo rời rạc thành một hệ thống gắn kết với quản lý trạng thái dùng chung. Bảy ứng dụng đã ra mắt trực tuyến ngay tại thời điểm khởi chạy, bao gồm Vena một giao thức cho vay dựa trên uy tín, Yumi một dịch vụ mua trước trả sau, Pulse Predictor một giao thức polling onchain, Pump Pals một trò chơi thể thao giả tưởng, Blend một công cụ tích hợp yield và Sprout một bộ quản lý chiến lược DeFi. Token BLEND đóng vai trò là token tiện ích cho các hoạt động của mạng, bao gồm phí giao dịch, staking và tín hiệu từ cộng đồng. Người dùng có thể stake BLEND để nhận lợi ích hệ sinh thái và cải thiện các hạng uy tín trên Prints, lớp uy tín của Fluent đã được ra mắt vào tháng 1. Sau giai đoạn mainnet, staking theo giao thức sẽ cho phép người nắm giữ ủy quyền token cho các node validator thông qua FluentBFT, cơ chế đồng thuận phi tập trung của giao thức. Đợt chào bán token công khai trên nền tảng của một CEX lớn diễn ra từ ngày 7 tháng 4 đến ngày 13 tháng 4, cung cấp 10 triệu token 1% tổng cung ban đầu với giá $0.10 mỗi token, tương ứng với triệu định giá fully diluted. Nguồn cung BLEND ban đầu được đặt ở mức 1 tỷ token, với chương trình airdrop dành cho cộng đồng chiếm 0.71% được lên lịch phân phối tại sự kiện tạo token. Fluent Labs đã huy động được 11.2 triệu USD tính đến nay. triệu USD vòng seed do Polychain Capital dẫn dắt đã hoàn tất vào tháng 2 năm 2025 với sự tham gia của Primitive, dao5, Symbolic Capital, Builder Capital, Nomad Capital và Public Works. Tiếp theo là vòng testnet trị giá 2.2 triệu USD vào tháng 7 năm 2025 thông qua Echo, Native Crypto, Q42, Wagmi VC và TPC Ventures, được bổ sung bởi triệu USD đợt chào bán token công khai hoàn tất vào tháng 4 năm 2026. Một CEX lớn gần đây đã công bố ý định niêm yết BLEND, cho phép người dùng tạo địa chỉ nạp tiền tại các khu vực được hỗ trợ.

GateNews58phút trước

COTI hợp tác với Sayfer để tăng cường bảo mật giao thức quyền riêng tư

Tin tức từ Gate, 24 tháng 4 — COTI đã công bố hợp tác với Sayfer, một công ty bảo mật blockchain được thành lập vào năm 2019, nhằm củng cố khung bảo mật hỗ trợ hệ sinh thái tập trung vào quyền riêng tư của mình. Sayfer sẽ đóng vai trò là cố vấn bảo mật dài hạn cho COTI, hỗ trợ dự án khi nó chuẩn bị để

GateNews3giờ trước

CoW Swap Ra Mắt Nâng Cấp Hạ Tầng Cho Solver Nhằm Củng Cố Cơ Chế Đấu Giá

Tin tức Gate, ngày 24 tháng 4 — Theo CoW DAO, CoW Swap đã triển khai hai nâng cấp hạ tầng cho solver để tăng cường cơ chế đấu giá và tối ưu hóa quy trình thực thi. Nâng cấp đầu tiên, "bids ẩn cho đến hạn chót," ngăn các solver xem báo giá của nhau trong các phiên đấu giá, yêu cầu đấu giá theo kiểu mù cho đến hạn chót, cần b

GateNews3giờ trước

Cơ sở người nắm giữ SHIB bùng nổ thêm 10.000 ví lên 1,573M khi Shibarium chạm 1 tỷ giao dịch

Tin từ Gate, ngày 24 tháng 4 — Cơ sở người nắm giữ của Shiba Inu đã tăng mạnh trong giai đoạn từ ngày 19 đến ngày 22 tháng 4 năm 2026, với hơn 10.000 ví Ethereum mới tham gia mạng và đẩy tổng số lên trên 1,573 triệu. Dữ liệu từ Etherscan ghi nhận động thái này là một trong những đợt mở rộng ngắn hạn nhanh nhất trong

GateNews5giờ trước

USDD Smart Allocator Vượt $16M về Tổng Lợi nhuận Đầu tư

Tin tức từ Gate, ngày 24 tháng 4 — USDD's Smart Allocator đã tích lũy hơn $16 triệu USD tiền lãi đầu tư, thể hiện khả năng tự tạo mạnh mẽ và củng cố tính cạnh tranh dài hạn của nó trong lĩnh vực stablecoin. Smart Allocator là cơ chế chia sẻ lợi suất của USDD, tạo ra lợi nhuận bằng cách tham gia vào các dự án chất lượng để kiếm lãi và phần thưởng nền tảng, sau đó phân phối các khoản thu nhập này trở lại cho người dùng. Cơ chế này nhấn mạnh các nguồn lợi suất ổn định và bền vững thay vì dựa vào các chiến lược lợi suất cao ngắn hạn. Tất cả chi tiết phân bổ quỹ và lợi suất đều được duy trì trên chuỗi và có sẵn để xác minh công khai.

GateNews5giờ trước
Bình luận
0/400
Không có bình luận