Tin Gate News, ngày 24 tháng 4 — DeepSeek V4-Pro và DeepSeek V4-Flash đã được phát hành chính thức và công bố mã nguồn mở vào ngày 24 tháng 4; độ dài xử lý theo ngữ cảnh được mở rộng đáng kể từ 128K lên 1M, tương đương mức tăng dung lượng gần gấp 10 lần. Huawei Computing cho biết các sản phẩm siêu điểm nút (supernode) Ascend của họ hỗ trợ đầy đủ các mô hình thuộc dòng DeepSeek V4 thông qua sự hợp tác chặt chẽ giữa công nghệ chip và công nghệ mô hình.
Huawei Ascend 950 đạt triển khai suy luận mô hình DeepSeek V4 với thông lượng cao và độ trễ thấp nhờ các kỹ thuật kernel hợp nhất (fused kernel) và song song đa luồng (multi-stream parallelism) nhằm giảm chi phí tính toán Attention và chi phí truy cập bộ nhớ. Đối với DeepSeek V4-Pro với đầu vào 8K, Ascend 950 đạt khoảng 20ms TPOT với thông lượng Decode 4,700 TPS trên một thẻ đơn; đối với DeepSeek V4-Flash với đầu vào dưới 8K, nó đạt khoảng 10ms TPOT với thông lượng 1,600 TPS. Dòng siêu điểm nút (supernode) Ascend A3 cũng đạt tương thích hoàn toàn, kèm theo các triển khai mã huấn luyện mẫu để tinh chỉnh nhanh. Dựa trên siêu điểm nút 64 thẻ Ascend A3 với chế độ EP lớn, DeepSeek V4-Flash đạt hơn 2,000 TPS thông lượng Decode trên một thẻ đơn trong các tình huống đầu vào/đầu ra 8K/1K bằng cách sử dụng công cụ suy luận vLLM. Toàn bộ các dòng sản phẩm Huawei Ascend A2, A3 và 950 đều hỗ trợ cả DeepSeek V4-Flash và V4-Pro.
Huawei Cloud công bố khả năng tương thích theo phương thức “đi trước” với DeepSeek V4, cung cấp cho nhà phát triển dịch vụ token API chỉ với một lần nhấp thông qua nền tảng MaaS của họ. Huawei Cloud đã tối ưu năng lực của lớp hệ thống (system layer), lớp toán tử (operator layer) và lớp cụm (cluster layer) để đảm bảo thích nghi nhanh mô hình và triển khai hiệu năng cao. Các doanh nghiệp bao gồm Kingsoft WPS và 360 đã tích hợp mô hình mới của DeepSeek thông qua Huawei Cloud.
Cambricon cũng công bố tương thích “Day 0” với DeepSeek V4-Flash và V4-Pro dựa trên khung suy luận vLLM, đồng thời mã thích nghi được công bố mã nguồn mở cho cộng đồng GitHub. Cambricon trước đó cũng đã đạt khả năng thích nghi theo phương thức “đi trước” khi DeepSeek V3.2 được phát hành vào năm ngoái, nhờ đã thực hiện tối ưu hóa hiệu năng sâu về phần mềm-hardware (phần mềm–phần cứng) đồng tác giữa các mô hình thuộc dòng DeepSeek.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Claw Intelligence hợp tác với Block Sec Arena để tăng cường bảo mật BNB Chain
Theo thông báo chính thức của Block Sec Arena vào ngày 30 tháng 4, Claw Intelligence, một nền tảng Web3 do AI dẫn dắt được xây dựng trên BNB Chain, đã công bố quan hệ đối tác chiến lược với Block Sec Arena nhằm tích hợp cơ sở hạ tầng an ninh mạng tiên tiến vào hệ sinh thái của mình. Sự hợp tác này hướng đến việc củng cố p
GateNews7giờ trước
NTT Công bố sáng kiến AI x OWN, lên kế hoạch tăng gấp ba công suất điện tại Nhật Bản lên 1 GW vào năm 2033
Vào ngày 27 tháng 4, Chủ tịch NTT Akira Shimada đã công bố sáng kiến AI x OWN, nỗ lực của công ty nhằm thiết kế lại hạ tầng internet để phục vụ AI theo thời gian thực. NTT dự kiến sẽ nâng gấp ba công suất điện trong nước từ khoảng 300 MW hiện nay lên khoảng 1 gigawatt vào năm tài chính 2033, khi tập đoàn viễn thông
GateNews9giờ trước
Nền tảng AI Certifyde hoàn tất vòng Seed 2 triệu USD vào ngày 1 tháng 5, được hậu thuẫn bởi CEO Ripple Brad Garlinghouse
Theo TechfundingNews, nền tảng ứng dụng AI Certifyde đã hoàn tất vòng gọi vốn seed trị giá 2 triệu USD vào ngày 1 tháng 5. Các nhà đầu tư bao gồm K5 Global, Flamingo Capital và các nhà đầu tư thiên thần, trong đó có đồng sáng lập Honey George Ruan, CEO Ripple Brad Garlinghouse và đồng sáng lập Nutra Roland
GateNews9giờ trước
Nhà Khoa học của Lầu Năm Góc: Anthropic vẫn bị đưa vào danh sách đen, xử lý ngoại lệ cho Mythos
Ngày 1 tháng 5, Chánh công nghệ Bộ Quốc phòng Mỹ (Pentagon technology chief) cho biết trước Quốc hội rằng, “Anthropic vẫn nằm trong danh sách đen, nhưng Mythos Preview là một câu chuyện khác”, qua đó chính thức thừa nhận Bộ Quốc phòng đối xử khác nhau với thương hiệu chủ lực của Anthropic và mô hình mới Mythos. Tuyên bố này trùng khớp với việc Axios công bố vào ngày 19 tháng 4 rằng NSA (Cơ quan An ninh Quốc gia) đã thực tế sử dụng Mythos để tạo sự tương hỗ, đồng thời chính thức xác lập định hướng chính sách “kênh ngoại lệ đối với Mythos” — đồng thời cũng đồng nghĩa rằng, về mặt lập luận pháp lý nội bộ, trước đây Bộ Quốc phòng đã từng cho rằng việc sử dụng công cụ của Anthropic sẽ đe dọa an ninh quốc gia, trong khi cách làm hiện tại lại tạo ra mâu thuẫn.
Anthropic vs Pentagon
ChainNewsAbmedia10giờ trước
137 Ventures đóng $700M trong quỹ mới, AUM đạt 15 tỷ USD
Theo ChainCatcher, 137 Ventures, nhà đầu tư sớm vào SpaceX, mới đây đã hoàn tất việc huy động vốn cho hai quỹ mới với tổng quy mô hơn 700 triệu USD, qua đó nâng tài sản được quản lý lên hơn 15 tỷ USD. Nguồn vốn mới sẽ hỗ trợ đầu tư vào các tác nhân AI, robot và hệ thống đẩy tên lửa không gian
GateNews10giờ trước
Reddit Tăng 16% nhờ Triển vọng Q2 Mạnh Mẽ; Apple Gặp Thiếu Hụt Mac khi Nhu cầu AI Vượt Quá Nguồn Cung
Cổ phiếu của Reddit đã tăng 16% trước giờ mở cửa thị trường vào thứ Sáu sau khi công ty đưa ra triển vọng doanh thu cho quý tới cao hơn dự kiến. Lượng khách truy cập hoạt động hằng ngày tăng 17% lên 126,8 triệu, trong khi doanh thu trung bình trên mỗi người dùng trên toàn cầu nhảy 44%, nhờ vào các tính năng được hỗ trợ bởi AI-powered
GateNews10giờ trước