Tin tức từ Gate, ngày 29 tháng 4 — Trọng số mô hình Ling-2.6-flash của Ant Group hiện đã được mở mã nguồn công khai, trước đây chỉ có sẵn thông qua API. Mô hình có tổng cộng 104 tỷ tham số với 7,4 tỷ tham số được kích hoạt cho mỗi lần suy luận, cửa sổ ngữ cảnh 256K và giấy phép MIT. Các phiên bản độ chính xác BF16, FP8 và INT4 có sẵn trên HuggingFace và ModelScope.
Ling-2.6-flash giới thiệu các cải tiến chú ý tuyến tính lai (hybrid linear attention) so với Ling 2.0, nâng cấp GQA gốc lên kiến trúc hybrid 1:7 MLA kết hợp Lightning Linear, cùng với MoE có độ thưa cực cao. Hiệu suất suy luận vượt đáng kể các mô hình tương đương: tốc độ tạo đỉnh đạt 340 token/giây trên 4 GPU H20, với thông lượng prefill và decode cao hơn khoảng 4 lần so với các mô hình mã nguồn mở tương đương. Các benchmark liên quan đến tác nhân cho thấy hiệu suất mạnh: BFCL-V4, TAU2-bench, SWE-bench Verified (61,2%), Claw-Eval và PinchBench đạt hoặc tiến gần mức SOTA. Trong toàn bộ bộ bài benchmark Artificial Analysis, tổng mức tiêu thụ token chỉ là 15 triệu. Trên AIME 2026, mô hình đạt 73,85%.
Trang web chính thức của Ant Group cũng liệt kê phiên bản flagship Ling-2.6-1T (phiên bản nghìn tỷ tham số) và phiên bản nhẹ (lightweight) Ling-2.6-mini (phiên bản nhẹ), tuy nhiên tính đến thời điểm xuất bản, trọng số của họ vẫn chưa được phát hành trên HuggingFace, chỉ có dòng flash hiện có thể tải xuống.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
X (Twitter) đón bản nâng cấp nền tảng quảng cáo lớn nhất trong 20 năm, xAI tham gia, phân bổ quảng cáo theo ý nghĩa ngôn ngữ bằng AI trở thành trọng tâm
X công bố từ tháng 4 năm 2026 sẽ triển khai đợt cải tổ nền tảng quảng cáo lớn nhất trong 20 năm, xây dựng lại công nghệ cốt lõi và kết hợp với xAI. Nền tảng mới lấy AI làm trung tâm để tối ưu hiệu quả, quảng cáo dựa trên ngữ nghĩa và ngữ cảnh, đồng thời nâng cao tính tiện lợi trong vận hành và khả năng kiểm soát/điều phối chiến dịch. Mục tiêu là biến quảng cáo thành các tín hiệu kinh doanh ngay trong ngữ cảnh tức thời, và kết hợp với chiến lược Everything App để trở thành động cơ thương mại của hệ sinh thái X.
ChainNewsAbmedia1giờ trước
Được hậu thuẫn bởi OpenAI, 1X khai trương nhà máy 58.000 ft² tại California, nhắm tới 10.000 robot trong năm đầu tiên
Theo Bloomberg, 1X Technologies, một startup robot được OpenAI hậu thuẫn và được thành lập tại Na Uy, đã mở một cơ sở sản xuất rộng 58.000 feet vuông tại Hayward, California, với tham vọng trở thành đơn vị dẫn đầu trong việc sản xuất hàng loạt robot hình người dành cho người tiêu dùng.
Cơ sở này dự kiến sẽ sản xuất 10.000 robot trong giai đoạn…
GateNews4giờ trước
Nhà Trắng Soạn Thảo Bản Ghi Nhớ Về Chính Sách AI, Chỉ Đạo Các Cơ Quan Mỹ Sử Dụng Nhiều Nhà Cung Cấp AI Khác Nhau Vào Ngày 30 Tháng 4
Theo các nguồn được PANews trích dẫn vào ngày 30 tháng 4, các quan chức Nhà Trắng đang soạn thảo một bản ghi nhớ chính sách trí tuệ nhân tạo (AI) toàn diện, trong đó chỉ đạo các cơ quan chính phủ Mỹ áp dụng nhiều nhà cung cấp dịch vụ AI khác nhau và tránh phụ thuộc vào một nhà cung cấp duy nhất. Bản ghi nhớ cũng yêu cầu tất cả các công ty AI được ký hợp đồng
GateNews4giờ trước
Cơ quan Quản lý Không gian mạng Trung Quốc khởi động chiến dịch kéo dài 4 tháng để kiềm chế tình trạng hỗn loạn trong ứng dụng AI vào ngày 30/4
Theo CCTV News, Cơ quan Quản lý Không gian mạng Trung Quốc đã khởi động một chiến dịch trên toàn quốc kéo dài bốn tháng vào ngày 30/4 nhằm giải quyết tình trạng hỗn loạn trong các ứng dụng AI. Sáng kiến này, được triển khai qua hai giai đoạn, nhắm tới các vấn đề bao gồm đăng ký mẫu hình bị thiếu, năng lực an toàn và rà soát nền tảng chưa đầy đủ,
GateNews5giờ trước
Forefront Tech hoàn tất định giá IPO $100M , niêm yết trên Nasdaq theo mã FTHAU
Theo ChainCatcher, công ty đầu tư mục đích đặc biệt Forefront Tech đã hoàn tất định giá IPO 100 triệu USD vào ngày 30 tháng 4 và sẽ niêm yết trên Nasdaq với mã FTHAU. Công ty dự kiến sử dụng số tiền thu được để theo đuổi các cơ hội sáp nhập và mua lại trong blockchain, fintech, trí tuệ nhân tạo trong
GateNews6giờ trước
Claude Code của Anthropic bị tính phí quá mức 200,98 USD do lỗi thanh toán, ban đầu bị từ chối hoàn tiền trước khi được bồi thường đầy đủ
Theo giám sát của Beating, một lỗi tính phí trong dịch vụ Claude Code của Anthropic đã khiến một thuê bao Max đạt mức bị tính phí quá 20 lần, tương đương 200,98 USD phí sử dụng phát sinh, trong khi chỉ dùng 13% hạn mức theo tháng của họ. Lỗi được kích hoạt khi lịch sử commit của kho git của người dùng chứa chữ in hoa
GateNews6giờ trước