Tin cổng Gate News, ngày 25 tháng 4 — DeepSeek đã phát hành các phiên bản xem trước của V4-Pro và V4-Flash vào ngày 24 tháng 4, cả hai đều là các mô hình open-weight với cửa sổ ngữ cảnh một triệu token. V4-Pro có 1,6 nghìn tỷ tổng tham số nhưng chỉ kích hoạt 49 tỷ trên mỗi lượt suy luận, sử dụng kiến trúc Mixture-of-Experts. V4-Flash có 284 tỷ tổng tham số với 13 tỷ tham số hoạt động.
Giá thấp hơn đáng kể so với các đối thủ: V4-Pro có giá $1,74 cho mỗi một triệu token đầu vào và $3,48 cho mỗi một triệu token đầu ra—khoảng thấp hơn 98% so với GPT-5.5 Pro của OpenAI ($30 input, $180 output) và chỉ bằng khoảng một phần hai mươi chi phí của Claude Opus 4.7. V4-Flash được định giá $0,14 cho đầu vào và $0,28 cho đầu ra trên mỗi một triệu token. Cả hai mô hình đều là mã nguồn mở theo giấy phép MIT và có thể chạy cục bộ miễn phí.
DeepSeek đạt được lợi thế về hiệu suất thông qua hai cơ chế chú ý mới: Compressed Sparse Attention và Heavily Compressed Attention, giúp giảm chi phí tính toán xuống còn 27% so với mô hình tiền nhiệm V4-Pro (V3.2) và 10% cho V4-Flash. Công ty huấn luyện V4 một phần trên các chip Huawei Ascend, tránh các hạn chế xuất khẩu của Mỹ đối với các bộ xử lý Nvidia tiên tiến. DeepSeek cho biết rằng khi 950 supernode mới được đưa vào hoạt động vào cuối năm 2026, giá sẽ còn giảm thêm.
Trên các benchmark hiệu năng, V4-Pro-Max xếp thứ nhất về lập trình cạnh tranh Codeforces (3,206 điểm, đứng khoảng vị trí thứ 23 trong số các thí sinh là con người) và đạt 90,2% ở các bài toán Apex Shortlist so với 85,9% của Claude Opus 4.6. Tuy nhiên, nó thua trong các bài benchmark đa nhiệm: MMLU-Pro (87,5% so với 91,0% của Gemini-3.1-Pro) và Humanity’s Last Exam (37,7% so với 44,4%). Với các tác vụ ngữ cảnh dài, V4-Pro dẫn đầu các mô hình mã nguồn mở nhưng thua Claude Opus 4.6 trong các bài kiểm tra truy xuất MRCR.
V4-Pro giới thiệu “interleaved thinking” (tư duy xen kẽ), cho phép quy trình làm việc của agent giữ lại ngữ cảnh suy luận qua nhiều lệnh gọi công cụ mà không xả bộ nhớ giữa các bước. Cả hai mô hình đều hỗ trợ tích hợp lập trình với Claude Code và OpenCode. Theo khảo sát nhà phát triển của DeepSeek trên 85 người dùng, 52% cho biết V4-Pro đã sẵn sàng để trở thành agent lập trình mặc định của họ, với 39% nghiêng về việc áp dụng. Các endpoint deepseek-chat và deepseek-reasoner cũ sẽ ngừng hoạt động vào ngày 24 tháng 7 năm 2026.
Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo
Tuyên bố miễn trừ trách nhiệm.
Bài viết liên quan
Claw Intelligence hợp tác với Block Sec Arena để tăng cường bảo mật BNB Chain
Theo thông báo chính thức của Block Sec Arena vào ngày 30 tháng 4, Claw Intelligence, một nền tảng Web3 do AI dẫn dắt được xây dựng trên BNB Chain, đã công bố quan hệ đối tác chiến lược với Block Sec Arena nhằm tích hợp cơ sở hạ tầng an ninh mạng tiên tiến vào hệ sinh thái của mình. Sự hợp tác này hướng đến việc củng cố p
GateNews7giờ trước
NTT Công bố sáng kiến AI x OWN, lên kế hoạch tăng gấp ba công suất điện tại Nhật Bản lên 1 GW vào năm 2033
Vào ngày 27 tháng 4, Chủ tịch NTT Akira Shimada đã công bố sáng kiến AI x OWN, nỗ lực của công ty nhằm thiết kế lại hạ tầng internet để phục vụ AI theo thời gian thực. NTT dự kiến sẽ nâng gấp ba công suất điện trong nước từ khoảng 300 MW hiện nay lên khoảng 1 gigawatt vào năm tài chính 2033, khi tập đoàn viễn thông
GateNews9giờ trước
Nền tảng AI Certifyde hoàn tất vòng Seed 2 triệu USD vào ngày 1 tháng 5, được hậu thuẫn bởi CEO Ripple Brad Garlinghouse
Theo TechfundingNews, nền tảng ứng dụng AI Certifyde đã hoàn tất vòng gọi vốn seed trị giá 2 triệu USD vào ngày 1 tháng 5. Các nhà đầu tư bao gồm K5 Global, Flamingo Capital và các nhà đầu tư thiên thần, trong đó có đồng sáng lập Honey George Ruan, CEO Ripple Brad Garlinghouse và đồng sáng lập Nutra Roland
GateNews9giờ trước
Nhà Khoa học của Lầu Năm Góc: Anthropic vẫn bị đưa vào danh sách đen, xử lý ngoại lệ cho Mythos
Ngày 1 tháng 5, Chánh công nghệ Bộ Quốc phòng Mỹ (Pentagon technology chief) cho biết trước Quốc hội rằng, “Anthropic vẫn nằm trong danh sách đen, nhưng Mythos Preview là một câu chuyện khác”, qua đó chính thức thừa nhận Bộ Quốc phòng đối xử khác nhau với thương hiệu chủ lực của Anthropic và mô hình mới Mythos. Tuyên bố này trùng khớp với việc Axios công bố vào ngày 19 tháng 4 rằng NSA (Cơ quan An ninh Quốc gia) đã thực tế sử dụng Mythos để tạo sự tương hỗ, đồng thời chính thức xác lập định hướng chính sách “kênh ngoại lệ đối với Mythos” — đồng thời cũng đồng nghĩa rằng, về mặt lập luận pháp lý nội bộ, trước đây Bộ Quốc phòng đã từng cho rằng việc sử dụng công cụ của Anthropic sẽ đe dọa an ninh quốc gia, trong khi cách làm hiện tại lại tạo ra mâu thuẫn.
Anthropic vs Pentagon
ChainNewsAbmedia10giờ trước
137 Ventures đóng $700M trong quỹ mới, AUM đạt 15 tỷ USD
Theo ChainCatcher, 137 Ventures, nhà đầu tư sớm vào SpaceX, mới đây đã hoàn tất việc huy động vốn cho hai quỹ mới với tổng quy mô hơn 700 triệu USD, qua đó nâng tài sản được quản lý lên hơn 15 tỷ USD. Nguồn vốn mới sẽ hỗ trợ đầu tư vào các tác nhân AI, robot và hệ thống đẩy tên lửa không gian
GateNews10giờ trước
Reddit Tăng 16% nhờ Triển vọng Q2 Mạnh Mẽ; Apple Gặp Thiếu Hụt Mac khi Nhu cầu AI Vượt Quá Nguồn Cung
Cổ phiếu của Reddit đã tăng 16% trước giờ mở cửa thị trường vào thứ Sáu sau khi công ty đưa ra triển vọng doanh thu cho quý tới cao hơn dự kiến. Lượng khách truy cập hoạt động hằng ngày tăng 17% lên 126,8 triệu, trong khi doanh thu trung bình trên mỗi người dùng trên toàn cầu nhảy 44%, nhờ vào các tính năng được hỗ trợ bởi AI-powered
GateNews10giờ trước