Tin cổng Gate News, ngày 25 tháng 4 — DeepSeek đã phát hành các phiên bản xem trước của V4-Pro và V4-Flash vào ngày 24 tháng 4, cả hai đều là các mô hình open-weight với cửa sổ ngữ cảnh một triệu token. V4-Pro có 1,6 nghìn tỷ tổng tham số nhưng chỉ kích hoạt 49 tỷ trên mỗi lượt suy luận, sử dụng kiến trúc Mixture-of-Experts. V4-Flash có 284 tỷ tổng tham số với 13 tỷ tham số hoạt động.

Giá thấp hơn đáng kể so với các đối thủ: V4-Pro có giá $1,74 cho mỗi một triệu token đầu vào và $3,48 cho mỗi một triệu token đầu ra—khoảng thấp hơn 98% so với GPT-5.5 Pro của OpenAI ($30 input, $180 output) và chỉ bằng khoảng một phần hai mươi chi phí của Claude Opus 4.7. V4-Flash được định giá $0,14 cho đầu vào và $0,28 cho đầu ra trên mỗi một triệu token. Cả hai mô hình đều là mã nguồn mở theo giấy phép MIT và có thể chạy cục bộ miễn phí.

DeepSeek đạt được lợi thế về hiệu suất thông qua hai cơ chế chú ý mới: Compressed Sparse Attention và Heavily Compressed Attention, giúp giảm chi phí tính toán xuống còn 27% so với mô hình tiền nhiệm V4-Pro (V3.2) và 10% cho V4-Flash. Công ty huấn luyện V4 một phần trên các chip Huawei Ascend, tránh các hạn chế xuất khẩu của Mỹ đối với các bộ xử lý Nvidia tiên tiến. DeepSeek cho biết rằng khi 950 supernode mới được đưa vào hoạt động vào cuối năm 2026, giá sẽ còn giảm thêm.

Trên các benchmark hiệu năng, V4-Pro-Max xếp thứ nhất về lập trình cạnh tranh Codeforces (3,206 điểm, đứng khoảng vị trí thứ 23 trong số các thí sinh là con người) và đạt 90,2% ở các bài toán Apex Shortlist so với 85,9% của Claude Opus 4.6. Tuy nhiên, nó thua trong các bài benchmark đa nhiệm: MMLU-Pro (87,5% so với 91,0% của Gemini-3.1-Pro) và Humanity's Last Exam (37,7% so với 44,4%). Với các tác vụ ngữ cảnh dài, V4-Pro dẫn đầu các mô hình mã nguồn mở nhưng thua Claude Opus 4.6 trong các bài kiểm tra truy xuất MRCR.

V4-Pro giới thiệu “interleaved thinking” (tư duy xen kẽ), cho phép quy trình làm việc của agent giữ lại ngữ cảnh suy luận qua nhiều lệnh gọi công cụ mà không xả bộ nhớ giữa các bước. Cả hai mô hình đều hỗ trợ tích hợp lập trình với Claude Code và OpenCode. Theo khảo sát nhà phát triển của DeepSeek trên 85 người dùng, 52% cho biết V4-Pro đã sẵn sàng để trở thành agent lập trình mặc định của họ, với 39% nghiêng về việc áp dụng. Các endpoint deepseek-chat và deepseek-reasoner cũ sẽ ngừng hoạt động vào ngày 24 tháng 7 năm 2026.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.

Tin tức liên quan

04-25 06:12

Các thương vụ IPO của SpaceX, OpenAI và Anthropic Có Thể Thu Hút Hơn $240 tỷ đô la, Thậm Chí Có Thể Ảnh Hưởng Đến Thanh Khoản Thị Trường Crypto

04-25 02:51

Startup mã hóa bằng AI Cognition đang đàm phán vòng gọi vốn định giá $25B

04-25 02:29

Google Đầu tư $10B vào Anthropic với Định giá Trước tiền $350B , tối đa $30B bổ sung gắn với các mốc hiệu suất

04-24 15:53

Alphabet dự kiến đầu tư lên đến $40 tỷ USD vào Anthropic, thúc đẩy cạnh tranh AI

04-24 00:27

Cognition AI Huy động vốn với mức định giá $25B trong các cuộc đàm phán giai đoạn đầu

Phân tích chuyên sâu

Google gia tăng thêm 40 tỷ USD đầu tư vào Anthropic: trước tiên chi 10 tỷ, sau đó giải phóng 30 tỷ tùy theo hiệu quả hoạt động, kèm 5GW năng lực tính toán TPU

ChainNewsAbmedia04-25 07:14

Định giá thị trường thứ cấp của Anthropic vượt 1 nghìn tỷ USD: Forge Global vượt OpenAI 8.800 tỷ

ChainNewsAbmedia04-24 07:14

DeepSeek ra mắt phiên bản xem trước mã nguồn mở V4, điểm kỹ thuật 3206 vượt qua GPT-5.4

Market Whisper04-24 05:38

Bình luận

0/400

Không có bình luận