DeepSeek Merilis Seri Model Open-Source V4 dengan 1,6T Parameter dan Lisensi MIT

Pesan Gate News, 24 April — DeepSeek telah merilis seri model open-source V4 di bawah Lisensi MIT, dengan bobot kini tersedia di Hugging Face dan ModelScope. Seri ini mencakup dua model (MoE) mixture-of-experts: V4-Pro dengan total parameter 1,6 triliun dan 49 miliar yang diaktifkan per token, serta V4-Flash dengan total parameter 284 miliar dan 13 miliar yang diaktifkan per token. Keduanya mendukung jendela konteks 1 juta token.

Arsitekturnya menampilkan tiga peningkatan kunci: mekanisme attention hibrida yang menggabungkan compressed sparse attention (CSA) dan heavily compressed attention (HCA) yang secara signifikan mengurangi overhead untuk konteks panjang—FLOPs inferensi V4-Pro untuk konteks 1M hanya 27% dari V3.2, dan KV cache (VRAM untuk menyimpan informasi historis selama inferensi) hanya 10% dari V3.2; manifold-constrained hyperconnections (mHC) menggantikan residual connection tradisional untuk meningkatkan stabilitas propagasi sinyal lintas-lapis; dan optimizer Muon untuk konvergensi pelatihan yang lebih cepat. Pra-pelatihan menggunakan lebih dari 32 triliun token data.

Pascapelatihan menggunakan pendekatan dua tahap: pertama melatih expert khusus domain melalui supervised fine-tuning (SFT) dan reinforcement learning GRPO, lalu menggabungkannya menjadi satu model melalui distilasi online. V4-Pro-Max (highest inference mode) mengklaim sebagai model open-source terkuat dengan benchmark coding kelas atas dan kesenjangan yang secara signifikan dipersempit dibandingkan model frontier closed-source dalam tugas penalaran dan agen. V4-Flash-Max mencapai performa penalaran level Pro dengan anggaran komputasi yang cukup, tetapi dibatasi oleh skala parameter pada pengetahuan murni dan tugas agen yang kompleks. Bobot disimpan dalam presisi campuran FP4+FP8.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Huawei Memperkirakan Pendapatan Chip AI 2026 Mencapai 12 Miliar Dolar AS, Naik 60% Dari 2025

Menurut Reuters, Huawei memperkirakan pendapatan chip AI tahun 2026 mencapai sekitar $12 miliar, yang setidaknya mewakili kenaikan 60% dari $7,5 miliar pada 2025. Sebagian besar pesanan tahun ini ditujukan untuk prosesor Ascend 950PR, yang mulai produksi massal pada bulan Maret. Perusahaan berencana meluncurkan sebuah

GateNews10menit yang lalu

NVIDIA berinvestasi pada startup legaltech AI asal Swedia, Legora, dengan Jude Law sebagai duta merek global

Nvidia melakukan investasi tambahan putaran Series D sebesar 50 juta dolar AS untuk Legora, sehingga total penghimpunan dana Legora mencapai 600 juta dolar AS dan valuasi 5,6 miliar dolar AS, dengan partisipasi Atlassian, Adams Street Partners, dan Insight Partners. Legora berfokus pada legal tech berbasis AI, menyediakan alat otomatisasi peninjauan, analisis kontrak, dan riset hukum. ARR lebih dari 100 juta dolar AS, jumlah karyawan meningkat dari 40 menjadi 400. Jude Law menjadi duta merek global, dengan slogan iklan Law just got more attractive.

ChainNewsAbmedia36menit yang lalu

Anthropic Membuka Beta Keamanan Claude untuk Pengguna Perusahaan pada 1 Mei

Menurut BlockBeats, pada 1 Mei, Anthropic mengumumkan bahwa Claude Security, alat keamanan kode, telah membuka pengujian beta publik untuk pengguna Claude Enterprise. Alat ini memindai repositori kode untuk kerentanan keamanan, melakukan verifikasi sekunder untuk mengurangi positif palsu, dan secara otomatis melakukan

GateNews42menit yang lalu

Biro Tenaga Kerja AS meluncurkan portal magang AI untuk membantu perusahaan melatih talenta

Biro Tenaga Kerja AS meluncurkan portal magang AI untuk National Apprenticeship Week, menyediakan sumber daya pelatihan serba ada. Dengan kerangka literasi AI, portal ini diubah menjadi keterampilan praktis, menawarkan modul lintas industri dan jalur yang fleksibel untuk membantu perusahaan mengintegrasikan pelatihan AI ke dalam program magang terdaftar, serta meningkatkan daya saing tenaga kerja dan industri.

ChainNewsAbmedia1jam yang lalu

X Meluncurkan Ulang Platform Iklan Berbasis AI pada April 2026, Perombakan Terbesar dalam 20 Tahun

Menurut X, platform ini memulai peluncuran bertahap dari platform iklan yang dibangun ulang pada April 2026. Langkah ini menandai perombakan sistem iklan terbesarnya dalam sekitar 20 tahun karena perusahaan memindahkan lebih banyak alat periklanan ke AI. Ads Manager baru menggunakan penargetan dan peringkat berbasis AI berdasarkan

GateNews1jam yang lalu

Intel Melonjak 114% pada April berkat Kinerja yang Kuat dan Optimisme AI

Menurut CNBC, saham Intel melonjak 114% pada April, menandai bulan terbaiknya sepanjang masa, didorong oleh pendapatan kuartalan yang lebih kuat serta optimisme investor yang kembali terkait pemulihan terkait AI. Saham naik 24% pada 24 April setelah CEO Lip-Bu Tan mengumumkan bahwa pendapatan kuartalan meningkat lebih dari 7%, sementara

GateNews2jam yang lalu
Komentar
0/400
Tidak ada komentar