Gate News, 25 April — DeepSeek merilis versi pratinjau V4-Pro dan V4-Flash pada 24 April, dua model open-weight dengan jendela konteks satu juta token. V4-Pro memiliki total 1,6 triliun parameter tetapi hanya mengaktifkan 49 miliar per pass inferensi menggunakan arsitektur Mixture-of-Experts. V4-Flash memiliki total 284 miliar parameter dengan 13 miliar yang aktif.
Harga secara signifikan lebih rendah dibanding kompetitor: V4-Pro berharga $1,74 per satu juta token input dan $3,48 per satu juta token output—sekitar 98% lebih rendah daripada GPT-5.5 Pro milik OpenAI ($30 input, $180 output) serta sekitar seperduapuluh biaya Claude Opus 4.7. V4-Flash dibanderol $0,14 untuk input dan $0,28 untuk output per satu juta token. Kedua model bersifat open-source di bawah lisensi MIT dan bisa dijalankan secara lokal secara gratis.
DeepSeek meraih peningkatan efisiensi melalui dua mekanisme perhatian baru: Compressed Sparse Attention dan Heavily Compressed Attention, yang menurunkan biaya komputasi menjadi 27% dari pendahulu V4-Pro (V3.2) dan 10% untuk V4-Flash. Perusahaan melatih V4 sebagian dengan chip Huawei Ascend, menghindari pembatasan ekspor AS untuk prosesor Nvidia yang canggih. DeepSeek menyatakan bahwa ketika 950 supernode baru hadir pada paruh akhir tahun 2026, harga akan turun lebih lanjut.
Pada benchmark performa, V4-Pro-Max menempati peringkat pertama pada Codeforces untuk pemrograman kompetitif (3,206 poin, berada di sekitar peringkat ke-23 di antara kontestan manusia) dan memperoleh 90,2% pada soal matematika Apex Shortlist dibanding Claude Opus 4.6 yang 85,9%. Namun, model ini tertinggal pada benchmark multitasking: MMLU-Pro (87,5% vs 91,0% milik Gemini-3.1-Pro) dan Humanity’s Last Exam (37,7% vs 44,4%). Pada tugas konteks panjang, V4-Pro memimpin model open-source tetapi kalah dari Claude Opus 4.6 pada uji retrieval MRCR.
V4-Pro memperkenalkan “interleaved thinking,” yang memungkinkan alur kerja agen mempertahankan konteks penalaran di seluruh banyak panggilan alat tanpa membuangnya di antara langkah. Kedua model mendukung integrasi untuk coding dengan Claude Code dan OpenCode. Menurut survei pengembang DeepSeek terhadap 85 pengguna, 52% mengatakan V4-Pro sudah siap sebagai agen coding default mereka, dengan 39% cenderung mengadopsinya. Endpoint lama deepseek-chat dan deepseek-reasoner akan dihentikan pada 24 Juli 2026.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Claw Intelligence Bermitra dengan Block Sec Arena untuk Memperkuat Keamanan BNB Chain
Menurut pengumuman resmi Block Sec Arena pada 30 April, Claw Intelligence, platform Web3 berbasis AI yang dibangun di BNB Chain, telah mengumumkan kemitraan strategis dengan Block Sec Arena untuk mengintegrasikan infrastruktur keamanan siber canggih ke dalam ekosistemnya. Kolaborasi ini bertujuan untuk memperkuat p
GateNews1jam yang lalu
NTT Mengumumkan Inisiatif AI x OWN, Berencana Melipatgandakan Tiga Kali Kapasitas Daya Jepang Menjadi 1 GW pada 2033
Pada 27 April, Presiden NTT Akira Shimada mengumumkan inisiatif AI x OWN, upaya perusahaan untuk merombak infrastruktur internet agar dapat digunakan oleh AI secara real-time. NTT berencana untuk melipat tiga kapasitas daya domestiknya dari sekitar 300 MW saat ini menjadi sekitar 1 gigawatt pada tahun fiskal 2033, saat perusahaan telekomunikasi raksasa tersebut
GateNews3jam yang lalu
Platform AI Certifyde Menyelesaikan Putaran Seed senilai 2 juta dolar pada 1 Mei, Didukung oleh CEO Ripple Brad Garlinghouse
Menurut TechfundingNews, platform aplikasi AI Certifyde menyelesaikan putaran pendanaan seed senilai 2 juta dolar AS pada 1 Mei. Para investor termasuk K5 Global, Flamingo Capital, serta investor angel termasuk Honey co-founder George Ruan, Ripple CEO Brad Garlinghouse, dan Nutra co-founder Roland
GateNews4jam yang lalu
Komando Teknologi Pentagon: Anthropic masih masuk daftar hitam, penanganan pengecualian untuk Mythos
Kepala teknologi Kementerian Pertahanan AS (Pentagon technology chief) pada 1 Mei menyampaikan kepada Kongres bahwa, “Anthropic masih berada di daftar hitam, tetapi Mythos Preview adalah isu lain”, sehingga secara resmi mengakui adanya perlakuan berbeda oleh Pentagon terhadap merek utama Anthropic dan model barunya Mythos. Pernyataan ini sejalan dengan temuan Axios pada 19 April bahwa NSA (National Security Agency) sudah benar-benar memakai Mythos untuk menciptakan keterkaitan, sekaligus secara resmi mengukuhkan arah kebijakan “saluran pengecualian Mythos”—yang juga berarti Pentagon sebelumnya pernah berargumen di pengadilan bahwa penggunaan alat Anthropic akan mengancam keamanan nasional, sehingga menimbulkan kontradiksi internal secara argumentasi hukum dengan praktik aktual saat ini.
Anthropic vs Pentagon
ChainNewsAbmedia4jam yang lalu
137 Ventures Menutup $700M dalam Dana Baru, AUM Mencapai $15B
Menurut ChainCatcher, 137 Ventures, investor awal di SpaceX, baru-baru ini menyelesaikan penggalangan dana untuk dua dana baru senilai lebih dari 700 juta dolar AS, sehingga aset kelolanya kini melebihi 15 miliar dolar AS. Modal baru ini akan mendukung investasi pada agen AI, robotika, dan pendorong ruang angkasa
GateNews4jam yang lalu
Reddit Melonjak 16% di Tengah Prospek Kuartal II yang Kuat; Apple Menghadapi Kekurangan Mac karena Permintaan AI Melebihi Pasokan
Saham Reddit naik 16% sebelum pasar dibuka pada Jumat setelah perusahaan mengeluarkan panduan pendapatan untuk kuartal mendatang yang lebih tinggi dari perkiraan. Pengunjung aktif harian tumbuh 17% menjadi 126,8 juta, sementara pendapatan rata-rata per pengguna secara global melonjak 44%, didorong oleh AI-powered
GateNews5jam yang lalu