Gate News 消息,4月24日——DeepSeek V4-Pro 和 DeepSeek V4-Flash 已于4月24日正式发布并开源。其上下文处理长度由 128K 显著扩展至 1M,容量提升近 10 倍。华为计算宣布其 Ascend 超级节点产品通过芯片与模型技术的紧密协同,已全面支持 DeepSeek V4 系列模型。
华为 Ascend 950 通过融合算子内核与多流并行技术,实现高吞吐、低延迟的 DeepSeek V4 模型推理部署,从而降低 Attention 计算与内存访问开销。对于输入 8K 的 DeepSeek V4-Pro,Ascend 950 实现约 20ms TPOT,单卡 Decode 吞吐为 4,700 TPS;对于输入低于 8K 的 DeepSeek V4-Flash,其达到约 10ms TPOT,吞吐为 1,600 TPS。Ascend A3 超级节点系列也实现全面兼容,并提供训练参考实现以便快速进行微调。基于搭载大 EP 模式的 Ascend A3 64 卡超级节点,借助 vLLM 推理引擎,DeepSeek V4-Flash 在 8K/1K 输入输出场景下实现单卡 Decode 吞吐超过 2,000 TPS。华为全系列 Ascend A2、A3 和 950 产品线均支持 DeepSeek V4-Flash 与 V4-Pro。
华为云宣布与 DeepSeek V4 的率先兼容,通过其 MaaS 平台为开发者提供一键式 API Token 服务。华为云优化系统层、算子层与集群层能力,以确保快速模型适配与高性能部署。包括金山 WPS 和 360 在内的企业已通过华为云集成 DeepSeek 新模型。
寒武纪 同样宣布基于 vLLM 推理框架对 DeepSeek V4-Flash 和 V4-Pro 实现 Day 0 兼容,并将适配代码开源给 GitHub 社区。寒武纪此前在去年 DeepSeek V3.2 发布时已实现率先适配:通过对 DeepSeek 系列模型进行深度的软件-硬件协同性能优化。
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Claw Intelligence Bermitra dengan Block Sec Arena untuk Memperkuat Keamanan BNB Chain
Menurut pengumuman resmi Block Sec Arena pada 30 April, Claw Intelligence, platform Web3 berbasis AI yang dibangun di BNB Chain, telah mengumumkan kemitraan strategis dengan Block Sec Arena untuk mengintegrasikan infrastruktur keamanan siber canggih ke dalam ekosistemnya. Kolaborasi ini bertujuan untuk memperkuat p
GateNews8jam yang lalu
NTT Mengumumkan Inisiatif AI x OWN, Berencana Melipatgandakan Tiga Kali Kapasitas Daya Jepang Menjadi 1 GW pada 2033
Pada 27 April, Presiden NTT Akira Shimada mengumumkan inisiatif AI x OWN, upaya perusahaan untuk merombak infrastruktur internet agar dapat digunakan oleh AI secara real-time. NTT berencana untuk melipat tiga kapasitas daya domestiknya dari sekitar 300 MW saat ini menjadi sekitar 1 gigawatt pada tahun fiskal 2033, saat perusahaan telekomunikasi raksasa tersebut
GateNews10jam yang lalu
Platform AI Certifyde Menyelesaikan Putaran Seed senilai 2 juta dolar pada 1 Mei, Didukung oleh CEO Ripple Brad Garlinghouse
Menurut TechfundingNews, platform aplikasi AI Certifyde menyelesaikan putaran pendanaan seed senilai 2 juta dolar AS pada 1 Mei. Para investor termasuk K5 Global, Flamingo Capital, serta investor angel termasuk Honey co-founder George Ruan, Ripple CEO Brad Garlinghouse, dan Nutra co-founder Roland
GateNews10jam yang lalu
Komando Teknologi Pentagon: Anthropic masih masuk daftar hitam, penanganan pengecualian untuk Mythos
Kepala teknologi Kementerian Pertahanan AS (Pentagon technology chief) pada 1 Mei menyampaikan kepada Kongres bahwa, “Anthropic masih berada di daftar hitam, tetapi Mythos Preview adalah isu lain”, sehingga secara resmi mengakui adanya perlakuan berbeda oleh Pentagon terhadap merek utama Anthropic dan model barunya Mythos. Pernyataan ini sejalan dengan temuan Axios pada 19 April bahwa NSA (National Security Agency) sudah benar-benar memakai Mythos untuk menciptakan keterkaitan, sekaligus secara resmi mengukuhkan arah kebijakan “saluran pengecualian Mythos”—yang juga berarti Pentagon sebelumnya pernah berargumen di pengadilan bahwa penggunaan alat Anthropic akan mengancam keamanan nasional, sehingga menimbulkan kontradiksi internal secara argumentasi hukum dengan praktik aktual saat ini.
Anthropic vs Pentagon
ChainNewsAbmedia11jam yang lalu
137 Ventures Menutup $700M dalam Dana Baru, AUM Mencapai $15B
Menurut ChainCatcher, 137 Ventures, investor awal di SpaceX, baru-baru ini menyelesaikan penggalangan dana untuk dua dana baru senilai lebih dari 700 juta dolar AS, sehingga aset kelolanya kini melebihi 15 miliar dolar AS. Modal baru ini akan mendukung investasi pada agen AI, robotika, dan pendorong ruang angkasa
GateNews11jam yang lalu
Reddit Melonjak 16% di Tengah Prospek Kuartal II yang Kuat; Apple Menghadapi Kekurangan Mac karena Permintaan AI Melebihi Pasokan
Saham Reddit naik 16% sebelum pasar dibuka pada Jumat setelah perusahaan mengeluarkan panduan pendapatan untuk kuartal mendatang yang lebih tinggi dari perkiraan. Pengunjung aktif harian tumbuh 17% menjadi 126,8 juta, sementara pendapatan rata-rata per pengguna secara global melonjak 44%, didorong oleh AI-powered
GateNews11jam yang lalu