Menurut analisis blog terbaru Nvidia, GPU Blackwell hampir dua kali lebih mahal per jam dibanding generasi Hopper, namun menghasilkan biaya inferensi per token yang 35 kali lebih rendah. Dengan DeepSeek-R1 sebagai model uji, sewa Blackwell (GB300 NVL72) sebesar $2,65 per GPU per jam, sedangkan Hopper $1,41, tetapi throughput per GPU meningkat dari 90 menjadi 6.000 token per detik. Kenaikan throughput 65x ini menurunkan biaya per sejuta token dari $4,20 menjadi $0,12.
Angka $0,12 mengasumsikan optimasi perangkat lunak penuh termasuk inferensi low-precision FP4 dan multi-token prediction (MTP). Tanpa MTP diaktifkan, biaya per sejuta token mencapai sekitar $2,35, turun menjadi $0,11 dengan MTP aktif, yang menunjukkan dampak optimasi 21x hanya dari fitur tersebut.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
NVIDIA berinvestasi pada startup legaltech AI asal Swedia, Legora, dengan Jude Law sebagai duta merek global
Nvidia melakukan investasi tambahan putaran Series D sebesar 50 juta dolar AS untuk Legora, sehingga total penghimpunan dana Legora mencapai 600 juta dolar AS dan valuasi 5,6 miliar dolar AS, dengan partisipasi Atlassian, Adams Street Partners, dan Insight Partners. Legora berfokus pada legal tech berbasis AI, menyediakan alat otomatisasi peninjauan, analisis kontrak, dan riset hukum. ARR lebih dari 100 juta dolar AS, jumlah karyawan meningkat dari 40 menjadi 400. Jude Law menjadi duta merek global, dengan slogan iklan Law just got more attractive.
ChainNewsAbmedia2menit yang lalu
Anthropic Membuka Beta Keamanan Claude untuk Pengguna Perusahaan pada 1 Mei
Menurut BlockBeats, pada 1 Mei, Anthropic mengumumkan bahwa Claude Security, alat keamanan kode, telah membuka pengujian beta publik untuk pengguna Claude Enterprise. Alat ini memindai repositori kode untuk kerentanan keamanan, melakukan verifikasi sekunder untuk mengurangi positif palsu, dan secara otomatis melakukan
GateNews7menit yang lalu
Biro Tenaga Kerja AS meluncurkan portal magang AI untuk membantu perusahaan melatih talenta
Biro Tenaga Kerja AS meluncurkan portal magang AI untuk National Apprenticeship Week, menyediakan sumber daya pelatihan serba ada. Dengan kerangka literasi AI, portal ini diubah menjadi keterampilan praktis, menawarkan modul lintas industri dan jalur yang fleksibel untuk membantu perusahaan mengintegrasikan pelatihan AI ke dalam program magang terdaftar, serta meningkatkan daya saing tenaga kerja dan industri.
ChainNewsAbmedia31menit yang lalu
X Meluncurkan Ulang Platform Iklan Berbasis AI pada April 2026, Perombakan Terbesar dalam 20 Tahun
Menurut X, platform ini memulai peluncuran bertahap dari platform iklan yang dibangun ulang pada April 2026. Langkah ini menandai perombakan sistem iklan terbesarnya dalam sekitar 20 tahun karena perusahaan memindahkan lebih banyak alat periklanan ke AI. Ads Manager baru menggunakan penargetan dan peringkat berbasis AI berdasarkan
GateNews1jam yang lalu
Intel Melonjak 114% pada April berkat Kinerja yang Kuat dan Optimisme AI
Menurut CNBC, saham Intel melonjak 114% pada April, menandai bulan terbaiknya sepanjang masa, didorong oleh pendapatan kuartalan yang lebih kuat serta optimisme investor yang kembali terkait pemulihan terkait AI. Saham naik 24% pada 24 April setelah CEO Lip-Bu Tan mengumumkan bahwa pendapatan kuartalan meningkat lebih dari 7%, sementara
GateNews1jam yang lalu
Marathon Digital Holdings akan Mengakuisisi Long Ridge Energy senilai $1,5 miliar untuk Ekspansi Pusat Data AI
Marathon Digital Holdings mengakuisisi Long Ridge Energy senilai $1,5 miliar untuk memperluas kapasitas pusat data AI. Kesepakatan ini mencakup pembangkit listrik tenaga gas alam 505 MW dan 1.600 acre lahan di Ohio, yang menyediakan lebih dari 1 GW kapasitas daya untuk mendukung infrastruktur AI dan TI di masa depan.
GateNews1jam yang lalu