Berita Gate News, pada 18 Maret, NVIDIA bersiap meluncurkan chip inferensi Groq 3 LPU ke pasar China, diperkirakan akan dirilis paling cepat pada Mei. Menurut sumber yang mengetahui, chip ini bukan versi downgrade atau khusus untuk pasar China. Ini adalah kali pertama NVIDIA memperkenalkan lini produknya ke China setelah mengakuisisi perusahaan chip inferensi AI Groq sekitar 1,7 miliar dolar AS pada akhir 2025, dan berbeda dari strategi chip yang sudah disetujui untuk produksi ulang seperti GPU H200. Groq 3 LPU adalah coprocessor khusus inferensi, dilengkapi 500MB SRAM on-chip, dengan bandwidth inferensi hingga 150 TB/s, tetapi memiliki daya komputasi floating point yang rendah dan tidak cocok untuk pelatihan model. Arsitektur ini memungkinkan performa puncaknya berada di bawah batasan performa yang berlaku dalam kontrol ekspor AS saat ini (TPP < 21.000 dan bandwidth DRAM < 6.500 GB/s), sehingga dapat menghindari pembatasan ekspor yang dihadapi GPU seperti H200. Namun, Groq LPU dalam solusi asli NVIDIA harus digunakan bersama GPU Vera Rubin yang tidak dapat diekspor ke China (dengan rasio rekomendasi sekitar 25:75), sementara versi China harus diadaptasi untuk berjalan secara independen dengan sistem lain, dan performa aktualnya masih perlu diamati.