Kabar Gerbang, 24 April — Insinyur OpenAI Clive Chan telah mengajukan keberatan terperinci terhadap bab rekomendasi perangkat keras dalam laporan teknis V4, menyebutnya "mencengangkan: biasa saja dan rawan kesalahan" dibandingkan versi V3 yang terkenal. Panduan perangkat keras V3, yang mencakup sesi Tanya Jawab yang menjadi topik diskusi paling populer di konferensi akademik ISCA, menawarkan rekomendasi spesifik yang selaras dengan standar interkoneksi industri. V4, sebaliknya, jauh lebih kabur.

Chan secara sistematis menantang tiga rekomendasi utama. Terkait konsumsi daya, laporan tersebut menyarankan bahwa optimasi perangkat lunak memungkinkan chip menjalankan komputasi, penyimpanan, dan komunikasi pada kapasitas penuh secara bersamaan, serta merekomendasikan agar produsen chip menyisakan margin daya tambahan. Chan berpendapat ini kontraproduktif: total daya chip dibatasi oleh keterbatasan proses fisik, sehingga menyisakan lebih banyak margin daya hanya menurunkan frekuensi operasi, yang pada akhirnya mengurangi kinerja komputasi. Mengenai transfer data GPU-ke-GPU, laporan tersebut menganjurkan model pull—di mana GPU secara aktif mengambil data—dibandingkan model push, dengan alasan tingginya overhead notifikasi pada operasi push. Chan membantah hal itu, dengan mengatakan bahwa pull sebenarnya lebih lambat dan bahwa kemampuan adaptor jaringan yang ditingkatkan akan lebih disukai. Namun, keduanya mungkin membahas lapisan yang berbeda dari masalah ini: laporan membahas overhead mekanisme notifikasi, sedangkan Chan merujuk pada latensi transmisi itu sendiri.

Untuk fungsi aktivasi, laporan tersebut merekomendasikan mengganti SwiGLU dengan fungsi yang lebih sederhana untuk mengurangi beban komputasi. Chan tidak melihat manfaat apa pun dari hal tersebut, dengan mencatat bahwa Sonic MoE sudah menunjukkan kinerja optimal menggunakan SwiGLU. Chan menduga DeepSeek mungkin "secara sengaja melemahkan bagian ini."

Lihat Sumber

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.

Berita Terkait

04-24 04:29

V4-Pro Mencapai Tingkat Lolos Kode 67% dalam Uji Dogfooding Internal, Mendekati Performa Opus 4.5

04-24 03:21

Data Pelatihan DeepSeek V4 Berlipat Ganda Jadi 33T, Memicu Ketidakstabilan yang Menunda Rilis

04-24 03:04

DeepSeek Merilis Seri Model Open-Source V4 dengan 1,6T Parameter dan Lisensi MIT

04-24 01:46

OpenAI Meluncurkan GPT-5.5, Dirancang untuk Tugas Agen dan Alur Kerja yang Kompleks

04-23 20:42

Pelanggaran Keamanan Vercel Meluas hingga Ratusan Pengguna; Pengembang AI Berisiko Lebih Tinggi

Analisis Kedalaman

DeepSeek meluncurkan V4 versi pratinjau sumber terbuka, penilaian teknis 3206 melampaui GPT-5.4

Market Whisper04-24 05:38

OpenAI 推 GPT-5.5: 12M konteks, indeks AA teratas, Terminal-Bench 82.7% menulis ulang tolok ukur agen

ChainNewsAbmedia04-23 19:45

Anthropic Mengungkapkan Bug Tiga Kali Tumpang Tindih pada Claude Code: Penurunan kemampuan penalaran, Lupa cache, dan Perintah 25 karakter yang berbalik menyerang

ChainNewsAbmedia04-23 18:14

Komentar

0/400

Tidak ada komentar