Berita Gerbang, 24 April — DeepSeek V4 telah mempublikasikan hasil dari evaluasi penalaran matematis formal, meraih skor sempurna 120/120 pada Putnam-2025, menyamai Axiom untuk posisi pertama.
Dalam rezim praktis yang menggunakan LeanExplore dan constrained sampling, V4-Flash-Max mencetak 81.00 pada tolok ukur Putnam-200 Pass@8, secara signifikan mengungguli Seed-2.0-Prover (35.50), Gemini 3 Pro (26.50), dan Seed-1.5-Prover (26.50). Hasil rezim frontier menunjukkan V4 berada di depan Seed-1.5-Prover (110/120) dan Aristotle (100/120).
V4 menggunakan pendekatan hibrida penalaran formal-informal: penalaran informal menghasilkan solusi bahasa alami kandidat, self-verification menyaring hasil, dan agen formal menyelesaikan pembuktian yang ketat di Lean. Hasil rezim frontier memanfaatkan penskalaan komputasi skala besar, sementara skor rezim praktis lebih mencerminkan kemampuan penerapan standar.
Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke
Penafian.
Artikel Terkait
Perusahaan AI Tiongkok Mempertimbangkan Membongkar Struktur Red-Chip Setelah Penghentian Akuisisi Manus oleh Meta
Menurut Beating, Komisi Nasional Pembangunan dan Reformasi China menghentikan akuisisi Meta senilai 2 miliar dolar AS atas perusahaan agen AI Manus, sehingga Komisi Pengawas Sekuritas China memperketat persetujuan untuk pencatatan IPO Hong Kong oleh perusahaan red-chip (perusahaan asal China yang memegang aset domestik th
GateNews8menit yang lalu
Musk Menyelesaikan Kesaksian Uji Coba Tiga Hari dalam Gugatan OpenAI, Mengutip Klaim Kerugian Senilai $130-150B
Menurut beberapa laporan media, Elon Musk menyelesaikan kesaksian selama tiga hari dalam gugatanya melawan OpenAI pada 28-30 April, dengan total waktu kesaksian lebih dari 7 jam. Musk, yang mendirikan OpenAI pada 2015 bersama investasi awal sebesar $38 juta, mengklaim perusahaan tersebut meninggalkan m
GateNews18menit yang lalu
Meta Mengakuisisi Startup AI Robotika Assured Robot Intelligence pada 1 Mei
Menurut Bloomberg, Meta mengakuisisi Assured Robot Intelligence, startup robotika AI dengan kantor di San Diego dan New York, pada 1 Mei. Tim yang diakuisisi, termasuk para pendiri Lerrel Pinto dan Xiaolong Wang, akan bergabung dengan Meta Superintelligence Labs dan bekerja dengan Meta Robotics Studio. Keuangan
GateNews18menit yang lalu
Organisasi yang Terhubung dengan OpenAI Membayar Influencer $5.000 Per TikTok untuk Menyebarkan Pesan “Ancaman AI dari China”
Menurut WIRED, organisasi nirlaba Build American AI, yang berafiliasi dengan super PAC Leading the Future, telah secara sistematis merekrut influencer media sosial melalui perusahaan pemasaran SM4 untuk menyebarkan pesan “China mengancam AI AS” di TikTok dan Instagram. Organisasi tersebut
GateNews24menit yang lalu
Nebius Membeli Eigen AI untuk $643M agar Meningkatkan Penempatan Model AI
Menurut The Economic Times, pada 1 Mei, perusahaan infrastruktur AI berbasis di Amsterdam, Nebius, mengumumkan akan mengakuisisi Eigen AI senilai kira-kira 643 juta dolar AS dalam bentuk kas dan saham Kelas A. Eigen AI, yang didirikan oleh mantan peneliti MIT, berspesialisasi dalam teknologi inferensi dan optimasi. Nebius berencana untuk melanjutkan
GateNews28menit yang lalu
Pentagon Menandatangani Kesepakatan AI dengan 8 Perusahaan, Mengecualikan Anthropic dari Akses Jaringan Level Rahasia
Menurut Beating News, Pentagon mengumumkan kesepakatan dengan delapan perusahaan teknologi untuk menerapkan alat dan infrastruktur AI mereka pada jaringan militer rahasia tingkat (IL6) dan sangat rahasia (IL7) di AS. Perusahaan yang baru ditandatangani termasuk Nvidia, Microsoft, AWS, Reflection AI, plus yang sebelumnya
GateNews28menit yang lalu