Peneliti OpenAI: Sistem AI Bisa Menangani Sebagian Besar Pekerjaan Riset dalam Dua Tahun

Pengumuman Gate News, 29 April — Peneliti OpenAI Sébastien Bubeck dan Ernest Ryu mengatakan bahwa sistem AI dapat melakukan sebagian besar pekerjaan riset manusia dalam dua tahun, dengan menyajikan matematika sebagai ukuran kemajuan AI yang jelas. Tidak seperti tes performa yang masih samar, masalah matematika menawarkan verifikasi yang presisi: jawaban bisa benar atau salah, tanpa ruang untuk ambiguitas.

Bubeck mencatat bahwa pemikiran AI yang sejati membutuhkan kemampuan bertahan melalui rangkaian penalaran yang panjang. Satu kesalahan dalam argumen berisi banyak langkah dapat meruntuhkan seluruh pembuktian, sehingga deteksi dan koreksi kesalahan di tengah proses menjadi tujuan utama bagi model tingkat lanjut. Laboratorium internal OpenAI telah menghasilkan lebih dari sepuluh teorema benar-benar baru yang dapat dipublikasikan di jurnal-jurnal teratas bidang kombinatorika, yang menunjukkan bahwa AI kini menghasilkan karya yang benar-benar orisinal dan terobosan, bukan sekadar menyusun ulang makalah yang sudah ada.

Namun, terobosan ilmiah yang berkelanjutan menuntut fokus yang konsisten selama berminggu-minggu pengujian. Sistem yang ada saat ini masih memerlukan pengawasan manusia yang ketat untuk memandu dan memverifikasi setiap perubahan arah. Bubeck menggunakan “AGI time” untuk mengukur berapa lama sebuah model dapat meniru pemikiran manusia secara independen; sistem yang ada saat ini bekerja kira-kira selama beberapa hari hingga satu minggu, sementara target industri adalah berminggu-minggu atau berbulan-bulan agar memungkinkan kerja otonom di bidang seperti biologi.

Memori jangka panjang sangat penting untuk masa depan ini. Jendela chat standar membatasi kedalaman—pembuktian matematika yang kompleks sering kali melebihi 50 halaman—sementara repositori kode menunjukkan bagaimana sesi kerja yang lebih panjang memungkinkan pemecahan masalah yang lebih mendalam. Ketika AI memperoleh kemandirian dan memori, keahlian manusia menjadi semakin berharga, bukan semakin tidak. Para pekerja harus mempertahankan pengetahuan fondasional yang mendalam untuk menantang dan memverifikasi jawaban mesin, dan organisasi perlu sistem filter otomatis serta sistem reputasi baru untuk menjaga kepercayaan di tengah banjir riset yang dibantu AI.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

66,3% Karyawan AS Berpenghasilan Tinggi Menggunakan Alat AI di Tempat Kerja, Menurut Survei Federal Reserve

Menurut survei Federal Reserve, 66,3% karyawan AS yang berpenghasilan lebih dari $200.000 per tahun telah menggunakan alat AI di tempat kerja dalam 12 bulan terakhir per 1 Mei. Pada kelompok berpenghasilan lebih rendah, tingkat penggunaannya turun secara signifikan: 51,6% untuk mereka yang berpenghasilan $100.000–$200.000, 40,2% untuk mereka yang berpenghasilan $50.000–$100.000,

GateNews18menit yang lalu

xAI Meluncurkan API Grok 4.3 dengan Jendela Konteks Token 1 juta pada $1,25 per Juta Token Input

Menurut BlockBeats, xAI meluncurkan API Grok 4.3 pada 1 Mei. Model baru ini mendukung jendela konteks 1 juta token dan menawarkan kemampuan input/output teks, fitur multimodal, serta kemampuan pemanggilan alat. API Grok 4.3 dibanderol $1,25 per 1 juta input

GateNews30menit yang lalu

Raksasa Teknologi AS Siap Menggelontorkan $700B untuk Infrastruktur AI pada 2026, Jauh Melampaui China yang bernilai $105B

Menurut South China Morning Post, raksasa teknologi AS diperkirakan akan menghabiskan lebih dari $700 miliar untuk infrastruktur AI tahun ini, jauh melampaui rekan-rekan mereka di Tiongkok. Google, Microsoft, Meta, dan Amazon menyumbang sebagian besar dari total tersebut, sementara Morgan Stanley memperkirakan penyedia cloud Tiongkok akan menghabiskan sekitar $105 miliar

GateNews36menit yang lalu

Huawei Memperkirakan Pendapatan Chip AI 2026 Mencapai 12 Miliar Dolar AS, Naik 60% Dari 2025

Menurut Reuters, Huawei memperkirakan pendapatan chip AI tahun 2026 mencapai sekitar $12 miliar, yang setidaknya mewakili kenaikan 60% dari $7,5 miliar pada 2025. Sebagian besar pesanan tahun ini ditujukan untuk prosesor Ascend 950PR, yang mulai produksi massal pada bulan Maret. Perusahaan berencana meluncurkan sebuah

GateNews1jam yang lalu

NVIDIA berinvestasi pada startup legaltech AI asal Swedia, Legora, dengan Jude Law sebagai duta merek global

Nvidia melakukan investasi tambahan putaran Series D sebesar 50 juta dolar AS untuk Legora, sehingga total penghimpunan dana Legora mencapai 600 juta dolar AS dan valuasi 5,6 miliar dolar AS, dengan partisipasi Atlassian, Adams Street Partners, dan Insight Partners. Legora berfokus pada legal tech berbasis AI, menyediakan alat otomatisasi peninjauan, analisis kontrak, dan riset hukum. ARR lebih dari 100 juta dolar AS, jumlah karyawan meningkat dari 40 menjadi 400. Jude Law menjadi duta merek global, dengan slogan iklan Law just got more attractive.

ChainNewsAbmedia1jam yang lalu

Anthropic Membuka Beta Keamanan Claude untuk Pengguna Perusahaan pada 1 Mei

Menurut BlockBeats, pada 1 Mei, Anthropic mengumumkan bahwa Claude Security, alat keamanan kode, telah membuka pengujian beta publik untuk pengguna Claude Enterprise. Alat ini memindai repositori kode untuk kerentanan keamanan, melakukan verifikasi sekunder untuk mengurangi positif palsu, dan secara otomatis melakukan

GateNews1jam yang lalu
Komentar
0/400
Tidak ada komentar