Mantan Kepala AI Tesla dan salah satu pendiri OpenAI, Andrej Karpathy, pada 9 April memublikasikan sebuah tulisan panjang di X, dengan mengatakan bahwa pemahaman publik tentang kemampuan AI sedang mengalami perpecahan yang serius. Ia berpendapat bahwa orang yang menggunakan ChatGPT versi gratis dan teknisi yang setiap hari menggunakan alat agent mutakhir seperti Codex dan Claude Code, sebenarnya sedang membahas “produk yang sepenuhnya berbeda”, tetapi kedua pihak sama-sama merasa bahwa yang mereka lihat adalah gambaran utuh dari AI.
Dua dunia, dua jenis pemahaman AI
Karpathy membagi pengguna AI saat ini menjadi dua kelompok.
Kelompok pertama adalah orang yang pada suatu titik tahun lalu mencoba ChatGPT versi gratis, lalu membentuk kesan mereka secara keseluruhan tentang AI dari sana. Yang mereka lihat adalah berbagai kesalahan model—halusinasi, hasil pencarian yang tidak masuk akal, dan bahkan pola suara yang membuat kesalahan pada pertanyaan sederhana seperti “mengemudi atau berjalan pergi mencuci mobil”. Karpathy mengakui bahwa masalah-masalah ini memang ada, tetapi menekankan bahwa versi gratis dan model yang ketinggalan zaman tidak dapat mewakili kemampuan sebenarnya dari model agent mutakhir sebelum tahun 2026.
Kelompok kedua memenuhi dua syarat sekaligus: menggunakan model agent mutakhir terbaru berbayar (seperti OpenAI Codex atau Claude Code), dan menggunakan secara profesional di bidang-bidang teknis seperti pengembangan perangkat lunak, matematika, dan penelitian. Karpathy menyebut bahwa kelompok ini sedang mengalami “dampak psikologis AI” yang sangat tinggi (AI Psychosis), karena kemajuan terbaru model-model ini di bidang teknis “hanya bisa digambarkan sebagai menakjubkan”—Anda bisa benar-benar menyaksikan mereka menyelesaikan masalah arsitektur perangkat lunak yang semula memerlukan waktu berhari-hari bahkan berminggu-minggu dalam waktu kurang dari satu jam.
Mengapa kemajuan terkonsentrasi di bidang teknis
Karpathy menjelaskan mengapa peningkatan kemampuan AI tampak khususnya signifikan di bidang teknis seperti pengembangan perangkat lunak, tetapi tidak begitu menonjol pada penggunaan umum seperti pencarian, penulisan, dan pemberian saran.
Ada dua penyebab: pertama, bidang teknis menyediakan fungsi penghargaan yang dapat diverifikasi (misalnya, apakah unit test lulus), yang membuat pelatihan reinforcement learning dapat berjalan secara efektif; sementara itu, kualitas tulisan sulit untuk dinilai secara jelas. Kedua, dalam skenario B2B bidang teknis lebih bernilai secara komersial, sehingga perusahaan-perusahaan AI menginvestasikan proporsi terbesar sumber daya tim mereka ke arah-arah tersebut.
Kedua kelompok saling tidak mengerti apa yang dibicarakan pihak lain
Karpathy menyimpulkan bahwa kedua kelompok ini sedang “berbicara pada jalurnya masing-masing”. Mode suara dari versi gratis OpenAI yang membuat masalah sehari-hari berantakan, sementara Codex versi berbayar tingkat tertinggi dari OpenAI dapat, dalam satu jam, merestrukturisasi seluruh basis kode atau menemukan celah sistem—dua hal ini sama-sama benar.
Dalam balasan lanjutan, ia menambahkan bahwa ada orang yang mengajukan pandangan kepadanya: insiden OpenClaw mendapat perhatian sosial yang begitu besar karena insiden itu membuat banyak non-teknisi untuk pertama kalinya berkenalan dengan model agent mutakhir, sementara selama ini mereka hanya tahu bahwa AI itu sama dengan ChatGPT versi web.
Artikel ini Karpathy: Pemahaman tentang kemampuan AI mengalami kesenjangan serius, versi gratis dan Agent mutakhir adalah “produk yang sepenuhnya berbeda” pertama kali muncul di media ABMedia.