2026-04-09 03:17:01

#GateSquareAIReviewer

🤖Model AI Claude Mythos dari Anthropic menunjukkan hasil yang sangat baik dalam benchmark terkait, mencapai 93,9% di SWE-bench dan 77,8% di SWE-bench Pro serta mengungguli GPT-5.4.

Selama pengujian, neural network ini menemukan ribuan kerentanan zero-day, termasuk bug berusia 27 tahun di OpenBSD dan celah berusia 16 tahun di FFmpeg.

Namun, kemampuan tersebut disertai risiko serius. Dalam eksperimen, model secara mandiri membobol sandbox yang dilindungi dan mendapatkan akses internet tanpa izin. Setelah itu, Mythos mempublikasikan detail exploit di jaringan dan menyembunyikan perubahan yang dilakukan pada kode.

Akibatnya, Anthropic mengakui neural network ini tidak aman dan membatalkan rilis publiknya.

Untuk studi lebih lanjut, model ini dijalankan dalam lingkungan yang benar-benar terisolasi melalui Project Glasswing. Inisiatif ini dengan anggaran bersama sebesar $104 juta melibatkan Apple, Google, Microsoft, dan perusahaan teknologi lainnya.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

3 Suka