Hari ini dini hari, sisi gelap bulan resmi merilis dan membuka sumber model flagship generasi terbaru dari seri Kimi — Kimi K2.6, kurang dari 3 bulan setelah peluncuran versi sebelumnya K2.5. Setelah dirilis, popularitasnya sangat tinggi, jumlah tampilan di akun resmi sudah mencapai 4 juta.

Saat ini, Agen sering kali kesulitan saat menangani proyek rekayasa yang kompleks, meskipun mereka mahir menyelesaikan tugas tertentu secara mandiri, kolaborasi tim masih kurang. Bagaimana mengatasi batasan ini, menjadi tujuan utama Kimi K2.6.

Versi baru ini mengeksplorasi cara memicu kemampuan kolaborasi tim Agen: memperkuat fitur Agent Swarm (Kumpulan Agen) yang diperkenalkan di K2.5, melalui adaptasi kerangka kerja seperti OpenClaw untuk memperkuat kerja aktif Agen, dan Claw Group (Kelompok Claw) yang baru menambahkan kemampuan koordinasi organisasi. Sistem kemampuan lengkap ini membangun sebuah sistem AI yang lebih mendekati tim manusia.

Untuk mewujudkan semua ini, model dasar harus cukup kuat. Kali ini, Kimi K2.6 menunjukkan kemajuan yang jelas dalam kemampuan inti seperti Agen umum, pengkodean, dan pemahaman gambar. Tes seperti Humanity’s Last Exam, SWE-Bench Pro yang mendekati skenario pengembangan nyata, dan DeepSearchQA yang menguji kemampuan pencarian mendalam Agen, semuanya menunjukkan K2.6 unggul dari pesaingnya.

Bahkan jika membandingkan K2.6 dengan model tertutup seperti GPT-5.4, Claude Opus 4.6, Gemini 3.1 Pro, hasilnya tetap seimbang, bahkan beberapa indikator bisa mengungguli mereka.

Platform evaluasi model besar Artificial Analysis mengumumkan hasil terbaru, 「Kimi K2.6 menjadi raja model sumber terbuka baru」!

Setelah peluncuran Kimi K2.6, platform penggabungan model besar OpenRouter memberikan penilaian tinggi, menyatakan bahwa model generasi baru dari sisi gelap bulan ini menonjolkan kemampuan pemrograman jangka panjang, dirancang khusus untuk skenario Agen yang membutuhkan eksekusi berkelanjutan. Dibandingkan chatbot tradisional, model ini lebih mirip seorang 「insinyur sistem」, mampu memecah tugas kompleks, mengeksekusi langkah demi langkah, dan terus mengoptimalkan selama proses.

Seorang pengguna berkomentar bahwa model flagship Kimi ini sangat kuat, bahkan sudah bisa bersaing dengan GPT-5.4 dalam penulisan kode, harganya jauh lebih murah daripada Opus 4.7, dan tetap sumber terbuka serta gratis. Sekarang, setiap beberapa bulan pasti muncul model sumber terbuka baru yang mendekati GPT dan Claude tertutup. 「Rasanya model sumber terbuka benar-benar sudah mengejar, dan semuanya didorong oleh China.」

12 jam nonstop, 300 Agen bekerja bersamaan

Apakah bentuk akhir Agen sudah tiba?

Kali ini, Kimi K2.6 terus memperkuat di bidang pemrograman. Beberapa hari lalu, Kimi K2.6-Code-Preview yang diluncurkan secara diam-diam di luar negeri sedang ramai dibicarakan, dan banyak yang menantikan versi resmi K2.6.

Sebagai model dengan kemampuan pemrograman terkuat dari seri Kimi hingga saat ini, kemampuan pengkodean jangka panjang Kimi K2.6 mengalami terobosan, membantu mendorong otomatisasi pengembangan perangkat lunak ke tahap yang lebih dalam dalam proses rekayasa.

Misalnya, Kimi K2.6 dapat dengan lancar mengunduh Qwen3.5-0.8B secara lokal di Mac dan menjalankannya. Ia tidak mengikuti tumpukan teknologi umum, melainkan menulis ulang proses inferensi menggunakan bahasa Zig yang kurang umum dan terus mengoptimalkannya, yang sendiri sudah menunjukkan kemampuan generalisasi model.

Proses ini berlangsung lebih dari 12 jam, selama itu menggunakan lebih dari 4000 alat, dan melakukan 14 iterasi. Dengan penyesuaian parameter dan refaktor, kecepatan inferensi dari awal sekitar 15 token/detik meningkat menjadi sekitar 193 token/detik, bahkan lebih cepat sekitar 20% dari aplikasi chat model besar lokal LM Studio.

Selanjutnya, fokus upgrade Kimi K2.6 ini adalah memperkuat kolaborasi output dari kumpulan Agen. Singkatnya, fitur ini bertujuan untuk menyusun ulang 「bagaimana Agen bekerja sama」.

Sejauh mana kemampuan ini? K2.6 mampu secara otomatis memecah tugas kompleks, mendistribusikannya ke Agen dengan keahlian berbeda, membiarkan mereka menangani pencarian, riset mendalam, analisis dokumen, penulisan dokumen panjang, dan seterusnya, lalu menggabungkan hasilnya untuk melanjutkan proses.

Dengan mekanisme ini, satu kali jalankan bisa menyelesaikan seluruh rangkaian: dari data awal, konten web, hingga PPT dan tabel, semuanya otomatis dibuat, tanpa perlu bolak-balik alat, apalagi intervensi manual.

Selain itu, arsitektur dasar kumpulan Agen juga diperluas, mampu mengatur hingga 300 sub-Agen secara bersamaan, menyelesaikan 4000 langkah kolaborasi, dan kemampuan paralel langsung ditingkatkan ke level baru. Setelah skala meningkat, peran AI pun berubah: mulai mengendalikan seluruh proses dan langsung memberikan hasil yang sistematis.

Contohnya, kumpulan Agen ini membongkar dan memanfaatkan makalah astrofisika berisi data visual beresolusi tinggi, menghasilkan laporan penelitian sekitar 7000 kata, 20.000 dataset, dan 14 grafik.

Agar AI dapat berevolusi menjadi pekerja siber yang aktif 24/7 tanpa intervensi manusia, Kimi K2.6 melakukan adaptasi mendalam terhadap kerangka kerja seperti OpenClaw dan Hermes Agent.

Untuk itu, Kimi K2.6 semakin memperkuat kemampuan eksekusi mandiri model: baik akurasi panggilan API, stabilitas jangka panjang, maupun perlindungan keamanan saat menjalankan tugas penelitian kompleks, semuanya menunjukkan performa yang mengesankan.

Dalam bidang Vibe Coding, desain situs Kimi K2.6 semakin menarik. Situs yang dihasilkan, terutama bagian tampilan utama, memiliki daya tarik visual yang besar dan konsistensi gaya yang baik. Ditambah lagi, elemen interaktif dan efek gulir yang ditambahkan mampu menarik pengguna untuk tinggal lebih lama.

Selain desain front-end, Kimi K2.6 juga membawa kejutan bagi pengembang back-end, dengan peluncuran fitur login akun Kimi dan pengumpulan data formulir. Kamu bisa membuat halaman pendaftaran acara dan dengan mudah melihat data pendaftaran dari backend. Dengan begitu, integrasi front-end dan back-end menjadi lebih lancar.

Saat ini, Kimi K2.6 sudah menjadi model default untuk versi web Kimi, aplikasi, dan asisten pemrograman Kimi Code, ayo segera digunakan.

Pengujian langsung, bikin heboh seluruh dunia

Tanpa banyak basa-basi, kita langsung uji beberapa contoh, lihat hasilnya bagaimana.

Tes bagian pertama menggunakan 「K2.6 Agent」, dari sudut pandang praktis dan estetika, untuk melihat apakah mampu menghasilkan efek front-end yang cukup menarik.

Ada yang suka 《Persona 5》?

Ini adalah gaya seni yang sangat khas, sebuah kekerasan visual yang menyamar sebagai manga. Menggunakan desain yang sangat tidak teratur untuk menantang konvensi estetika, dan menanamkan tema 「perlawanan terhadap kebosanan sosial」 ke dalam piksel dan garis. Menggabungkan desain grafis datar dan ruang 3D secara sempurna, membuat simbol manga dan ekspresi visual menyatu secara mendalam.

Kalau kita buka sebuah kedai kecil bergaya P5, seperti apa tampilannya?

Kami menemukan bahwa selama membangun halaman web front-end, agen Kimi K2.6 melakukan pengujian lengkap, bahkan mensimulasikan klik:

Selain itu, kami membuat easter egg, di mana Kimi K2.6 menampilkan video pembuka 《Persona 5 Royal》 tanpa menyediakan bahan apa pun, dan membuat animasi singkat.

Kami melanjutkan dengan permintaan lain, kali ini gaya desain front-end yang berbeda: 「Desain halaman utama yang penuh daya tarik visual untuk platform e-commerce, dengan navigasi atas berisi logo merek, kotak pencarian, keranjang belanja, tombol login/daftar, banner utama (Hero Section) menampilkan promosi utama, produk terlaris, atau diskon musiman, di bawah Hero Section menampilkan rekomendasi produk atau kategori, dan di bagian bawah halaman atau area mencolok menampilkan ulasan pengguna tentang produk pilihan.」

Satu kali generate, langsung menghasilkan halaman utama dengan tingkat penyelesaian sangat tinggi. Meskipun ada beberapa kekurangan, kami yakin masalah kecil bisa diperbaiki dalam satu iterasi, dan hasilnya tetap memuaskan.

Kami juga menguji fungsi kumpulan Agen K2.6, untuk membuat brosur laporan 《2026 Artificial Intelligence Index Report》 dari Stanford University, yang diminta untuk menghasilkan halaman web, tabel, dan PPT, tanpa diberikan informasi tambahan atau dokumen apa pun, menguji performa kolaborasi antar agen.

Kami perhatikan, setiap agen memiliki ID, deskripsi tugas, dan profil masing-masing. Saat menggunakan kumpulan Agen, kamu benar-benar seperti seorang direktur yang mengatur sumber daya manusia, menugaskan dan memanfaatkan semua orang secara efisien, membentuk tim kerja otomatis yang menjalankan tugas. Rasanya seperti menulis 「andalan」 di ID mereka.

Akhirnya, semua konten yang kami butuhkan berhasil dihasilkan, mulai dari halaman web yang menarik, PPT yang terorganisasi dengan baik, hingga tabel data yang serius.

Apakah kolaborasi multi-agen sudah menjadi masa depan?

Serangkaian tes di atas menunjukkan kekuatan Kimi K2.6 sebagai 「model dasar」 di era Agen.

Di tengah meningkatnya tren 「Lobster Craze」 yang dipicu oleh OpenClaw, fitur baru Claw Group menunjukkan jalur evolusi yang jelas untuk agen selanjutnya.

Saat ini, Claw Group sudah membuka uji coba terbatas.

Fitur ini menandai masuknya kolaborasi agen ke era baru. Kamu bisa menghubungkan berbagai Agen yang berjalan di lokal, ponsel, atau cloud, masing-masing membawa alat, keahlian, dan memori, dan bekerja sama dalam sebuah 「kelompok」 untuk mendorong tugas.

Di sini, K2.6 lebih berperan sebagai pengatur: siapa yang ahli pencarian, siapa yang bertanggung jawab analisis, siapa yang menghasilkan konten, akan dibagi sesuai kemampuan. Jika ada bagian yang tersendat, dia juga bisa mendeteksinya dan mengatur ulang tugas, mengganti orang, agar proses tetap berjalan.

Bayangkan saat kamu perlu menyiapkan laporan kompleks atau mengembangkan proyek berlapis, agen-agen dalam Claw Group ini akan seperti sekelompok profesional, berdiskusi, berkoordinasi, dan menyesuaikan, akhirnya menyajikan hasil yang akurat dan lengkap.

Inovasi ini tidak hanya melampaui mode eksekusi agen individu tradisional, tetapi juga mendorong kemajuan organisasi cerdas. Kehadirannya membuat 「banyak AI agen bekerja bersama」 menjadi lebih nyata.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
GatePreIPOsLaunchesWithSpaceX
300.38K Popularitas
#
Gate13thAnniversaryLive
759.86K Popularitas
#
BitcoinBouncesBack
174.07K Popularitas
#
IsraelStrikesIranBTCPlunges
30.57K Popularitas
#
USIranTalksProgress
879.84K Popularitas

Sematkan

peta situs

Era Agen Tunggal Resmi Berakhir: Jika tidak bisa mengalahkan satu, maka lawan 300.

12 jam nonstop, 300 Agen bekerja bersamaan

Pengujian langsung, bikin heboh seluruh dunia

Topik Trending

GatePreIPOsLaunchesWithSpaceX

Gate13thAnniversaryLive

BitcoinBouncesBack

IsraelStrikesIranBTCPlunges

USIranTalksProgress

Sematkan