Xiaomi Mengungkap Detail Pelatihan MiMo-V2-Pro: Parameter Model 1T, Ribuan GPU Diterjunkan

Pesan Gate News, 24 April — Pemimpin tim model bahasa besar Xiaomi, Luo Fuli, mengungkapkan dalam wawancara mendalam bahwa model MiMo-V2-Pro memiliki total 1 triliun parameter dan memerlukan ribuan GPU untuk pelatihan. Ia mencatat bahwa skala 1T mewakili ambang batas minimum untuk mencapai kinerja yang mendekati tingkat Claude Opus 4.6 dan mendapatkan tiket masuk yang kompetitif untuk fase berikutnya dari agen AI.

Secara teknis, versi Pro menggunakan mekanisme extreme sparse attention dengan rasio 7:1 antara global attention dan sliding window attention, untuk mengendalikan biaya inferensi bagi pemrosesan konteks panjang. Model ini juga mempertahankan arsitektur MTP (Multi-Token Prediction) untuk memanfaatkan kelebihan daya komputasi agar inferensi lebih cepat.

Dari sisi manajemen, tim MiMo yang beranggotakan 100 orang hanya memiliki 30–40 orang yang terlibat langsung dalam iterasi inti. Tim beroperasi tanpa hierarki formal atau pembagian sub-kelompok yang eksplisit, serta tanpa tenggat waktu pengiriman. Saat menghadapi masalah numerik yang tidak stabil seperti lonjakan training loss, tim memprioritaskan menghentikan pelatihan untuk investigasi, bahkan jika itu berarti menghentikan operasi selama satu atau dua minggu dan menimbulkan biaya komputasi hingga jutaan dolar.

Penafian: Informasi di halaman ini dapat berasal dari pihak ketiga dan tidak mewakili pandangan atau opini Gate. Konten yang ditampilkan hanya untuk tujuan referensi dan bukan merupakan nasihat keuangan, investasi, atau hukum. Gate tidak menjamin keakuratan maupun kelengkapan informasi dan tidak bertanggung jawab atas kerugian apa pun yang timbul akibat penggunaan informasi ini. Investasi aset virtual memiliki risiko tinggi dan rentan terhadap volatilitas harga yang signifikan. Anda dapat kehilangan seluruh modal yang diinvestasikan. Harap pahami sepenuhnya risiko yang terkait dan buat keputusan secara bijak berdasarkan kondisi keuangan serta toleransi risiko Anda sendiri. Untuk detail lebih lanjut, silakan merujuk ke Penafian.

Artikel Terkait

Musk Bersaksi xAI Menggunakan Model OpenAI untuk Melatih Grok

Elon Musk bersaksi pada Kamis di pengadilan federal California bahwa perusahaannya di bidang kecerdasan buatan xAI sebagian menggunakan model OpenAI saat melatih chatbot Grok, menurut TechCrunch. Pengakuan itu merupakan pengakuan publik yang langka oleh pengembang AI besar atas praktik yang semakin berkembang

CryptoFrontier1jam yang lalu

CEO Google Sundar Pichai mengungkapkan bahwa dengan AI Gemini, ia dapat memahami sisi manusia untuk membangun komunikasi yang lebih tulus

Pichai mengatakan bahwa sebelum rapat-rapat penting, ia menggunakan sudut pandang Gemini untuk menganalisis dan memprediksi psikologi lawan, sehingga dapat meningkatkan empati dan komunikasi yang lebih tulus. Agen AI juga dapat secara otomatis merangkum email, menyusun jadwal, dan membuat ringkasan agar urusan harian menjadi lebih efisien. Selain itu, platform AI berbasis open co-creation tengah berkembang; teknologi sumber terbuka seperti Gemini 4 menurunkan hambatan masuk. Ia juga menekankan perlunya membangun kerangka tata kelola AI, dengan keterlibatan pihak pemerintahan dan masyarakat untuk mengatasi tantangan seperti keamanan siber, deepfake, dan keberlanjutan.

ChainNewsAbmedia1jam yang lalu

OpenAI Luncurkan Keamanan Akun Tingkat Lanjut untuk ChatGPT

Peluncuran Keamanan Akun Tingkat Lanjut OpenAI pada Kamis meluncurkan Advanced Account Security, pengaturan baru yang dapat diaktifkan (opt-in) untuk ChatGPT yang ditujukan bagi pengguna yang menginginkan perlindungan lebih kuat atau menghadapi risiko lebih tinggi terhadap serangan digital. Perusahaan mengatakan fitur baru ini dibuat sebagai respons terhadap bagaimana orang

CryptoFrontier2jam yang lalu

X (Twitter) menghadirkan peningkatan platform iklan terbesar dalam 20 tahun, xAI ikut campur, dan penargetan berbasis AI untuk pemahaman makna menjadi inti

X mengumumkan peluncuran transformasi terbesar untuk platform periklanan dalam 20 tahun terakhir mulai April 2026, dengan membangun ulang teknologi dasar dan menggabungkannya dengan xAI. Platform baru berfokus pada optimalisasi performa yang digerakkan AI, serta iklan semantik dan kontekstual, untuk meningkatkan kemudahan pengoperasian dan kontrol penayangan. Targetnya adalah menjadikan iklan sebagai sinyal bisnis dalam konteks real-time, serta mendukung strategi Everything App agar menjadi mesin bisnis untuk ekosistem X.

ChainNewsAbmedia5jam yang lalu

Didukung OpenAI, 1X Membuka Pabrik seluas 58.000 Sq-Ft di California, Menargetkan 10.000 Robot pada Tahun Pertama

Menurut Bloomberg, 1X Technologies, sebuah startup robotika yang didukung OpenAI dan didirikan di Norwegia, telah membuka fasilitas manufaktur seluas 58.000 kaki persegi di Hayward, California, dengan target untuk menjadi yang terdepan dalam memproduksi massal robot humanoid kelas konsumen. Fasilitas tersebut diperkirakan akan memproduksi 10.000 robot dalam

GateNews8jam yang lalu

Gedung Putih Menyusun Rancangan Memorandum Kebijakan AI yang Mengarahkan Lembaga AS untuk Menggunakan Banyak Penyedia AI pada 30 April

Menurut sumber yang dikutip PANews pada 30 April, pejabat Gedung Putih sedang menyusun draf memo kebijakan kecerdasan buatan yang luas yang mengarahkan lembaga pemerintah AS untuk menggunakan beberapa penyedia layanan AI dan menghindari ketergantungan pada satu vendor saja. Memo tersebut juga mengharuskan semua perusahaan AI yang dikontrak

GateNews8jam yang lalu
Komentar
0/400
Tidak ada komentar