Berita Gate News, 10 April, Tencent Hunyuan merilis rangkaian model dasar kecerdasan jasmani HY-Embodied-0.5, di mana versi 2B dengan parameter telah resmi dirilis sebagai open source. Rangkaian model ini dirancang untuk agen kecerdasan jasmani di dunia nyata, dengan fokus pada peningkatan kemampuan persepsi ruang-waktu dan penalaran jasmani, yang dapat diterapkan pada skenario seperti prediksi lingkungan, eksekusi interaksi, dan perencanaan tugas.
Keluarga model ini mencakup dua versi, 2B dan 32B: model 2B ditujukan untuk perangkat edge dan penerapan yang ringan, sementara model 32B digunakan untuk tugas penalaran yang kompleks serta keputusan cerdas tingkat lanjut. Dari sisi arsitektur teknis, HY-Embodied-0.5 memperkenalkan mekanisme Mixture-of-Transformers (MoT) untuk mewujudkan pembagian komputasi tersegmentasi multimoda, melalui token laten untuk meningkatkan kemampuan representasi persepsi, serta menggabungkan pelatihan pasca evolusi mandiri dan metode distilasi berbasis kebijakan, untuk mencapai optimasi kolaboratif kemampuan model berukuran berbeda.
Dari aspek performa, rangkaian model ini tampil menonjol dalam 22 pengujian benchmark, model 2B melampaui model SOTA pada ukuran setara untuk 16 tugas, versi 32B telah mendekati level terdepan, yang menunjukkan kemampuan generalisasi kecerdasan jasmani yang kuat serta potensi penerapan di skenario dunia nyata.