Message de Gate News, 24 avril — La responsable de l’équipe de grands modèles de langage chez Xiaomi, Luo Fuli, a révélé dans une interview approfondie que le modèle MiMo-V2-Pro compte au total 1 trillion de paramètres et nécessitait des milliers de GPUs pour l’entraînement. Elle a noté que l’échelle de 1T représente le seuil minimum pour obtenir des performances se rapprochant du niveau de Claude Opus 4.6 et obtenir un billet d’entrée compétitif pour la phase suivante d’agents IA

D’un point de vue technique, la version Pro utilise un mécanisme d’attention éparse extrême avec un ratio de 7:1 entre l’attention globale et l’attention par fenêtre glissante, afin de maîtriser les coûts d’inférence pour le traitement de longs contextes. Le modèle conserve également l’architecture MTP (Multi-Token Prediction) pour tirer parti de la puissance de calcul disponible afin d’accélérer l’inférence.

Côté gestion, l’équipe MiMo de 100 personnes ne compte que 30 à 40 personnes directement impliquées dans les itérations cœur. L’équipe fonctionne sans hiérarchies formelles ni divisions explicites en sous-groupes, ni de dates limites de livraison. Lorsqu’elle rencontre des problèmes numériques instables tels que des pics de perte d’entraînement, l’équipe donne la priorité à l’arrêt de l’entraînement pour investigation, même si cela implique d’arrêter les opérations pendant une à deux semaines et d’engendrer des coûts de calcul se chiffrant en millions de dollars.

Afficher la source

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

Le PDG de Google, Pichai, révèle qu’il utilise l’IA Gemini pour comprendre la nature humaine et instaurer une communication plus authentique.

Agent IA Actualités de l’industrie de l’IA

Pichai affirme qu’avant des réunions importantes, il analyse et anticipe les pensées de son interlocuteur à partir des perspectives de Gemini, afin de renforcer l’empathie et d’améliorer des échanges plus sincères. Les agents IA peuvent aussi organiser automatiquement les e-mails, planifier et résumer, rendant les tâches du quotidien plus efficaces. Par ailleurs, des plateformes IA fondées sur la co-création ouverte sont en plein essor : des technologies open source comme Gemini 4 abaissent le seuil d’entrée. En même temps, l’accent est mis sur la mise en place de cadres de gouvernance de l’IA ; le secteur politique et la société doivent y participer pour relever des défis tels que la cybersécurité, les deepfakes et la durabilité.

ChainNewsAbmediaIl y a 13m

OpenAI lance une sécurité de compte avancée pour ChatGPT

Actualités de l’industrie de l’IA

Lancement de la sécurité avancée du compte OpenAI a présenté jeudi la Sécurité avancée du compte, un nouveau paramètre facultatif pour ChatGPT destiné aux utilisateurs qui souhaitent une protection plus solide ou qui font face à des risques plus élevés d’attaques numériques. La société a déclaré que cette nouvelle fonctionnalité a été conçue en réponse à la façon dont les gens sont

CryptoFrontierIl y a 1h

X (Twitter) connaît la plus grande mise à niveau de sa plateforme publicitaire sur 20 ans, avec l’intervention de xAI, et la publicité sémantique alimentée par l’IA devient l’élément central

Actualités de l’industrie de l’IA

X annonce le lancement, à partir d’avril 2026, de la plus importante refonte de sa plateforme publicitaire en 20 ans : reconstruction de la technologie sous-jacente et intégration de xAI. La nouvelle plateforme se concentre sur l’optimisation des performances pilotée par l’IA et sur des publicités sémantiques et contextuelles, afin d’améliorer la facilité d’utilisation et le pilotage des campagnes. L’objectif est de transformer la publicité en signaux commerciaux en temps réel, ancrés dans le contexte, et de s’intégrer à la stratégie Everything App pour devenir le moteur commercial de l’écosystème de X.

ChainNewsAbmediaIl y a 4h

OpenAI soutenu par 1X ouvre une usine de 58 000 pieds carrés en Californie, vise 10 000 robots la première année

Actualités de l’industrie de l’IA

D’après Bloomberg, 1X Technologies, une startup de robotique soutenue par OpenAI et fondée en Norvège, a ouvert une usine de fabrication de 58 000 pieds carrés à Hayward, en Californie, avec l’objectif de devenir leader dans la production de masse de robots humanoïdes grand public. Le site devrait produire 10 000 robots d’ici

GateNewsIl y a 6h

La Maison-Blanche rédige un mémo de politique sur l’IA ordonnant aux agences américaines d’utiliser plusieurs fournisseurs d’IA le 30 avril

Actualités de l’industrie de l’IA

D’après des sources citées par PANews le 30 avril, des responsables de la Maison-Blanche rédigent une note d’orientation générale sur les politiques en matière d’intelligence artificielle qui ordonne aux agences du gouvernement américain d’adopter plusieurs fournisseurs de services d’IA et d’éviter de dépendre d’un seul prestataire. La note exige également que toutes les entreprises d’IA sous contrat

GateNewsIl y a 7h

Commentaire

0/400

Aucun commentaire