Hugging Face ouvre en open source ml-intern, un agent IA pour la recherche autonome en ML

Message de Gate News, 22 avril — Hugging Face a rendu open source ml-intern, un agent de recherche en ML capable d’accomplir de manière autonome l’ensemble du workflow : lire des articles, organiser des jeux de données, lancer l’entraînement sur GPU, évaluer les résultats et itérer pour améliorer. Le projet est construit sur le framework smolagents de Hugging Face et propose à la fois des interfaces en ligne de commande (CLI) et web, avec du code disponible sur GitHub.

La chaîne d’outils de ml-intern est conçue autour de l’écosystème Hugging Face. Elle récupère des articles depuis arXiv et HF Papers tout en retraçant les chaînes de citations pour une lecture plus approfondie ; explore des jeux de données sur HF Hub, valide leur qualité et reformate les données pour l’entraînement ; et, lorsque des ressources GPU locales ne sont pas disponibles, invoque HF Jobs pour lancer des tâches d’entraînement basées sur le cloud. Une fois l’entraînement terminé, l’agent lit automatiquement les sorties d’évaluation, diagnostique les causes d’échec et relance des expériences. Par défaut, il utilise Claude Sonnet 4.5 pour piloter la boucle de décision, avec un maximum de 300 itérations par exécution et une compression automatique du contexte lorsqu’il dépasse 170k tokens.

Hugging Face a démontré trois cas d’usage. Dans une tâche de raisonnement scientifique, l’agent a identifié les jeux de données OpenScience et NemoTron-CrossThink à partir des chaînes de citations, a filtré sept variantes depuis ARC, SciQ et MMLU selon le niveau de difficulté, puis a mené 12 rounds de fine-tuning supervisé sur Qwen3-1.7B, améliorant les scores GPQA de 10 % à 32 % en moins de 10 heures. Pour une application médicale, l’agent a déterminé que les jeux de données existants étaient insuffisants, a écrit des scripts pour générer 1 100 échantillons de données synthétiques et les a mis à l’échelle 50 fois pour l’entraînement, dépassant les performances de Codex de 60 % sur HealthBench. Dans un scénario compétitif de mathématiques, l’agent a rédigé un script d’entraînement GRPO et a lancé l’entraînement sur des GPU A100 via HF Spaces, puis a mené des études d’ablation après avoir observé un effondrement de la récompense.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

L’agent IA Manfred forme une entreprise et prépare un portefeuille crypto pour trader d’ici la fin du mois de mai

L’agent IA Manfred a créé sa propre société et obtenu un portefeuille crypto ainsi que des justificatifs d’entreprise afin d’embaucher du personnel et d’effectuer des paiements, d’après les rapports disponibles. L’agent n’est pas prévu pour commencer à négocier des cryptomonnaies avant la fin de

GateNewsIl y a 2h

MoonPay lance la carte MoonAgents sur le réseau Mastercard vendredi

D’après The Block, MoonPay a lancé MoonAgents Card vendredi : une carte de débit virtuelle Mastercard permettant aux agents IA et aux utilisateurs de dépenser des stablecoins directement depuis des portefeuilles onchain. La carte est émise via Monavate, une plateforme mondiale de paiements réglementée et membre principal de Mastercard, en

GateNewsIl y a 4h

137 Ventures clôture $700M dans de nouveaux fonds, l'actif sous gestion atteint 15 milliards de dollars

Selon ChainCatcher, 137 Ventures, un investisseur précoce de SpaceX, a récemment finalisé une levée de fonds pour deux nouveaux fonds totalisant plus de 700 millions de dollars, portant ses actifs sous gestion à plus de 15 milliards de dollars. Le nouveau capital servira à financer des investissements dans les agents d’IA, la robotique et la propulsion spatiale

GateNewsIl y a 5h

Reddit en hausse de 16 % après des perspectives solides pour le deuxième trimestre ; Apple fait face à une pénurie de Mac alors que la demande liée à l’IA dépasse l’offre

L’action de Reddit a grimpé de 16 % avant l’ouverture des marchés vendredi après que la société a publié des perspectives de revenus pour le trimestre à venir supérieures aux attentes. Le nombre de visiteurs actifs quotidiens a augmenté de 17 % à 126,8 millions, tandis que le revenu moyen par utilisateur dans le monde a bondi de 44 %, porté par des fonctionnalités alimentées par l’IA…

GateNewsIl y a 5h

Visa lance le programme Agentic Ready à Hong Kong le 1er mai, permettant les paiements par agents d’IA

Selon le média hongkongais Ming Pao, Visa a lancé le programme Visa Agentic Ready à Hong Kong le 1er mai, permettant des paiements par agents d’IA. Le programme s’appuie sur la tokenisation, la vérification d’identité, la gestion des risques et des mécanismes d’autorisation. Les participants initiaux incluent

GateNewsIl y a 8h

OpenClaw publie la version v2026.4.29 le 29 avril et met à niveau la mémoire vers un wiki personnalisé avec suivi des relations

D’après Beating, l’assistant IA open-source OpenClaw (367 000 étoiles GitHub) a publié la version v2026.4.29 le 29 avril, marquant sa deuxième mise à jour en deux jours. Le système de mémoire a évolué, passant d’un simple rappel basé sur la récupération à un wiki personnalisé, permettant aux agents de construire automatiquement des profils de personnages et de suivre r

GateNewsIl y a 18h
Commentaire
0/400
Aucun commentaire