Gate News 消息,4 月 22 日——Hugging Face 已开源 ml-intern,这是一款机器学习研究代理,能够自主完成完整工作流:阅读论文、整理数据集、启动 GPU 训练、评估结果并迭代改进。该项目基于 Hugging Face 的 smolagents 框架,提供 CLI 和基于网页的界面,代码可在 GitHub 上获取。
ml-intern 工具链围绕 Hugging Face 生态系统设计。它从 arXiv 和 HF Papers 检索论文,同时追踪引文链以便更深入阅读;在 HF Hub 上浏览数据集,验证质量,并将数据重新格式化以用于训练;当本地 GPU 资源不可用时,它会调用 HF Jobs 来启动基于云端的训练任务。训练完成后,代理会自动读取评估输出、诊断失败原因,并重新运行实验。默认情况下,它使用 Claude Sonnet 4.5 来驱动决策循环,每次运行最多 300 次迭代,并在超过 170k tokens 时自动进行上下文压缩。
Hugging Face 展示了三个使用案例。在科学推理任务中,代理通过引文链识别出 OpenScience 和 NemoTron-CrossThink 数据集;按难度等级从 ARC、SciQ 和 MMLU 中筛选出 7 个变体;并在 Qwen3-1.7B 上进行了 12 轮监督微调,使 GPQA 分数在 10 小时内从 10% 提升到 32%。在医疗应用中,代理判断现有数据集不足,编写脚本生成 1,100 个合成数据样本,并将其放大 50 倍用于训练,在 HealthBench 上相较 Codex 的表现提升了 60%。在竞争性的数学场景中,代理编写了一个 GRPO 训练脚本,并通过 HF Spaces 在 A100 GPU 上启动训练;随后在观察到奖励崩塌后开展了消融实验。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
OpenClaw 于 2026.4.29 版本在 4 月 29 日发布,将内存升级为带关系追踪的个性化 Wiki
根据 Beating,开源 AI 助手 OpenClaw(GitHub 36.7 万个星标)于 4 月 29 日发布 v2026.4.29,标志着它在两天内的第二次更新。其记忆系统从基于检索的简单回忆演进为个性化 wiki,使得智能体能够自动构建角色画像并追踪 r
GateNews4小时前
Google 执行长皮查伊透露利用 Gemini AI 洞悉人性建立更真诚的沟通
皮查伊表示,在重要会议前,他用 Gemini 的观点分析预测对方心理,以此增进同理心与更真诚的沟通。AI 代理也能自动整理邮件、排程与摘要,使日常琐事更高效。另以开放共创为核心的 AI 平台正在兴起,Gemini 4 等开源技术降低门槛;同时强调建立 AI 治理框架,政界与社会需参与以解决网安、深伪与永续等挑战。
鏈新聞abmedia7小时前
Oobit 将于周四推出支持 Visa 的 AI 代理卡,使用户无需法币换汇即可使用 USDT 消费
据 The Block 称,Tether 支持的钱包初创公司 Oobit 于周四推出 AI Agent Cards,使自治机器人能够使用 USDT 余额进行购买,而无需转换为法币或直接访问企业银行卡凭证。由 Visa 支持的卡片可在 Visa 可用的线上场景中使用
GateNews7小时前
ChimpX AI 在种子轮融资中筹集 280 万美元,由 Waterdrip Capital 和 MetaLabs Ventures 领投
ChimpX AI 今日宣布完成一轮 280 万美元的种子轮融资,以加速 Mojo AI 的开发。Mojo AI 是一款执行代理,将纯英文意图转换为 Solana 上的链上 DeFi 交易。本轮融资由 Waterdrip 领投
GateNews9小时前
主要 CEX 于 4 月 29 日上线代理支付协议,实现由 AI 驱动的跨链交易
根据最近的一则公告,一家领先的加密货币交易所于 4 月 29 日发布了 Agent Payments Protocol,该协议是一项开放标准,使人工智能代理能够在无需人工干预的情况下,跨越多个区块链网络执行完整的商业交易。该协议
GateNews9小时前
海象推出 MemWal SDK 用于 AI 代理记忆
海象(Walrus)已推出 MemWal,这是一款旨在通过为 AI 代理存储和访问信息带来可验证性、可用性、可移植性和可共享性,从而解决代理式记忆(agentic memory)局限性的 SDK,依据 Mysten Labs Group 产品经理 Abinhav Garg 的说法。
可验证且可移植的记忆
Crypto Frontier10小时前