ME News ニュース、2023年4月22日(UTC+8)、動察Beatingの監視によると、Hugging Faceがオープンソース化したml-internは、「論文の読み取り、データセットの整理、GPUトレーニングの開始、結果の評価、反復改善」までの全工程を自主的に行えるML研究エージェントです。プロジェクトは自社のsmolagentsフレームワークを基に構築され、CLIとウェブインターフェースの両方の入口を提供し、コードはGitHubでオープンソース化されています。ml-internのツールチェーンはHugging Faceエコシステムを中心に構築されており、arXivやHF Papersで論文を検索し、引用チェーンをたどって深く読むことができる。HF Hub上のデータセットを閲覧し、品質を確認した後に再フォーマットして訓練に投入。ローカルにGPUがない場合はHF Jobsを呼び出してクラウド上で訓練タスクを開始し、訓練終了後に自動的に評価出力を読み取り、失敗原因を診断して再実行します。デフォルトではClaude Sonnet 4.5を呼び出して意思決定ループを駆動し、1回の最大反復回数は300回、コンテキストが170kトークンを超えると自動的に圧縮されます。Hugging Faceはリリース投稿で3つのケースを示しています。科学推論タスクでは、エージェントが基準論文の引用チェーンからOpenScienceとNemoTron-CrossThinkデータセットを見つけ出し、ARC、SciQ、MMLUから難易度に応じて7つのバリエーションを抽出し、Qwen3-1.7B上で12回のSFTを実行、GPQAのスコアは10%から32%に向上し、所要時間は10時間未満です。医療シナリオでは、エージェントが既存のデータセットの品質不足を判断し、自らスクリプトを作成して1100件の合成データを生成、50倍に拡張して訓練に使用し、HealthBench上でCodexを60%以上超えました。競技数学シナリオでは、エージェントが自らGRPO訓練スクリプトを作成し、A100上でHF Spacesを通じて訓練を開始、報酬の崩壊を観測した後、アブレーション実験を行い原因を調査しました。(出典:BlockBeats)
Hugging Faceオープンソースのml-intern、論文の自動読解、データ選択、トレーニング実行を行うML研究エージェント
ME News ニュース、2023年4月22日(UTC+8)、動察Beatingの監視によると、Hugging Faceがオープンソース化したml-internは、「論文の読み取り、データセットの整理、GPUトレーニングの開始、結果の評価、反復改善」までの全工程を自主的に行えるML研究エージェントです。プロジェクトは自社のsmolagentsフレームワークを基に構築され、CLIとウェブインターフェースの両方の入口を提供し、コードはGitHubでオープンソース化されています。ml-internのツールチェーンはHugging Faceエコシステムを中心に構築されており、arXivやHF Papersで論文を検索し、引用チェーンをたどって深く読むことができる。HF Hub上のデータセットを閲覧し、品質を確認した後に再フォーマットして訓練に投入。ローカルにGPUがない場合はHF Jobsを呼び出してクラウド上で訓練タスクを開始し、訓練終了後に自動的に評価出力を読み取り、失敗原因を診断して再実行します。デフォルトではClaude Sonnet 4.5を呼び出して意思決定ループを駆動し、1回の最大反復回数は300回、コンテキストが170kトークンを超えると自動的に圧縮されます。Hugging Faceはリリース投稿で3つのケースを示しています。科学推論タスクでは、エージェントが基準論文の引用チェーンからOpenScienceとNemoTron-CrossThinkデータセットを見つけ出し、ARC、SciQ、MMLUから難易度に応じて7つのバリエーションを抽出し、Qwen3-1.7B上で12回のSFTを実行、GPQAのスコアは10%から32%に向上し、所要時間は10時間未満です。医療シナリオでは、エージェントが既存のデータセットの品質不足を判断し、自らスクリプトを作成して1100件の合成データを生成、50倍に拡張して訓練に使用し、HealthBench上でCodexを60%以上超えました。競技数学シナリオでは、エージェントが自らGRPO訓練スクリプトを作成し、A100上でHF Spacesを通じて訓練を開始、報酬の崩壊を観測した後、アブレーション実験を行い原因を調査しました。(出典:BlockBeats)