ニュース速報メッセージ:4月23日 — Perplexityの研究チームが、Web検索エージェント向けのポストトレーニング手法の詳細を説明する技術記事を公開しました。このアプローチは、2つのオープンソースのQwen3.5モデル (Qwen3.5-122B-A10B と Qwen3.5-397B-A17B) を使用し、2段階のパイプラインを採用します。すなわち、命令追従と言語の一貫性を確立するための教師あり微調整 (SFT) の後に、検索精度とツール使用の効率を最適化するためのオンライン強化学習 (RL) を行います。
RLフェーズでは、GRPOアルゴリズムを2つのデータソースとともに活用します。1つは、内部のシードクエリから構築された独自のマルチホップ検証可能な質問-回答データセットで、推論の2〜4ホップと、複数ソルバによる検証を必要とします。もう1つは、配備要件を客観的に検査可能な原子的条件へ変換してSFTの振る舞い劣化を防ぐ、ルーブリックに基づく汎用会話データです。
報酬設計では、ゲート付き集約を採用します——ベースラインの正しさが達成された場合にのみ、選好スコアが寄与します (question-answer match または すべてのルーブリック基準が満たされた場合)。これにより、高い選好信号が事実誤りを覆い隠すことを防ぎます。効率ペナルティは同一グループ内のアンカーリングを用い、同じグループにおける正答のベースラインを超えて、ツール呼び出しや生成長に対してなめらかなペナルティを適用します。
評価では、Qwen3.5-397B-SFT-RLが検索ベンチマーク全体で業界最高水準の性能を達成しています。FRAMESでは、単一ツール呼び出しで57.3%の精度を実現し、GPT-5.4を5.7パーセントポイント上回ります。また、Claude Sonnet 4.6を4.7パーセントポイント上回ります。中程度の予算 (4回のツール呼び出し) では、1クエリあたり$0.02で73.9%の精度を達成し、GPT-5.4の1クエリあたり$0.085での67.8%の精度、Sonnet 4.6の1クエリあたり$0.153での62.4%の精度と比較しています。コスト数値は各提供元の公開API料金に基づき、キャッシュの最適化は除外されています。
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は
免責事項をご参照ください。
関連記事
セイウチがAIエージェントのメモリ向けMemWal SDKをローンチ
ウォルラスは、Mysten Labs GroupのプロダクトマネージャーであるAbinhav Gargによると、AIエージェントが情報を保存しアクセスする方法において、検証可能性、可用性、移植性、共有可能性をもたらすことで、エージェント型メモリの制約に対処することを目的としたSDKであるMemWalをローンチしました。
検証可能で移植可能なメモリ
CryptoFrontier11分前
Oobitが、直接USDTの支払いに対応するAIエージェントVisaカードを発表
The Blockによると、Tetherに裏付けられたウォレットのスタートアップであるOobitは、AIエージェントが通貨交換や取引ごとの承認なしに、Visaに対応した加盟店でUSDTを直接使える仮想の「Agent Cards(エージェントカード)」を本日ローンチしました。各カードは単一のエージェントに割り当てられており、利用限度額が含まれています
GateNews3時間前
AethirClawは、4月30日に、5分で導入できる事前設定済みの暗号AIエージェント「CARA」を発表します
AethirClawの公式発表(4月30日)によると、同社はAethirの分散型GPUインフラ上で動作する、あらかじめ設定済みの暗号資産AIエージェントであるCARAをローンチしました。このプラットフォームには、オンチェーン、リアルタイムの市場モニタリング、クジラウォレットの追跡などを含む50以上のビルトインスキルがあります。
GateNews4時間前
Nous ResearchのHermes Agentが、30日後に未使用スキルを自動で引退(オートリタイア)させるためのキュレーター機能を追加
Nous Researchによると、Hermes Agentフレームワークはスキルのライフサイクルを自動的に管理するために4月29日にCurator機能を追加しました。この機能は、AIエージェントがスキルを無期限に蓄積して、使われていないものを削除せずにシステムプロンプトが膨れ上がってしまうという先行する制限に対処します。
Curator
GateNews6時間前
Grok は、複数ステップのクリエイティブなワークフローのための、無限キャンバスを備えた Imagine Agent モードのベータ版をローンチしました
Beatingが監視しているレポートによると、GrokのWeb版は、xAIの既存の画像および動画生成機能に基づいて構築された新しいエージェント型ツールであるImagine Agent Mode(ベータ)をロールアウト中です。インターフェースは、従来のチャットウィンドウを無限キャンバスに置き換えており、4つのプリセットが含まれています
GateNews7時間前
Billions Networkは、18,000人超のエージェントを展開し、第3位のエージェント・エコシステムへと成長しました
BlockBeatsによると、4月30日までにBillions Networkはデプロイ数においてエージェント・エコシステムの第3位となり、18,000以上のエージェントをデプロイしたことでEthereumを上回った。ネットワークの順位はBNB ChainとBaseのみに続いている。Billionsはまた、検証済みのエージェントID機能をwにわたって同期させた
GateNews9時間前