Google DeepMind幹部:すべてのAIプロダクト企業はカスタムベンチマークを構築すべき

ゲートニュース 4月27日 — Google DeepMindのシニア・プロダクトマネージャーであり、Google AI Studioのプロダクトリードでもあるローガン・キルパトリックは、Xで、AIベースのプロダクトを構築するすべての企業は、AIモデルの性能を測るために自社のカスタムベンチマークを確立すべきだと述べた。彼はこれを、モデルの改善が「自社に不釣り合いなほど大きな利益をもたらす」ための方法だと説明し、創業者やビジネスリーダーに「明日から始めるよう」促した。

ほとんどの企業は現在、公的なリーダーボードに依存してAIモデルを選んでいるが、それらは一般的な能力を測るものであり、多くの場合、特定のビジネスシナリオと噛み合っていない。キルパトリックは例として、契約書レビュー会社を挙げた。同社が最も重視しているのは条項抽出の正確性だが、その能力は公的ベンチマークに存在しないため、そのタスクにおけるモデル性能を評価できない。カスタムベンチマークには2つの重要な利点がある。第一に、企業は自社のビジネス課題に対して各モデル更新を評価し、全体で最上位のモデルではなく、実際の利用ケースで最も良い性能を発揮するモデルを選べるようになること。第二に、企業はこれらのテストセットをモデル提供者と共有でき、ビジネスにとって重要な領域での継続的な最適化につながることだ。

キルパトリックは、ZapierやSierraのような企業がすでにこのアプローチを実装しているとし、「ここで生み出せるアルファはかなりある」と述べた。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

ムスク氏が、第4営業日(裁判中)にxAIがOpenAIのモデルに対して蒸留(ディスティレーション)を使用したことを認めた

BeatingとThe Vergeによると、ムスクとOpenAIの訴訟における4日目に、OpenAIの弁護士は、xAIがOpenAIの技術を使ってモデルを改善するために蒸留(distillation)を用いたのかどうかを疑問視した。ムスクは当初、「ほとんどすべてのAI企業がこれをやっている」と述べたが、直接の答えを求められると、認め…

GateNews9分前

米連邦準備制度の調査によると、米国の高収入従業員の66.3%が職場でAIツールを使用している

米連邦準備制度(FRB)の調査によると、5月1日時点で、年収20万ドル超の米国の従業員のうち66.3%が過去12か月に職場でAIツールを使用したことがあるという。低所得層では利用率が大幅に低下し、年収10万ドル〜20万ドルの層で51.6%、年収5万ドル〜10万ドルの層で40.2%である。

GateNews28分前

xAIは、入力トークン100万あたり1.25ドルで、1Mトークンのコンテキストウィンドウを備えたGrok 4.3 APIを提供開始

BlockBeatsによると、xAIは5月1日にGrok 4.3 APIをローンチしました。新しいモデルは100万トークンのコンテキストウィンドウに対応し、テキストの入力/出力、マルチモーダル機能、ツール呼び出し機能を提供します。Grok 4.3 APIは、入力100万あたり1.25ドルの価格です

GateNews40分前

米国のテック大手は2026年にAIインフラへの$700B 投資を行う予定で、中国の1,050億ドルを大きく上回る

サウスチャイナ・モーニングポストによると、米国のテック大手は今年、AIインフラに対して7000億ドル超を投じる見通しで、中国の同業他社を大きく上回る。Google、Microsoft、Meta、Amazonがその大半を占めており、一方でモルガン・スタンレーは、中国のクラウド提供事業者が約105億ドルを投じると推計している。

GateNews45分前

ファーウェイは、2026年のAIチップ売上が120億ドルに達すると予想しており、2025年から60%増となる見込みです

ロイターによると、ファーウェイは2026年のAIチップ売上が約120億ドルに達すると見込んでおり、2025年の75億ドルから少なくとも60%以上の増加に相当します。今年の受注の大半は、3月に量産を開始したAscend 950PRプロセッサ向けです。同社は(これから)ローンチする予定です。

GateNews1時間前

NVIDIA投資のスウェーデンAI法務テック新興企業Legora、ジュード・ロウが世界的なブランドアンバサダーに就任

NVIDIA が Legora への Series D の増資として 5,000 万米ドルを投資し、Legora の累計調達額を 6 億米ドル、評価額を 56 億米ドルに引き上げました。Atlassian、Adams Street Partners、Insight Partners が参加しています。Legora は AI 法律テックに注力しており、自動化された審査、契約分析、法務調査などのツールを提供しています。ARR は 1 億米ドルを超え、従業員数は 40 から 400 に増加しました。Jude Law が世界的なブランドアンバサダーとなり、広告スローガンは「Law just got more attractive」です。

ChainNewsAbmedia1時間前
コメント
0/400
コメントなし