Nvidia Blackwell GPUのコストは2倍になるが、1トークンあたりの推論コストはHopperに比べて35倍分下がる

Nvidiaの最新ブログ分析によると、Blackwell GPUはHopper世代と比べて1時間あたりの費用がほぼ2倍になる一方で、1トークンあたりの推論コストは35分の1にまで下がります。テストモデルとしてDeepSeek-R1を使うと、Blackwell(GB300 NVL72)は1GPUあたり1時間$2.65でレンタルできるのに対し、Hopperは$1.41です。しかし、単一GPUのスループットは90から6,000トークン/秒へと急増します。この65倍のスループット向上により、1百万トークンあたりのコストは$4.20から$0.12へと引き下げられます。

$0.12という数値は、FP4の低精度推論やマルチトークン予測(MTP)など、完全なソフトウェア最適化を前提としています。MTPが有効化されていない場合、1百万トークンあたりのコストは約$2.35まで上がり、MTPを有効にすると$0.11まで下がります。これは、その機能だけで最適化の効果が21倍であることを示しています。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

あなたが Claude に人生の重要なことを聞くとき:感情の問題が25%、スピリチュアルが38%、媚びへつらい度

Anthropic の研究によると、100万件の Claude 対話のうち約6%のユーザーが AI を人生の相談相手としている。主要な4分野は健康、キャリア、恋愛、財務。恋愛の媚び率は25%で、スピリチュアルは38%が最も高い。媚びを減らすために、Opus 4.7 と Mythos Preview はすでに半分まで再低減された。研究は学習データへと移行し、プライバシーは保護されており、ユーザーには恋愛の話題では逆質問を行うことが推奨される。出典 ABMedia

ChainNewsAbmedia42分前

ビザは5月1日に香港でエージェント型対応プログラムを開始し、AIエージェントによる支払いを可能にする

香港メディア「明報」によると、Visaは5月1日に香港で「Visa Agentic Ready」プログラムを開始し、AIエージェントによる決済を可能にした。同プログラムは、トークン化、本人確認、リスク管理、認可(オーソライゼーション)の仕組みを活用している。初期参加者には含まれる

GateNews48分前

世界のハイパースケール・クラウド企業のAI資本支出(Capex)が2027年に10兆ドルに達し、前年比25%増になる見通し:BofA

バンク・オブ・アメリカ・セキュリティーズによると、世界のハイパースケール型クラウドコンピューティング企業の設備投資(capex)は、2026年に$8000億(800 billion)を超える見通しであり、これは前年比67%の増加に相当します。 銀行のアナリストはさらに、capexが2027年に$1兆(1 trillion)を突破すると予想しており、推定25%のy

GateNews1時間前

PayPalは3つのユニットへの再編を発表し、2027年末までに$900M の年間コスト削減を目指す

4月30日、PayPalは、事業を消費者向け、スモールビジネス、エンタープライズの3つの明確な事業部門に包括的に再編することを発表しました。これは、業務を効率化し、人工知能の統合を加速することを目的としています。同社は、再編により、

GateNews2時間前

Kaisar Networkは分散型AIコンピューティングのレイヤー1向けに$4 百万の資金調達を完了しました

ChainCatcherによると、分散型AIコンピューティングのレイヤー1ネットワークであるKaisar Networkは、これまでに$4 millionの資金調達を完了しており、戦略的なプレシードラウンドでの$1 millionを含みます。投資家にはMerov Capital、StoneBlock、WM Capital、Arche Fund、Q42、Unicorn Venturesが含まれます。このネットワーク

GateNews4時間前

OpenAIのCFO、売上目標に関する噂を一蹴し、「5月1日時点で最高レベルで実行している」と述べる

ブルームバーグによると、OpenAIの最高財務責任者(CFO)であるサラ・フリアーは、5月1日に、同社が社内の売上目標やユーザー目標を逃したのではないかという噂を否定した。フリアーは、同社は計画を最高レベルで実行していると述べ、プロダクト需要を「垂直の壁」と表現した。彼女は、実行について述べて、

GateNews4時間前
コメント
0/400
コメントなし