AnthropicがPrompt Cachingダッシュボードをリリース、キャッシュヒットとコストを可視化

robot
概要作成中

MEニュース 2023年4月22日(UTC+8)、動察Beatingの監測によると、Claude Developer ConsoleにPrompt Caching Dashboardが登場しました。入口はplatform.claude.com/usage/cacheです。
ダッシュボードはワークスペース、モデル、期間でフィルタリングでき、主に三つのデータを表示します:キャッシュ読み取り率(cache read ratio)、つまりリクエストの中で既存のキャッシュにヒットした割合;キャッシュ使用量構成、入力トークンを未キャッシュ、5分キャッシュ書き込み、1時間キャッシュ書き込み、キャッシュ読み取りの四種類に分けて積み上げ棒グラフで表示;書き込み償却倍数(write amortization)、一度のキャッシュ書き込みが後続の読み取りで何回再利用されたかを示します。
スクリーンショット例では、Claude Opus 4.6は7日間で27.4億の入力トークンを処理し、読み取り率は85.4%、書き込み償却は8.65倍です。
下部には1時間から24時間の粒度でのキャッシュ読み取り率の時系列グラフもあります。
Anthropicのプロンプトキャッシュ機構は、APIユーザーがシステムプロンプトや長いコンテキストなどの固定内容をキャッシュ可能としてマークできるようにしています。初回書き込みには追加料金がかかりますが、その後のヒットは標準入力料金の約1割で計算されます。
キャッシュはデフォルトで5分間保持され、有料プランでは1時間まで延長可能です。
以前は、ユーザーはAPIのトークンカウントフィールドを間接的に見てキャッシュ効果を判断するしかなく、可視化ツールはありませんでした。
(出典:BlockBeats)

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン