Anthropic 釐清:Claude Code 品質下滑源自三項產品層變更,而非模型問題

快訊消息,4月23日—Anthropic 的工程團隊確認,過去一個月使用者所報告的 Claude Code 品質退化,源自三項彼此獨立的產品層變更,而非 API 或底層模型問題。這三個問題分別在 4 月 7 日、4 月 10 日和 4 月 20 日修復,目前的最終版本為 v2.1.116。

第一項變更發生在 3 月 4 日。團隊將 Claude Code 的預設推理工作量等級從「high」降低到「medium」,以解決在高推理強度下 Opus 4.6 偶發出現極端延遲尖峰的情況。由於廣泛的使用者投訴效能下降,團隊在 4 月 7 日將該變更回退。目前,Opus 4.7 的預設為「xhigh」,其他模型的預設為「high」。

第二個問題是 3 月 26 日引入的程式錯誤。系統原本設計為在對話不活躍超過一小時後清除舊的推理紀錄,以降低會話復原成本。然而,實作中的缺陷導致該清除動作在後續每一次回合都會重複執行,而不是只執行一次,因而使模型逐步失去先前的推理脈絡。這表現為越來越健忘、重複操作,以及異常的工具呼叫。該錯誤也使每次請求都發生快取未命中,加速了使用者配額的消耗。兩個彼此無關的內部實驗掩蓋了重現條件,使除錯過程延長到超過一週。修復於 4 月 10 日完成後,團隊使用 Opus 4.7 檢查問題程式碼,並發現 Opus 4.7 能夠識別該錯誤,而 Opus 4.6 則不能。

第三項變更於 4 月 16 日與 Opus 4.7 一同推出。團隊在系統提示詞中加入指令,以降低冗餘輸出。數週的內部測試顯示沒有回歸,但在上線後與其他提示詞的互動卻使程式碼品質下降。延長評估後發現,Opus 4.6 與 4.7 的效能均下降 3%,因此在 4 月 20 日回滾。

這三項變更分別在不同時間影響了不同使用者群組,而它們的綜合效果導致普遍且不一致的品質下滑,使診斷更加困難。Anthropic 表示,現在將需要更多內部員工使用與使用者相同的公開建置版本、針對每次系統提示詞修改都執行完整的模型評估測試套件,並實施分階段推出期。作為補償,Anthropic 已重置所有訂閱使用者的使用配額。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

PayPal 揭露重組為三個部門,目標在 2027 年底前達成 $900M 年度節省

在 4 月 30 日,PayPal 宣布進行全面的結構性重組,將業務拆分為三個明確的事業單位——消費者(Consumer)、中小型企業(Small Business)以及企業(Enterprise)——目標在於精簡營運並加速人工智慧(AI)的整合。公司預估此次重組將帶來

GateNews1小時前

Kaisar Network 完成 $4 百萬美元的募資,為去中心化的 AI 運算層 1

根據 ChainCatcher,Kaisar Network(一個去中心化的 AI 計算 Layer 1 網路)截至目前已完成 $4 百萬的融資金額,其中包含在策略性 Pre-Seed 輪中融資 100 萬美元。投資者包括 Merov Capital、StoneBlock、WM Capital、Arche Fund、Q42 和 Unicorn Ventures。該網路

GateNews2小時前

OpenAI 首席財務官駁斥營收目標傳聞,稱公司將於 5 月 1 日以最高水準執行

根據 Bloomberg 報導,OpenAI 首席財務官 Sarah Friar 在 5 月 1 日駁斥了該公司未達內部銷售與用戶目標的傳聞。Friar 表示,公司正以最高層級執行其計畫,並將產品需求形容為「垂直牆」。她指出,執行

GateNews3小時前

馬斯克的顧問在法庭上揭露 xAI 的 $974B 出價,針對 OpenAI 非營利資產,引發新一輪審視

根據 Jared Birchall 在 Musk 對 OpenAI 提起訴訟的第 4 天作證內容,xAI 的 9740 億美元出價收購 OpenAI 這家非營利組織的資產,目的是避免 Sam Altman 在 OpenAI 重整期間對這些資產進行低估。然而,Judge Yvonne Gonzalez Rogers 質疑 Birchall 如何能提出 9740 億美元

GateNews4小時前

馬斯克承認 xAI 在第 4 天審判期間對 OpenAI 模型使用了蒸餾技術

根據 Beating 與 The Verge,在 Musk 與 OpenAI 的審判第 4 天,OpenAI 的律師質疑 xAI 是否使用蒸餾(distillation)來透過使用 OpenAI 的技術改進其模型。Musk 起初表示「幾乎所有 AI 公司都這麼做」,但在被追問是否能直接回答時,承認

GateNews4小時前

美國高收入員工中有 66.3% 在工作中使用 AI 工具,美聯儲調查顯示

根據美國聯邦準備理事會(Federal Reserve)的調查,截至 5 月 1 日,每年收入超過 20 萬美元的美國受僱者中,有 66.3% 在過去 12 個月於工作中使用過 AI 工具。在較低收入級距中,使用率顯著下降:收入在 10 萬美元至 20 萬美元之間者為 51.6%,收入在 5 萬美元至 10 萬美元之間者為 40.2%,

GateNews5小時前
留言
0/400
暫無留言