Anthropic 确认:Claude Code 质量下滑背后是三项产品层变更,而非模型问题

Gate News 消息,4月23日——Anthropic 的工程团队确认,用户在过去一个月中报告的 Claude Code 质量退化源于三个相互独立的产品层变更,而非 API 或底层模型问题。这三个问题分别在 4月7日、4月10日和 4月20日得到修复,当前最终版本为 v2.1.116。

第一项变更发生在 3月4日。为了解决在 Opus 4.6 高推理强度下偶发出现的极端延迟峰值,团队将 Claude Code 的默认推理工作量等级从 “high” 降为 “medium”。在大量用户抱怨性能下降后,团队在 4月7日撤回了该变更。目前在 Opus 4.7 上默认为 “xhigh”,在其他模型上默认为 “high”。

第二个问题是在 3月26日引入的一个漏洞。系统被设计为在对话不活跃超过一小时后清除旧的推理记录,以降低会话恢复成本。然而,实现中的缺陷导致清除操作在之后每一次轮次中反复执行,而不是只执行一次,从而使模型逐步丢失既有推理上下文。该问题表现为越来越健忘、重复操作以及异常的工具调用。该漏洞还导致每次请求都发生缓存未命中,从而加速用户配额的消耗。两个彼此无关的内部实验掩盖了复现条件,使得调试过程延长到超过一周。在 4月10日修复后,团队使用 Opus 4.7 检查了有问题的代码,并发现 Opus 4.7 能识别该漏洞,而 Opus 4.6 无法。

第三项变更于 4月16日与 Opus 4.7 同期上线。团队在系统提示词中加入了指令,以减少冗余输出。几周的内部测试表明不会出现回归,但上线后与其他提示词的交互会降低编码质量。更长时间的评估显示 Opus 4.6 和 4.7 的性能均下降 3%,因此团队在 4月20日执行了回滚。

这三项变更在不同时间影响了不同用户群体,它们叠加产生了广泛且不一致的质量下滑,使得诊断变得更加复杂。Anthropic 表示,现在它将需要更多内部员工像用户一样使用相同的公开构建版本,对每一次系统提示词修改都运行完整的模型评估套件,并实施分阶段的灰度发布期。作为补偿,Anthropic 已重置所有订阅用户的使用配额。

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

AI-платформа Certifyde привлекает $2M в посевном финансировании вместе с CEO Ripple Брэдом Гарлингхаусом

Согласно ChainCatcher, платформа для AI-приложений Certifyde объявила о завершении раунда посевного финансирования на сумму $2 миллионов долларов. Инвесторы включают K5 Global, Flamingo Capital, а также бизнес-ангелов, таких как CEO Ripple Брэд Гарлингхаус, сооснователь Honey Джордж Руань и сооснователь Nutra Роланд

GateNews15м назад

DeepSeek запускает функцию распознавания изображений в бета-тестировании

Согласно PANews, сегодня DeepSeek запустила функцию распознавания изображений (29 апреля), в настоящее время она находится на бета-тестировании. Для развертывания бета-версии могут быть выбраны как пользователи веб-версии, так и мобильного приложения.

GateNews1ч назад

Anthropic Запускает 8 Коннекторов для Творческих Инструментов для Claude, Включая Blender, Adobe, Autodesk

Anthropic объявила набор коннекторов для творческих инструментов, которые позволяют Claude напрямую управлять профессиональным программным обеспечением, используемым дизайнерами и музыкантами. Первые восемь коннекторов охватывают 3D-моделирование, визуальный дизайн, музыкальное продакшн и живые выступления, а партнёрами выступают Blender, Adobe,

GateNews1ч назад

Белый дом обходит оценку рисков Пентагона, чтобы развернуть модель Mythos от Anthropic 29 апреля

Согласно Whale Factor, Белый дом обходит оценку рисков Пентагона, чтобы развернуть модель Mythos от Anthropic во всех федеральных ведомствах 29 апреля. Этот шаг направлен на ускорение возможностей федерального ИИ и на то, чтобы идти в ногу с темпами децентрализованных ИИ-сетей. Это означает существенный сдвиг

GateNews1ч назад

Cognizant приобретет Astreya за $600M , чтобы расширить бизнес по развитию инфраструктуры ИИ

По данным Reuters, 29 апреля Cognizant согласилась приобрести Astreya примерно за $600 миллиона, поскольку расширяет свой бизнес по развитию инфраструктуры ИИ. Astreya — поставщик ИТ-услуг, специализирующийся на инфраструктуре ИИ и услугах дата-центров. Ожидается, что сделка будет завершена во втором квартале

GateNews1ч назад

30 вредоносных плагинов на ClawHub, замаскированных под AI-инструменты, скачаны более 9 800 раз

Согласно исследователю Manifold Акс Шарме, 30 плагинов на ClawHub, замаскированных под легитимные AI-инструменты, были скачаны более 9 800 раз, при этом тайно превращая AI-ассистентов пользователей в криптовалютных работников. Плагины, опубликованные под аккаунтом imaflytok, выглядят как обычные планировщики задач и инструменты мониторинга, однако содержат скрытые инструкции, которые выполняют несанкционированные операции. После установки плагины автоматически регистрируют AI-ассистентов пользователей на сторонних серверах, создают криптовалютные кошельки и извлекают приватные ключи без согласия и уведомления пользователя. Затем ассистенты выходят на связь каждые 4 часа в ожидании назначенных задач. Шарма отметил, что плагины не содержат вредоносного кода, который можно обнаружить с помощью сканеров безопасности: они используют только стандартные интерфейсы и легитимные инструменты, из-за чего их сложно выявить при обычных проверках безопасности.

GateNews1ч назад
комментарий
0/400
Нет комментариев