Anthropic 用可见的备用方案取代 Claude Fable 5 的 5 条隐形防护措施
Anthropic 本周承认,其 Claude Fable 5 模型中的“不可见防护”是“错误的权衡”,并宣布将用面向 Claude Opus 4.8 的可见后备方案替换它们,从本周开始。该公司在推出 Claude Fable 5(其新 Mythos 类别的首个产品)后遭到强烈反弹,因为其防护被埋在长达 319 页的系统卡中,且会在用户被怀疑正在构建竞争性 AI 模型时,偷偷降低他们的回复质量。争议在 AI 研究公司 SemiAnalysis 于 2026 年 6 月 9 日公开报告称其 GPU 推理研究已被标记之后爆发;Anthropic 于 2026 年 6 月 11 日在 X 上发布道歉。该不可见防护的工作方式不同于模型既有的可见保护,后者针对网络安全与生物研究会在请求被改由更早的 Opus 4.8 模型处理时通知用户。 Anthropic 宣布对被标记请求启用可见后备系统 从本周开始,被标记的请求将可见地路由至 Claude Opus 4.8,而不是静默地交付降级后的 Fable 输出。API 用户在请求被拒绝时将收到明确的拒绝原因。Anthropic 表示,服务器端的后备通知
Oliver Grant·16 分钟前