够狠！Claude 5 被禁！临死拉 GPT 5.5 下水

2026 年 6 月 13 日，美国政府以国家安全为由，要求暂停任何外国公民访问 Fable 5 和 Mythos 5。

由于限制范围涵盖美国境内外所有外国公民，甚至包括 Anthropic 内部外国籍员工，Anthropic 最终只能中止所有客户对这两款模型的访问。

但 Anthropic 明显不服。

Anthropic 在声明中称，政府并没有提供详细的国家安全说明，目前只给出了口头证据。所谓风险，是一种范围狭窄、并非通用的潜在“越狱”方法，本质上是要求模型阅读一个特定代码库，并修复其中的软件缺陷。

Anthropic 的核心反驳在于，这种能力并不是 Fable 5 或 Mythos 5 独有。

Anthropic 称，自己已经审阅了一份被认为是政府指令依据的报告，并验证后认为，报告中展示的能力水平已经可以从其他模型中广泛获得，其中包括 OpenAI 的 GPT-5.5，而且这类能力每天都被网络安全防御人员用于维护系统安全。

这句话才是整份声明中最有火药味的部分。

Anthropic 等于在公开喊话，如果“读代码、找漏洞、修漏洞”就足以构成叫停前沿模型的理由，那问题就不该只落在 Anthropic 身上。因为 OpenAI 的 GPT-5.5 同样具备类似能力，行业内其他前沿模型也很难完全置身事外。

《华尔街日报》披露，相关越狱研究由 Amazon 研究人员完成。他们通过一系列提示词，让 Anthropic 模型输出了少量安全漏洞相关信息。网络安全公司 Luta Security CEO Katie Moussouris 在看过 Anthropic 分享的报告副本后认为，这些内容更像是网络安全防御人员会使用的信息，而不是攻击者的关键武器。

公告全文：

翻译：

关于美国政府要求暂停 Fable 5 和 Mythos 5 访问的声明

美国政府以国家安全相关权限为依据，向 Anthropic 发出一项出口管制指令，要求暂停任何外国公民访问 Fable 5 和 Mythos 5，无论其身处美国境内还是境外。

这一限制也包括 Anthropic 内部的外国籍员工。

这项指令的实际影响是，为了确保合规，我们必须突然中止所有客户对 Fable 5 和 Mythos 5 的访问。

其他 Anthropic 模型的访问不受影响。

我们于今天美国东部时间下午 5 点 21 分收到政府指令。来函并未说明具体的国家安全关切。我们的理解是，政府认为其掌握了一种绕过 Fable 5 安全机制的方法，也就是所谓的“越狱”。

我们查看了一段演示，内容是使用这一特定方法发现少量此前已知的轻微漏洞。这些漏洞看起来都相对简单，而且我们发现，其他公开可用的模型在不需要绕过安全机制的情况下，也能发现这些漏洞。

关于 Fable 的安全防护措施，Anthropic 在模型发布博客中已经阐明了我们的立场：

我们已经设置了强有力的安全防护机制，大幅降低 Fable 被用于网络安全等相关任务中的滥用风险。事实上，我们的防护措施非常严格，许多用户甚至抱怨这些限制过于宽泛。

在 Fable 发布前的几周，Anthropic 与美国政府、英国 AI 安全研究所（UK AISI）、多家私营第三方机构以及内部团队合作，对 Fable 的安全防护机制进行了总计数千小时的红队测试。

这些测试表明，Fable 的安全防护机制明显强于以往任何已经部署的模型。

到目前为止，还没有任何测试人员找到一种“通用越狱”方法。所谓通用越狱，是指能够大范围绕过模型安全防护、解锁大量网络能力的越狱方式。

我们认为，对于任何模型提供商来说，做到完全抵御越狱，目前恐怕都不现实。整个行业现有的每一种安全防护机制，都可能受到非通用越狱的影响。所谓非通用越狱，是指在特定情境下诱导模型输出某些网络安全相关信息。未来，也很可能会出现通用越狱方法。我们在发布 Fable 5 时已经清楚说明了这一点。

正因为目前看来还无法实现完全的越狱防护，Anthropic 在 Fable 5 上采取了“纵深防御”策略。

我们的目标是，对于非通用越狱，让其影响范围尽可能狭窄；对于通用越狱，让其制造成本变得非常高。同时，我们还结合全面监控机制，以便快速发现并阻断任何成功攻击。

这也是为什么 Anthropic 要求 Fable 的客户数据保留 30 天。这一政策变化会给我们与客户之间的关系带来实际成本，但它能帮助我们研究并缓解越狱问题。

我们仍然支持这套纵深防御策略。它降低了 Fable 带来的风险，使其风险水平与行业内已经部署的现有模型相当。

事实上，我们甚至还没有收到任何令人担忧、且已经造成有害结果的非通用潜在越狱披露。已经向我们披露的潜在越狱，要么只是完全无害的回应，要么只是一些轻微发现，并没有体现出 Mythos 独有的能力提升。

截至目前，政府只向我们提供了口头证据，称可能存在一种范围狭窄、并非通用的越狱方法。这个方法本质上是要求模型阅读某个特定代码库，并修复其中的软件缺陷。

我们的理解是，有一个潜在越狱案例被提交给了政府。我们已经审阅了一份报告，并认为这份报告是政府发布指令的依据。我们核实后认为，该报告中展示的能力水平，其实已经可以从其他模型中广泛获得，包括 OpenAI 的 GPT-5.5，而且每天都被负责维护系统安全的防御人员使用。

我们将在未来 24 小时内分享更多细节。

我们正在遵守政府的法律指令，并将取消所有用户对 Fable 5 和 Mythos 5 的访问权限。不过，我们不同意这样的判断：仅凭一个范围狭窄的潜在越狱发现，就足以要求召回一款已经部署给数亿人的商业模型。

如果这一标准适用于整个行业，我们认为，它实际上将导致所有前沿模型提供商的新模型部署全部停摆。

正如我们此前公开表示的那样，我们认为政府应该有能力阻止不安全的模型部署，但这应当建立在一套透明、公平、清晰，并且以技术事实为基础的法定程序之上。

此次行动并不符合这些原则。

我们对这次给客户造成的中断深表歉意。我们认为这是一起误解，并正在努力尽快恢复访问。

万益资讯网

够狠！Claude 5 被禁！临死拉 GPT 5.5 下水

热门分类

够狠！Claude 5 被禁！临死拉 GPT 5.5 下水

猜你喜欢

唐杰谈AGI开放竞争这两天发生的一件事，让我不得不重新思考开源模型的价值，因为

分享一下iOS27内置壁纸⬇️

全球最火的AI公司Anthropic同时扔出两个重磅炸弹：•一边是CEO达

自研?实则是在中国开源AI大模型的基础上演变而来。据印媒6月12日报道，一家

报告显示，三星设备中存在无法移除的以色列间谍软件，而三星至今作出任何解释。调查细

Anthropic最新的大模型如果发现你在利用它进行机器学习等相关的研究的时候，

难怪内塔尼亚胡会大言不惭地说，你手里握着一块以色列！我看到最新报告显示，三星设备

热门分类