
2026 年 6 月 13 日,美国政府以国家安全为由,要求暂停任何外国公民访问 Fable 5 和 Mythos 5。

由于限制范围涵盖美国境内外所有外国公民,甚至包括 Anthropic 内部外国籍员工,Anthropic 最终只能中止所有客户对这两款模型的访问。

但 Anthropic 明显不服。
Anthropic 在声明中称,政府并没有提供详细的国家安全说明,目前只给出了口头证据。所谓风险,是一种范围狭窄、并非通用的潜在“越狱”方法,本质上是要求模型阅读一个特定代码库,并修复其中的软件缺陷。
Anthropic 的核心反驳在于,这种能力并不是 Fable 5 或 Mythos 5 独有。
Anthropic 称,自己已经审阅了一份被认为是政府指令依据的报告,并验证后认为,报告中展示的能力水平已经可以从其他模型中广泛获得,其中包括 OpenAI 的 GPT-5.5,而且这类能力每天都被网络安全防御人员用于维护系统安全。

这句话才是整份声明中最有火药味的部分。
Anthropic 等于在公开喊话,如果“读代码、找漏洞、修漏洞”就足以构成叫停前沿模型的理由,那问题就不该只落在 Anthropic 身上。因为 OpenAI 的 GPT-5.5 同样具备类似能力,行业内其他前沿模型也很难完全置身事外。
《华尔街日报》披露,相关越狱研究由 Amazon 研究人员完成。他们通过一系列提示词,让 Anthropic 模型输出了少量安全漏洞相关信息。网络安全公司 Luta Security CEO Katie Moussouris 在看过 Anthropic 分享的报告副本后认为,这些内容更像是网络安全防御人员会使用的信息,而不是攻击者的关键武器。
公告全文:

翻译:
关于美国政府要求暂停 Fable 5 和 Mythos 5 访问的声明
美国政府以国家安全相关权限为依据,向 Anthropic 发出一项出口管制指令,要求暂停任何外国公民访问 Fable 5 和 Mythos 5,无论其身处美国境内还是境外。
这一限制也包括 Anthropic 内部的外国籍员工。
这项指令的实际影响是,为了确保合规,我们必须突然中止所有客户对 Fable 5 和 Mythos 5 的访问。
其他 Anthropic 模型的访问不受影响。
我们于今天美国东部时间下午 5 点 21 分收到政府指令。来函并未说明具体的国家安全关切。我们的理解是,政府认为其掌握了一种绕过 Fable 5 安全机制的方法,也就是所谓的“越狱”。
我们查看了一段演示,内容是使用这一特定方法发现少量此前已知的轻微漏洞。这些漏洞看起来都相对简单,而且我们发现,其他公开可用的模型在不需要绕过安全机制的情况下,也能发现这些漏洞。
关于 Fable 的安全防护措施,Anthropic 在模型发布博客中已经阐明了我们的立场:
我们已经设置了强有力的安全防护机制,大幅降低 Fable 被用于网络安全等相关任务中的滥用风险。事实上,我们的防护措施非常严格,许多用户甚至抱怨这些限制过于宽泛。
在 Fable 发布前的几周,Anthropic 与美国政府、英国 AI 安全研究所(UK AISI)、多家私营第三方机构以及内部团队合作,对 Fable 的安全防护机制进行了总计数千小时的红队测试。
这些测试表明,Fable 的安全防护机制明显强于以往任何已经部署的模型。
到目前为止,还没有任何测试人员找到一种“通用越狱”方法。所谓通用越狱,是指能够大范围绕过模型安全防护、解锁大量网络能力的越狱方式。
我们认为,对于任何模型提供商来说,做到完全抵御越狱,目前恐怕都不现实。整个行业现有的每一种安全防护机制,都可能受到非通用越狱的影响。所谓非通用越狱,是指在特定情境下诱导模型输出某些网络安全相关信息。未来,也很可能会出现通用越狱方法。我们在发布 Fable 5 时已经清楚说明了这一点。
正因为目前看来还无法实现完全的越狱防护,Anthropic 在 Fable 5 上采取了“纵深防御”策略。
我们的目标是,对于非通用越狱,让其影响范围尽可能狭窄;对于通用越狱,让其制造成本变得非常高。同时,我们还结合全面监控机制,以便快速发现并阻断任何成功攻击。
这也是为什么 Anthropic 要求 Fable 的客户数据保留 30 天。这一政策变化会给我们与客户之间的关系带来实际成本,但它能帮助我们研究并缓解越狱问题。
我们仍然支持这套纵深防御策略。它降低了 Fable 带来的风险,使其风险水平与行业内已经部署的现有模型相当。
事实上,我们甚至还没有收到任何令人担忧、且已经造成有害结果的非通用潜在越狱披露。已经向我们披露的潜在越狱,要么只是完全无害的回应,要么只是一些轻微发现,并没有体现出 Mythos 独有的能力提升。
截至目前,政府只向我们提供了口头证据,称可能存在一种范围狭窄、并非通用的越狱方法。这个方法本质上是要求模型阅读某个特定代码库,并修复其中的软件缺陷。
我们的理解是,有一个潜在越狱案例被提交给了政府。我们已经审阅了一份报告,并认为这份报告是政府发布指令的依据。我们核实后认为,该报告中展示的能力水平,其实已经可以从其他模型中广泛获得,包括 OpenAI 的 GPT-5.5,而且每天都被负责维护系统安全的防御人员使用。
我们将在未来 24 小时内分享更多细节。
我们正在遵守政府的法律指令,并将取消所有用户对 Fable 5 和 Mythos 5 的访问权限。不过,我们不同意这样的判断:仅凭一个范围狭窄的潜在越狱发现,就足以要求召回一款已经部署给数亿人的商业模型。
如果这一标准适用于整个行业,我们认为,它实际上将导致所有前沿模型提供商的新模型部署全部停摆。
正如我们此前公开表示的那样,我们认为政府应该有能力阻止不安全的模型部署,但这应当建立在一套透明、公平、清晰,并且以技术事实为基础的法定程序之上。
此次行动并不符合这些原则。
我们对这次给客户造成的中断深表歉意。我们认为这是一起误解,并正在努力尽快恢复访问。