万益资讯网

6月30日,美国商务部长 Howard Lutnick 给 AI 公司 Anth

6月30日,美国商务部长 Howard Lutnick 给 AI 公司 Anthropic 发了一封信:你们的模型出口,不再需要许可证了。

出口许可证这种东西,通常管的是芯片、导弹零件、核材料。这次,它管的是一个聊天机器人。

事情要从3周前说起。6月12日,美国商务部下令 Anthropic 切断境外用户对其最新模型的访问,理由是担心其他国家拿它攻击美国的电网和银行系统。Anthropic 手里没有按国家封锁用户的技术手段,干脆全球停服。

被封锁的是两个模型:Claude Fable 5 和 Claude Mythos 5。两者共享同一个底层模型,但 Mythos 5 专门释放了网络安全方向的能力,能比市面上几乎所有其他模型更高效地发现和利用软件漏洞,甚至逼近顶尖人类安全专家的水平。简单说,它能在代码里快速找洞,还能告诉你怎么钻进去。Fable 5 面向普通用户,本身不具备这种进攻能力,但亚马逊(Amazon)的研究人员找到了一种“越狱”方法,用特殊话术骗过 AI 的安全防线,让 Fable 5 写出了展示漏洞如何被利用的示范代码。

这次越狱直接触发了美国政府的出口禁令。

为了证明自己的清白,Anthropic 在禁令期间进行了大量对比测试。结果发现,市场上技术稍逊一筹的对手,比如 GPT-5.5 和月之暗面 Kimi K2.7,也能在测试中找出相同的漏洞。这证明越狱暴露的只是常规的网络防御工作,并不属于 Mythos 5 那种国家安全级别的威胁。

即便如此,为了通过商务部的审查,Anthropic 还是给 Fable 5 套上了更沉重的锁链。他们重新训练了1个安全分类器,专门拦截这类越狱行为。测试显示,新的分类器能拦截99%以上使用该越狱手法的尝试。随之而来的代价,就是对普通程序员的误伤。

程序员在进行正常的日常编程和调试时,部分良性请求可能会被系统误拦截。一旦请求被拦截,Fable 5 会通知用户,并将该请求转交给上一代模型 Opus 4.8。换句话说,模型变安全了,但对程序员来说,有时候会变笨。

在一封披露给路透社(Reuters)和《纽约时报》(The New York Times)的信件中,商务部长 Lutnick 表示,Anthropic 已通过深度配合解除了安全风险,不再需要额外的出口许可证,但美国政府保留随时重新评估并恢复出口管制的权利。白宫办公厅主任 Susie Wiles 也在社交平台上宣称,这是一场前所未有的政企合作胜利。

Fable 5 今天恢复全球服务。Mythos 5 自6月26日起仅对美国境内的部分机构重新开放,Anthropic 正通过一个名为“玻璃翼”(Glasswing)的计划,将访问权限逐步扩展到可信赖的网络安全防御研究人员。

Anthropic 还拉着亚马逊、微软(Microsoft)、谷歌(Google)等合作伙伴,起草一套给越狱评分的行业标准,按4个维度打分:解锁了多大能力,能用来干多少坏事,武器化有多容易,以及发现它需不需要专业知识。

为了时刻防范新的越狱威胁,Anthropic 不仅成立了24小时不间断的值班监控团队,还在黑客服务平台 HackerOne 上推出了赏金计划,邀请全球的民间黑客来寻找 Fable 5 的漏洞。Anthropic 自己也承认,造出完全无法越狱的模型“大概率不可能”,能做的是抢在攻击者前面找到漏洞并堵上。

这场禁令也彻底改变了 Anthropic 与华盛顿的关系。就在2026年3月,这家 AI 公司还因为被列入国家安全黑名单而起诉美国政府。当时,公司声称美国政府是因为他们拒绝配合开发自主武器和进行国内大规模监视而实施报复。现在,双方却开始深度绑定,Anthropic 甚至向美国政府承诺提供前沿模型的早期访问权。

Anthropic 首席执行官 Dario Amodei 呼吁国会尽快通过立法,建立统一的安全监管标准。他抱怨政府的决策速度太慢,就像《指环王》里行动迟缓的“树人”,光是打个招呼就要花上整整1天。如果法律跟不上 AI 指数级增长的速度,AI 很快就会从好玩的玩具,变成塞满数据中心的“天才军团”,从而威胁国家安全。

然而,过度的监管可能会产生反作用。前沿安全研究所(Frontier Security Institute)执行主任 Isaac Harris 担忧,如果美国对本土大模型施加过多限制,而来自竞争对手的 AI 产品拥有更少的限制,美国市场将面临困境。

如果美国开发者因为监管限制无法顺畅工作,或者外国用户被美国 AI 拒之门外,他们很可能会转身去使用那些缺乏安全限制的竞争对手模型。届时,美国构筑的安全防线将形同虚设。

~~~~~~

图源:NurPhoto / Contributor | NurPhoto

信源:Belanger, Ashley. "After spooking Trump into safety testing, Anthropic AI models get global release." Ars Technica, 1 July 2026