万益资讯网

唐杰谈AGI开放竞争 这两天发生的一件事,让我不得不重新思考开源模型的价值,因为

唐杰谈AGI开放竞争

这两天发生的一件事,让我不得不重新思考开源模型的价值,因为真的太魔幻了......

大家应该都刷到了,Anthropic发布的Claude Fable 5,上线仅72小时,就被一纸出口管制指令砸下来,要求立即切断所有外国国民对Fable 5和Mythos 5的访问权限。

所有外国国民,无论你在美国境内还是境外,甚至包括Anthropic自己公司里的非美籍员工。

Anthropic说,他们目前没办法在全球范围内精确识别谁是受限对象、谁不是,所以只能选择对所有人关闭。

就这样,一个发布不到三天的行业旗舰模型,全球下线。

Anthropic自己在声明里说了一句话,大意是,政府的决定建立在「严重的误解」之上。但不管是不是误解,结果已经摆在那了:全球所有依赖Fable 5的开发者,工作流全部中断。

我们再来看今天发生的另一件事。今天,就在Fable 5被强制下线不到24小时之后,智谱宣布GLM-5.2全量开放。

时间定在今晚5:21,覆盖GLM Coding Plan的所有级别,Lite、Pro、Max、团队版全部拉平。

没有灰度、没有排队、没有内测码。API下周上线,模型权重下周开源,MIT协议,可商用,可私有化部署,可二次微调。

智谱在发布信里写了一句话:在一些前沿模型突然变得不可用的时刻,我们选择相信另一条路。

那GLM-5.2本身到底怎么样?

先说最核心的一点:1M上下文,而且官方强调了四个字,真正可用。

行业里有个公开的秘密:很多模型标称的上下文长度和实际能用的长度之间,存在巨大的落差。标称128K,跑到80K就开始丢信息。

GLM-5.2把这个当核心卖点,说明在长程任务上做过了大量工程验证。对于需要处理整个代码仓库、长文档分析、多轮复杂对话的场景来说,是非常刚需的。

再说代码能力。GLM-5系列从出生就是冲着Coding来的。

今年2月GLM-5发布时,SWE-bench-Verified 77.8分、Terminal Bench 2.0 56.2分,都是当时开源模型最高分。

3月的5.1版本,官方展示过一个案例:给它一个任务指令,它自主运行了8小时,在向量数据库优化上跑了655轮迭代,把查询吞吐提升到初始版本的6.9倍。

到了5.2这一代,智谱说,这是他们心目中最强的国产Coding模型。

但以上这些技术细节都不是今天这篇文章最想聊的。

我最想聊的是开源。

昨天的事情给了所有人一个极其直观的教训。Fable 5的技术指标没有任何问题,Anthropic的工程能力毋庸置疑,但这些都挡不住一个事实:一封政府信函就能让它在全球范围内消失。

你基于它搭建的产品、你写好的工作流、你客户正在使用的服务,72小时之内可以全部归零。

但开源模型从根本上解决了这个问题。MIT协议的意思很简单:权重是你的,代码是你的,你拉到自己的服务器上,没有人能半夜把你的东西收回去。

这也是为什么最近半年,全球范围内对开源大模型的需求在快速增长。不是因为开发者突然变理想主义了,而是因为他们被现实反复教育了。

Fable 5的事只是最新的一课,不会是最后一课。

以GLM-5.2为例,开源意味着一个百万级上下文、代码能力对标前沿水平的模型,你不仅可以通过云端API调用,还可以下载权重自己部署。

对数据不能出境的企业、对隐私有硬性合规要求的客户、对模型需要深度定制的垂直场景,这几乎是唯一的路。

就在全球开发者因为Fable 5下线而手忙脚乱地找替代方案的时候,一个同等量级的开源模型说:我来了,全量开放,下周开源,MIT协议,随便用。

今晚5:21,GLM-5.2全量开放。好不好用,都值得去亲自试一下。