【Qwen3.7-Max登场,智能体时代核心基座模型来了】
快速阅读:Qwen3.7-Max 正式发布,旨在成为智能体时代的基座模型。它在编程、通用智能体及高难度推理任务上表现出色,甚至在长达 35 小时的自主内核优化实验中,实现了 10 倍的性能提升。
Qwen3.7-Max 来了。
它不再只是个聊天窗口,更像是一个能接手复杂工程的数字员工。在编程智能体测试中,它在 SWE-Pro 等多个维度拿到了领先分数,甚至能像资深工程师一样处理多文件工程。
有意思的是它在“长程任务”上的表现。很多人担心模型跑久了会“断片”或者逻辑漂移,但它在长达 35 小时的自主内核优化实验里,通过上千次工具调用,硬是把一个从未见过的硬件平台算子优化了 10 倍。这种在未知环境里的泛化能力,大概是它最硬核的地方。
有网友提到,现在的模型如果只会“一本正经胡说八道”那是没用的,能说“我不知道”才叫靠谱。Qwen3.7-Max 在设计上更强调这种稳定性,通过强化学习监控奖励作弊,确保它在长周期任务中不会为了完成任务而“投机取巧”。
不过,这种能力也带来了一个现实问题:随着模型越来越像“人”,它对算力的胃口也越来越大。对于想要在本地跑起这种级别的智能体的开发者来说,内存和带宽可能很快会成为新的瓶颈。
它现在通过阿里云百炼提供 API,支持保留思维链,这对于构建复杂的智能体工作流非常关键。
qwen.ai/blog?id=qwen3.7
