万益资讯网

国产大模型编程杀到全球第二了 今天凌晨,全球权威AI编程榜单Code Aren

国产大模型编程杀到全球第二了

今天凌晨,全球权威AI编程榜单Code Arena更新排名,阿里最新旗舰Qwen3.7-Max:1541分,仅次于Claude系列,把GPT-5.5、Gemini-3.5-Flash等国际模型甩在了后面!
这还是‌唯一破1540分的国产模型‌,全球总榜排第四,直接把Claude Opus 4.6都比下去了!

给大家科普下这个榜单有多“硬核”:
不是考算法题,而是要从零写出完整可交互的Web应用,开发者匿名PK投票,没法刷榜,比benchmark可信多了,被称为“AI编程界的奥运会”一点不夸张!

Qwen3.7-Max到底牛在哪?:
阿里拿它做了个极限测试——在全新发布、连文档都没给全的平头哥真武M890芯片上,从零优化AI推理内核!
连干35小时,调用了1158次工具,做了432次内核评估,从编写、编译到性能分析全自己搞定,最后优化完直接比官方参考实现快了10倍!
这种长周期复杂任务,其他模型可能早就上下文乱套了,但是它30小时之后还能自己主动重构架构,妥妥的能独立干活的程序员。

从3.5到3.7,阿里三个月更三次,现在已经能支持千次工具调用、35小时不崩,再往下发展,真的离“AI自主写项目”不远了,以后小团队一个模型就能搞定开发不是梦?
现在主要通过API开放,想要尝鲜的朋友可以蹲蹲阿里云官方消息!为国产大模型点赞!🎉

国产大模型 AI编程 阿里千问