国产大模型编程杀到全球第二了今天凌晨，全球权威AI编程榜单Code Aren

2026-05-26 19:21:07 亿点都不科技鸭科技

国产大模型编程杀到全球第二了

今天凌晨，全球权威AI编程榜单Code Arena更新排名，阿里最新旗舰Qwen3.7-Max：1541分，仅次于Claude系列，把GPT-5.5、Gemini-3.5-Flash等国际模型甩在了后面！
这还是‌唯一破1540分的国产模型‌，全球总榜排第四，直接把Claude Opus 4.6都比下去了！

给大家科普下这个榜单有多“硬核”：
不是考算法题，而是要从零写出完整可交互的Web应用，开发者匿名PK投票，没法刷榜，比benchmark可信多了，被称为“AI编程界的奥运会”一点不夸张！

Qwen3.7-Max到底牛在哪？：
阿里拿它做了个极限测试——在全新发布、连文档都没给全的平头哥真武M890芯片上，从零优化AI推理内核！
连干35小时，调用了1158次工具，做了432次内核评估，从编写、编译到性能分析全自己搞定，最后优化完直接比官方参考实现快了10倍！
这种长周期复杂任务，其他模型可能早就上下文乱套了，但是它30小时之后还能自己主动重构架构，妥妥的能独立干活的程序员。

从3.5到3.7，阿里三个月更三次，现在已经能支持千次工具调用、35小时不崩，再往下发展，真的离“AI自主写项目”不远了，以后小团队一个模型就能搞定开发不是梦？
现在主要通过API开放，想要尝鲜的朋友可以蹲蹲阿里云官方消息！为国产大模型点赞！🎉

国产大模型 AI编程阿里千问