万益资讯网

SuperCLUE最新中文大模型测评结果出炉,全球第一梯队被海外模型牢牢占据,国

SuperCLUE最新中文大模型测评结果出炉,全球第一梯队被海外模型牢牢占据,国产表现最好的三款模型,只能在全球第五名的位置上激烈竞争。

本次测评覆盖21款国内外主流模型,测评集包括六大任务:数学推理、科学推理、代码生成、智能体(任务规划)、精确指令遵循、幻觉控制,共492题。

Gemini、GPT-5.5、Claude-Opus、Gemini-Flash四款海外模型稳居前四,形成难以撼动的第一梯队。

DeepSeek-V4-Pro、Qwen3.7-Max、豆包Seed 2.0 Pro三款国产模型分数非常接近,组成国内第一梯队,全球排名集中在第五位附近,成为国产第一集团。

PS:假设我们放开应用市场的话,结果会如何?科技AI