近期,深圳河套学院AI训练平台项目团队,联合哈尔滨工业大学(深圳)、深圳市大数据研究院、华为等多方团队,依托深智城AI算力平台开展联合技术攻关,顺利完成超大规格AI大模型的全参数训练任务。
本次攻关全程依托昇腾910C国产AI算力集群,成功实现1.6万亿参数大模型DeepSeek-V4-Pro的全参数后训练,且训练过程稳定高效,完成1500步以上长稳训练,模型计算利用率稳定超30%,关键算子效率实现显著提升。这也是公开可查范围内,全球第三方机构首次基于纯国产算力平台完成该级别万亿级大模型的完整训练实践。
AI技术应用分为两个核心环节,难度差别极大。普通的模型调用、业务推理难度较低,而从零开展全参数大模型训练,对芯片算力、硬件稳定性、配套技术体系要求极高,长期以来是高端AI技术的核心壁垒,也一度被海外算力技术垄断。
此次成功训练万亿级大模型,有着标志性意义。它直接印证了国产AI芯片和算力集群,完全具备支撑世界级超大参数模型训练的能力,彻底验证了国产算力训练顶级大模型的技术可行性,打破了“国产算力只能做基础应用、无法攻坚高端训练”的固有认知。
同时,本次多方产学研协同攻关的模式,也为国内AI产业发展积累了成熟的工程经验,为后续更多超大模型自主训练、AI技术国产化迭代提供了可靠路径。这一突破进一步夯实了我国AI产业自主可控的发展基础,助力摆脱海外算力技术依赖,推动国产人工智能产业迈入高质量、自主化发展新阶段。