说实话,之前对国产U我一直持保留态度。但这次智博会仔细看了海光双芯表现,事情确实在起变化。
先说他们现在的打法:CPU做通用基座,DCU专攻AI推理。现场聊下来,深算DCU跑MoE模型架构确实有心得。现在大模型都往MoE+CoT方向走,对显存带宽和调度要求极高,不是单卡堆算力能解决的。海光DCU能支撑十亿到万亿参数大模型训练,这一点就卡住生态位了。
说实话,海光在生态开放上走得一直比较彻底,毕竟开放HSL总线协议,不是一般厂商可以做到的。这一点的好处也显而易见。
以前买国产卡,想组集群最大的槛就是互联——你买A家的卡,只能配A家的互联方案,生态锁死,组完还不好用。海光把互联标准打开了,产业上下游伙伴都可以基于HSL实现系统连接,多卡通信损耗能降一大截。
再一个,DTK软件栈迭代到26.04版本,已经能稳定跑10万亿参数模型,集成2000+算子,兼容100+主流AI框架,MLPerf多项测试达国际领先水平。
国产算力的春天什么时候来?就是码农不用当适配工具人的那天。海光这一步,踩在点子上了。
海光信息 DCU 智博会 AI芯片 大模型

