断供警报拉响!谁能扛起国产算力"抗脆弱"大旗?
这两年,国产AI集群一路狂飙,从几十卡、上百卡,卷到了几百卡的超节点级别,谁性能高、谁堆卡多,一目了然。但真要问一句——万一哪天某家核心芯片突然断供、软件栈出问题了,谁家的系统还能顶得住不出事?
这才是国产算力真正的“下半场命题”——抗脆弱能力。
现在很多顶尖AI集群,典型的像昇腾384围绕单一软硬件体系打穿,生态闭环好是好,效率也高,前期跑得很快。但反过来讲,如果这个“闭环”被掐了一环呢?
相比之下,另一种更“耐造”的路径也在成型。现在浪潮、中兴……现在越来越多厂商开始走开放架构,兼容不同芯片,适配主流生态,哪怕起步慢一点,也是在“构筑冗余”。不把鸡蛋放一个篮子,是所有国家级基建都该具备的基本素养。
又比如最近刚上新的640卡超节点,虽然看上去是性能猛,密度、规模比384还翻了几个台阶,但底层的多芯片、多系统支持才是更大的看点。哪家芯片掉链子,它可以临时换备胎。这种灵活性,不是堆性能能解决的。
国家政策层面其实早就点了这个题:“多元算力融合”、“建设融合算力中心”、“提升资源利用率”,这些都是在为国产算力生态的抗脆弱能力打地基。不是某一家,而是整个体系该往这条路走。