按照DeepSeek V4论文的结论,目前国产GPU的算力普遍在1000-2000TFLOPs,在FP8精度下,只需要163~326GB/s的卡间互联即可满足模型要求。而当下国产GPU的卡间互联带宽普遍在200~400GB/s,DeepSeek V4彻底解放了国产算力生产力,彻底打开国产算力的澎湃需求。
按照DeepSeek V4论文的结论,目前国产GPU的算力普遍在1000-2000TFLOPs,在FP8精度下,只需要163~326GB/s的卡间互联即可满足模型要求。而当下国产GPU的卡间互联带宽普遍在200~400GB/s,DeepSeek V4彻底解放了国产算力生产力,彻底打开国产算力的澎湃需求。