万益资讯网

余承东接手盘古后第一句话就是“字典里没有第二,只有第一”。但现实是,华为算力优先

余承东接手盘古后第一句话就是“字典里没有第二,只有第一”。但现实是,华为算力优先给了外部,自己训练卡有限,所以没卷万亿参数。这次开源盘古2.0,总参505B但只激活18B,512K上下文配合MoE架构,明显是走效率路线。加上30B端侧模型秋天上麒麟芯,华为想靠全栈调优突围,这很“华为主”。 余承东谈盘古大模型目标