万益资讯网

真的被这一幕干沉默了……

2026-06-04 15:46:31 量子位置科技

最近微软推出一系列自研模型，其技术报告里面一张表格直接把我看呆了：

从零开始训练模型过程中，微软连续迭代了v2、v3、v4三个约600B参数的MoE模型，要知道600B参数都快和DeepSeek-V3（671B）一个量级了！

关键是，这三个模型基本就是拿来测试用的，并且分别做了这些迭代：

v2：用于验证新硬件、训练框架、容错等基础设施。

v3：主要优化路由（如切换到dropless MoE），继续基础设施测试。

v4：增加专家数、引入LatentMoE等，进一步测试更大规模和复杂架构。

这个过程消耗的算力可想而知！第一次这么直观地感受到，前沿AI已经是靠拼资源的游戏了。微软

阅读：4 点赞：0

猜你喜欢

微软发布全新量子芯片微软发布全新量子芯片当地时间6月2日，微软在旧金山举行的B

微软发布全新量子芯片微软发布全新量子芯片当地时间6月2日，微软在旧金山举行的B

2026-06-03 新儿论娱乐

标签：芯片微软旧金山量子芯片 it芯片

外媒：美国企业转向DeepSeek，寻求替代高价硅谷AI据纽约企业支出平台R

外媒：美国企业转向DeepSeek，寻求替代高价硅谷AI据纽约企业支出平台R

2026-06-05 英文头条

标签： deepseek ai 纽约硅谷人工智能

上周，OpenClaw创始人贴出了自己的Token使用量。（下图）他一

上周，OpenClaw创始人贴出了自己的Token使用量。（下图）他一

2026-05-29 互联带师阮一峰

标签： openclaw openai 程序员

有博主说小米MIMO大模型抄袭阿里千问目前，该爆料视频已删除，通过公开信息回答总

有博主说小米MIMO大模型抄袭阿里千问目前，该爆料视频已删除，通过公开信息回答总

2026-06-03 薇赏科技

标签：小米科技阿里巴巴千问

中美之间的算力差距到底有多大？根据公开的行业统计，中国总算力规模稳居全球第二

中美之间的算力差距到底有多大？根据公开的行业统计，中国总算力规模稳居全球第二

2026-06-04 芸仪阿搜

标签：算力芯片英伟达 it芯片

很多人应该都刷到过，Anthropic之前为了训练Claude，被曝出来搞了一个

很多人应该都刷到过，Anthropic之前为了训练Claude，被曝出来搞了一个

2026-06-03 西里森森

标签： anthropic Anthropic 图书馆斯蒂芬·库里

微软Build炸场！Windows正式成为AIAgent平台旧金山刚刚落幕

微软Build炸场！Windows正式成为AIAgent平台旧金山刚刚落幕

2026-06-04 亿点都不科技鸭

标签：微软 Windows ai 旧金山

量子计算迎来颠覆性飞跃！据媒体6月3日报道：微软直接甩出王炸新技术，在旧金山

量子计算迎来颠覆性飞跃！据媒体6月3日报道：微软直接甩出王炸新技术，在旧金山

2026-06-03 韩知

标签：微软量子计算旧金山芯片科学重器