9月29日DeepSeek-V3.2-Exp模型发布。作为迈向新一代架构的中间

草吃羊吃狼 2025-09-30 09:38:50

9月29日DeepSeek-V3.2-Exp 模型发布。作为迈向新一代架构的中间步骤，引入了 DeepSeek Sparse Attention（一种稀疏注意力机制），在几乎不影响模型输出效果的前提下，实现了长文本训练和推理效率的大幅提升。得益于新模型服务成本的大幅降低，官方 API 价格也相应下调，百万token的输入价格4元->2元（缓存未命中）/0.5元->0.2元（缓存命中），输出价格12元->3元。

当日寒武纪与昇腾均已实现对DeepSeek-V3.2-Exp的适配，寒武纪开源了大模型推理引擎vLLM-MLU源代码。昇腾针对DeepSeek-V3.2-Exp架构中两个全新的算子针对性地进行算子Tiling设计、Cube核与 Vector核间的流水优化、计算流程的实现优化等，模型和融合Kernel均已开源。

deepseek的架构创新以及国产算力的迅速适配彰显国内AI软硬件实力，模型大幅降本有利于AI应用加速落地，day 0适配和优化彰显了国产芯片的生态建设和技术积累成果，芯片和算法的联合创新，软硬件协同方式将进一步加速国内AI产业发展。

相关板块是国产算力、AI应用 AI Agent

0 阅读：0

草吃羊吃狼

感谢大家的关注

作者最新文章

1

明天一号了去乡下找我的托尼老师来理个头发，在想要不要换个发型你们给个意见

2

多年战斗的老铁汁中秋节给寄了这么多盘手别说，这香港美心月饼还真挺好吃[haha]

3

尾盘搞了些OPENAI的概念股过国庆了。盯了一天盘好累了。去睡一觉股票狗终于可以

4

这个行情一定要搞阳谋，明牌的。偏门搞不得几百亿市值的能涨停，几十亿的一动不动

5

中午在撸铁，看着自己的脚丫子，突然发现一个很严重的问题人类一直在进化，唯独这个脚

6

盘面波动还是挺大的目前银行还是跌的，这个老登跌盘面波动大没事主力调仓换股什么的

7

干啥也别满仓小票原因是对10次只要一次踩雷就挂了。

8

9月29日DeepSeek-V3.2-Exp 模型发布。作为迈向新一代架构的中间

9

9、29.上市公司公告大全

10

【热点前瞻】重构知识结构推进国家智慧教育平台全面深化应用相关概念股有魅视科技(0

热门分类

财经TOP

1

给我一亿，还你十亿，这些股炸了：1、岩山科技；2、寒武纪-U；3、数据港；4、利

2

美国为何不直接冻结中国在美资产？就这么说吧，美国要是真冻结了，反而是帮了中国一把

3

9.5热门股票技术分析1、太平洋：两阳夹一阴，上涨趋势2、岩山科技：顶部结构，落

4

9月21号，星期日，热门人气自查！！上海建工:巨额封单，还有低点美的集团:回

5

意料之中泰国宣布了9月23日，财联社报道，泰国突然宣布8月汽车产量同比下降

6

明年开始，纯电动车出口要实施出口许可证管理了出口量这么大，加强管理势在必行新能源

7

炒股养家必须具备的条件。一、本金1.一线城市：至少100万+2.二三线城市：

8

曾经有一个摆脱做牛马的机会却没有抓住，还是继续搬砖吧🧱药捷安康不到3个月股价涨

9

刷到央视财经对话魏建军的预告，感触很深。当好多人都挤在“油电同价”的独木桥上搞

10

想知道中国新能源出口欧洲卖多贵不？[思考]国内11.98万起的领克01，在欧洲得

财经最新文章

1

人形机器人概念龙头龙头梳理题材概念驱动事件：宇树科技预计10月至12月间提交上

2

固态电池【五巨头】第一强：宁德时代——"宁王"稳如老狗技术狠活：凝聚态电

3

刷到央视财经对话魏建军的预告，感触很深。当好多人都挤在“油电同价”的独木桥上搞

4

AI智能体概念核心龙头股有哪些:● 科大讯飞：语音及多模态AI的全球领导者，星火

5

王思聪大概率不回国啦！可不是因为那20亿欠款，也不是王健林卖了48座万达，关

6

明年开始，纯电动车出口要实施出口许可证管理了出口量这么大，加强管理势在必行新能源

7

据报道，路虎每日停产损失高达500万英镑（约合4700万人民币）至1000万英镑

8

1999！如果财力雄厚，那肯定买四个

9

感谢来总，一天600多也是创近期新高了

10

英国金融时报最近报道了，中国星际之门，说明整个西方世界都在看中国的算力崛起这篇报