万益资讯网

播客速读 AI硬件供应链瓶颈深度对话 开篇在这段访谈中,主持人围绕当前AI硬件供

播客速读 AI硬件供应链瓶颈深度对话

开篇在这段访谈中,主持人围绕当前AI硬件供应链的诸多瓶颈提出问题,嘉宾则从高带宽存储器(HBM)到DRAM、闪存、先进封装、光子学、电力散热以及关键材料等层面展开分析,并分享了对行业技术走向与投资机会的看法。对话信息密度极大,涵盖从上游晶圆到终端系统的完整链条,是一次兼具技术深度与市场视角的深度交流。

重点内容

一、HBM与DRAM的供给瓶颈与定价逻辑

**1. HBM本质是堆叠式DRAM,供应并非外界认为的那样紧绷**在被问及HBM的供应是否紧绷以及观点差异时,嘉宾指出认为供应紧绷的人往往不了解其制造工艺。HBM(本义为高带宽存储器,本质上就是堆叠式DRAM)可以在多余的DRAM晶圆上进行堆叠封装,而当前约60%的DRAM晶圆产能已被转用于AI用的HBM。

**2. DRAM价格因需求转移而飙升,HBM的定价能力相对较弱**嘉宾解释,DRAM的价格之所以出现剧烈上涨(16GB内存条从约100美元涨至约1000美元),是因为制造商像操纵卡特尔的联盟一样故意控制供应以维持高价,一部分市场的晶圆被抢占用于HBM等AI需求,导致整体供应收缩。尽管HBM的定价被认为处于中等偏低水平,但其定价能力仍不及传统DRAM。

**3. 核心供应商集中在三星、SK海力士,质量领先**嘉宾提到,目前HBM的主要供应商是三星和SK海力士,二者的产品质量被认为最佳;美光也生产部分HBM,但在市场上采购的企业会优先选择能获取的任何来源。嘉宾进一步指出,新增利润的约60%来自普通DRAM和DDR内存,而非HBM,这解释了供应商在定价策略上更倾向于传统DRAM。

二、NAND/Flash与新型高带宽存储的崛起

**1. 高带宽闪存(HBF)尚未存在,有望在一到两年内实现市场垄断**在被问及高带宽闪存的进展时,嘉宾表示HBF目前尚未存在,可能是最严重的瓶颈;SanDisk和SK海力士预计将在进入市场时获得约一到两年的垄断地位,预计将在今年年底获得样品,明年第二季度左右进入量产阶段。

**2. 闪存比DRAM便宜约55倍,潜在成本优势显著**嘉宾指出,当前DRAM价格极高,而闪存目前只有DRAM约1/55的成本;如果把闪存用在AI推理场景,可用更少的硬件实现相近的带宽,而成本优势可以弥补性能的差距。

**3. 写可靠性问题在推理场景下不构成根本障碍**针对业界担忧闪存在GPU加速器中的可靠性衰退,嘉宾认为这一问题会随着硬件改进和软件纠错方案得到缓解;在AI推理场景下,权重只需加载和读取,无需频繁重写,长期来看不会成为根本性障碍。

三、先进封装——摩尔定律的新延伸

**1. 封装技术正成为提升计算能力的关键路径**在被问及为何封装如此重要时,嘉宾强调,当晶体管尺寸已接近物理极限时,提升芯片面积和堆叠层数成为维持算力增长的主要手段,封装正在成为新的摩尔定律。

**2. 台积电CoWoS与英特尔EMIB的竞争格局**嘉宾指出,台积电的CoWoS(晶圆级封装)目前产能已被预订约60%,主要来自英伟达的GPU需求,剩余份额分配给AMD等其他公司;而英特尔的EMIB(嵌入式多芯片互连桥)在先进封装领域也在加速推进。嘉宾把两者的对比比作"半挂卡车与法拉利",认为台积电暂时领先但英特尔正在急剧追赶。要在台积电获得先进封装产能,可能需要等待到约2028年。

**3. 台积电过于保守将导致市场份额流失**嘉宾批评台积电在先进封装产能扩张上过于保守,这正是造成当前内存问题的根本原因;认为台积电需要将其晶圆产能翻倍。

四、光子学与共封装光学的技术挑战

**1. 硅光子学和共封装光学器件对高质量激光器的需求**在被问及光子学的发展时,嘉宾说明,用于共封装光学(CPO)的高速激光器需要具备最小的噪声和最窄的波长,目前Lumentum等公司的产品质量最高,但成本高昂。

**2. 供应链紧张导致价格处于中等水平**嘉宾指出,激光器的采购价格目前居中,采购工作已基本完成,但由于缺乏同等质量的竞争对手,短期内价格难以下降;大规模部署仍需等到明年年初,届时可以在数据中心看到实际效果。

**3. 激光器可靠性问题需在部署后更换**嘉宾强调,激光器在系统部署期间很可能出现故障,需要更换;这将创造持续的需求,因为能够提供同等质量激光器的竞争对手极少。

五、电力、散热与基础设施的紧迫需求

**1. 电压架构正向800V直流迁移**在被问及电力传输的趋势时,嘉宾表示,数据中心正从传统的48V直流向800V直流架构转变,以降低传输损耗并提升机架间输电效率;这需要变压器和逆变器来实现机架间的800V输电。

**2. GPU功耗增长迅速,散热面临挑战**嘉宾指出,GPU功耗并非每年增长10-20%,而是每代翻倍;Rubin(约2200瓦)和Feynman(约4400瓦)的功耗数据已经表明这一趋势,预计下一代Feynman之后的产品功耗将接近5900瓦。这使现有的散热方案(包括液冷和直接芯片冷)面临极大压力。

**3. 散热方案尚无可靠答案**嘉宾指出,虽然多家公司正在研究800V电压下的散热技术,但在功率提升到4.5千瓦以上时仍缺乏可靠的降温方案;液冷设备目前不紧缺,但这是一个一至两年后将变得关键的问题,届时先进制程的芯片将面市。嘉宾看好Flex公司在数据中心冷却方案上的技术布局,包括800V电压下芯片和变压器的冷却解决方案,但其路线图仅延伸到约5兆瓦,超过此功率目前尚无解决方案。

六、其他关键组件与材料及行业投资视角

**1. 高频PCB和ABF基板的结构性短缺**在被问及印刷电路板(PCB)供给时,嘉宾指出,用于先进封装的PCB需要多层、信号完整性极佳,但日本和台湾仅有少数几家公司能够大规模生产,导致高质量PCB供不应求。Vera Rubin Ultra最初计划使用四颗reticle die拼接,但现改用两颗通过PCB通信的reticle die。此外,PCB材料(用于屏蔽不同层的玻璃纤维)价格已经飙升,全球仅有至多一两家日本公司能够供应这些材料,构成真正的结构性短缺。

**2. 嘉宾对几家公司的投资偏好**在被问及个人投资看法时,嘉宾表示非常看好英特尔,认为其在18A制程上的封装技术以及背面供电设计可以在功耗方面实现对台积电的超越——因为现在功耗效率比晶体管密度更重要,而英特尔在功耗性能上占据优势,这也是苹果选择英特尔用于笔记本电脑的原因;同时对Flex在数据中心冷却方案上的技术布局持积极态度;此外,他提到仍保留对英伟达的长期关注,因其在GPU市场的主导地位短期难以动摇,但同时批评英伟达近年创新放缓,许多新功能似乎是在复制专业竞争对手的方案。

写在最后

**总体感受**本场访谈信息量极大,覆盖了从存储、封装、光子学到电力与散热等AI硬件全链条的关键瓶颈。嘉宾对技术细节的深入阐释以及对供应链结构、定价逻辑的判断,为理解当前AI硬件的供需紧张提供了系统视角。尤其是关于HBM、DRAM、闪存在成本与性能之间的权衡,以及封装与光子学在未来的成长空间,都具有较高的参考价值。

**值得关注的方向**1. **DRAM定价走势**:需密切关注三星和SK海力士是否扩大产能,或面临客户转向中国替代厂商(如CXMT或合资企业)的压力。2. **高带宽闪存(HBF)的商用化进度**:其产能落地时间、成本优势以及对DRAM市场的潜在冲击值得持续跟踪;预计今年年底将有样品明年第二季度实现量产。3. **大规模散热解决方案**:随着GPU功耗向5千瓦以上级别迈进,相关散热技术将成为关键瓶颈,目前鲜有明确解决方案。