瓶颈转移,布莱克威尔规模化 | AI生成和翻译
在过去一年中,NVIDIA Blackwell架构(B200、GB200)的生产堪称工业规模化的典范,同时也揭示了一个道理:瓶颈只是转移而非消失。
如果说Hopper系列(H100)定义了2023-2024年,那么过去12个月(2025年中至2026年中)则是由向Blackwell大规模、复杂的过渡所定义。以下是台积电(TSMC)及供应链如何应对这一转变的过程。
1. 从单芯片到超级芯片(复杂度的鸿沟)
台积电过去一年面临的最大挑战并非仅仅是产量,而是架构的彻底变革。
| 特性 | Hopper (H100/H200) | Blackwell (B200/GB200) |
|---|---|---|
| 逻辑设计 | 单芯片(1个Die) | 多芯片(2个GPU Die + 1个CPU) |
| HBM内存 | 80–95 GB HBM3e | 192 GB HBM3e |
| 封装 | 标准CoWoS | CoWoS-L(先进2.5D/3D) |
| 互连 | NVLink | NVLink C2C(芯片间互联) |
制造一块Blackwell GB200“超级芯片”意味着台积电需要生产两个巨大的GPU Die和一个Grace CPU,用超高速硅桥连接它们,并在顶部堆叠八块高容量HBM3e内存芯片。这一过程比上一代更容易出现故障。
2. 瓶颈的演变(2025-2026年)
在Hopper时代,瓶颈是CoWoS产能。而在Blackwell时代,瓶颈变成了“复合约束”:
- 先进封装(CoWoS): 台积电自2023年底以来成功将CoWoS产能扩大了约十倍。到2026年中,先进封装的月产量已达到约12万至13万片晶圆。然而,由于Blackwell物理尺寸巨大且结构复杂,它占用了生产线上的“地面空间”,相比于更小、更简单的Die,实际可处理的芯片总数反而减少了。
- HBM3e短缺: 每个Blackwell GPU需要192 GB的HBM3e。这种特定内存(主要来自SK海力士和美光)的全球产能已在2026年底前被全部预订。NVIDIA当前的产量天花板取决于能够获得多少HBM,而不仅仅是台积电能生产多少硅晶圆。
3. 过去一年的生产里程碑
- 2025年底(产能爬坡): Blackwell实现量产。NVIDIA报告称Blackwell的销售“打破纪录”,云服务提供商完全吃下了台积电能够交付的每一块芯片。
- 2026年初(美国制造): 一个重要的里程碑是,首批NVIDIA Blackwell晶圆在美国本土——台积电亚利桑那工厂(Fab 21)成功生产。虽然这还不是主要的产量来源,但标志着供应链多元化战略的开端。
- 2026年中(转向GB300): 截至2026年6月,台积电已开始转移重心。“标准版”Blackwell(B200)正成为成熟产品,行业当前正在将产能过渡到Blackwell Ultra(GB300)系列,该系列提供更高的性能和内存密度。
总结:数据一览
行业分析师估计,尽管Hopper的产量在2024年达到峰值,但Blackwell在总计算性能交付上已超越前者。尽管复杂度更高:
- Blackwell现已成为主导平台,占NVIDIA 2026年高端出货量的70%以上。
- 晶圆成本大幅上涨。 随着3nm制造成本上升以及Blackwell芯片本身巨大的尺寸,每片晶圆的成本显著增加,这也解释了NVIDIA对B200/GB200系统收取高溢价的原因。
台积电在短短一年内将Blackwell从复杂工程设计方案转化为大规模生产的“机架级”系统,这被认为是历史上最成功的大规模技术部署之一——尽管供应仍然“受限”,以至于2027年之前的产能已全部售罄。