HBM主导地位与内存墙 | AI生成和翻译

Home 2026.06

问题: 为什么SK海力士在AI时代如此重要?仅仅是内存容量的问题,还是另有更深层次的原因?竞争格局又是怎样的?

回答:

SK海力士的重要性不在于内存容量,而在于内存带宽瓶颈,并且他们是解决这一问题的全球领导者。

内存墙问题

在AI基础设施中,“内存墙”已成为技术进步的主要障碍,因为内存速度无法跟上处理器的发展步伐。以下是这对你工作的重要性:

当你在MI300X上训练模型时,GPU能以约192 TFLOPS的算力执行浮点运算,但从内存中提取数据的速度受限于内存接口。标准DDR5甚至GDDR6内存速度太慢——数据吞吐量成为瓶颈,而非算力。

HBM(高带宽内存) 通过使用硅通孔(TSV)垂直堆叠DRAM来解决此问题,可实现约1-10 TB/s的带宽。SK海力士的HBM3每堆叠可提供约460 GB/s的带宽。这对以下至关重要:

从2024年第一季度到2025年第四季度,HBM在所有AI芯片组件支出中的占比从52%上升至63%——超过了逻辑裸片(英伟达GPU的占比从14.2%下降至12.9%)。这并非炒作;AI基础设施支出正围绕内存进行重构。

SK海力士的竞争优势

市场地位: SK海力士保持着最明确的HBM领导者地位,与英伟达的整合最为紧密。他们已大规模出货HBM3,并完成了HBM4的开发,其带宽是上一代的两倍,能效提升超过40%。

下一代创新: SK海力士即将推出的iHBM(集成HBM5,计划2029年+发布)将冷却直接置于热量集中的Die-to-Die物理层内部,热阻降低30%。这至关重要——在1TB/s的吞吐量下,热管理已成为工程现实。

战略合作: 英伟达和SK海力士宣布了针对下一代内存的多年联合工程合作,该消息在数小时前刚刚公布。这标志着深层结构性协同,而非交易性供应。

竞争对手

三星: HBM4E样品已出货,但在良率、可靠性、热行为、供应量和产品路线图对齐方面仍在追赶。他们有潜力但落后于人。

美光: HBM领域的较小玩家。专注于消费级/DRAM;尚未成为AI内存领域的重要力量。

真正的竞争态势: 对于初创公司构建加速器、推理盒或专用服务器而言,内存访问、供应承诺和功耗表现可能决定产品能否以成本和规模出货。这正是英伟达与SK海力士携手的原因——没有HBM供应保障,就无法出货AI加速器。

这对你的意义

如果你在规模化训练模型,你已经在承担HBM的成本。MI300X的192GB HBM3并非摆设——它是实现146B参数模型所需5.3TB/s吞吐量的唯一途径。在智能体AI时代,CPU的重要性将提升,且向边缘设备的扩展很可能发生,单个AI推理服务器所需的DRAM容量将增加一倍以上。这意味着以内存为中心的架构问题正从训练GPU扩展到推理和边缘部署。

如果你正在构建需要规模化运行推理的智能体或系统,尽早理解内存瓶颈将有助于架构决策——无论是针对数据中心还是边缘部署。


参考文献:


Back Donate