丽莎·苏如何拯救AMD | AI生成和翻译
问题:Lisa Su 是如何拯救 AMD 的?
回答:
Lisa Su 于 2014 年 10 月接任 CEO 时,AMD 已濒临死亡——股价约 2-3 美元,负债约 10 亿美元,在与 Intel 和 Nvidia 的竞争中不断萎缩。以下是实际的扭转机制。
1. 将所有赌注押在一个架构上:Zen。 在 Zen 之前,AMD 的 Bulldozer 架构是一场灾难——核心数虽高但 IPC(每周期指令数)极差,惨败给 Intel 的 Core 系列。Su 将稀缺的研发资金重新投入到由 Jim Keller 领导的从零开始的设计中。Zen(2017 年)相比前一代实现了约 52% 的 IPC 提升,这是一个巨大的单代飞跃。这是扭转过程中最重要的技术决策。
2. 小芯片(Chiplets)——结构性洞察。 这是值得深入理解的部分。AMD 没有构建一个大的单片式芯片,而是将 CPU 拆分为多个小芯片(CCD),通过 Infinity Fabric 连接,并配备独立的 I/O 芯片。这在经济上为何重要:
- 良率随芯片面积增大而急剧下降。每片晶圆上的缺陷大致呈泊松分布,因此大芯片包含致命缺陷的概率高得多。更小的芯片 → 良率显著提高 → 每颗可用芯片的成本降低。
- 可以混合使用工艺节点——计算小芯片采用尖端 TSMC 工艺,而便宜的 I/O 芯片则使用较旧节点。
- 同一个小芯片设计只需改变封装数量,即可从桌面(Ryzen)扩展到服务器(EPYC)再到 Threadripper——设计成本大幅摊销。
这使得一家资金短缺的公司能够比 Intel 更经济,而 Intel 受困于 10nm 工艺的单片式芯片良率严重受损。AMD 本质上是靠封装策略取胜,而不仅仅是晶体管。
3. 将制造外包给 TSMC。 Su 完全转向无晶圆厂模式,借助 TSMC 的工艺领先优势(7nm,随后 5nm),而 Intel 自己的晶圆厂在 14nm/10nm 上停滞多年。这使 AMD 的竞争力与其自身制造脱钩——恰好在 Intel 失误的时间窗口内形成了结构性优势。
4. EPYC 与数据中心利润率。 消费级 Ryzen 重塑了品牌,但利润来源于 EPYC 服务器芯片。小芯片让 AMD 在每插槽上拥有多达 64 个核心,而 Intel 则远低于这个水平,数据中心带来了支撑其他一切的高利润率。AMD 从约 2% 的服务器市场份额成长为重要玩家。
5. 纪律与专注。 她消除了干扰,偿还了债务,并让公司严格执行一个紧凑的多年路线图,且按时完成——这在半导体行业实属罕见。
结果:股价从约 2 美元(2014 年)升至远高于 100 美元,市值一度超越 Intel,如今 AMD 凭借 MI300X/MI300A 成为 AI 加速器领域可信的第二名——这正是你在训练 GPT-2 时使用的硬件。鉴于你在 MI300X(192GB HBM3)上运行工作负载,你直接受益于这次扭转:AMD 之所以拥有重要的数据中心 GPU 业务,正是因为 Zen/小芯片/TSMC 战略创造了现金和信誉,从而为 Instinct 提供了资金。
给构建者的元启示:AMD 并非通过以 Intel 的方式击败 Intel(单片式芯片、自有晶圆厂)而获胜。它改变了竞争轴心——小芯片和无晶圆厂杠杆——使其自身限制转化为优势。这是一次根本性的重新架构,而非渐进式改进。