谁构建了PyTorch分布式 | AI生成和翻译

Home 2026.06

问题: Andrew Tulloch 是 PyTorch 分布式训练模块(torch.distributed)的开发者吗,还是由其他人构建的?

答案:

简短回答:不是 Tulloch。他是 PyTorch 生态系统的传奇人物,但 torch.distributed / DDP 是由 Meta 的另一个团队构建的。

谁实际构建了 torch.distributed / DDP

权威参考是 VLDB 2020 论文 PyTorch Distributed: Experiences on Accelerating Data Parallel Training(arXiv:2006.15704)。作者列表包括 Shen Li、Yanli Zhao、Rohan Varma、Omkar Salpekar、Pieter Noordhuis、Teng Li、Adam Paszke、Jeff Smith、Brian Vaughan、Pritam Damania 和 Soumith Chintala。Tulloch 不在其中。关键人物如下:

那么 Tulloch 以什么闻名?

领域相近但不同——性能和推理基础设施,而非分布式训练 API:

供你参考的思维模型

既然你在研究 nanoGPT 规模的训练和 DeepSeek 风格的 MoE,可以将这些名字映射到各个层级:

torch.distributed (c10d, ProcessGroup, NCCL/Gloo)  → Pieter Noordhuis, Teng Li
DDP (Reducer, bucketing, comm/compute overlap)      → Shen Li
FSDP (param sharding, ZeRO-3-style)                 → Yanli Zhao, Rohan Varma, Min Xu (fairscale)
DTensor / torchtitan (TP/PP/FSDP2 composition)      → Wanchao Liang
Kernels / quantization / inference perf (FBGEMM)    → Andrew Tulloch

如果你想阅读代码,可以从 torch/csrc/distributed/c10d/reducer.cpp 开始——这是 Shen Li 的 DDP 设计的核心(梯度桶 + autograd 钩子 + 异步 AllReduce),而且它出奇地易读。

参考文献:


Back Donate