李卓翰：vLLM 联合创始人

李卓翰：vLLM 联合创始人 | AI生成和翻译

首页 2026.06

问题： vLLM 中的李卓涵（Zhuohan Li）是谁？

回答：

李卓涵（GitHub：zhuohan123）是 vLLM 的共同创建者，与 Woosuk Kwon 拥有同等的创始地位。以下是完整情况：

起源故事： 2022 年夏天，李卓涵与研究伙伴 Woosuk Kwon 试图通过跨 GPU 分配工作来提升大型深度学习模型的效率。当他们搭建演示时，性能表现极差。李卓涵表示：”我们意识到内存管理将成为服务这些模型的重大瓶颈。” 在接下来的几个月里，李卓涵与 Kwon 深入钻研，最终从经典虚拟内存和分页技术中获得灵感，开发出了 PagedAttention。

背景： 李卓涵是加州大学伯克利分校的计算机科学博士生，师从 Ion Stoica，专注于高效机器学习系统——特别是大型模型的训练与部署。他的研究作品包括 Alpa、AlpaServe、Vicuna 以及 vLLM（PagedAttention）。他本科毕业于北京大学，并在微软研究院、Anyscale 和 Google Brain 实习过。

博士论文： 他 2024 年在伯克利完成的博士论文《以大模型赋能高效自动化系统》涵盖了 AlpaServe（用于扩展服务规模的模型并行技术）以及 vLLM/PagedAttention（内存利用与推理吞吐量优化）。

曾在 OpenAI 工作，现就职于 Meta： 在构建 vLLM 之后，李卓涵加入了 OpenAI，负责为 GPT-OSS 落地的基础设施和推理工作。他目前在 Meta 继续构建 vLLM。

一句话总结： 李卓涵是 vLLM 的中国联合创始人（北京大学本科 → 师从 Ion Stoica 的伯克利博士），与 Woosuk Kwon 共同发明了 PagedAttention，随后加入 OpenAI，目前正在 Meta 继续 vLLM 的相关工作。他在 GitHub/X 平台上的账号是 zhuohan123。

返回捐助