顶尖LLM工程师与研究员

顶尖LLM工程师与研究员 | AI生成和翻译

Home 2025.10

大语言模型时代十大AI专家/工程师

自2017年Transformer架构问世以来，大语言模型时代已走过近十年历程。这个时代由推动模型扩展、训练技术、安全性与应用创新的先驱者们共同塑造。本文聚焦那些对ChatGPT（OpenAI）、Grok（xAI）、Gemini（Google DeepMind）和Claude（Anthropic）等核心系统产生重大影响且具备深厚技术造诣的专家。遴选标准侧重于直接参与技术突破的研究人员和工程师，参考依据包括他们对基础论文的贡献、模型开发实践以及开源工具建设。

Ilya Sutskever
OpenAI联合创始人兼前首席科学家，主导GPT系列模型开发，包括实现ChatGPT生成能力的核心创新。他在序列转换和扩展定律方面的研究定义了大语言模型的训练范式。
Dario Amodei
Anthropic（Claude创造者）CEO兼联合创始人，曾任OpenAI研究副总裁。开创可扩展监督与宪法AI技术，对大语言模型的安全对齐与伦理部署产生深远影响。
Andrej Karpathy
前OpenAI与特斯拉AI总监，GPT-2/3接口及视觉语言模型的关键架构师。他的教育资源和微调方法为数百万开发者降低了大语言模型工程门槛。
Jeff Dean
Google DeepMind首席科学家，主导PaLM和Gemini等巨型模型的训练基础设施。革新大语言模型的分布式系统，实现万亿参数级别的训练能力。
Demis Hassabis
Google DeepMind CEO，推动DeepMind强化学习技术与Gemini多模态能力的融合。其神经科学启发的方法对大语言模型中的情景记忆机制产生重要影响。
Aidan Gomez
Transformer架构共同创造者（《Attention Is All You Need》论文合著者），Cohere联合创始人。直接塑造了从GPT到Gemini所有现代大语言模型的蓝图。
Jason Wei
OpenAI研究科学家，开创思维链提示与指令微调技术，释放ChatGPT的推理能力并全面提升基准测试表现。
Yoshua Bengio
图灵奖得主、蒙特利尔大学教授，推动被Claude和Grok采用的生成模型与AI安全框架发展。他对大语言模型风险的警示持续引领行业伦理建设。
Jimmy Ba
xAI（Grok）联合创始人兼AI负责人，Geoffrey Hinton昔日门生。专精大模型优化算法，为Grok在超大规模集群上的高效训练做出关键贡献。
Tom Brown
Anthropic研究科学家，GPT-3论文第一作者，Claude核心架构主要开发者。他的扩展实验揭示大语言模型的涌现能力，深刻影响整个领域发展。

这些专家以亲手实践的技术深度脱颖而出——他们撰写里程碑论文、主导模型发布、攻克实际部署难题，共同推动了过去十年大语言模型的爆发式增长。

参考资料

Back Donate