人工智能的肥尾陷阱

人工智能的肥尾陷阱 | AI生成和翻译

首页 2026.06

问题： 为什么在公司（尤其是像 ChatGPT 或 DeepSeek 这样的 AI 初创公司或 AI 项目）中过于结果驱动实际上是有害的？

回答：

这是一个真实存在的矛盾，会扼杀优秀的 AI 工作。核心问题如下：

在常规软件中，努力与结果大致呈线性关系。你开发一个功能，它上线，它就能工作。AI 则不同——结果的分布是厚尾的。大多数实验会失败。少数会取得巨大成功。突破几乎从来不会来自“显而易见”的路径。

如果你以结果为导向优化：

ChatGPT、DeepSeek、AlphaGo——回顾起来，它们看起来是结果驱动的。但投入却是：

OpenAI 花了多年时间在强化学习理论、安全研究以及 GPT-1/2/3 上，没有任何商业产品
DeepSeek 由一家量化对冲基金（幻方量化）支持，该基金能够承受多年的亏损——梁文锋明确表示，他资助这个项目是因为它具有智力上的重要性，而不是因为它现在能盈利
AlphaFold 来自 DeepMind，而 DeepMind 在 Alphabet 旗下亏损运营多年

它们之所以取得成果，是因为它们并非纯粹的结果驱动。

1. 探索与利用的平衡 结果压力迫使你进行利用（使用当前有效的方法）。但 AI 的进步在于探索（尝试三年后可能有效的方法）。RLHF、MoE、思维链——这些在刚开始时都不是“稳妥的赌注”。

2. 研究人员的士气与留任 顶尖 AI 研究人员是内在驱动的。他们希望深入理解事物。如果每周都是指标评审，最优秀的人就会离开。Karpathy 留在 OpenAI 不是为了 KPI。

3. “局部最优”陷阱 结果压力促使团队进行爬山优化。你只能永远得到 GPT-3.5，而不是通过架构重新思考得到 GPT-4。DeepSeek 的 MoE 突破需要忽略“赶紧发布更密集模型”的压力。

4. 算力分配错误 在结果压力下，算力被用于演示和基准测试。真正的突破需要长时间的训练运行，且结果不确定。你无法通过 A/B 测试来找到新架构。

优秀 AI 组织实际衡量的内容：

结果是滞后指标。过程才是领先指标。

在你银行的 AI 工作中——这正是企业 AI 项目表现不及预期的主要原因。他们设定 OKR 如“在 Q3 前部署 3 个 AI 功能”，然后想知道为什么这些功能只是围绕 GPT-4 的浅层包装，没有真正的护城河。结果压力选择了可演示的，而非可防御的。

如果你将来创立自己的 AI 初创公司：明确保护探索时间。将 30% 的工程时间预算用于不附带任何可交付成果的任务。那才是真正优势的来源。

返回捐助