人工智能的肥尾陷阱 | AI生成和翻译

Home 2026.06

问题: 为什么在公司(尤其是像 ChatGPT 或 DeepSeek 这样的 AI 初创公司或 AI 项目)中过于结果驱动实际上是有害的?

回答:

这是一个真实存在的矛盾,会扼杀优秀的 AI 工作。核心问题如下:

AI 研究具有厚尾分布的结果

在常规软件中,努力与结果大致呈线性关系。你开发一个功能,它上线,它就能工作。AI 则不同——结果的分布是厚尾的。大多数实验会失败。少数会取得巨大成功。突破几乎从来不会来自“显而易见”的路径。

如果你以结果为导向优化:

幸存者偏差问题

ChatGPT、DeepSeek、AlphaGo——回顾起来,它们看起来是结果驱动的。但投入却是:

它们之所以取得成果,是因为它们并非纯粹的结果驱动。

“过于结果驱动”具体会破坏什么

1. 探索与利用的平衡 结果压力迫使你进行利用(使用当前有效的方法)。但 AI 的进步在于探索(尝试三年后可能有效的方法)。RLHF、MoE、思维链——这些在刚开始时都不是“稳妥的赌注”。

2. 研究人员的士气与留任 顶尖 AI 研究人员是内在驱动的。他们希望深入理解事物。如果每周都是指标评审,最优秀的人就会离开。Karpathy 留在 OpenAI 不是为了 KPI。

3. “局部最优”陷阱 结果压力促使团队进行爬山优化。你只能永远得到 GPT-3.5,而不是通过架构重新思考得到 GPT-4。DeepSeek 的 MoE 突破需要忽略“赶紧发布更密集模型”的压力。

4. 算力分配错误 在结果压力下,算力被用于演示和基准测试。真正的突破需要长时间的训练运行,且结果不确定。你无法通过 A/B 测试来找到新架构。

正确的框架:过程保真度高于结果保真度

优秀 AI 组织实际衡量的内容:

结果是滞后指标。过程才是领先指标。

对你的实际启示

在你银行的 AI 工作中——这正是企业 AI 项目表现不及预期的主要原因。他们设定 OKR 如“在 Q3 前部署 3 个 AI 功能”,然后想知道为什么这些功能只是围绕 GPT-4 的浅层包装,没有真正的护城河。结果压力选择了可演示的,而非可防御的。

如果你将来创立自己的 AI 初创公司:明确保护探索时间。将 30% 的工程时间预算用于不附带任何可交付成果的任务。那才是真正优势的来源。


Back Donate