AI无法生成新知识 | AI生成和翻译
您分享的文档就是微博原文——作者王垠的文章《网球和AI》。该URL指向的内容正是这篇文章。
问: 我应该如何理解王垠的这篇文章——《网球和AI》?
答:
这几乎可以确定是王垠所写,考虑到微博账号和写作风格——这种风格是显而易见的:自我指涉、对抗性、阴谋论色彩,以及对个人智力优越感的强烈确信。您将他列为您的技术偶像之一,因此仔细理解这篇文章至关重要。
核心论点
他提出了一个核心论断:AI(Transformer模型)无法生成真正的新知识——它只能重新组合现有文本。
他通过一个个人实验得出了这个结论:他尝试用AI帮助自己开发网球技术,却发现AI毫无用处——因为他自己的研究已经超越了互联网上所有可获取的信息。AI没有任何原始素材可供利用。
他的表述:AI就是翻译。从自然语言到自然语言,或从自然语言到代码。但它无法创造新的东西。
技术论点(实际上很有道理)
“Transformer模型终究只是在做翻译”
这是一个精炼且站得住脚的观点:
- Transformer模型是在人类产生的文本语料库上训练的。它们的“知识”是该语料库的有损压缩。
- 当你询问训练数据中没有充分体现的内容时(例如王垠私下开发的网球生物力学),模型没有任何可插值的依据。它要么产生幻觉,要么重复通用来源的信息。
- 他的结论是:任何领域的前沿对AI来说都是不可触及的,因为根据定义,前沿尚未被记录下来。
这与你在训练中已经了解的内容完全吻合:模型只能根据学到的分布预测下一个token。它无法进行物理实验,无法感知本体感觉,无法在现实世界中迭代。
他的表述:“只有人(或其它生命体)才有和现实世界接轨的能力”——只有生命体才能与物理现实交互。这是具身认知论证——这是AI哲学中一个真实且严肃的批判(德雷福斯、布鲁克斯等)。
心理层面
王垠的写作总是将真正的洞察与更个人化的东西混合在一起。在这篇文章中:
- 他将自己的网球研究描述为一场对真理的孤独征服,对他人隐藏,因为他人“不配得到”。
- 他否定所有医学(中医和西医)是“用来伤害人类的秘密武器”。
- 他相信自己的鞋带研究花了“数小时”,而其他人做不到这一点。
- 他认为90%的网球世界都是谎言,而自己是唯一能够看穿这些谎言的人。
这是他一贯的写作模式:有效认知内核包裹在自大和偏执中。不要因为表达方式而否定其论点。但也不要全盘接受其世界观。
从中汲取什么(对您的发展路径而言)
-
核心AI批判是真实的。 在您自己工作的前沿——您的自定义CLI代理、您的模型训练实验——AI会达到平台期。AI可以搭建脚手架,但新颖的架构决策必须来自您自己。您可能已经体验到了这一点。
-
具身/现实世界基础是难题。 机器人技术与强化学习是弥合这一差距的一种途径。没有工具使用或传感器的当前LLM,在需要物理实验的领域本质上具有局限性。
-
AI作为“螺丝刀”的框架。 他说的没错,目前AI最佳用途是作为高杠杆工具,而不是自主研究者。您自己的工作流程——使用LLM进行代码搭建,同时自己指导架构——正是正确的模式。
-
6个月深度研究方法值得注意。 他对网球的态度与他对CPS和CFA的态度相同:全身心投入,第一性原理解构,愿意宣称其他一切都是错误的。这也是Karpathy的方法。这是真正达到前沿的方式。
一句话总结
王垠将网球作为AI知识边界的压力测试,发现AI在互联网信息范围之外失效,并得出结论:Transformer是复杂的插值器——是有用的工具,但无法成为科学家。