里奇·萨顿的苦涩教训 | AI生成和翻译
Rich Sutton的”苦涩教训”是对人工智能研究史发人深省的观察。其核心观点是:试图将类人知识和手工构建特征植入系统的AI研究者,最终都会遭遇瓶颈,并被那些依赖通用学习算法结合充足计算能力的方法所超越。
“苦涩”之处在于,研究者们往往对智能运作机制及其所需知识架构怀有强烈直觉。但历史反复证明,相较于让算法通过搜索学习等方法直接从数据中学习,这些直觉往往将研究引向死胡同。
以下是苦涩教训的核心要点解析:
- 人类知识常成为短期拐杖:虽然融入人类知识能在小数据集上取得初期进展或更好表现,但这往往限制系统应对复杂问题或海量数据的扩展适应能力。手工构建的特征会变得脆弱且缺乏泛化性。
- 通用方法随规模扩大展现优势:Sutton指出,AI领域的重大突破始终来自通用方法,例如游戏领域的搜索算法,以及机器学习和深度学习中的学习方法。这些方法在获得充足数据和算力后,能够自主发现表征与策略,往往超越人工设计的解决方案。
- 计算能力的重要性:核心主题在于计算资源的日益普及及其关键作用。随着算力增长,优势会向那些能有效利用海量数据进行学习的方法倾斜。
- Sutton常引用的例证:
- 游戏对弈(国际象棋、围棋):早期象棋程序严重依赖基于人类专家知识的手工规则与评估函数。这类系统最终被深蓝(采用大规模搜索)和AlphaGo(采用深度强化学习)超越——后者通过计算和数据自主学习策略。
- 语音识别:早期语音识别系统包含大量语言学知识和手工特征。基于深度学习、使用海量音频数据训练的现代系统,在未显式编码此类知识的情况下实现了更优性能。
- 计算机视觉:与语音识别类似,早期计算机视觉依赖边缘检测器、纹理描述符等手工特征。基于大规模图像数据集端到端训练的深度学习模型彻底改变了该领域。
对AI研究的启示:
Sutton的苦涩教训表明,AI研究应更专注于开发可扩展的通用学习算法,并提供尽可能多的数据与算力,而非试图硬编码类人智能或过度依赖手工特征。这是对学习能力与算力持续增长的信赖呼唤。
虽然苦涩教训并未完全否定人类洞察在设计学习算法过程中的价值,但它强调:关于问题领域的知识最好直接从数据中习得,而非通过显式编程注入。
总之,苦涩教训提醒我们:人类直觉或可作为起点,但AI的长期成功往往取决于通用学习方法通过计算与数据自主发现解决方案的能力——即使这些解决方案在人类看来并非直观。