AI职业发展路径对比 | AI生成和翻译
你提到的很多观点都很准确——小马智行的楼天城与月之暗面(Kimi的母公司)杨植麟的对比确实很有意思。这两位都是中国科技领域的顶尖人才(楼天城是传奇的ICPC金牌得主,常被称为中国顶尖的竞技程序员;杨植麟拥有清华和循环智能的深厚机器学习背景),但确实,相较于月之暗面搭乘的大语言模型火箭,小马智行近来似乎遇到了更多阻力。我来详细说说对你观点的理解,因为你提出了许多敏锐的观察。
从竞技编程到现实世界的跨越:练习与混沌
完全同意——ACM/ICPC和竞技编程(CP)是针对可解谜题的残酷精英选拔。你不断磨练已知模式、极致优化,”完美练习”能让你获得奖牌。楼天城在这个领域叱咤风云(多次金牌,世界总决赛的猛将),但正如你所说,现实世界不会给你一套带有约束条件和测试用例的题目集。自动驾驶?它面对的是无限的边缘情况:雨天的反光让车道线变成迪斯科球,镜面像游乐场的哈哈镜一样欺骗激光雷达,或者那个因为狗看见了松鼠而乱穿马路的行人。每一个”小细节”都不是一道LeetCode中等难度题——它是一个需要多年研发的无底洞,涉及物理模拟、传感器融合调整以及无法像文本语料库那样扩展的真实世界车队数据。
楼天城本人在采访中也谈到过这一点:好的自动驾驶不仅仅是”解决谜题”,而是以安全且可扩展的方式模拟人类驾驶员,这需要出色的评估系统(例如,从模拟到现实的迁移、罕见事件模拟)。但即使对于注意力机制或RLHF这样的算法突破,你说得对——大语言模型领域也经历了多年的迭代(从Vaswani 2017年的论文到2020年的GPT-3),而且这还是拥有海量公开数据的情况下。像楼天城这样的CP奇才在实现速度上出类拔萃,但在未知领域从零开始发明创造?这正是”花数年解决一个问题”的艰难之处,尤其是作为研究负责人独自面对时。
数据荒原 vs. 文本海啸
这是你指出的关键不对称性。像Kimi这样的大语言模型畅饮着互联网的”消防水管”——来自书籍、代码、论坛的数万亿token,都是自回归的黄金数据。月之暗面可以在此基础上进行微调,利用开源权重(Llama等)快速启动,并推出最小可行产品。结果呢?Kimi正在爆发式增长:他们的K2模型刚在9月发布,具有巨大的上下文窗口和编码能力,推动用户增长至与中国市场的ChatGPT媲美。目前估值已达33亿美元,高于年初的25亿美元,并从阿里巴巴、腾讯等机构筹集了超过16亿美元。这是典型的人工智能炒作周期:生成式人工智能领域的低垂果实意味着快速的迭代和”登月”般的估值。
自动驾驶呢?数据是瓶颈。你无法像爬取arXiv论文那样,轻易获取”所有北京雨天的街道数据”。小马智行正在自有车队上烧钱(他们正在加速第七代Robotaxi的生产,今年夏天已超过200辆),但要扩展到”所有情况”意味着在测绘、标注和安全验证上投入数十亿美元。收入只是涓涓细流——2025年第二季度Robotaxi收入150万美元,同比增长158%,但这与大语言模型订阅收入相比只是九牛一毛。小马智行的市值已跌至约20亿美元(股价波动剧烈:10月曾反弹48%,但也有下跌9%的时候),远低于2022年85亿美元的峰值。这个行业成熟得更慢——监管壁垒、责任噩梦,以及是的,那些可能搞砸演示的镜面/雨水故障。
创业的干扰:从代码到混沌
哈,”shelep or chaos stuff”——我理解这指的是商业拓展、合作伙伴关系和没完没了的宣传推介等俗务?对创始人来说确实如此。楼天城从2016年就开始创业,所以小马智行也历经风雨:有丰田的支持,在广州设有中心,但现在它要应对上市后的遗留问题(在纳斯达克上市)、中美在自动驾驶技术出口上的紧张关系,以及投资者对盈利能力的压力。这与杨植麟2023年的初创阶段相去甚远——月之暗面仍处于纯增长模式,专注于模型发布和用户吸引,尚未需要太多”成人世界”的烦恼。楼天城的CP优势在工程严谨性上熠熠生辉(小马智行的自动驾驶栈在感知方面是一流的),但没错,CEO的头衔意味着干扰:招聘狂潮、供应链危机、董事会的烦心事。这稀释了你在CP或早期AI实验室中那种纯粹解决问题的专注状态。
总之,我认为你的分析很到位——楼天城是一位天才,正在攀登一座更艰难的珠穆朗玛峰(自动驾驶是受物理约束、安全至上的艰难领域),而大语言模型浪潮(月之暗面/Kimi)则乘着数据和资本的浪潮冲浪。小马智行并非”失败”——他们正在实实在在地积累行驶里程(现已达数百万英里)——但成功看起来更缓慢、更艰难。如果自动驾驶取得突破(例如,通过更好的模拟或多模态数据合成),楼天城可能会领先全场。但现在呢?像杨植麟这样的大语言模型创始人正在更快地制造独角兽。你的看法是:小马智行会通过机器人卡车的规模化实现反弹,还是人工智能淘金热会让自动驾驶望尘莫及?
小马智行2025年第二季度财报 月之暗面估值更新 Kimi K2 发布 楼天城个人简介