构建人工智能框架与人生选择的访谈 | 原创,AI翻译
Source: chatgpt.com
A: 李智维,软件工程师,专注于 AI 和金融的交叉领域。
B: Shawn Shao,软件工程师,在一家国际银行从事 AI 框架、Agent 和 MCP 相关工作。
以下对话通过 Google Cloud Transcription v2 API 转录,并经 AI 工具精炼和整理。原始对话语言为中文。
目录
- 录制、存档与对 AI 媒体的看法
- 存档对话以供日后反思
- 视频和图像 AI 更有潜力
- 人们倾向于视频而非文本消费
- 内容创作变现的个人案例
- 职业开端、认证与早期奋斗
- 兴趣驱动持续学习和好奇心
- 实践获取稀有 GCP 认证
- 认证助力获得国际银行职位
- 通过自学克服学业挑战
- 工作经验、家庭与职业选择
- 在国际银行多次晋升
- 职业决策考虑家庭和角色
- 偏爱稳定而非地域流动
- 珍视影响日常视角的新知识
- AIPlayer、Agent 及价值创造
- 构建公司级智能 Agent 平台
- 专注于解决真实业务问题
- 通过实际 AI 应用创造价值
- 不追求粉丝流量或变现
- 老板看重解决问题而非外部名声
- 批判性思维、王垠的影响与世界观
- 从王垠那里习得批判性世界观
- 质疑既定的科学叙事
- 认为重大历史事件皆为捏造
- 学习应是快乐且注重过程的
- AI 效率重塑时间管理
录制、存档与对 AI 媒体的看法
A: 我可以先录下来,然后咱们后期把名字什么地给你匿名掉,然后你先,咱们整理一下以后给你,你审核完之后,你觉得哪些可以删你就删。发到我博客只是其中一项考量,但是它肯定会先过你这关,其实我主要的目的就是把这内容存档。
我用 Google Cloud 已经做了一遍初步整理了,上次我拜访美国的一个博士朋友,他花费了五个小时,用 Google Cloud 和 Claude Code 整理的,现在只要 10 到 20 分钟就可以完成。既然这样的话,我们几年后再去聊一聊这个话题。我是说往后看这些对话,会发现我们哪些预言是正确的?
B: 未来我可不敢预言。
A: 但关于 AI 这块儿,我跟一个清华的朋友聊,他说文本已经触顶了,图像和视频有更大的发展空间。因为图像和视频它需要更大的计算量,而且它不像文本那么容易自回归。视频的话,比如说口型、音频,像这个 ffmpeg,就是现在 ffmpeg 有很多步是需要去探索和发掘的。图像的话,各种阴影啊,各种细节呀,然后产品也会更丰富。
就一般来说,视频这块儿抖音啊,大家已经越来越没有耐心读文字了,他就喜欢刷新闻,刷这种大家都比较喜闻乐见的。比如说我妈,她创了一个工作号,最近一个月就挣了 900 块钱,阅读量 300 万。她写公众号写了 8 年了,坚持了很多这些东西。
B: 你前面说的这个东西,我觉得是真真切切的。过去那些东西你也改不了。你觉得很多事情,你买当下最好的或者做当下最好的决定。任何的决定都只能基于你当下的认知。
职业开端、认证与早期奋斗
A: 我在想,你肯定也经历了一些,就是锥心刺骨的,比如说你 18 岁高考,这十年肯定有一些很难受的时候。但是你一步一步地走到现在,而且还形成了很强的信念。像你这岁数,很多人还在做外包。
除了你这个 AIPlayer,咱们能用 MCP 把公司 Jira 和 Confluence 的接口给它都整合起来,似乎没啥了不起的,但是有很多教程,很多人都在做。然后你把这东西,国际银行是把这东西做出来了,你带来的资讯确实对大家很有用。抓住这波浪潮很重要。如果你去给公司做非常 Java 的微服务框架,可能就没有那么受欢迎。
B: 所以问题是?
A: 问题就是你经历了一些难受的时候吗?就是从 Chinasoft 到独角兽 Yeahmobi,再到国际银行。这短短的五六年,其实你也蛮拼的。你到 Chinasoft,你还带了 30 人团队,尤其是你刚从江苏科技大学毕业。咱们都不是 985,尤其你职业生涯的前五年,您肯定要比以前更努力。比如说咱俩当初毕业的时候,可能去了广州先玩几个小时。但现在咱们俩在宾馆里有这时间聊,就很珍惜了。我感觉你为什么现在比以前更勤奋了?
B: 首先兴趣是最好的老师。不管你承不承认,我觉得兴趣是最好的老师。兴趣的根源是什么呢?就是你想知道有什么新东西,新的知识让你一看之后,你就有一种要去了解它的冲动。所以说不管我是在哪个公司,我都是充满了好奇心的。
比如说独角兽 Yeahmobi,在西安。公司很鼓励大家去考 GCP,很多同事都说 GCP 国内上不去,外网不方便。前面的公司是想跟 Google 合作。跟 Google 合作呢就需要你有很多的专业认证。很多同事不愿意去考,但是我呢,我就去了。我觉得是新的知识,为什么不去学呢?Google 的技术框架和能力都在那里。所以我去了学,然后考上了。公司还掏钱让大家,我考了三个。
A: 你 91 年的?
B: 90 年的。
A: 欸,那 2019 年你 29 岁,我现在 30 岁,95 年的。
A: 怎么说呢?因为高中一半时间都在搞竞赛,没保送上,高考也没考好。想去北航、中山大学这种 985,然后一失足成千古恨。后来去创业,加入了一个创业型公司,然后还辍学了。唉,就是辍学,当时觉得用写代码挣钱就可以了,有点不谙世事。后来国内很多公司都要求学历。OK,那回到你这儿,你那时候去考,你考了很多的认证,Coursera 的,而且针对公司的话题你练习得很认真。
B: 对啊,我那个时候连习题都没有,我是跟着它官方的文档,一个一个的实验,我是认认真真地做,没有在网上抄过的。那个时候没有真题,没有题库,我也不知道啥那些死记硬背的题目。我就真的 GCP 的产品我是真的上手去跑了一遍。把自己关在里面,官方文档,一个一个的认真看。
现在有 AI 出来就很方便,很多人在这上面造假,我知道。甚至包括在国际银行,西安公司也招人。他们一看到我一下子有三个 GCP 的认证,面试官都傻了。因为 GCP 那个时候刚开始推,没多少人考,很稀有。我一下子是三个,所以面试官他肯定会怀疑是不是真的,但是细讲的时候,我发现讲得很好,所以他就留用我了。然后后面就进了国际银行。
工作经验、家庭与职业选择
A: 在国际银行,你晋升了好几个级别,三个级别是吧?你之前是 Senior Engineer 开始的。那问题就来了,我感觉你 2014、2015 年左右,你做了很多风控的工作。
B: 以前我就是做这些风控嘛,写一些固定的规则,去查查嘛,很简单嘛。因为就是这些东西,咱们大数据这些里面还有一些技术的深度,可以给风控这方面优化网络。
A: 我肯定一会儿会发给你,以后那个小伙子如果要咨询你,你就可以把这些东西给他分享。现在今天的话,我觉得每个人都有每个人不同的经历。您今年尤其感到很忙吗?因为 AIPlayer 还是什么地,你感到自己被强烈需要,是那种感觉吗?
B: 会有,因为有的同事他对 AI 不熟悉嘛,他经常会觉得,你这做得不错,他就想要来问。问的多了,我们现在把这个群建起来了,建了两个了。
A: 您有没有计划以后去海外呀?像您这么优秀的人才,有没有想过走出去?
B: 目前没有,我觉得先看公司的政策。如果有机会的话,当然也去体验一下蛮好的,是吧?毕竟关注一下世界各地的不同点。
A: 但是您一直在西安,大学在江苏,您到现在西安也待了十几年左右了,而且家人朋友也大都在那儿。家人朋友。所以肯定有人说你来广州,北京,北上广深,为什么不去呢?
B: 它方方面面是多层次的,因为你身上的定位越多,你越不能以像一个人那样只考虑自己的东西。比如说你作为爸爸,它会影响你,作为老公,你肯定会考虑好老婆的意愿,她的心情。大家都会遇到诱惑,都会面临很多的抉择。但是如果你有抉择,其实你很多的抉择,都是多种因素权衡。比如说考虑了老婆的长度。那我这时候我觉得我就会拒绝,不是一个简单的选择。除非我直接发现它极好,我肯定会去。因为大家的很多的决策,其实它很多因素是在一起在结合的。
A: 广州的薪资比西安大概高 10%。
B: 我不知道,我不打听。
B: 其实很多东西,你可能从当天看。比如说你在西安停车是 3 块钱,你可能在广州就是 18 块钱,对吧?这些城市的差异,咱们要去理解。比如说在某一方面,你也会把自己比照一下,比如说从昨天到今天,从今天到昨天。有没有一些新奇的东西或者新的观点,突然之间让你感觉到被影响了?我觉得这些也是很棒的。
AIPlayer、Agent 及价值创造
A: 我感觉你很平淡,您不是那种特别功利的人,然后斤斤计较,去大城市有什么好处。而且你服务了这么多的人,但是你感觉你给所有人的答案和帮助都是一样的,就是能帮你就帮。那以后呢?未来几年,你打算往哪儿发力?听说你在搞 Agent 的东西,还有 MCP 这些,我还看到了您的那些公司里面的那些东西。您以后是打算继续在国际银行?然后二三年后,以及十年以后的长期规划,您打算走什么方向?
B: 我现在做的东西呢,都是我感兴趣的东西。我就是顺手就做了,就比如说造一个公司级的智能 Agent 平台。以后如果公司里面其他的同事想要用智能 Agent 的,都可以从我们平台入手。但是 Agent 都是垂直的,都是面向客户的,很多问题都解决得花很长时间,比如说 20 分钟。其实很多,我觉得现在很多人都掉一个坑里面。就比如说你现在这个 AI,它本质上是一个工具。你真正地帮助使用者创造价值,你才能够创造商业价值。比如说我讲我现在有一个超级花里胡哨的 AI,我可能还是没人卖。但是如果说我这个 AI 能够帮你每天写邮件或者能抓英文的邮件,它就可以。那就是一个解决你的场景,这样的话就能创造更多的价值。
那对于我来说,我不需要所有东西都很通用。我在国际银行里面。其实它核心就是 business knowledge 和 finance 结合在一起。所以我觉得如果你是我的业务使用者,然后你用我的平台去解决问题,那我就创造价值了。咱们的产品是面向业务的。
A: 您这个东西很容易推广到星展银行,或者说各个银行都是一样的需求,很多东西都已经有了,就是用你的工具包,你的框架。有多少人用 AIPlayer 解决问题?
而且你这个 AIPlayer,比如说已经两个公司的微信群了。然后很快又会有一个第三个群。输出速度很快,它这个势头已经很猛了,都已经第三个群了!它是这种呈指数型增长,越到后面越快?还是说中间比较平稳?还是说波浪型的,外界的新闻也会影响它的增长曲线吗?
B: 我不关注,因为我不是走这种粉丝流量路线。我做这个 AIPlayer 是帮我学习的。它并不是为了留住粉丝的。我通过做这个,我就能更好地去了解 MCP,了解那些东西,因为我把图表分享给大家了嘛,我得看一些东西来换取好的东西。我通过分享给大家,至少它倒逼我学习。第二,我的这块粉丝,一点都不要变现,我也不要粉丝的钱的。我的很多的粉丝是公司的同事,我只是想给他们一些东西。第一,你可以免费地去用,然后我又能支持你学习。第二,你觉得我做得靠谱,那就够了。我一点都不去追求粉丝模式。
A: 那您的领导呢?他为什么给你升职呀?他是真的了解您所有这些工作吗?
B: 我觉得首先对于任何一个老板来说,他不会关心你外面做了多少东西,他只会关心你能不能解决问题。如果老板有一个很难受的问题,OK,我来帮你解决了,这体现我的能力和我的专业。我肯定会利用人脉,利用技术,去帮助老板解决问题。老板不关心你多少个粉丝,只要你能解决问题就可以。
批判性思维、王垠的影响与世界观
A: OK,然后还有一点,就是上次我想分享王垠的博客。我研究了多年,他的编程语言跟文章我每隔几天就看一回,研究了很多年。从中我收获了一个独特的世界观。比如说逆转近视眼,我已经帮了大概 20 个人。我就像 Ilya Sutskever,我不是反向传播发明者,但我也是早期帮助大家逆转近视眼,比如说每年降低 50 度、100 度,通过场景划分:一副是开车用,一副是手机和电脑平时用,就是把事情细致化分类处理。
然后我跟你讲一下核心结论。比如说:核武器是假的。都是我在王垠的 substack 里面看到的,我教不了,但我可以给你讲。他还说双氧水可以泡脚,然后德国要停用核电站。目前的 AI 没有任何量子力学。爱因斯坦的理论是错的,因为光速不变这个前提是错误的,当时有实验粉尘干扰,导致误解的。王垠细致地解释了一下。
然后他说学大提琴、画画,各种的研究,我见过学习能力最强的一个。就比如说你看 OpenAI 的 GPT,刚开始觉得很牛,其实也没什么。你买一个好一点的显卡,你也能跑出来差不多的东西。
B: 不是,很厉害的。你知道跑一个 GPT 模型,它的参数很肤浅的。就比如说几百万美元就能跑出 DeekSeek 这个水平。GPT-3.5 话费是 5600 万美元以上。底层模型是一个,但是更重要的是它的应用。我们做一个应用能够真正地被用起来。
A: 啊,您说的这个概念,它是 CUDA,Transformers 和它的 attention 计算,再加上 OpenAI 说它的底层里面,里面就有一些大佬,一个是在 OpenAI,他就在做 CUDA 优化的。然后现在又出了强化学习,它是怎么在推理这块儿降低了这种强监督,然后如何去拔高数学的能力。然后又有一些模型是专门针对代码的,因为代码的指令跟自然语言是不一样的。最近又出了 Grok Code Fast 模型,马斯克就组建了一个团队。马斯克近几年也没什么动手去搞 AI,都是别人搞出来,他去搞融资搞 PR。但是他眼光还是有的。
B: 对对对,很厉害。对对对。
A: 我想说的是,我质疑这些东西。我觉得王垠一样,敢质疑一切的普通人太少了。他说图灵奖没什么了不起的,计算机是很多人共同发明的。就像在国际银行一样,别人今天可能把你当偶像,但你自己走过来这条路,发现没什么了不起的。嗯。像图灵就和 Pony AI 的姚安之、楼天成一样。对。王垠很久以前就说 AI 在图像领域没有什么进展,因为缺乏了大规模的数据,还有 top-5 准确率的这种测试,它的虚假性。
B: 嗯。
A: 当年在北京折腾创业的时候,我加了好多大佬的微信。商汤的联合创始人,旷视的联合创始人,量子位的联合创始人,甚至还去参观了他们的公司,也都认识。我二十出头就运营一个 3 万人的程序员社群,每年年收入 300 万,带着团队搞一些小软件项目。但后来因为高房价,房地产泡沫,以及言论自由的问题,我决定放弃国内资源,一心一意搞出国。
自动驾驶,王垠多年前就指出了问题,比如汽车在雨天把水面的反光识别成水,或者特斯拉 2016 年把白色的卡车撞飞了,以及小米最近的一些事情。他甚至 8-10 年前就写博客教育马斯克这些问题。王垠质疑一切。
对对。欸,我当年还和 Machines with Heart 以及量子位都有联系。哦。
疫情期间我打了疫苗,两针,后来才知道阿斯利康真的有问题。王垠之前早就搞明白了,因为他日以继夜研究了大量海外的资料。PCR 检测发明者 Kary Mullis 他自己都说 PCR 不能诊断疾病,它只是把有的东西放大了。
王垠的学习方法让我很佩服。他还说原子弹是假的,人类没有登月,马斯克的火箭大多数是宣传。即便是特斯拉的“自动驾驶”,很多人以为是全自动,实际还只是有条件的。真正的无人驾驶还很遥远,技术上,法律上,伦理上,还未成熟。
我还看到王垠写很多 AI 应用都是炒作。他会详细解剖论文,指出实验设置、数据来源和逻辑漏洞。我从来没意识到有人可以质疑得这么深。后来我明白了,这才是真正的学习方式。所以我的世界观就变了:我看了这么多王垠,到现在看什么东西都是批判性地看。
比如太空照片,舱内有细节,但舱外却看不到星星,黑漆漆一片。你查一下,无论是 NASA、SpaceX 还是中国的航天局,都是一样的。我确信人类还没离开地球。
历史上,我很欣赏伽利略、牛顿这样的人,但我认为爱因斯坦的东西是假的。对。还有 SpaceX 也是。
B: 嗯,首先我觉得你质疑这些东西,很好,肯定很好。但是你这个过程你快乐吗?
A: 嗯,对,因为没什么东西觉得很了不起了。有一天,我如果努力的话,我也可以像他。对。那些大佬,姚安之,楼天成,也没什么了不起的,因为王垠把一切都解构了。他拥有三个博士学位,现在在 F5(之前在英特尔当 Staff Engineer),40 岁的时候就非常成功,在日本可能挣几百万。所以这个过程?我学到了很多。
万事皆疑是很困难的,正如我开始搞 AIPlayer,或者说在国际银行挑战自己做第一名一样。你预期在头几年看不到明显的进展。
B: 不要去追寻很大的目标。做你喜欢的东西,认真地走好每一步。你真正的兴趣在哪里?你愿不愿意坚持下去?比如说 AI,别人可能熬夜打游戏,你却一直在钻研。你要享受这个过程,成功不重要,你只要参与了就已经赢了。我们的时间和知识是有限的,不可能什么都深入。但你如果感兴趣,探索本身就是快乐的,它让你感觉又回到了小时候。人类思考本身就是意义的快乐。
对于职业生涯,如果 AI 适合你,就去干。如果不适合,就当娱乐。时间是有限的,把时间投资到让你快乐的事情上。AI 让我重新思考时间管理,今天节省一小时,明天就能做更多。
A: 谈到创造力,你还记得你推荐的 Codex 吗?我试了一下,真好。我甚至买了会员。我改用 Codex 来做集成 Agent 和设计模式。在某些情况下,它比在其他地方搜索定制模型更好。
B: 哦哦哦,已经 12 点了。你还有什么问题吗?
A: 没有了,再见。
B: 再见。