人工通用智能的世界

Home PDF Audio

如果有一天,我们只需告诉人工智能(AI)创建一个像TikTok或YouTube这样的应用程序,它就能提供包含数百万行代码的完整项目,那将是非常令人惊叹的。

当ChatGPT在2022年11月底发布时,它能够执行修复代码片段和回答各种问题等任务。它擅长解释神经网络的概念,并提供“Hello, World!”示例,支持多种编程语言。这就像拥有一个非常强大的搜索引擎,能够直接给出答案。

然后,它具备了搜索功能。我可以指示ChatGPT从网站检索链接列表并创建相关文档。

接着,发布了ChatGPT 3.5、4、4o、o1-mini和o1等版本。

现在,它可以处理添加网站暗黑模式的请求。它可以提供更新HTML、CSS或脚本所需的代码和说明,甚至建议添加暗黑模式切换按钮。实现暗黑模式涉及更改CSS,如果网站使用Markdown,那也需要更新。

这就像AI可以实现整个功能或特性,而不仅仅是代码片段。

通过结合这些功能,我们可以创建一个应用程序。因此,有一天,如果我们告诉AI工具构建一个终端、浏览器、待办事项列表、任务应用程序、日历、代码协作工具或会议应用程序,它可能会提供整个项目代码。

我们可以使任务更加复杂。例如,我们可以要求AI将所有现有的YouTube代码集成在一起,并使用OpenAI、Claude或Deepseek的API为YouTube添加AI功能。这可能包括添加智能助手、用AI翻译替换当前翻译、增强AI搜索功能,甚至策划专门的短视频,比如请求YouTube提供100个有趣的关于日本生活的短视频。

这就是一个应用程序。但是更高级的任务呢,比如创建一个操作系统?我们可以告诉AI设计一个全新的、完全开源的操作系统,具有新颖的设计、基本应用程序、终端、命令行和调度程序,类似于Oberon,使用数据结构而不是字符串在进程之间进行交互。

接下来呢?我们可以要求AI设计最新的Mac并更新其操作系统。

然后呢?我们可以告诉AI设计并更新整个家居,根据我们的活动、最新的知识和需求,定制所有电器,以创造更好的生活环境。

然后呢?我们可以要求AI设计整个城市,根据市民的行为和最新的知识,改善他们的生活。

最后呢?我们可以告诉AI改善地球,利用所有可用的知识和信息,增强每个人的生活。

我在为这篇文章想一个标题时遇到了困难。我们叫它“人工通用智能的世界”。

根据Deepseek的说法,“人工通用智能(AGI)是指一种具有理解、学习和应用知识能力的人工智能,能够在广泛的任务中表现出与人类智能相当的水平。”与设计用于特定任务(如人脸识别、语言翻译或下棋)的狭义AI不同,AGI可以执行任何人类能够完成的智力任务。

在考虑AI的未来时,有两个基本点需要把握:算法和计算。AI算法主要涉及微积分、反向传播、变压器、GPT和多头潜在注意力。

在数字世界中,将会有从X到Y的映射,其中X可以是文本、图像、视频、音频、代码或任何字节数据,Y也可以是这些数据。

计算机本身并不理解AGI;它只是人类创造的定义,对机器来说并不重要。

AI在物理世界中的应用将包括自动驾驶和机器人技术等领域。如果数字世界可以映射X到Y,物理世界也会如此。例如,机器人可以将食材变成菜肴、搭建乐高、装饰房屋、铺瓷砖、安装空调,甚至组装宜家家具。

已经有工业机器人在使用。日本著名的公司包括FANUC、川崎重工和安川电机公司。

那为什么家庭中没有更多的机器人呢?消费类机器人需要多才多艺,能够执行多种任务。例如,烹饪机器人可能只能搅拌和炒食材,用户需要准备食材并在搅拌后清洁。

未来,机器人将出现在家庭、商店、学校、办公室、电影院和旅游景点等地——基本上任何地方都有人类工人。

将会有一个云端的世界模型,一个可能大约100PB的非常大的模型。作为参考,1PB等于1,024TB,1TB等于1,024GB。Llama 3 70B模型的一个版本文件大小为21.1GB。

世界上的机器人将需要咨询云端的世界模型以采取行动。只要机器人能够有效执行其任务,100毫秒或甚至1秒的网络延迟是可以接受的。


Back 2025.01.18 Donate