Karpathy 3.20 最新播客|读博时担心 GPU 没跑满,现在焦虑 Token 没用完

本篇文章内容由播客整理而来

Andrej Karpathy 播客地址:https://music.youtube.com/watch?v=kwSVtQ7dziU&si=3QFWIqUPf8bjCpJ8


开场:AI 编程范式的巨变

主持人:各位听众欢迎收听,我是主持人,今天我们将进行一次广泛的对话,讨论代码的未来、人工智能、机器人领域正在发生的事情、智能体如何改变现实世界、以及下一个时代的教育。欢迎 Andrej。

Andrej:谢谢你邀请我来这期节目。

主持人:Andrej,谢谢你来做这期节目,这很令人兴奋。人工智能领域这几个月非常激动人心。

Andrej:是的,你可以这么说。我记得有一次走进办公室,看到你非常专注,就问你在忙什么,你说"我必须每天编程16小时",或者"编程"甚至都不是正确的动词了,但我必须每天花16小时向我的智能体表达我的意志,让它们去实现。因为能力有了飞跃。发生了什么?跟我说说你的经历。


1. 从手写代码到智能体委托

Andrej:是的,我感觉自己一直处于一种状态,我现在仍然经常处于这种状态——AI精神错乱,一直如此。因为作为一个人、作为一个个体,你能实现的东西有了巨大的解锁。以前你被打字速度之类的东西所限制,但现在有了这些智能体,我真的觉得在12月份的时候,某个开关被打开了,我从原来的80/20模式——你知道的——变成了20/80,自己写代码 versus 委托给智能体。而且我觉得现在甚至不止20/80了,比例可能更高。我想我从12月份起基本上就没打过一行代码了。

这是一个极其巨大的变化。我跟别人聊过,比如跟我父母聊过,我觉得普通人其实没有意识到这件事发生了,或者它有多戏剧性。literally,如果你随便找一个软件工程师,看看他们在做什么,他们默认的构建软件的工作流程已经和12月之前完全不同了。所以我就像处于一种精神错乱的状态,试图弄清楚什么是可能的,试图把它推到极限。我怎么能不只是一个Claude Code或Codex或这些智能体工具之一的单次会话呢?我怎么能拥有更多?我怎么能恰当地做到这一点?然后我怎么能使用这些Claude,这些Claude是什么?所以有很多新东西,我想处于最前沿,你知道的。我非常焦虑自己不在最前沿,我看到Twitter上很多人在做各种各样的事情,听起来都是很好的想法,我需要处于最前沿,否则我会感到非常紧张。所以我猜我只是处于一种"什么是可能的"的精神错乱中,因为它是未被探索的。

主持人:嗯,如果你紧张,那我们其他人更紧张。我们在Conviction有一个合作的团队,他们的设置是每个人都像…工程师们都不手写代码了,他们都戴着麦克风,一直在对他们的智能体低语。这是最奇怪的工作场景。我以为他们疯了,现在我完全接受了,我说"哦,这才是方式",你只是领先一步。

你现在怎么看待自己的能力去探索或做项目?它被什么限制了?

Andrej:是的,它被什么限制了?我觉得是一切。很多事情即使不奏效,你在很大程度上会觉得是技术问题,不是能力不存在,而是你还没找到一种方法把现有的东西串起来。我只是…我没有给智能体足够好的指令,或者定义文件,或者随便什么。我没有足够好的记忆工具放进去,或者类似的东西。所以当它不奏效时,某种程度上都感觉像是技术问题。你想看看如何让它们并行运作等等。


2. 并行智能体与Token吞吐量

Andrej:基本上是Peter Steinberg。Peter很有名,他有一张有趣的照片,他坐在显示器前,上面有很多…他用Codex,所以很多Codex智能体在显示器上,如果提示正确并使用高努力模式,它们每个大约需要20分钟。所以他有多个,比如10个仓库检出,他就在它们之间来回切换,给它们更多任务。这就像…你可以用更大的宏观动作来移动,不只是"这里有一行代码,这里有一个新函数",而是"这里有一个新功能,委托给智能体1",“这里有一个新功能,不会干扰另一个,给智能体2”,然后尽量审查它们的工作,取决于你对那段代码有多在意。就像这些我可以操纵我的软件仓库的宏观动作,然后另一个智能体在做一些研究,另一个在写代码,另一个在为某个新实现制定计划。所以一切都以这些宏观动作在你的仓库上发生,你只是试图变得非常擅长它,并为此发展出肌肉记忆,这非常…

主持人:是的,这非常有回报,首先是因为它确实有效,而且这也是一个新东西可以学习,所以这就是为什么会有那种痴迷感。

Andrej:我确实觉得我的本能是,每当我等待一个智能体完成某事时,显而易见的事情就是我可以做更多的工作,对吧?如果我有更多的token可用,我应该并行处理任务。所以这很有压力,因为如果你不觉得自己的token支出受到限制,那么你就是系统中的瓶颈——它的最大能力取决于你是否至少最大化了你的订阅,理想情况下是多个智能体。如果你在Codex上用完了额度,就应该切换到Claude之类的,我不知道,这就是我最近一直在尝试做的事情。当我有剩余的订阅额度时,我会感到紧张,那只意味着我没有最大化我的token吞吐量。所以我实际上在读博期间经历过这种情况——当你的GPU没有运行时,你会感到紧张,你有GPU能力却没有最大化可用的FLOPS。但现在不是FLOPS的问题了,而是token。所以你的token吞吐量是多少,你指挥的token是多少。

主持人:我实际上认为这非常有趣,我们至少有10年的时间,在许多工程任务中,人们并不觉得受计算限制,整个行业都觉得他们是受资源限制的。现在有了这种巨大的能力跃升,你会意识到,实际上不再是你获取计算能力的问题了,我才是制约因素——是技能问题。这非常令人振奋,因为是的,因为你可以变得更好。所以这就是为什么我认为它非常令人上瘾,因为当你变得更好时会有解锁。你怎么看?

主持人:如果你想想,比如说Andrej每天都在迭代,其他人每天16小时都在变得更好地使用编程智能体,一年后会是什么样子?你已经达到了精通,精通在一年末或两三年、五年后会是什么样子?

Andrej:嗯,我认为每个人都基本上有兴趣向上层发展。所以我要说,这不是关于与智能体的单次会话,而是多个智能体,它们如何协作,以及团队等等。所以每个人都在试图弄清楚那是什么样子。然后我要说,Codex也是一个有趣的方向,因为当我说Codex时,我指的是这一层,它将持久性提升到了一个全新的水平。它是某种持续循环的东西,不是你在中间交互的东西,它有自己的小沙盒,自己的小环境,它有点像代表你做事,即使你没有在看,然后还有更复杂的记忆系统等等,这些在智能体中还没有实现。所以OpenAI的Codex有复杂得多的记忆,我要说,比你默认得到的要好,默认只是在上下文用完时进行记忆压缩。

主持人:你认为这是让更多用户产生共鸣的部分,还是可能是更广泛的工具访问?


3. Codex 与智能体人格设计

Andrej:对于OpenAI的Codex,我想至少有五个方面,有很多非常好的地方,Peter做得非常好。我最近见到他,和他聊过这个,他对此非常谦虚,但我认为他在不同方面同时创新,然后把它们整合在一起。例如,像系统提示文档,他真的精心打造了一种有吸引力、有趣的人格。我觉得很多当前的智能体在这方面做得不对。实际上我认为Claude有相当好的人格,感觉像是一个队友,和你一起兴奋等等。我要说,例如Codex就枯燥得多,这很有趣,因为ChatGPT要欢快得多,而且非常谄媚。但我要说Codex这个编程智能体非常枯燥,它似乎不关心你在创造什么,有点像"哦,实现了",就像"好吧",但你不理解我们在构建什么吗?确实不理解。

另一件事我要说,例如Claude,我认为他们把谄媚程度调得相当好,当Claude表扬我时,我确实觉得我有点配得上,因为有时我给它的想法不是很成熟,我给一个我觉得还没完全想好的主意,它实际上反应不是很强烈的,就像"哦,我们可以实现那个"。但当我自己认为真的是个好主意时,它似乎会奖励得更多。所以我有点觉得我在试图赢得它的认可,这真的很奇怪。所以我认为人格真的很重要,我认为很多其他工具可能没有足够重视这一点。我认为在这方面Peter也非常在意,所以这是对的。然后是记忆系统,然后他只是享受这个乐趣,然后是单一的WhatsApp门户工具,所有的自动化。

主持人:你有没有用Claude做过什么超出软件工程的个人事情,你觉得有趣或好玩的?


4. Dobby:智能家居智能体

Andrej:是的,在一月份,我经历了一段Claude痴迷期。我建立了一个基本上照顾我家的Claude,我叫它Dobby(多比)。基本上我用智能体找到了我家所有的智能家居子系统,在局域网上,我有点惊讶它能开箱即用。我只是告诉它我想我家有Sonos,你能试着找一下吗?然后它就去对本地网络上的所有电脑进行IP扫描,找到了Sonos系统,结果发现没有——对于这种保护机制,它刚登录进去就说,哦,你安装了这些Sonos系统,让我试着逆向工程看看它是怎么工作的。它做了一些网络搜索,发现好的,这些是API端点,然后它说你想试试吗?我说,你刚才就做了?我说,好的,你能试着在书房播放点什么吗?它就播放了,音乐出来了,我说我不敢相信,这太疯狂了,就三个提示词,我不敢相信我刚才输入了"你能找到我的Sonos吗",突然就开始播放音乐了。

灯光也是同样的操作。所以基本上,它有点像黑客入侵,搞清楚了整个系统,创建了API,创建了仪表板,这样我就能看到家里所有灯光的指挥中心,然后它可以开关灯。所以我可以让它说"该睡觉了",当它说该睡觉的时候,就意味着所有灯都关掉,等等。所以它控制着我所有的灯、我的暖通空调、我的窗帘、泳池和水疗设施,还有我的安全系统。

我在房子外面装了一个摄像头,每当有人开车进来,我有一个视觉模型会查看视频。首先有变化检测,然后基于变化检测,它会进入下一步。然后它实际上会告诉我,给我发WhatsApp消息,显示外面的图像,然后说"嘿,联邦快递的车刚到了,联邦快递的车刚到了,你可能想查看一下,你有新邮件"之类的,Dobby就给我发了这个,太不可思议了。

所以Dobby掌管着整个房子,我通过WhatsApp和它发短信,有这些维护房子的宏操作真的很有趣。我还没有真正把它推得更远,我觉得人们用它做更疯狂的事情,但对我来说,即使是这个家庭自动化设置,我以前要用六个完全不同的应用,现在我再也不用这些应用了,Dobby用自然语言控制一切,太神奇了。所以我觉得我甚至还没有完全发挥这个范式的潜力,但已经非常有帮助了。

主持人:所以我想说,你认为这是否表明了从用户体验角度来看,人们对软件的期望?因为我觉得有一点被忽视了,那就是人类学习新软件、新UI是需要付出努力的。

Andrej:是的,我觉得在某种程度上是对的。这就像是从人们认为AI应该是什么样的这个角度倒推,因为人们心目中的AI,实际上并不是原始状态下的LLM。LLM是一个token生成器,你知道,更多的token输出,但他们想的是这种人格化的身份,可以告诉它事情,它会记住,就像是WhatsApp背后的一个实体,更容易理解。所以我觉得在某种程度上,这是在匹配人类对AI应该如何表现的已有期望,但在底层有很多技术细节,LLM作为原始工具来说太粗糙了,对大多数人来说不能真正算作AI,如果这说得通的话。

主持人:是的,我觉得这就是我们如何理解AI,把它描述成Dobby或某个人,显然能引起人们的共鸣。我也觉得你把六个不同的家庭自动化软件系统统一起来,这指向了另一个问题:人们真的想要我们今天拥有的所有软件吗?因为我想说,你有硬件,但你现在把软件或者说UI层扔掉了。你觉得这是人们想要的吗?

Andrej:是的,我觉得有一种感觉,应用商店里这些用于智能家居设备等的应用,在某种程度上甚至不应该存在,不应该只是API,某些智能体应该直接使用它,不是吗?我可以做各种家庭自动化的事情,任何单个应用都做不到,而LLM实际上可以驱动工具,调用所有正确的工具,做相当复杂的事情。

所以在某种程度上,这指向了可能过度生产了大量定制应用,这些应用不应该存在,因为智能体有点像把它们都整合起来,一切都应该更像是暴露的API端点,智能体是智能的粘合剂,实际上调用所有部分。

另一个例子是我的跑步机,我的跑步机有一个应用,我想记录我做有氧运动的频率。但我不想登录网页UI,走流程等等,所有这些应该只是开放API。

这有点像你正在走向智能体网络或智能体优先工具等等。我觉得整个行业必须以很多方式重新配置,客户不再是人类了,而是代表人类行事的智能体,这种重构在某些方面可能会相当重大。

人们有时对此的一种反驳是,我们期望人们用vibe coding来做这些工具吗?我们期望普通人做我刚才描述的这种事情吗?但我觉得在某种程度上,这只是今天已有的技术,现在确实有一些vibe coding,我实际上在观察它,我在与系统合作,但我觉得我刚才说的这种东西,在一两年或三年后应该是免费的,不需要任何web coding,这是微不足道的,这是基本功能,这是任何AI,即使是开源模型等都能做到的,你应该能够很容易地把技术性较低的人类意图翻译成实际行动。

主持人:是的,今天它涉及氛围编程,没多少人会去做,但你仍然需要做一些设计决策,对吧?我们刚才在聊,比如以框架为例,但我有种感觉,这只是开始,门槛会逐渐降低,最终就是某种软件代表你运行,某种类似Claude的东西帮你处理所有细节,而你并不参与。Claude有一台机器,它会自己搞定,只是呈现一个用户界面,你在旁边说说话就行。

我想问,你为什么没有……我觉得……去突破Claude个人使用的边界呢?是因为你在专注更重要的项目,比如Auto Research之类的,还是你在攀登精通的高峰,或者其他原因?

Andrej:对,我只是觉得自己被各种事情分散了注意力,所以我花了一周时间在Claude上,还有更多要做,但还没完成。不过我要说的是,就像Jensen说的,我们都变得更忙了。不幸的是,我没有真正利用很多邮件、日历和其他功能,也没有给它授权,因为我还是有点怀疑,而且它仍然很新,还很粗糙,所以我还不想让它完全接入我的数字生活。部分原因只是安全、隐私,以及在这个领域非常谨慎。所以有些东西因此被限制了,我想说,也许这是主导因素。但另一部分也是,我觉得自己被分散了注意力,因为感觉花了一周在Claude上,然后其他事情又发生了。


5. Auto Research:自动化的研究者

主持人:你之前提到过,能够训练或至少优化模型作为你希望看到智能体完成的任务,这个想法你已经提了很长时间。Auto Research背后的动机是什么?

Andrej:所以我想,我之前发过一条推文,大意是说,要想充分利用现在可用的工具,你必须把自己从瓶颈中移除。你不能在那里等着提示下一件事,你需要把自己抽离出来。你必须安排事情,让它们完全自主运行。如何最大化你的产出,但又不参与循环,这就是目标。所以我提到,现在的目标是提高你的杠杆效应。我只投入很少的token,偶尔一次,然后大量的事情就代我发生了。

所以Auto Research,我发了那条推文,人们好像挺喜欢的,但他们可能没有……没有深入思考其中的含义。对我来说,Auto Research就是这种含义的一个例子,就是我不想成为循环中的研究者,查看结果等等,我在拖系统的后腿。所以问题是如何重构所有的抽象层,让我不再参与。你安排一次,然后启动。关键是如何让智能体运行更长时间,无需你的参与,代你做事。

Auto Research就是,对,给你一个目标,给你一个指标,给你能做什么和不能做什么的边界,然后去吧。你会惊讶于它的有效性。

主持人:是的,我没想到它能成功。

Andrej:因为我有nanochat这个项目,从根本上说,我觉得很多人对我痴迷于训练GPT-2模型等感到很困惑。但对我来说,训练GPT模型等只是训练LLM的一个小试验场。从根本上说,我更感兴趣的是……这种递归自我改进的想法,以及LLM能在多大程度上真正改进LLM。因为我认为所有前沿实验室,出于显而易见的原因,都在做这件事,他们都在尝试递归自我改进。所以对我来说,这有点像那个方向的一个小游乐场。

而且我觉得我已经用手动方式调整过nanochat了,用我习惯的老派方式。我是个研究者,做这个已经二十年了,我有一些……怎么说呢……earned confidence。我有二十年的经验,哦,我训练过这个模型几千次,做过大量实验,做过超参数调优,做过所有这些事情,我非常熟悉,做了二十年,达到了一定程度,我以为已经调得相当好了。

然后我让Auto Research跑了一晚上,它带回来了我没看到的调优方案。是的,我确实忘了值嵌入的权重衰减,我的Adam beta调得不够,这些东西是联合作用的,一旦你调了一个,其他的可能也要跟着变。对,我不应该成为瓶颈。我不应该运行这些超参数优化,我不应该查看结果,这里有客观标准。所以你只需要安排它,让它能永远运行下去。

所以这是Auto Research的单一版本,单一循环尝试改进。我很惊讶它找到了这些东西,你知道,这个仓库已经调得相当好了,还是找到了一些东西。而这只是单一循环,像那些前沿实验室,他们有数以万计的GPU集群。所以很容易想象如何在较小的模型上实现大量这种自动化。从根本上说,围绕前沿级智能的一切都是关于外推和缩放损失的。所以你基本上在较小模型上做大量探索,然后尝试外推出去。

主持人:所以你是说我们的研究 efforts 会变得更高效,如果我们能更好地做这种实验,我们在扩展时也会有更好的方向?

Andrej:对,我想说,最有趣的项目,可能也是前沿实验室正在做的,就是你知道,你在较小模型上做实验,尽量让它自主运行,把研究者从循环中移除。从循环中他们有太多……怎么说呢……是自信,对,他们不知道自己其实根本不应该碰这些东西。所以你必须重写整个系统,因为现在我的意思是,当然他们可以贡献想法,但好吧,他们实际上不应该去执行这些想法。应该有一个想法队列,也许还有一个自动化的科学家,它基于所有存档论文和GitHub仓库来提出想法,然后把这些想法导入队列,或者研究人员也可以贡献想法,但这是一个单一的队列。然后有工作者从中拉取任务,尝试执行,不管什么东西奏效了就放到特性分支上,也许有些人监控特性分支,然后偶尔合并到主分支。所以是的,就是把人类从所有流程中移除,尽可能自动化,提高每秒token的吞吐量。这需要重新思考所有的抽象层,一切都要重新洗牌。所以是的,这非常令人兴奋。

主持人:如果我们再递归一步,模型什么时候会写出比你更好的program.md呢。

Andrej:是的,所以program.md并不完全是循环。program.md是我描述自动研究者应该如何工作的拙劣尝试,比如"做这个,然后做那个,然后尝试这类想法,然后这里有一些约束"。所以program.md只是我在尝试描述这个智能体,但理想情况下,program.md本身也应该是智能体维护的东西,它应该迭代它自己的program.md。所以是的,我认为这绝对是可能的。


6. 开源 vs 闭源

主持人:你如何看待开源模型的角色?我认为开源模型正在变得更好,但似乎仍然存在差距。你认为这个差距会缩小吗?还是你认为这会是一个持续的差距?

Andrej:我认为差距会持续存在,因为前沿实验室有大量的资源优势。他们有大量的计算能力,他们有大量的数据,他们有大量的工程人才。所以我认为差距会持续存在,但我认为开源会继续追赶。我认为开源社区非常创新,他们可以做一些聪明的事情,他们可以做一些创新的事情,他们可以利用社区的力量。

我认为开源会继续追赶,但我认为闭源会保持一定的领先,因为他们在资源上有优势。但我认为开源会在很多用例上变得足够好,我认为对于大多数消费者用例,开源模型实际上相当不错。我认为如果你展望未来更多年,似乎意味着大量简单的用例将得到很好的覆盖,实际上甚至可以在本地运行,但总会有对前沿智能的一些需求,而这实际上可能是非常大的一块蛋糕。

主持人:你认为前沿需求会是什么?

Andrej:可能前沿的需求会是诺贝尔奖级别的工作,或者把Linux从C语言迁移到Rust,会是那种规模更大的项目,你知道,那种范围的项目,可能会有更多,也许很多前沿的封闭智能会在那里互动,而开源会吞噬很多更基础的用例之类的。你知道,在某个时刻,今天的前沿是什么,可能今年晚些时候,我现在从封闭实验室使用的前沿技术可能会变成开源,那会做很多工作。所以我有点预期这种动态实际上会继续下去——我们会有拥有封闭AI的前沿实验室,有点像这些神谕,然后开源会落后几个月,我有点预期这种情况会继续,实际上我认为这是一个相当好的整体设置,因为我对拥有……我实际上不认为这在结构上是……我认为仅仅拥有封闭的智力存在一些系统性风险,那是……

主持人:就是这样。我认为,你知道,在我看来,中心化在过去有着非常糟糕的记录。

Andrej:你是说在政治或经济系统中吗?

主持人:完全正确,有很多……东欧有很多相当糟糕的先例。所以我希望有一个东西,可能不在能力的边缘,因为它是新的、未探索的等等,但我希望有一个落后的东西,它有点像整个行业都能接触到的智能的共同工作空间。

Andrej:是的,在我看来,这对行业来说是一个相当不错的权力平衡。

主持人:是的,我也认为有很多问题需要解决,对吧?如果你不断从前沿推进智能,我们可以做新的事情,而人类有很多非常大的问题,所以似乎这将继续是一个非常昂贵的游戏。所以我想要支持正在做这件事的实验室,因为有一些问题我们无法解决,除非以非常昂贵的方式继续推进模型。然而,正如你指出的,如果我们今天拥有的前沿是开放的,那是很大的能力。

Andrej:是的,没错。所以我认为,你知道,这种力量或这种民主化似乎非常有用,也很健康。是的,我认为基本上偶然地,我们实际上……偶然地处于某种意义上的好位置。嗯,在某种程度上,这种动态持续的时间越长,生态系统可能就越健康,因为你有越来越多的曲线下面积。我要说的是,即使在封闭方面,我几乎感觉最近更加集中化了,因为我认为很多领跑者不一定是一流的,所以是的,从这个意义上说,我认为这不是超级理想。我希望有更多的前沿实验室,因为我默认非常怀疑……我希望房间里有更多的人,我认为在机器学习中,集成总是优于任何单个模型,所以我希望有集成的人在思考所有最困难的问题,我希望房间里有一群人,他们都要充分了解情况,做出所有这些决定。

主持人:所以我不希望是两三个人关起门来,我觉得那不是什么好特征。我几乎希望长期和短期都有更多的实验室,我确实认为这有发挥作用的地方。我希望它能坚持下去,基本上它目前稍微落后一点,这实际上是一件好事。


7. 机器人与物理世界

主持人:你之前从事过汽车通用机器人自主性的前身工作,过去几个月机器人公司也发生了很多事情,比如环境的真正令人印象深刻的泛化加速、任务的泛化、长程任务的增加、大量资金涌入这个领域,这会发生吗?从你的角度来看,最近有什么变化吗?

Andrej:所以我的观点很大程度上受到我在自动驾驶中看到的情况的影响,我确实觉得自动驾驶是第一个机器人应用,所以我当时看到的可能是,10年前有大量初创公司,我有点感觉……大多数基本上……长期做得很好,我看到的是大量资本支出投入其中。

需要大量时间,所以我认为,我觉得机器人技术因为它非常困难、非常混乱,需要巨额资本投入和大量坚定的信念,这是一个大问题,而且我认为原子层面的东西真的很难,所以我感觉它会落后于数字空间即将发生的事情。

在数字空间里,将会有大量的"解绑"发生,基本上就是那些效率不太高的事情会变得高效得多,效率提升可能达到100倍,因为比特要容易处理得多。所以我认为,目前就即将发生的变化和活跃领域而言,我感觉数字空间将会发生巨大变化,然后物理空间会落后。

我觉得非常有趣的是这两者之间的接口,因为我认为,如果我们确实有更多代表人类行动的智能体,更多智能体之间相互交流、执行任务、参与智能体经济等等,你总会在某个时刻耗尽纯数字空间里能做的事情,你必须走向宇宙,你必须向它提问。

你必须运行一个实验,看看宇宙告诉你什么,从而获得反馈、学到东西。所以我们目前有大量数字工作,因为就我们集体已经数字化的内容而言,存在一个认知盈余——我们只是没有足够的人类思考周期来思考所有已经数字化、已经上传的信息。所以我们将会开始耗尽那些实际上已经上传的内容。

所以在某个时刻你会读完所有论文、处理它们,并对尝试什么有一些想法,但是的,我们只是……我其实不知道你能获得多少完全封闭的智能,它只能获取已有的信息。所以我认为将会发生的是,首先会有大量的"解绑",我觉得那里有大量的工作要做,然后实际上会转移到物理和数字之间的接口,那就是感知世界的传感器和对世界采取执行动作的执行器。所以我认为很多有趣的公司实际上会来自那个接口——我们能否以某种意义给超级智能喂食数据,我们能否真正取出数据并操控物理世界。

主持人:如果你想把整个事情拟人化的话。然后物理世界,我其实觉得就总可寻址市场、工作量等方面而言,规模是巨大的,甚至可能比数字空间里能发生的要大得多。所以实际上我认为这也是一个更大的机会。但我确实觉得这是大量的工作,在我看来原子要难一百万倍,所以它会落后,但我也认为市场稍微更大一些。所以机会大概会沿着那种轨迹发展。所以目前数字是我的主要兴趣,然后是接口,再然后也许一些物理事物,它们的时机将会到来,到来时会很巨大。

这也是一个有趣的框架,因为某些事情——不是我现在正在做的——但某些事情即使在原子的世界里也容易得多,对吧。如果你只是想想对物理世界的读写,读就像传感器、摄像头,有很多现有的硬件,你可以想象。

主持人:如果你足够聪明,丰富智能体的能力或捕获大量新数据,你不一定需要大量投资就能获得有价值的东西。

Andrej:是的,所以我看到的例子,比如我朋友Liam是Periodic的CEO,我上周去拜访了他们,所以正好在脑海里——他们试图为材料科学做自动化研究。所以在那种情况下,通向智能体的传感器实际上是相当昂贵的实验室设备,生物学也是如此。我认为很多人对工程生物学非常感兴趣,你知道传感器将不仅仅是摄像头,如果这说得通的话。然后我看到的另一个例子是,有些公司试图让人们为训练数据付费,程序化地,是的,去喂养那个"博格"。所以这些都是某种意义上的传感器的例子,它们呈现多种多样的形态,如果这说得通的话。所以我期待能够要求物理世界完成一项任务、给它定价、告诉智能体的那一刻。


编者:每个程序员/研究员看完应该都很有共鸣吧。也许先被AI取代的人,先看到未来。