Linguista

「EconTalk - with Dwarkesh Patel」AI的过去与未来:规模化时代、未来展望与人类角色

「简报」AI的“规模化”浪潮:算力驱动下的飞跃与未解之谜

在人工智能领域,一场由计算能力指数级增长驱动的变革正在重塑技术格局,但其底层原理的神秘面纱仍未完全揭开,引发了关于未来机遇与深刻社会影响的激烈讨论。

近年来,人工智能(AI)取得了令人瞩目的进展,从大型语言模型(LLM)如ChatGPT的惊艳亮相,到不断涌现的新能力,公众和业界的目光往往聚焦于算法的创新。然而,播客作者、与Gavin Leech合著《规模化时代:人工智能口述史 2019-2025》的Dwarkesh Patel在与EconTalk主持人Russ Roberts的深度对话中指出,一个更根本、或许被低估的趋势是过去六年(2019-2025)的主旋律——“规模化”(Scaling)。

Patel认为,近期AI突破的真正基石,在于计算能力(Compute)和数据量的爆炸式增长。他提到,AI领域的算力投入大约以每年翻两番 (4×) 的速度增长,投资规模从十年前的学术爱好飙升至如今的数千亿美元级别。这种规模的扩张并非线性,模型性能的代际飞跃,如从GPT-2到GPT-3,再到GPT-4,往往伴随着大约百倍 (100×) 的算力投入增加。

“这就像一个进化过程,”Patel解释道,“有了更多的算力进行实验,你才能尝试不同的想法,才能发现为什么像Transformer这样的架构比之前的更好。”Transformer架构由谷歌研究人员在2018年左右提出,其关键优势在于易于在大型GPU集群上并行训练,这使其极度契合“规模化”的需求。将其与简单的“预测下一个词”训练目标相结合,产生了出乎意料的智能涌现。

进展背后的经验主义与认知鸿沟

尽管成果斐然,AI研究者们,包括构建这些复杂系统的顶尖科学家,对于规模化为何有效的根本原因仍缺乏令人满意的理论解释。Patel引用了Anthropic公司CEO Dario Amodei的坦诚之言:“事实是,我们仍然不知道。这几乎完全只是一个偶然的经验事实。”这种状况凸显了当前AI发展在很大程度上依赖于经验性的试错和扩展,而非完全的理论指导——投入更多算力、更多数据,观察会发生什么。

这种“黑箱”特性也体现在AI能力的矛盾表现上。当前的LLM可以在某些认知任务(如前沿数学、编程)上表现出色,但在看似更简单的常识推理和与物理世界交互的能力上却步履蹒跚。Patel指出了所谓的“计算机使用”难题:模型难以可靠地执行需要多步骤、与外部系统交互的现实任务,如预订航班或组织活动。这呼应了Hans Moravec早在数十年前提出的悖论:对人类来说困难的抽象任务对AI相对容易,而人类凭直觉就能完成的感知、运动和常识性任务,对AI来说却异常困难。

“蜂巢思维”与未来的不确定性

展望未来,Patel对单一超级智能(ASI)通过纯粹思考解决所有问题的设想表示怀疑。他更倾向于一种“蜂巢思维”(Hive Mind)的图景:数十亿个AI以超人速度思考、高效通信、任意复制和合并,形成一种前所未有的集体智能。这种集体优势并非源于个体IQ的无限拔高,而是数字生命特有的协同能力,可能带来指数级的经济增长和知识积累,但也可能引发关于控制权和中心化风险的担忧。

在讨论通用人工智能(AGI)的路径时,Patel预测,首个AGI可能效率低下、成本高昂(他形象地比喻为“耗资相当于蒙大拿州的基础设施”),依赖于如“推理扩展”(让模型思考更长时间以提升性能)等技巧。其最终目标是达到或超越人脑约20瓦 (20 W)的能效水平,但这将是一个漫长的过程。

深刻变革:超越工具,重塑体验

这场由规模化驱动的AI革命,其影响远不止于创造更强大的工具。主持人Russ Roberts表达了一种深刻的担忧,他称之为“悲伤”而非恐惧:AI可能从根本上改变人类日常生活的结构,使许多我们珍视的体验——如智力发现的快感、获得认可的成就感、探索世界的自主感——变得过时或失去意义。他反思道:“世界会物质更丰富……但会不会有更多的人类繁荣(human flourishing)?我不太确定。”

对此,Patel则持一种更为审慎的乐观态度。他认为,人类历史上已经适应了多次巨大的技术和社会变迁,未来或许也能适应一个物质极大丰富的时代。他甚至提到了“跨人类主义”(Transhumanism)的可能性,即人类利用技术增强自身,开启新的体验维度。但他同时也承认,我们正站在一个前所未有的变革门槛上,未来的图景充满了巨大的不确定性。

这场关于AI规模化时代的对话揭示了一个核心张力:人类正以前所未有的速度构建日益强大的人工智能系统,其驱动力主要是资源投入的规模效应,而非对其工作原理的完全理解。这种建立在经验基础上的飞速发展,使得预测未来轨迹、评估潜在风险以及思考人类自身在智能机器时代的角色,成为当下最为紧迫和困难的议题之一。正如Patel所言,关于智能是否会反馈自身、社会将如何演化等根本性问题,“可能是当今世界最重要的辩论”。

访谈录

内容介绍

本次访谈录呈现了EconTalk主持人Russ Roberts与播客作者、《The Scaling Era》合著者Dwarkesh Patel之间的一场深度对话。访谈围绕着人工智能(AI)在2019年至2025年间经历的快速发展展开,核心聚焦于“规模化”——即计算能力和数据量的指数级增长——在驱动AI进步中所扮演的关键角色。Patel阐述了为何这一时期对于理解AI至关重要,并探讨了如Transformer等关键技术如何受益于并进一步推动了规模化的趋势。

对话不仅限于技术层面,更深入到AI当前的能力边界与显著局限,例如其在执行复杂现实世界任务和运用常识方面的挑战。双方进一步探讨了关于智能本质的基础性问题,以及为何简单的规模扩张能够产生看似智能的行为,尽管我们对此仍缺乏完整的理论解释。

展望未来,访谈触及了通用人工智能(AGI)和超级人工智能(ASI)的可能性,Patel提出了引人深思的“蜂巢思维”概念,并与Roberts就AI对社会结构、人类角色及个体生活意义的深远影响进行了交流,其中既有对技术潜力的乐观展望,也包含了对人类独特体验可能受到冲击的审慎思考。此外,对话还穿插了关于AI领域创新过程的讨论,以及对播客制作技艺和好奇心驱动知识探索的有趣反思。

内容纲要

 访谈:AI的规模化时代、现状与未来 (Russ Roberts & Dwarkesh Patel)
    ├── 引言与核心议题
    │   ├── 嘉宾介绍:Dwarkesh Patel,《The Scaling Era》作者
    │   └── 核心问题:为何关注2019-2025年AI发展?“规模化”的重要性
    ├── “规模化时代” (The Scaling Era)
    │   ├── 定义:算力 (Compute) 和数据 (Data) 的指数级增长是关键驱动力
    │   ├── 证据:算力投资剧增 ($数千亿), 算力年增长率 (~$4 \times$), 模型代际算力需求 (~$100 \times$)
    │   ├── 意义:解释了近期AI突破(如GPT系列)的基础
    │   └── 根本问题:为何规模化有效?智能的本质(经验事实,缺乏理论解释)
    ├── AI技术与当前进展
    │   ├── 关键技术:Transformer架构(易于并行、适合扩展)
    │   ├── 训练方法:“预测下一个词”的有效性
    │   └── 近期趋势(2024年底后):
    │       ├── 推理扩展 (Inference Scaling) 成为新前沿
    │       ├── 预训练扩展 (Pre-training Scaling) 边际效益递减
    │       └── 模型差异化:趋同 vs. 特定优化目标 (Anthropic vs. Others)
    ├── AI能力、局限与应用
    │   ├── 当前应用:头脑风暴、研究、翻译、建议 vs. 工作流自动化(效果有限)
    │   └── 核心局限:
    │       ├── 缺乏可靠的“计算机使用”能力(多步骤现实任务)
    │       ├── 常识与长期代理能力 (Agency) 短板 (Moravec悖论现象)
    │       └── 未展现出基于广博知识的创造性发现(类比镁与偏头痛)
    ├── 未来方向与推测
    │   ├── AGI/ASI路径:
    │   │   ├── 首个AGI可能低效、昂贵,依赖技巧(如推理扩展)
    │   │   └── 目标:达到或超越人脑效率 ($20$ W)
    │   ├── 智能反馈循环:AI能否加速自身发展?
    │   ├── 核心观点分歧:
    │   │   ├── 单一超级智能 (Dwarkesh怀疑)
    │   │   └── AI“蜂巢思维” (Hive Mind) (Dwarkesh倾向):集体智能、超人协作
    │   ├── 未来社会结构:中心化 vs. 去中心化,过渡期风险
    │   └── 人类长期独特能力:Dean Ball清单 vs. Moravec悖论的启示
    ├── 社会影响与人类福祉
    │   ├── Russ的担忧(“悲伤”):AI可能改变生活结构,使人类独特乐趣失色
    │   └── Dwarkesh的回应(乐观):
    │       ├── 人类的适应能力 (历史经验)
    │       ├── 跨人类主义 (Transhumanism) 的可能性
    │       └── 未来视角可能远超当下想象 (类比公元1000年)
    ├── 创新本质与理解缺失
    │   ├── AI发展特点:试错与经验扩展 > 理论指导
    │   ├── 从业者现状:构建复杂系统但缺乏完全理解
    │   └── 历史类比:莱特兄弟、蒸汽机、制药业
    ├── 元讨论:播客制作与好奇心
    │   ├── 播客准备:深度研究 (Dwarkesh) vs. 高效阅读与框架 (Russ)
    │   ├── 优质访谈要素:建立融洽关系、深入追问、真诚交流
    │   ├── 嘉宾选择:名人 vs. 深度专家 (Sarah Payne, David Reich)
    │   ├── 独立内容创作:可行性与挑战 (天赋 vs. 努力)
    │   └── 好奇心的作用:知识激发更多探索,访谈是探索边界的方式
    └── 结论与致谢

AI访谈:规模化时代、未来展望与人类角色

受访者:Dwarkesh Patel (播客作者,《The Scaling Era》合著者) 采访者:Russ Roberts (EconTalk 主持人)


一、 引言与核心主题

Russ (主持人): 今天是2025年3月25日,我的嘉宾是播客作者Dwarkesh Patel。你可以在YouTube、Substack以及drakesh.com上找到他。他与Gavin Leech合著了《规模化时代:人工智能口述史 2019-2025》(The Scaling Era: An Oral History of AI 2019-2025),这也是我们今天以及我猜想的许多其他话题的主题。Dwarkesh,欢迎来到EconTalk。

Dwarkesh (嘉宾): 谢谢你邀请我,Russ。我一直是你的粉丝,我刚才还在跟你说,大概在我开始做自己的播客之前很久就是了。所以能和你交流真的非常酷。

Russ (主持人): 我非常感谢。我也很欣赏你的工作。我们会谈到一些。你在书的开头提到——我得说这本书由Stripe Press出版,他们制作的书非常精美,不幸的是我看到的是PDF版本,但即便是PDF也很漂亮,我相信实体书会更棒——你说我们需要审视过去的六年,从2019年至今。我们为什么要关注这段时间?我们错过了什么?

Dwarkesh (嘉宾): 我认为在大众对AI的普遍认知中,甚至在研究人员谈论它时,存在一种观点,认为发生的大事是我们取得了算法上的突破,提出了新的大思想。这确实发生了,但其背景是这些宏观趋势,最重要的是算力的积累、数据的积累。甚至这些新算法也是在这种进化过程中产生的,如果你有更多的算力进行实验,你就可以尝试不同的想法。如果你没有更多的算力,你事先不会知道为什么Transformer比以前的架构效果更好。然后当你审视我们为什么从GPT-2到GPT-3到GPT-4,再到我们现在使用的模型时,这又是一个投入越来越多算力的故事。这就引出了一系列问题,比如,智能的本质是什么,以至于你只需将一大堆算力投入到广泛的数据分布中,就能在另一端得到一个能解决问题的、具有能动性的事物?它还引发了许多关于未来会发生什么的问题。但我认为,这种算力每年增长约4倍的趋势 (4×),投资水平达到如今数千亿美元的规模——而这在十年前还只是一个学术爱好——这才是被忽视的趋势。

二、 规模化的核心作用 (The Scaling Era)

Russ (主持人): 我没有提到你是计算机科学专业的,所以你懂一些我完全不懂的东西。

(接上一部分关于规模化重要性的讨论)

Dwarkesh (嘉宾): (继续解释规模化趋势)...每年算力投入大约翻两番 (4×)。投资水平达到如今数千亿美元的规模——而这在十年前还只是一个学术爱好——这才是被忽视的趋势。

Russ (主持人): 你为什么把你的书命名为《规模化时代》(The Scaling Era)?这暗示着另一个时代即将到来,如果不是很快的话。你知道那会是什么吗?它会被叫做别的名字吗?你知道它会被称为什么吗?强化学习(RL)时代?

Dwarkesh (嘉宾): 不,我认为它仍将是...“规模化”(Scaling)指的是我们正在让这些系统变得大上成百上千倍。如果你看从像GPT-3到GPT-4,或者GPT-2到GPT-3的飞跃,这意味着你将用于系统的计算量增加了大约100倍 (100×)。这不完全是这样,因为随着时间的推移,你也会发现使模型更高效的方法,但基本上,如果你使用相同的架构来获得相同水平的性能,你将需要增加100倍的计算量才能从一代升级到下一代。所以这就是指这个意思,即从一个级别到下一个级别,算力呈指数级增长。未来的大问题是,我们是否会看到这种模式——我认为我们会看到这种模式,因为人们仍然希望在训练系统上投入大量算力。而且我们按计划将获得算力的大幅增长,因为公司在ChatGPT爆炸性成功后订购的集群现在正在上线。问题在于,要实现推理、代理能力等方面的重大突破,需要多少算力。

三、 关键技术与当前进展

Russ (主持人): Transformer是什么?解释一下,它是这项技术的一部分。

Dwarkesh (嘉宾): Transformer是谷歌研究人员在2018年发明的一种架构。它是ChatGPT以及你思考大语言模型(LLM)时所玩的那类模型背后的基础性架构突破。它与之前的架构的区别在于,它更容易进行并行训练。所以如果你有这些巨大的GPU集群,Transformer在扩展上比其他架构实用得多。这使我们能够不断地在这个试图让这些东西变得智能的问题上投入更多的算力。另一个重大突破是将这种架构与一个非常简单的训练过程结合起来:预测下一个词。我们现在只是知道它是这样运作的,所以我们会说,当然,这就是获得智能的方式。但这实际上非常有趣,对吧?你在维基文本中预测下一个词,随着模型越来越大,它能捕捉到越来越长的模式,以至于现在它完全可以通过图灵测试,甚至在某些任务中提供帮助。

Russ (主持人): 是的,我想你说它变得“智能”,显然你是在打引号,但……也许不是,我们稍后会讨论这个。在第一章的末尾,你说:“本书的知识截止日期是2024年11月。这意味着在此之后发生的任何信息或事件将不会反映出来。”那已经是两个世纪前的事了。这对书以及你思考和谈论它的方式有何影响?

Dwarkesh (嘉宾): 显然,此后的大突破是推理扩展(inference scaling),像01和03这样的模型,甚至DeepSeek的推理模型。所以在某种重要意义上,这与过去是一个很大的断裂。以前我们认为,预训练(pre-training),也就是简单地让模型变得更大——比如从GPT-3.5到GPT-4——是进步的来源。但现在看来,单靠这个似乎有点令人失望。GPT-4.5发布了,它比GPT-4好,但没有显著提高。所以下一个前沿现在是,你能从尝试让这些较小模型针对特定目标进行训练中榨取多少潜力?不仅仅是预测互联网文本,而是“为我解决这个编程问题”、“为我解决这个数学问题”。这能带来多少提升?因为这些是可验证的问题,你知道答案,你只需要看模型能否得到那个答案。我们能否在稍微困难一些、更模糊的任务上取得一些进展?可能就像你做的研究类型,或者那些需要大量连续步骤的任务。比如,模型仍然不能可靠地使用计算机,对吧?而这正是很多经济价值所在。要实现远程工作的自动化,你实际上必须能做远程工作。所以,这是一个很大的变化。

Russ (主持人): (对Dwarkesh关于Russ研究类型的评论的回应)...我现在迷上了Claude。有传言说Claude处理希伯来语比其他LLM更好。我不知道这是否属实,因为我的希伯来语不够好,无法验证。但如果你问我为什么喜欢Claude,答案很尴尬:字体真的太棒了。它在我手机上的显示方式排列得很漂亮。它就是一个可爱的视觉界面。有些工具在某些特定任务上确实比其他工具好得多。我们知道这一点吗?业内人士知道吗?他们对此是否有哪怕模糊的概念?例如,我假设有些可能更擅长编码,有些可能更擅长深度研究,有些可能更擅长思考,也就是在回答前花时间。这对许多普通人想做的事情来说,它们之间有区别吗?我们知道吗?我们知道原因吗?

Dwarkesh (嘉宾): 我觉得普通人比AI研究人员更能回答这个问题。我有一个问题是,从长远来看,这里的趋势会是什么?在我看来,这些模型有点相似,而且不仅相似,它们随着时间的推移变得越来越相似。现在每个人都在发布推理模型,不仅如此,他们在推出新产品时,不仅抄袭产品,还抄袭产品名称。谷歌的Gemini有“深度研究”,OpenAI也有“深度研究”。你可以想象,从长远来看,它们可能会有所区分。看起来各个实验室确实在追求某种不同的目标。像Anthropic这样的公司似乎更侧重于优化完全自主的软件工程师,因为他们认为这是首先释放大量价值的地方。而其他实验室可能更侧重于优化消费者采用,或者仅仅是企业应用之类的。但至少到目前为止,告诉我你的印象如何,但我的感觉是它们感觉挺相似的。

Russ (主持人): 它们确实很像。事实上,我认为在像翻译这样的事情上,一个真正的双语者可能会有偏好或品味。

四、 AI的能力、局限与应用

Russ (主持人): (继续讨论模型相似性)...你知道,我的用途——实际上,我会问你在个人生活中用它做什么,而不是你在理解该领域的智力追求。对我来说,我现在用它来做头脑风暴——比如“帮我想想思考某个特定问题的方法”。还有辅导——我不确定Transformer是什么,所以我问了Claude它是什么,我稍后还会举另一个例子。我经常用它来翻译,因为我觉得Claude比谷歌翻译好得多,感觉上是这样。我不知道它是否比ChatGPT更好。最后,我喜欢向它咨询旅行建议,这很奇怪我这样做。你知道,有无数网站说罗马有12个最佳景点,但出于某种原因,我想要Claude的意见。还有,“给我推荐这个地方附近的三家酒店”。我对它有一种完全非理性的信任。这就是我的用途。我们会回到还有什么重要的事情上,因为这些事情虽然不错,但并非特别重要。你在个人生活中用它做什么?

Dwarkesh (嘉宾): 研究。因为你知道,作为播客主持人的工作,我每周或每两周为每位嘉宾做准备。在准备过程中,有一个可以互动的东西是非常有帮助的。因为你知道,你读了一些东西,但你感觉不到为什么这很重要,它如何与其他想法联系起来。能够持续地与你的困惑进行互动非常有帮助。另一件事是,我尝试将这些LLM整合到我的播客工作流程中,帮助我找到剪辑片段,自动化某些类似的事情。它们在某种程度上有点用,老实说不是那么有用。但是,是的,它们对研究来说作用巨大。我好奇的一个大问题是,当我们得到完全的——当它们能够真正使用计算机时,那是否会是一个巨大的解锁,无论是对我还是对其他人能提供的价值而言?

Russ (主持人): 解释一下你这是什么意思。

Dwarkesh (嘉宾): 现在它们……有些实验室推出了名为“计算机使用”(computer use)的功能,但它们就是不太行。它们无法可靠地完成像帮你预订航班或为一个欢乐时光安排后勤这样的事情,以及无数其他类似的事情,对吧?你知道,人们有时用这样的框架来看待这些模型:它们现在是高中水平,现在是大学水平,现在是博士水平。显然,一个博士——我的意思是,一个高中生可以帮你订机票,也许一个高中生尤其能做到,博士可能就不行了。所以问题是,到底出了什么问题?为什么它们在这方面(指高级认知任务,如回答前沿数学问题)如此聪明——这些新推理模型能回答前沿数学问题——但它们却不能帮我组织(活动)?它们不能玩一个全新的视频游戏?这到底是怎么回事?我认为这可能是我们未来一两年会了解到的根本问题:这些它们所具有的“常识性”弱点,是否是某种内在问题,我们是否低估了……我的意思是,一个类比是,我相信你以前听过这个,但我的感觉是,当深蓝(Deep Blue)击败卡斯帕罗夫时,有一种感觉,好像智能的一个基本方面被破解了。但回过头来看,我们意识到,实际上那个国际象棋引擎是非常狭隘的,并且缺少了很多自动化一个工人或其他事情所必需的基本组成部分。我想知道,如果事后看来,如果我们回顾这些模型——在我完全错误的那个版本里,这些模型并没有那么有用——我们是否会对自己说,关于长期代理能力、连贯性和常识,我们当时是低估了某些东西。

Russ (主持人): 嗯,我认为在我们对它们有更好一点的理解之前,我不知道我们是否能解决那个问题。你知道,你问过Anthropic的负责人一些关于它们是否有效的问题。你问:“从根本上说,规模化(scaling)为什么有效的解释是什么?为什么宇宙是这样组织的,以至于如果你向足够广泛的数据分布投入大量的计算资源,这东西就会变得智能?”Anthropic的CEO Dario Amodei说:“事实是,我们仍然不知道。这几乎完全只是一个偶然的经验事实。这是一个你可以从数据中感知到的事实,但我们仍然没有一个令人满意的解释。”这似乎是一个巨大的障碍。那种……那种未知似乎是一个巨大的障碍,阻碍了让它们在实际成为虚拟助手方面做得更好——不仅仅是给我关于罗马的建议,而是预订行程、预订餐厅等等。没有这个(理解),我们将如何改进它们?模型中那些古怪的部分,幻觉的部分……

Dwarkesh (嘉宾): 是的,是的。这是一个我觉得我们在未来一两年会得到很多好证据的问题。我在那次采访中问Dario的另一个问题,我感觉我仍然没有得到好的答案,是这样的:看,如果你有一个人类,他记住了和这些LLM一样多的东西,对吧?它们基本上知道任何人类写下来的所有东西。即使是一个中等聪明的人,也应该能够建立一些非常有趣的联系,做出一些新的发现。我们有人类这样做的例子。有一个人发现,如果你观察镁缺乏时大脑发生的变化,它实际上看起来非常像偏头痛的样子。所以,通过给人们补充镁剂或类似的东西,解决了很多偏头痛问题,对吧?那么,为什么我们没有证据表明LLM利用它们拥有的这种独特的、不对称的优势,以这种创造性的方式来达到某些智能目的呢?对于所有这些问题都有答案,人们给了我一些有趣的答案,但很多问题仍然存在。

五、 AI发展的本质与未来展望

Russ (主持人): (继续之前关于规模化效率和成本的讨论)...退一步看,展望一下AGI(通用人工智能)。总有一天,AGI的运行效率至少能和人脑一样高,对吧?人脑以20瓦 (20 W)的功率运行。而一个H100芯片,例如,大约需要1000瓦 (1,000 W)的功率,这可能只能存储一个模型的权重之类的。但我们知道,在物理上,人脑使用的能量足以驱动人类水平的智能是可能的,甚至可能比这更高效。但在我们达到那个水平之前,我们会建造一个AGI,它可能耗资相当于蒙大拿州的基础设施,需要数百亿美元的资本支出,并且在各种奇怪的方式上显得笨拙。也许你必须使用某种推理扩展(inference scaling)的技巧——我指的是这样一种想法:通常你可以通过让模型思考更长时间来解决难题。事实上,它奇怪地持续扩展,不仅当你增加一页思考,而是增加100页思考,1000页思考。我常常在想,OpenAI用这些视觉处理谜题(称为ARC KGI)解决了一个挑战,它持续改进,直到思考了大约5000页关于这些非常简单的视觉挑战。我有点想看看第300页上写了什么,它取得了什么重大突破使得那一步有价值?总之,存在这种技巧,你不断投入更多算力去思考,从而得到更好的输出。这将是第一个AGI。我们会建造它,因为它仍然非常有价值。拥有一个AGI是如此有价值,以至于我们会用我们能想到的最没效率的方式来建造它。我们建造的第一个AGI不会是物理上可能的最有效率的那一个。但是……是的。

Russ (主持人): 你能想到另一种技术,其中试错被证明如此成功吗?你知道,我之前和Matt Ridley做过一次精彩的关于创新和技术的访谈。他其中一个见解(我不确定是不是他的,但他书中写到的,我认为是他的)是,很多时候专家们落后于那些只是在……瞎鼓捣的人。你知道,他谈到莱特兄弟只是些自行车修理工,他们并不特别懂空气动力学,他们只是尝试了一堆东西,直到最终飞离了地面。这里的含义是——我不确定我是否认为这接近于事实——我们现在这个世界,这些智力上极其复杂的计算机科学家正在构建这些异常复杂的Transformer架构,但他们却不知道它们是如何工作的。这真的很奇怪。如果你不知道它们如何工作,让它们变得更好的最简单方法就是做更多迄今为止有效的事情,并期望它最终会跨过你可能希望它跨过的某个界限。但是……你能想到另一种技术,其中试错与其中蕴含的深刻智力深度如此紧密地结合在一起,成为如此重要的一部分吗?这在我看来相当不寻常,我猜。

Dwarkesh (嘉宾): 我觉得大多数技术……实际上我很想听听你对经济史等方面的看法,但我觉得大多数技术可能都有这个元素:个体天才的作用某种程度上被高估了,而是在微小改进上持续积累。而且通常不是像Transformer那样的某个重大突破,而是比如你找到了一个更好的优化器,你找到了更好的硬件,对吧?很多这些突破都取决于这样一个事实:我们不可能在90年代做同样的事情。实际上,那时人们有类似的想法,只是它们没有被扩展到足以让你看到当时AI潜力的水平。但我确实认为这对我们来说是一个非常重要的问题。因为这里最大的问题……或者说这里的核心问题不是“我们今年想用哪个模型”之类的问题。核心问题是:智能是否会反馈于自身?它会在多大程度上反馈于自身?如果它确实反馈,我们最终是否会得到某种超人智能?因为这些东西正在制造更好的模型,或者类似的事情。那么问题就在于,你是否只需要一百万个超级智能的AI研究人员,一百万个自动化的Ilya Sutskever或Alec Radford,他们思考“人脑的架构是什么?我们如何在机器中复制它?”或者你是否需要那种进化过程,它需要大量的算力进行实验,甚至可能需要硬件突破?那仍然会是变革性的。希望在某个时候我们可以讨论这个……我非常想听听更多经济学家对于爆炸性增长潜力等的看法。这仍然与一个需要一年以上才能实现智能爆炸的世界相容,但这是一个根本性的问题:智能是否会反馈于自身?

Russ (主持人): 是的,我不太……智能有点被高估了,你知道。所以我有点……是的,我对这个有点怀疑。而且我也相信,大多数真正棘手的人类问题并非无法解决,不是因为我们不够聪明,而是因为世界很复杂,这与智力无关。这是因为存在权衡取舍,而且“好”的定义没有明确界定,甚至“最好”或“更好”也没有。但我知道这让我处于一个小的、悲观的阵营。而且我真的认为这并不重要,实际上。因为我们将看到很多这些变化,我们将实时看到它们,我们将看到它们是否有效。回想试错法,在你回答问题时我意识到,这难道不常见吗?我想到制药行业有很多碰运气、胡乱猜测,然后某个东西就奏效了。所以我们想象有一天,因为我们的基因或生物技术,我们可以更有效地定制药物。但我认为大部分……我们还没到那一天。所以在那个行业,在那个世界里,确实有很多这样的情况。所以也许它比我想象的更常见。我不知道。

Dwarkesh (嘉宾): 是的,有……是哪位经济史学家?Alan Blum还是Robert Allen?他有一个关于工业革命的理论,认为它首先发生在英国,因为那里的煤炭足够便宜,你可以制造出那些最初实际上效率极低的机器。我认为第一台蒸汽机利用的是蒸汽冷凝产生的真空压力来使活塞回退,而后来的更高效的机器会直接用蒸汽推动活塞。总之,其他国家至少在之前没有走上这种进化阶梯:你制造低效的机器,煤炭足够便宜,你可以就往里面扔煤,看看能不能让它工作起来。然后稍后你沿着成本曲线向上走,找到这些改进等等。类似的事情也发生在硬件和AI上。在90年代和80年代,人们有这样的想法:嗯,你可以做深度学习,你需要这些不同的架构。现在我们有了计算能力来实际尝试这些想法。未来几年我们将获得越来越多的计算能力。嗯,你知道,也许我们应该期待加速。

Russ (主持人): 一个类似的朋友,我想到了Fred Smith。我以前讲过这个故事,但据说联邦快递(Federal Express)运营的第一个晚上,联邦快递只运送了两个包裹,其中一个是Fred Smith寄给他妈妈的生日礼物。所以它一开始并非一帆风顺。过了相当长一段时间,他们发不出工资,不得不关门。只是Fred在从芝加哥的银行家那里被告知“不行”回来的路上,看到一班飞往里诺的航班,去了轮盘赌桌,用他姐姐的信托基金赢了足够的钱,维持了公司的运转。如果说Fred明白这是一个必然成功的想法,那当然很好听,但我们知道他坚持下去的真正原因是他是一个人,他把自己的心血都投入到这件事中,他不会放弃,直到尝试了所有途径。让他做到这一点的不是对世界的理论理解,而是更人性化的东西,我认为。

Dwarkesh (嘉宾): 我能向你请教一个想法吗?我的一部分想法是,看,这种单一超级智能凭借其在安乐椅上思考并洞悉世界如何运作的能力……你知道,有些人有这样的想法,哦,它会想出如何除掉它的政治对手,建造纳米机器人,无论是通过说服还是某种其他操纵,自己想出未来的技术,它将对世界产生这种无所不能的影响。我不相信这个。但我相信这个想法:如果你看看灵长类动物和人类之间发生了什么变化,那不仅仅是个体……Joseph Henrich有一本关于这个的精彩著作。不仅仅是……不仅仅是智力,甚至主要不是智力,而是我们相互协调、分享知识、跨代积累知识的能力。现在,当我们思考AI时,与其想一个单一的、超级智能的AI,不如想象数十亿个以超人速度思考的存在,它们能够以人类根本无法做到的方式相互交流。它们可以字面上分享彼此的心智状态,可以提炼它们的见解,可以字面上合并,可以任意复制自己。所以如果你有一个拥有某些隐性知识的超级熟练工人,你可以以每个副本几美分的价格任意复制他们。从根本上说,你拥有一个大得多的人口规模。如果你相信……很多经济增长理论认为,更多的人意味着更多的想法,并且这会反馈自身。所以,出于同样的老式经济增长、文化演进的原因,我认为这个AI的“蜂巢思维”(Hive Mind)实际上将会……不是作为一个个体AI,而是作为一种整个经济范围内的现象,将完全是对当前系统的一种冲击和改变。

Russ (主持人): 可能是。让我问你一个问题,既然我要回避你的问题。我非常喜欢我的智能手机,喜欢到令人尴尬的程度。我认识到我对它的喜爱有点类似于成瘾,就我们能定义的成瘾而言。我有时会想,我可能以前在节目中问过这个问题,如果史蒂夫·乔布斯还活着,假设他认为乔纳森·海特(Jonathan Haidt)是对的——我对乔纳森·海特的研究持不可知态度,但我确实认为他触及到了一些东西,我认为手机对孩子不太好,而且我很确定它们对成年人也不太好——我会问史蒂夫·乔布斯:“你愿意让时光倒流,不去想这个产品吗?它只是个手机,不是你口袋里的电脑。”你会这样做吗?我认为人类很难说:“哦,是的,我想它……它可能不是净收益,它……我对它感到不安。”我认为大多数人很难做到这一点。我认为他们会说:“向前看,向上走。”类似地,如果我们有那十亿个AI代理,不管我们怎么称呼它们,你可能首先会问它们的问题之一是:“你认为让你们被释放出来对人类有好处吗?”抛开那里的激励问题,如果那个世界里可以定义“自我利益”的话。它们能回答那个问题吗?我的意思是,对我来说,这不就是一个例子,说明智力并不真正擅长某些事情吗?而且它们都可以连接在一起分享思想的事实……你必须相信——这是一个非常哈耶克式的观点,我们在这里引入一点经济学——你必须相信它们不仅能够协调它们的思维,不仅能够汇集它们都拥有的所有知识(顺便说一句,它们都拥有,所以这不像人类那样有差异,它们可能拥有非常相似的数据库),它们真的能够预测在不同政策结果下存在的n种未来吗?当然,然后它们还必须汇总福祉,这对我来说简直是一个无意义的问题。但你可以教它们这样做,它们会对此非常热情。负责它们的人会对你很热情。我想起哈耶克在他的诺贝尔奖演讲中,他基本上说宏观经济学是不可知的。就像你无法知道明天哪支运动队会赢一样。平均而言,其中一支可能更有可能获胜,但如果另一支队的四分卫,或者另一支队的前锋,或者另一支队的投手,前一天晚上和他们的配偶吵架了……但理论上,如果你真的相信世界是决定论的——对此我持不可知但怀疑的态度——哦,你也会知道所有这些,因为你会有所有这些人的酶、化学失衡以及所有数据。它们实际上可以预测所有这些结果。所以我对此表示怀疑。你认为我们会朝着那个方向发展吗?

Dwarkesh (嘉宾): 嗯……所以……最终我认为不会,但让我为那些可能认为类似事情是合理的人阐述一下理由。现在,中央计划或这种中央协调和预测之所以行不通,有很多原因,但其中之一是,Xi大脑中的算力和他治下中国的每个人一样多,对吧?1015 次浮点运算。未来,可能会出现这样一种情况:中央……中央权力或协调者或其他什么,拥有比外围多得多的原始算力,并且与外围有更大的带宽。现在Xi作为一个人类只能监控这么多。未来的他可能是这样的……你可以以每小时几美分的价格运行一个Xi的副本,但你可以运行一个“巨型Xi”(Mega Xi),它比普通的大一千倍,运行速度快一千倍,并且有它的副本监控着中共发出的每一条通信,以及你每次与中共网站或其他什么互动时……那个人就像……然后他们把所有这些信息提炼回中央的那个“大块头”里。这就是为什么它看起来合理的理由。但我仍然认为这种中央计划行不通的原因是……整个……我认为这种观点低估了整个世界因AI而变得更加复杂的程度。如果你拿今天的苹果公司,或者就拿一台电脑来说,然后问:“今天的苹果公司能否协调……”我不知道,也许罗马经济很复杂,但比如乌尔(Ur)的经济?也许它可以。也许乌尔的经济可以通过这种方式来协调。但是苹果公司能协调今天存在的整个世界经济吗?我表示怀疑,对吧?所以,也许ASI(人工超级智能)能够协调今天存在的经济,但无法协调那个同样有其他AGI部署在整个经济中、做着它们不同事情的经济。我认为我最大的担忧是,在我们到达这个去中心化的世界——每个部门都急剧增长并变得更加复杂,然后因为更高的人口规模,有了更多的专业化,以及我们为人类设计的协调机制(如股份公司、国家能力等等)也为AI发展出了新的制度——在这个去中心化的状态实现均衡之前,我们是否应该担心某个玩家拥有巨大的领先优势?他们获得了第一个“蜂巢思维”(hive mind),而这个蜂巢思维因为世界其他地方还没有采用AI,所以比世界其他地方加起来还要强大。这个问题实际上归结为部署速度与AI反馈自身的速度之争。这是一个重大的辩论,我们之前也触及过,但这可能是当今世界最重要的辩论,有趣的是我们对此关注不够。

Russ (主持人): 嗯,我认为我们关注不够的原因之一是我们并不真正理解ASI——顺便说一句,ASI是人工超级智能。我认为我们关注不够的原因是……它在情感上很遥远,也许在时间上并不遥远。但我想回到你之前说的一点,只是为了给你找点茬。谈到一个拥有……能够接触到大量智能的领导者。我怀疑一个美国总统的智商和他的政府的成功之间有很好的相关性。现在,我想你必须辩称:“我知道,但那只是人类智能。这将远远超过180的智商,会像10000的智商。”所以这根本不是一回事。我们甚至不能……再次,这非常……我喜欢取笑这个领域的人,这与宗教思想非常相关。你知道,就像我们无法想象上帝的心智,他能看到每个人,或每个思想,不仅在这里,而且在阿尔法半人马座,如果他们……你知道,在那个遥远的星系里。而我只是……我怀疑那是否只是痴心妄想。但你知道,很难说,很难说。

Russ (主持人): 我想给你引用一段我最近看到的采访。这是来自……我今天在Si Maiwitz的页面上看到的。他引用了Daniel Kokotajlo和Dean Ball之间的一次访谈。我不知道他从哪里得到的来源,但我看不到来源,但如果可以,我们会链接到Simuitz的页面。他问Dean Ball(一位关于AI的思想家):“你能举一些例子,说明20年后AI仍然会比最优秀的人类差的事情吗?它们会在哪些方面更差?”Dean Ball的回答非常精彩:“按摩。”我不确定他这点对不对,但好吧。“按摩。竞选总统。了解互联网上没有的世界信息。表演莎士比亚。品尝食物。说对不起。”这是一个不错的清单。它涵盖了……非常广泛的范围,包括人类经验中一些更光辉的部分,并非全部,但有一些。你觉得呢?20年后,除了那些,人类还会不会有……除非你想反驳?你能想到一些AI将难以超越我们的事情吗?还是它们几乎可以在所有方面超越我们?

Dwarkesh (嘉宾): 我认为20年是很长的时间。我喜欢那个清单背后的情感,但如果时间是两年而不是20年,我会更认同。是的,这里有一个关于这些AI改进方式的非常自相矛盾和令人惊讶的事情。在90年代,Hans Moravec——他实际上是第一个提出“规模化”想法的人,即你可以根据你使用的计算量来预测人类智能何时出现。事实上,他在90年代或80年代预测2028年我们将获得构建人类水平AI所需的计算能力。这就像一个非常简单的预测,你知道,相差不远,我们拭目以待,我猜。但他有一个非常有趣的悖论,那就是当我们思考什么是困难的,什么是AI需要很长时间才能发展的技能时,我们想到的是对人类来说什么是困难的。但我们没有考虑到进化花费了多少时间来优化一项技能。而进化必须花费大量时间优化的那些技能是如此普遍,以至于在人类范围内它们的变化不大,因为,你知道,十亿年来你一直在学习如何移动,控制你的四肢,理解你的环境,并拥有这种长期的连贯性。只有在过去的几十万年里,你可能才学到了任何与做数学相关的东西,或者发展了相关的认知技能。所以这些东西已经破解了……或者即将破解前沿数学、编码等等。但是,存在一种关于人类智能的老派观点,比如亚里士多德的观点,认为使我们成为人的是我们进行这类推理任务的能力,以及拥有这些更高层次抽象思想的能力。事实上,从AI将首先获得什么技能的角度来看,这可能是我们最不“人类”的部分。它将首先获得这种亚里士多德式的人类理解,这将是它获得的第一项技能。而那种非常……爬行动物脑的东西,实际上将是它最后自动化的技能。

Russ (主持人): (关于杏仁核和潜意识处理的评论)...我没有描述你的书,但你的书是……你我有一个共同点:你采访了很多人工智能方面的人,我也是。你采访了——我们在开始前我问过你——你说大概有20个?我想我大概做了15个左右。从某种意义上说,我远远领先于你,Dwarkesh。我大概在2014年采访了尼克·博斯特罗姆(Nick Bostrom),那时他还在担心。但你比我领先,更重要的是,这本书是一本……它给了我启发。它是你所做访谈的摘录汇编,围绕着AI领域这些重要问题进行分组。因此,它非常有趣。在我读这本书的时候,即使我知道一些来自我那可怜的14次访谈的见解……但你实际上不仅可能做得更多,你可能记得更清楚,因为你写了这本书,整理了这本书。所以这是一个有趣的认知现象。但有一件事让我印象深刻,尽管采访了所有这些人——我采访过各种立场的人,正如你一样:担忧者、乐观主义者、实践者……你知道,哲学家类型的人——你的书在某种程度上是第一次让我有点害怕。所以我想谈谈为什么,并希望你对此做出回应。这会是一个很长的问题,已经太长了,抱歉。但你写了一篇文章,叫做《全自动化公司会是什么样子》(What fully automated firms will look like),你在我们刚才的谈话中也提到过一些。你是这样写的:“即使是那些期望人类水平AI更早到来的人,仍然神秘地低估了当我们拥有它时世界将会有多么不同。大多数人都在锚定他们期望的单个模型会有多聪明,即他们在问自己:‘如果每个人都有一个可以7x24小时工作的非常聪明的助手,世界会是什么样子?’每个人都忽略了AI将拥有的集体优势,这与原始智商无关,而与它们是数字化的这一事实有关。它们可以被复制、提炼、合并、扩展和进化,而这些是人类根本做不到的。一个所有工人、所有管理者都是AI的全自动化公司会是什么样子?我认为,这样的AI公司将以前所未有的速度增长、协调、改进和被选择。”我们先不争论这是否真的可行,是很快、明天、40年后还是100年后。让我们假设它是真的。我读到这里,再加上一些从业者的极其看涨的乐观情绪——你在书的开头谈到过,其中一些是出于自身利益,但很多只是他们已经完全接受了这种观点,这不是……这只是他们看待世界的方式,这其中有某种美感——我意识到,当我读完那些……那些摘录和领域内人士的一些评论后,我不是害怕,我只是感到悲伤。我想阐述一下这种悲伤,你可以谈谈害怕和悲伤。我担心,也许这是一个愚蠢的担忧,我生活中如此多的乐趣将无法为我两岁半的孙女所享有。我记得我学线性代数的时候——抱歉不是线性代数,是一门高等统计学课程——我意识到你可以用多种方式证明中心极限定理。(这两门是我大学里上过的最难的课,顺便说一句,所以我搞混了。)结果是你可以用一种叫做特征函数的东西来证明,然后你可以用一种叫做……我想是特征函数(eigenfunctions)?我甚至不记得了,那时我21岁,差不多50年前了。当我看到……我只记得当我看到这两种截然不同的数学技巧可以得到相同结果,并且其中存在某种潜在的连贯性时,我所感受到的那种兴奋。所以在我们开始谈话之前,我让Claude帮我做了那些证明。我现在已经看不懂了,但我可以请Claude帮我理解它们。所以我的孙女可能永远不会有那种激动。在我生命中很晚的时候,我父亲告诉我我是一个好作家。我想我当时大概50多岁。那真是令人激动。他一生都在批评我的写作,我想他认为那对我有好处,也许确实是。但这使得当他称赞我写的东西时,感觉更加甜美。我不知道我的孙女是否会因为她的写作而感到激动,考虑到她将要成长的环境。买我的第一辆车,能够负担得起,拥有一种自主感和成功感。发现一本你一直在寻找的、已经绝版的旧书的激动。发现一位新思想家或一个新的播客,比如Dwarkesh Patel的。就像,“这家伙是谁?”是的,你联系了我,我不知道,抱歉,我知道……我以为我知道你的名字,然后我看到了你在做什么,你在和谁交谈,我就想:“哇,这家伙做得真棒。”然后我发现你才……多大?24岁?天哪!这真的很有趣。我要开始读你的东西了。这是我即兴的想法。现在我明白,我的孙女会有不同的激动,也许是更好的。但是读你的文章和你的书让我第一次意识到,AI不仅仅是一个更好的工具,能节省我的时间,比如像谷歌地图或谷歌翻译那样。它将重塑世界,改变日常生活的结构,不仅仅是让它更快或更便宜,而是真正、真正地不同。世界可能会变得更美好,它会在物质上更繁荣,原因就是你在那篇文章中写的。这不是小事。但会不会有更多的人类繁荣(human flourishing)?我不太确定。对某些人来说,绝对会,你为你的书采访的许多人就是。他们将拥有非凡的体验,知道自己不仅在宇宙中留下了一个印记,而且是一个巨大的印记。而这个……这个我可以与之互动的东西,它是神秘的,真的令人兴奋。但它将改变一切。这很可怕。不是因为它会把我变成一个回形针,或者……你知道,践踏我,或者因为我只是个凡人而忽略我。只是……世界将会变得非常不同。我甚至在想,对我孙女来说,读一本1950年写的小说会是什么感觉?我不知道。你的想法?抱歉说了这么长。

Dwarkesh (嘉宾): 不,不,我其实很高兴。因为这是一个如此重要的问题,也是我们在进行关于AI趋势等宏大讨论时,某种程度上会忽略的事情。我甚至不会完全排除“回形针担忧”(paperclipper concerns),因为我有太多的不确定性,我改变主意太多次了,就在上周,我对AI的一些最重要的问题改变了看法。所以我心想,谁知道呢?这种事以前从未发生过,我们拭目以待。但是,好吧,先把那个放一边。是的,情况确实如此,我认为值得坦诚面对这一点,而不是自我安慰:迟早会有一个时刻,人类仅仅是不太可能增加任何……某种意义上反事实的有价值的东西。至少在那种……计算GDP数字的意义上,对吧?就像马匹,现在你可以骑着玩,但它们的存在不是因为需要它们来移动你。这显然是一个巨大的变化。我有一种直觉,人类已经适应了如此不同的……想想今天的世界,以及经历了多少不同的转变。不仅仅是从狩猎采集的过去,甚至那时人们也低估了火有多重要,或者工具、农业革命、工业革命、社会世俗化有多重要。国家的建立,而不是只有你当地的亲属等等。如果我们处理了所有这些,我觉得我们能很好地应对物质极大丰富……但你在宏伟的计划中,在经济上不是那么有生产力。另一件我认为人们忽略的事情,我认为对之后发生的事情的图景很重要,但人们可能对此感到不舒服,那就是跨人类主义(transhumanism)。我确实认为,给予人类自由去拥有他们的思想、他们的身体、他们的精神……去放大、改变,随他们所愿,这一点很重要。这里的直觉是,人们以一种非常……反乌托邦的方式来看待这个,比如赛博朋克之类的。但确实存在一种……像熊彼特或哈耶克式的思考:我们就是不知道我们对未来所不知道的东西。与其仅仅把新技术看作是反乌托邦的,不如试着想象一下未来的人们可能会如何看待这样一个事实:他们拥有能够体验更伟大的美、更伟大的创造力、与其他心智更紧密连接的心智。他们不再受我们觉得繁琐的那些事情的困扰。我的意思是,这里的另一个直觉是,如果你……我相信你听过这个思想实验,但我认为它来自Phil Trammell:如果我说,我把你送回公元1000年,但是……我需要在公元1000年付给你多少钱,让你在公元1000年拥有这么多财富,然后我把你送回那一年?我认为答案很可能是:没有任何数量的财富能让我宁愿在公元1000年拥有,而不是就活在当下。所以,尤其是在未来,当你谈论AI“蜂巢思维”将发明的各种东西时,无论是在健康方面,还是在福祉、繁荣、连接以及……嗯……我认为这很难估计。我认为你的孙女或你孙女的孙女很可能会对我们持有类似我们对公元1000年的人们所持有的那种看法。

Russ (主持人): 我从未听说过Phil……我不知道Phil Trammell是谁,但那个思想实验正是我在我的作品中花了太多时间去写的那种。

Dwarkesh (嘉宾): 哦,抱歉,也许……也许实际上你是来源而我……

Russ (主持人): 不,不是我。因为我从不回到1000年,我回到1950年。几乎没有……今天活着的人,如果他们能体验到1950年的日常时刻,在体验过2025年后,会愿意回去。当然,奇怪的部分是,1950年的人们很幸福,他们中的一些人。一些人显然不是。我们可以争论有多少人,他们的特点是什么,他们受到了糟糕的对待等等。但我同意那个思想实验,我认为它强大而深刻。我认为不仅仅是我习惯了现在,回到1950年会很痛苦。我活得更长,我的生活质量更高,我的日常生活更有趣,因为我不是在1900年当农民。所以我……我曾经……我曾经是你,Dwarkesh。我曾经对人类创造力让世界变得更好的力量抱有那种无限的乐观。但我比你老,我并不更聪明。但当你老了,我想你会获得某种……你会失去一些乐观。我不认为失去它必然是理性的,但它来自各种分析思维之外的东西。所以……很高兴被提醒。我希望你是对的。我希望……你知道,拥有一个人工膝盖并不会毁掉人类的体验。所以很高兴想到人工智能将以对我们有意义的方式,共同地和个别地增强我们的体验。所以我喜欢这个想法。

Dwarkesh (嘉宾): 是的,而且你我,Russ,将处于一个特别有利的位置,因为我们所做的……我的意思是,我们已经有了我们的……我们已经有了我们后AGI时代的职业规划,对吧?

Russ (主持人): 你确定吗?

Dwarkesh (嘉宾): 是的,我认为……难道不是新技术……我认为是某个ChatGPT,创造了这个在两个有趣、有思想的人之间的播客?我们几乎已经过时了。它会变得更好。但我认为那种……替代性的体验,知道……我的意思是,现在已经是这样了,对于我可能做的任何特定主题的播客,可能都有比那个特定播客更好的资源。但人们仍然想收听,因为那里有一些一致性,有一些连续性和智力上的同志情谊的感觉。也许……也许一旦你有了个人的AI朋友,而你真正的朋友正在采访你的虚拟Russ Roberts关于他的新书之类的事情,情况就会改变。但是……嗯……是的,至少我更喜欢这个,而不是我以前……我作为计算机科学专业学生可能最终会从事的职业。当我思考什么能在AGI时代幸存下来时。

Russ (主持人): 我也有同感。我们稍后可以讨论一下原因,我希望。我最近在与Ian Leslie的对话中提到了这一点,那期还没播出,但很快会。在与Chuck Klosterman的对话中,他思考了一个问题:谁将被铭记为60、70年代摇滚乐短暂辉煌时期的典型摇滚乐队?他指出(Klosterman),通常只有一个。100、200年后,会有人被铭记为AI的创造者吗?会有一个名字,当人们说:“哇,你知道,史蒂夫·乔布斯真的改变了计算世界。”史蒂夫·乔布斯,我认为会击败比尔·盖茨,但我们拭目以待。但在这个问题上,我觉得有趣的是,你说……你说了一些……哦,你说:“哦是的,那个被……Transformer是由谷歌的几个研究人员搞出来的。”你没有提到他们的名字。部分原因是因为不止一个,所以这很有挑战性。你认为有谁会被永载史册,被称为“创造者”,即使那不是真的?

Dwarkesh (嘉宾): 也许只有在回顾时才会有。也许是Geoffrey Hinton,也许是Ilya Sutskever。不过有趣的是,显然我不是……我不是从业者或任何类似角色,我只是碰巧通过阅读了解了它。但即使只是对AI领域发生了哪些突破有了一些熟悉,这种近距离模式会让你觉得:哦,没有一个单一的重大突破是进步的中心。它就是这个行业,以及你在从硬件到软件到中间所有环节的整个堆栈中,一直在进行这些微小的改进。这可能与……“盖尔曼失忆症”(Gell-Mann Amnesia)的概念有关,虽然不完全相同。或者……在这种情况下,也许如果你最了解的那个行业,你明白它是所有这些组合式……人类创造力的结果,人们在进行这些微小的发现,是人类的“蜂巢思维”在相互交流等等——也许你不了解的行业也是这样运作的。每当你想到:“哦,这是……这是飞行、汽车或……无论什么突破背后的天才”,那可能也是一个类似的故事。

Russ (主持人): 我认为这是一个很棒的见解。我喜欢这个。我认为这可能是真的。当你接近它时,你明白它有多复杂。但它被提炼成……一种实际上相当误导人的“伟大创新者”的概念,而实际上它是一个“蜂巢思维”,只是除非你非常接近它,否则并不明显。

六、 社会影响与人类福祉

(此部分内容主要源自上文第五部分中关于自动化公司、人类未来角色、跨人类主义以及Russ的“悲伤”和Dwarkesh的回应等段落,强调对人类福祉的影响)

Russ (主持人): (在讨论完“蜂巢思维”和未来可能性后,谈到对AI从业者的印象)你在与这些人相处了很长时间后,有什么概括性的看法吗?你不仅采访了更多的人,而且你的播客比我的更长,所以你在经验……接触方面远远领先于我。有一件事让我印象深刻,那就是他们平均而言非常乐观。有一些担忧者,但很多人只是对技术和未来抱有愉快的乐观态度。你对他们作为个体或他们的观点有什么看法吗?

Dwarkesh (嘉宾): 我想……也许我在这里是一个有偏见的报道者,因为我和他们中的许多人是朋友等等,我也采访过他们。但我认为我们生活在一个好的……好的宇宙之一。我认为有很多邻近的宇宙,在那里我们应该思考的那类问题——我认为我们应该思考“回形针问题”(paperclippers),再说一次,这真的很难思考——也许我们会回过头看,我猜我们不会回头看了,但也许有人会回头看然后说:“Eliezer一直都是对的。”但是,建造这些实验室的那些人思考这个问题的事实——你可能会说这是口头承诺,但口头承诺总比没有好。而且通常这些解决方案……也许很多关键解决方案最终只会是:你做了那个显而易见的事情,它不会花费你太多,但你必须把它当作某种程度的优先事项。而在很多邻近的宇宙里,“失控AI”(misaligned AI)的想法或者这种“蜂巢思维”失控的想法,根本不会出现在人们的脑海里。你只是把它们当作工具,直到你到达……直到你到达那个点。所以我确实很欣赏这样一个事实:至少这些人似乎——我相信他们的话,或者至少在没有相反证据的情况下给予他们疑罪从无的推定——他们投身于此,或者随着他们投身其中并更认真地思考AGI的前景时,他们确实认真对待“世界之后会发生什么”这个问题。你知道,这比它可能的样子要好。

Russ (主持人): 你提到的Eliezer是Eliezer Yudkowsky,他是担忧者之一。我们会链接到我对他以及你的访谈。

Dwarkesh (嘉宾): 是的。

七、 播客制作的反思与好奇心

Russ (主持人): 沉浸在这个世界里,对你个人有何改变(如果有的话)?除了让你夜不能寐 vs. 不担心 vs. 夜不能寐(你刚才提到的)之外。

Dwarkesh (嘉宾): 有一件事发生了:无论我做什么关于什么话题的采访,我都忍不住会问:“这和AI有什么关系?”这可能会有点……我将采访这位古DNA遗传学家……David Reich,我相信你肯定在某个时候采访过他。我们谈论6万年前发生了什么,为什么这个部落消灭了那个部落,我就会想:“哦。”或者,你知道,人类和灵长类动物之间的基因变化是什么?然后你就会想:“嗯,这是否为规模化假说提供了证据?猴子和人类大脑之间的结构相似性是否意味着仅仅是规模化改变了一切?”或者当我邀请《我们成功的秘诀》(Secrets of Our Success)的作者Joseph Henrich上节目时,我就会问:“嗯,你为什么不认为AI的‘蜂巢思维’会因为人口规模和带宽而更加强大?”所以,也许这让我变得更像一个……思维单一的人。但这仅仅是因为,如果你认为这件事很快就会发生,而且如果你认为……它同时也是一个如此引人入胜的智力问题。因为你可能认为AI仅仅是关于回答这些技术性问题:“规模化会发生什么?这些新的训练技术会发生什么?”但从根本上说,你是在试图弄清楚一个由这些不同种类的存在组成的未来社会会是什么样子。没有任何人类知识领域与回答这个问题无关。你需要了解……增长理论的经济学,或者……你知道,我们如何模拟数十亿额外代理迅速涌入劳动力市场?(我们会称之为劳动力市场,这是一种听起来有点系统化的含糊其辞的方式。)甚至灵长类动物学和文化人类学家……地缘政治思想家关于国家将如何看待对这种力量的竞争。这一切都相关。所以这本书最棒的地方在于,你可以把这些不同类型的思想家并排放置,看看他们如何使用他们的概念工具来回答这些相当棘手的问题。

Russ (主持人): 这非常酷。在我们谈话的时候,我想……我想这是真的。如果你相信AI最终将能够完美地预测未来,因为它会如此聪明——再次,我对此高度怀疑,但思考起来很有趣——我认为它也能回溯过去。它将能够从世界当前的状态完全重构过去。我的意思是,如果你是决定论者的话。但是……也许我应该是。那将是伟大的。我们将回到Joseph Henrich,所有那些……那些基于四个化石和……你知道,在焦油坑中保存的两具尸体进行了所有这些极富想象力的推测的人们,他们将发现他们是对是错。

Dwarkesh (嘉宾): 实际上有一个非常……嗯……有趣的推测:看,如果他们做了……我相信你听说过波斯特洛姆(Bostrom)关于模拟比真实世界更多的论点,所以我们可能处于一个模拟中。对此有一个有趣的转折:如果你是一个未来的文明,你真正想要模拟的时期是什么?也许你想知道……我认为你就是想对发展更智能的智能体进行大量实验,看看进展如何。因为这可能是将要发生的最重要的事情。也许这与他们正在问自己的一个单独问题有关,比如,也许他们正在构建更高层次的东西,他们会想:“这会顺利吗?我们还是别做这个实验了。”所以,如果你要模拟过去,这似乎是你想要模拟的时间点。也许这……为我们是这个预测性回测的一部分(AI想要做的)这一想法增加了额外的可信度,已经……但是,是的,我认为反事实历史将会……是的,因此而成为一个大大改进的领域。我们已经……甚至不是AI,你看到那个了吗?我相信你看到了Nat Friedman和Luke Farritor的赫库兰尼姆卷轴(Herculaneum scroll)的事情?

Russ (主持人): 没有。

Dwarkesh (嘉宾): 哦,哦,天哪,我想你会喜欢这个。公元79年,维苏威火山爆发,赫库兰尼姆有一个图书馆。

Russ (主持人): 哦,他们刚发现它,对吧?

Dwarkesh (嘉宾): 我的意思是,我们已经知道它几百年了,我们一直有那些烧焦的卷轴。他们对它进行了CT扫描,然后他们发起了一场竞赛,使用现代……现代AI技术来尝试视觉上处理这些CT扫描,并像……阅读烧焦的卷轴。实际上,其中一个运行Doge(指赢得比赛的人之一Luke Farritor)的家伙,你知道,21岁的……超级天才……他听了我与Nat宣布奖项的播客,然后他对参与这个奖项产生了兴趣,并且他解决了它。他弄清楚了如何……解码这些世界。所以我们将从像这样用新技术发现知识中,更多地了解过去。

Russ (主持人): 这非常酷。你说他超级聪明,或者……我们不知道……它可能是在中国的某个地下室开发的,然后他被推出来作为一个……算了,我甚至不打算往那方面想。你提到你花一到两周的时间准备一次采访。你会如何描述你的准备过程?我相信它因嘉宾而异,但描述一下你做什么?你的目标是什么?

Dwarkesh (嘉宾): 首先,我……我进入这个过程的方式是选择一个能反映那种……那种深度的嘉宾。如果我要花费大量时间——这基本上就是我的生活,对吧?我把我的生命花在阅读和研究上,为采访做准备——我只想选择那些……让我感兴趣的嘉宾。我……我很高兴能花两周时间阅读他们的书籍、论文和所有东西。这通常意味着拒绝那些名气更大或更有影响力的嘉宾,仅仅因为……也许和他们(指名气大的嘉宾)谈两个小时可能很有趣,但是否值得花两周时间准备?然后准备本身,我很好奇你的过程,但对我来说,就像……就是做那些显而易见的事情:读他们的书,读他们的论文,和他们的同事交谈,阅读他们领域的相关文献。这取决于领域,对吧?AI不同于像经济学这样一些更规范化的领域。但或多或少,做显而易见的事情,但要做足够长的时间。是的,但你的过程是怎样的?

Russ (主持人): 我们正好相反。我希望找到尽可能多的不需要我花两周时间阅读的采访。因为我……我有一份日常工作,管理一所大学,或者说担任一所大学的校长,我不是在运营它,那是不可能的,但我努力帮助它。所以当我有一位有书的嘉宾时,我努力读完整本书。我说我努力读每一个字,但如果我不能读每一个字,我会读每一页。所以我能够非常快速地浏览一页,找出这一页的关键思想,以确保我不会问愚蠢的问题,或者不公平地对待嘉宾,因为“哦,是的,他们在第六章谈到了那个,但我错过了。”而且因为我很忙……嗯,两件事发生了。我在这方面比15、20年前做得好得多。而且……当播客开始时。我也在寻找那些我不需要读书的嘉宾,因为这很难。但我认为更有趣的准备时间,我没有花足够的时间……我会告诉你这个例子,你可以思考一下你自己的做法。我已经非常擅长阅读那本书,并且我可以在大约10分钟内构思出足够填满一个多小时的问题。你知道,我不需要花很多时间思考关键问题是什么。这不仅仅是“什么是有趣的问题?”我试图在整个节目中有一个叙事弧,这样听众可以把它串联起来,对吧?这不仅仅是“哦,这是一些娱乐,这是一些……智力刺激,这个很有趣,那个也很有趣。”我试图帮助他们理解书的论点,有时我这样做的方式是作者没有做到的。我可能对它有不同的构想。但我可以很快做到这一点。我没有花足够时间做的是思考:我如何在这方面做得更好?我们可以稍后讨论这个。我的意思是,我已经非常习惯这个了,因为我现在已经做了将近一千期了。它们比以前好。但它们可以好得多,也许。我如何思考如何变得更好?我在这方面做得不够。所以这不是我准备工作的重要部分:在即将到来的这次采访中,我必须把握住哪个关键点才能让它更上一层楼?

Dwarkesh (嘉宾): 嗯……你是指更多地从原始内容、传播,还是……或者两者兼而有之,或者其他什么?

Russ (主持人): 不是原始内容。不是……你说传播?

Dwarkesh (嘉宾): 是的,比如,你知道,在平台上的覆盖范围之类的。

Russ (主持人): 不。我指的是我们的融洽关系(rapport)。所以你我一直很开心,我逗了你几次,你接受得很好,没有被冒犯。可以想象,因此,无论是在接下来我们继续谈话的10或15分钟内,还是如果我再次邀请你回来,我们将进行一次比我们原本可能进行的更……字面上更超然(transcendent)的对话。其中一个挑战是我们通过Zoom进行,人们会说:“哦,那一定很难。”或者我以前通过电话进行,他们会说:“那是不是真的很难?你看不见对方。”但很多嘉宾很害羞,他们不想看着我的眼睛,这让他们不舒服。所以面对面实际上可能更尴尬,可能更少融洽。所以,你知道,我想从你那里得到的是一个……理想情况下是一个不安全的(unsafe)回应。我不想愚弄你,我不想让你吃惊,我不想伤害你的感情,我不想让你后悔你所说的话。但我想解锁一些……正确的、你以前没有写过的东西,你也没有在公共播客上向任何人透露过的东西。我们有过几次这样的时刻,我想对我来说是这样。我的意思是,我没有读过你写的所有东西,但我认为这次对话有其自发性和化学反应,这是有时不会发生的。所以我没有足够思考如何确保这种情况发生。也许你做不到,也许这只是运气,也许是……我不知道。

Dwarkesh (嘉宾): 我的意思是,我喜欢你的播客的原因之一就是你这样做。所以也许……我认为这在某种程度上是让EconTalk与众不同的地方。我一直在想……你知道……你有一种直觉,至少我在做采访时有这种直觉,哦,也许他们会觉得这个敏感或者别的什么。但是……特别是如果他们是大人物。比如,每当你去参加那些有影响力的人或学者的晚宴时,他们之间会……不断地互相取笑,他们会说:“你是不是把那件生意完全搞砸了?”或者“嗯,我认为……这个想法完全是错的,我认为是这样……”对吧?他们不断地……对彼此这样做。这就是他们期望的那种关系,他们觉得有趣的关系,对吧?这就是为什么他们去……这就是为什么他们和他们的朋友、同事、商业伙伴或……等等有这种融洽关系。所以我一直在尝试做的是:如果我和他们共进晚餐,并且我和他们有这种关系,我会如何与他们进行这种对话?其中一部分是……也许让“这是一次采访”这件事不那么明显。我认为你在这方面做得非常出色。就像,如果我们真的在吃晚餐,只有你我,对话会是什么样子?它会只是……在很多……所以会发生这样的事情,人们……采访者……会有一种感觉:“我不想知道”或者“我不在乎这个问题的答案”或者“这就像……你知道答案是显而易见的,但我必须为观众问这个”,以便观众能跟上或什么的。每当他们这样做的时候,都非常明显,至少对我这个观众来说,我会想:“如果你觉得那没意思,你凭什么认为我会觉得有意思?”对吧?你为什么不直接问你真正想跟进的事情?或者……即使它像……即使我个人不觉得有趣,但你觉得有趣并且你更积极,你说:“这是一件事,这是症结所在,我想了解更多”,这就会让整个事情更有活力,跟着你一起探索也更有趣。

Russ (主持人): 优秀的记者——我认识几个,不多,我很幸运认识更多就好了,但我认识几个优秀的记者——这是一种技能,对吧?首先是让人放松,让他们进入一个……“只有你我在这里谈话,没有别人在听”的空间。然后是问……真正的艺术在于——这对我来说很少发生,但我认为一个好的记者或间谍可以做得很好——知道何时问那个揭示性的问题,如果你一开始就问那个问题,对方会完全僵住,竖起壁垒,在剩下的时间里都会保持警惕。但经过足够长的时间后——再次,这可能是第三次采访,你知道,三年后,或者第五次,你知道,这很重要——但理想情况下,在这次采访中,你已经让他们信任你,你已经让他们足够放松,以至于他们感到安全,可以告诉你一些事情。要么是因为他们忘记了有几十万人在听,要么是因为他们不再在乎了。对我来说……对我来说,是那个“不再在乎”的部分真正有价值。当你意识到有人只是想和你分享一些东西,或者反过来,我想分享一些东西。顺便说一句,我喜欢的另一件事是,对我来说,一次成功的采访是我有了一个新的想法。这非常罕见。我们在这里已经有几次了,对我来说。这全是意外收获。

Dwarkesh (嘉宾): 是的,是的。嗯……这是我可能没有花足够时间去思考的事情。比如,因为你……我的意思是,我可能会花一周时间准备采访,然后这个……也许我应该更多地规划一下:我将开的第一个玩笑是什么, чтобы让他们在镜头开始滚动前放松下来?这将如何过渡,或者别的什么?嗯……但我确实只是……就像……同事的那种普遍氛围,如果你一起吃晚餐,会以一种非常戏谑的方式跟你开玩笑。我的意思是,关键是要确保这是一种……不是一个试图……抓住你可能做过的某些调皮事情的记者的氛围。

Russ (主持人): 没错,不是挖坑。

Dwarkesh (嘉宾): 没错。而是……一个你尊敬的人,一个同事,就会像……你知道,他们不会只是让你滔滔不绝,他们会说:“等等,这对我来说没道理”或者“嗯,那听起来不对。”就像……所以,只要有那种……戏谑的、友好的态度,我认为……嗯……而且这些人通常期待这个,而且他们通常……因为这就是他们的生活,对吧?他们不期望不受到挑战。而且他们更享受它。这就像……为此付出努力更有意义。嗯……也让对话变得更好。

Russ (主持人): 是的。这对你选择谁作为你的嘉宾也有影响。

Dwarkesh (嘉宾): 是的。

Russ (主持人): 我相信你经历过这个。有时你邀请某人上节目,他们不喜欢说话,或者他们不习惯说话,也不擅长说话。他们非常擅长写作。你犯了个错误,你邀请了他们。你发现自己说得比你想的要多。我遇到过一些嘉宾,我不点名,但他们不知道我是经济学家。他们没有做任何功课,没有做任何准备。他们只是被邀请了,他们不常被邀请,所以他们答应了。然后他们对待我就像对待一个……正在做播客的记者,这实际上让我觉得有点好笑和有趣。但我认为你谈到的那种融洽关系,我认为是……我认为听众喜欢旁听。这就是为什么你举的为观众解释的例子……就像,我不知何故不想听到那个。我想成为墙上的苍蝇,当两个有趣的人在分享他们的想法时。分享比采访更好,对吧?分享比……“我有一系列问题,我只是逐一问下去,当我们问完后,我说:‘谢谢你,Dwarkesh,参与EconTalk。’”好得多。而真正有趣的是,两个我认为相互尊重的人,像我们一样,进行一场比……“我正在试图采访的这位名人,他在专业上、智力上等等都远高于我”更平等的对话。

Dwarkesh (嘉宾): 我能说一件事吗?那就是,当我回顾我最受欢迎的嘉宾时,你可能会认为,哦,是那些名人,或者类似的人。所以确实存在你提到的风险,某人可能不太擅长谈话,你读了他们的书,你对它非常感兴趣,但播客效果并不好。这实际上很少发生在我身上。我想不出……也许我甚至想不出任何一个可能发生这种情况的案例。这种情况更为常见……如果我看我最受欢迎的嘉宾……我采访过像马克·扎克伯格、萨提亚·纳德拉、戴密斯(Demis Hassabis)、达里奥(Dario Amodei)和伊利亚·苏茨克维(Ilya Sutskever)这样的人。他们不是我最受欢迎的嘉宾。我最受欢迎的嘉宾是Sarah Payne。在我采访她之前,她根本不是一个公众熟知的人物。她是一位军事历史学家,写过关于20世纪几乎所有冲突以及其他冲突的书。我喜欢她的书,它们是惊人的军事历史著作。结果,你知道,她的视频有……像三百万、两百万的观看量。我和她做了四期独立的节目。每期有一百万、两百万、三百万的观看量。这仅仅是……另一个例子是David Reich,他是我第二受欢迎的嘉宾。他的观看量大概有150万。同样,这就像……我读了他的关于古代遗传学的书,我很喜欢。我完全不知道他作为演讲者会怎么样。甚至可能不清楚他是否是那种……传统意义上的“好的”演讲者。但他理解这些思想,他能真正深入地探讨这些有趣模型的细节。一旦你了解了这些,你才会接触到萨提亚·纳德拉和马克·扎克伯格。这也是为什么我……你可以稍微不那么……不是对抗性的,而是稍微更随意一些,当你邀请这些大人物时,然后说:“这仍然会是一次真正的采访。”因为归根结底,你知道,推动我前进的,无论是从观众的角度,还是让我享受我的工作的原因,是进行我喜欢的、有趣的对话。所以我们会这样做,不管嘉宾是谁。因为嘉宾是谁……最终并不能可靠地决定结果。

Russ (主持人): 英雄所见略同。我下一个问题就是关于Sarah Payne。所以我研究你,因为我拿到了你的书。然后我看到了这个对Sarah Payne的采访。我从没听说过她。然后我看到它有很多观看量。然后我看了30秒,就像:“这太棒了!”一半的精彩在于她的表达方式,是如此权威。就像……显然是真理,虽然不是,但可能是。第二部分是她知道很多,她在谈论很多有趣的事情。而且……我还发现了一篇关于你的文章,提到因为你采访了Sarah Payne,Noah Smith也采访了她。我当时……我读到那里时在想:“是的,我正在考虑这个,而且我可能仍然会……”你是怎么找到她的?你通常是怎么找到像她这样的人的?因为我认为……她受欢迎的部分原因和那个小巷子里的餐馆受欢迎的原因一样,而不是那个每个人都知道的著名餐馆。每个人都喜欢这个想法:有这么一个真正……才华横溢的人,只有你知道,大多数人不知道。你知道,我以前对Scott Alexander就有这种感觉,现在每个人都跟上了,但当我很多年前第一次读到他时,就像:“哦,天哪,这家伙太有趣了!”所以你发现了那个,这令人兴奋,非常有趣。你是怎么找到Sarah Payne的?你是怎么寻找她的?

Dwarkesh (嘉宾): 我……以及像她这样的人。我……我经历了一个阶段,我对第二次世界大战产生了浓厚的兴趣。你知道,我的……我的兴趣大概比我的实际年龄老30岁左右。所以我在Twitter上问:“我应该采访谁来谈谈二战?”然后Tanner Greer,他是一个很棒的博主,推荐了Sarah Payne。他说她不出名,但她去过所有大陆上的所有档案馆。她去过中国、俄罗斯、日本、英国的档案馆……你随便说一个,她都去过。她做了……她做了功课。她有最深的理解模型。所以我因此开始读她的书。你知道,我不知道,可能……大概只有五条亚马逊评论之类的。就是……不……我甚至找不到她的采访,因为她就是没有公众形象。后来我了解到——她永远不会公开说这个,但这是真的——如果你去亚马逊查她的书,作者是S.C.M. Payne,而不是Sarah。她大概60多岁,我不确定,也许50多岁。当她在军事史领域崭露头角时,我不认为……说Sarah Payne而不是S.C.M. Payne会有帮助。所以问题是,为什么这样一个引人入胜的演讲者,一个深入研究了所有这些不同冲突的人,为什么他们还没有出名?你知道,在我采访她之后,她上了《时代》杂志,诺亚(Noah Smith)显然还有其他许多人采访了她。也许……我认为答案可能就是,嗯……军事史,至少直到最近,不是一个……女性学者得到应有认可的领域。

Russ (主持人): 是的。这对我和我来说是一件令人惊奇的事情,我有时会谈到经济学以及……你知道,过去公共经济学家的稀有以及现在有多少,因为技术,因为播客和其他东西,博客。但世界充满了有趣的人。作为一名学者——你不是,对吧?但我……我喜欢学术界的一件事是,作为一名教授,你可以整天和聪明有趣的人在一起,他们告诉你你没想过的事情。所以如果你是一个好奇的人,学术生活有其吸引力。现在它被大大高估了,而且现在可能比以前更不真实了,因为它变得更加狭窄,更少……有趣。但Sarah Payne如此吸引人的原因之一——我用她作为一个原型——是你看得出来她不是想出名。她不是在推销自己。她不是在试图建立一个品牌。她只是一个有思想的人,读了很多书,知道很多东西。就像和Claude交谈一样,但是……是真人。所以……真实性以及对……自我推销的明显不屑或缺乏兴趣,也让她……让她具有吸引力。但我确实认为,让你我做我们所做的事情变得有趣的是有机会与真正聪明的人交谈并向他们提问。这是一种非凡的恩惠。多么荣幸。

Dwarkesh (嘉宾): 是的,是的。我能问你一个问题吗,Russ?

Russ (主持人): 当然。

Dwarkesh (嘉宾): 你说,看,如果人们想要这种生活方式,人们可以探索不同种类的思想,遇到有趣的人,学术生活可以提供这个。我很好奇你怎么看这个,但我的一部分想法是,是否更多的人可以……独立地做这类事情?所以他们……你知道,没有什么能阻止你开始你自己的博客,你自己的播客。我的意思是,播客尤其有助于启动你的……因为与其从零开始建立你自己的世界观,你可以首先采访一堆对这些话题思考得更久的人。在为他们做准备和与他们交谈的过程中,你可以建立起一套概念工具库。但你可以完全独立地做这个。我经常给出这个建议,我的一个朋友……取笑我说:“你就像……你就像一个中了彩票的乡下人,你……你告诉所有你认识的人:‘你得买刮刮乐,你知道,尽可能多地买。’”但是……但是……也许……是的,我的感觉是,这是一个领域,它不是……某种像……“我要上《美国达人秀》”之类的事情。我认为这就像一个……可行的职业道路。而且它显然非常有趣。你会不同意这个建议吗?你应该考虑成为一个独立的……“高内容创作者”(high content creator)是个糟糕的词,但你明白我的意思,像播客主、视频博主。

Russ (主持人): 嗯,是的。我不知道你是否听过我与Adam Mastroianni的采访,但他就是……你知道,一个非常有思想的人。他受过心理学训练,有过正常的学术生涯,然后决定不那样做了。他仍然会做研究,仍然会写他关心的事情,他只是可以在Substack上做,看看他是否能以此为生。我不认为……我认为那种才能是稀缺的。这是我的第一个想法。我们不点名,但有些播客主持人似乎不那么聪明或好奇,他们中的一些人还挺成功的。但平均而言,这是一件很难做的事情。而且要定期做也很难。大多数人不想在采访某人之前坐下来读一两个星期,对吧?所以我认为它选择的是那些非常擅长……谈话的人,显然,但也擅长吸收信息,并且擅长这种叫做“采访”的奇怪技能,它……看起来非常容易,我认为……我很好奇你是否认为它像我一样难。我认为它非常难做。要么是因为我不太擅长,要么就是它本身就难。所以我不认为它会成为……我不相信它会成为许多许多人追求智力生活的一种方式。我认为可以做到的是收听播客。其中一件……你知道,令人惊讶地没有很好地发生的事情是,以任何形式聚合播客。人们思考过,研究过,讨论过。但是……你知道,也许它甚至不是非常必要。也许这就是它没有发生的原因。你仍然可以通过谷歌搜索或使用AI,找到如此多非凡的材料来……自学东西,娱乐自己,并在智力上成长,在你遛狗、锻炼、洗碗等等的时候。你觉得它难吗?你觉得它难吗?对你来说难吗?

Dwarkesh (嘉宾): 对我来说很难。我确实认为,如果我说实话,我有一些朋友……他们的生活中有更好的事情可以做,也许吧。但是……嗯……我的意思是,你就像……你知道,你在管理一所大学,对吧?所以如果你……许多其他处于你位置的人不会……挤出时间来以播客的形式向世界传播这些内容和知识。他们只会做他们的……你知道,他们的日常工作让他们兴奋。我还有其他这样的朋友,他们像……我认为如果他们没有更好的事情要做,他们也会做出好的播客。幸运或不幸的是,我没有。所以……但是我的感觉是,当我和他们一起吃晚餐或什么的,我就想……特别是当我们邀请一个来自不同领域的人,他们开始问问题时,我就想:“是的,如果你进入这个领域,我会为我的工作担心的。”我得到这种感觉的次数不止一点点。关于……嗯,确实有很多人……你不应该……把它当作你的……“即使它行不通,我也会坚持做五年”,因为确实存在……它需要技巧,而你……也许你缺乏它。我会说,看,我们告诉人们去创业,我们认为这是一种……完全可行且值得称赞的事情,可以在你职业生涯的某个阶段尝试一下。如果它行不通——我的意思是,大概只有1%的能成功——如果它行不通,那就是行不通。你之后可以做别的事情。但值得一试,以防它成功。这是一份如此有趣的工作,以至于我觉得……让它真正成为一份职业,就相当于拥有一个成功的初创公司或类似的东西。就我对它的重视程度而言。如果我们认为……你承担1%的风险去创办一家初创公司是可行的,如果它不成功,你可以做别的事情——我只是觉得这就像……也许应该是一件这样的事情:是的,带着风险去做,知道它常常行不通,并且存在幂律分布,但给它一个真正的机会。比如花三个月时间把它当作你的主要事情。你不必辞掉工作,你不必做任何不负责任的事情,但要真正尝试一下。我至少……我感到幸运的是,人们在早期给了我那种鼓励,否则我可能就只是……那种可能会被自动化淘汰的软件工程师了,或者……我不想轻率地说,但是……嗯……

Russ (主持人): 但那是因为你非常聪明,我猜。

Dwarkesh (嘉宾): 我不太了解你,但我猜是因为你非常聪明,你可以在那一到两周的时间里相当快地吸收大量信息,才能做得好。所以我不太确定这对于……一个有不同选择的特定类型的人来说,通常是个好建议。对于……它可能是个好建议。对你来说,难在哪里?

Dwarkesh (嘉宾): 找到核心问题。找到……对于任何一位嘉宾,你都可以谈论一百万件不同的事情,但通常有一个关键的症结所在,如果……你不仅应该在这个点上施压,而且你应该持续施压,直到你完全耗尽了任何潜在的困惑,或者任何你认为他们没有回应你问题的可能性。因为很多想法……确实有这个……就像,我不知道,如果一个马克思主义者来到你的播客,而你没有……稍微刁难他们一下关于他们世界观中这个关键的……关键的弱点……那么……那么你就……那就算不上一次成功的采访。所以也许只是……即使我尽可能地强调核心问题,我可能还是低估了……真正深入追问的重要性。

Russ (主持人): 是的。没有什么比……你到了采访的结尾,你保存了它,你觉得:“那真的很好。”然后你看你的笔记,意识到:“我忘了问他那个最关键的问题了。”更糟糕的了。

Dwarkesh (嘉宾): 没错,没错。这仍然是一次好的采访,只是……有一件事本可以让它成为一次伟大的采访。嗯……顺便问一下,对你来说是什么?

Russ (主持人): 对我来说,有几件事。我尽量把它们控制在一个小时左右。现在我们已经进行到大约1小时28分钟了,我们还要再进行一会儿。但是……当我过去试图把它真的控制在一个小时左右时,我会非常疲惫和注意时间。所以我需要平衡:听论点,试图弄清楚我是否应该问一个后续问题,一个挑战性的问题,试图思考我是否应该跳到下一个话题,看时间,并保持我自己的思路清晰。是的,你知道……我认为听众……一些听众认为我说得太多了。我在这次采访中说得太多了,这很有趣,因为我认为我做了这么多AI采访,我觉得我对此有些话要说。我的思绪有好几次奔逸了。但困难的部分是知道……该做多少。其中有多少是我自己?如果一点都不是我——像某些人……某些嘉宾,大多数嘉宾,我希望他们闪耀,我试图引出他们的见解。但是然后……哦,我也有这么多话想说。是的。答案当然是,有时你没有,你应该闭嘴让嘉宾说话,因为我的一些听众会抱怨。所以这是一点。那些……那些权衡和平衡这些事情是……对我来说是困难的。而且随着你变老,并且你度过了漫长的一天,就像我一样——现在是耶路撒冷时间晚上7:30——我忘记……我比年轻时更容易失去思路。我有时会停下来说:“嗯,我们会把这个剪掉。”听众听不到那个,因为我们把它剪掉了。但是……那也很难。而且……

Dwarkesh (嘉宾): 这有点可悲。我的意思是,有很多情况下,我……回想起来,我就会想:“天哪,我……你知道,我错过了问那个问题”或者“这里有一个明显的后续问题”之类的。也许是……某种在你只是听的时候更难体会到的东西,作为采访者,有多少事情你同时在……你在想还剩多少时间,你想涵盖的其他话题是什么,对他们刚才具体说的话的后续是什么,以及它如何……过渡等等。所以常常在所有这些泡沫中,某些事情会被忽略。我的意思是……我想说,关于你提到的那个特定的事情,人们指出的……与你数十万的听众相比……确实存在一种失败模式,即过度根据少数几个发邮件的人的意见进行调整。而我个人,作为EconTalk的粉丝,实际上非常欣赏你和你的嘉宾有来有回的交流。因为这些人也上过其他播客,对吧?所以如果你只是想要他们原始的……演讲稿,你可以在别处找到。嗯……是的,保持……保持Russ的风格,我会说。

Russ (主持人): 你真好。你最喜欢它的什么?

Dwarkesh (嘉宾): 顺便问一下,你做了多少期了?

Russ (主持人): 不不不,关于你的,关于做播客。不,是的,多告诉我一些。别光说我了,你觉得呢?我们来谈谈你对我的看法。不。我的意思是,首先,你做了多少集?你认为你做了多少次采访?你知道吗?

Dwarkesh (嘉宾): 可能接近100次。

Russ (主持人): 好的。那么到目前为止,你最喜欢的事情是什么?不是最喜欢的嘉宾,我讨厌那个问题。你最喜欢……关于做了100次采访的什么事情?

Dwarkesh (嘉宾): 它给了我……在线下结识那些极其有趣、教给我很多东西的人的机会。有很多不同的方式可以模拟为什么播客会随着时间的推移而改进或增长。我实际上有点相信那种缓慢的复利增长是假的。原因可能……基本上我认为好的东西实际上确实会很快浮现出来。甚至不是……仅仅是做这个过程本身让我进步了多少,因为你可以一遍又一遍地做同样的事情。我认为生活中的一个教训是,你在生活中一遍又一遍地做同样的事情,如果你没有从中得到任何信号,你知道,你不会进步。我进步的主要方式,以及我从播客中得到的主要东西是,希望我在某个话题上做得足够好,这给了我机会去接触或者被该领域的一些从业者接触,他们可以教我更多。我们一起出去吃晚饭、喝咖啡等等。这帮助我在这个话题上做出更好的播客,帮助我认识更聪明的人,以此类推。尤其是在AI领域,这一直是……我的意思是,我……我真心……你非常客气地这么说,但我知道在大学里我大概是班里中等水平之类的。我……我不是想谦虚什么的,但我确实知道,很多……我之所以能提出关于AI或其他任何话题的好问题,是因为我在旧金山被这个“蜂巢思维”所包围。我的意思是,回到“蜂巢思维”的价值上。嗯……关键是要尝试在其他领域复制这一点。

Russ (主持人): 你看,你在你的班级里是中等,但那是在一个叫做计算机科学的班级。这是一个不同的班级。这是一个叫做“好奇心”的班级。这是一个叫做“综合各种不同事物”的班级。这是一种非常不同的技能。所以我欣赏你的谦逊,但我不确定这是应得的。但这么说很好。让我们以好奇心结束。在准备我们的谈话时,我意识到这肯定是一个老生常谈,每个人肯定都知道了。但我发现的是,我做的采访越多,我能花时间相处的有趣的人越多,我的好奇心并没有得到满足,它反而被激发了。这是多么奇怪的事情,对吧?就像,“我想知道一些东西。”“好吧,这里有一些东西。”现在你知道的比以前多很多了。你不会说:“嗯,是的,我想我快知道得足够多了。”你不会。你想越来越深入。对我来说,那是……我怀疑这对我来说是遗传的,但我想我在一生中以某种方式培养了它,因为我一直不是一个非常专精的人,我一生中在经济学之外阅读了很多东西。而且……你知道,这是糟糕的建议。你在谈论糟糕的建议。这里有一些糟糕的建议:“是的,读任何你想读的东西。不要在意学校成绩,成绩不重要。这真的不重要。只做你关心的事情。无论你的热情是什么,去追求它。”是的,嗯,如果它不赚钱,通常是个问题。所以这不是唯一的事情,但它并非无关紧要。但对我来说,最棒的事情是……我不知道这还会持续多久,我70岁了。但我现在可能和我以往任何时候一样好奇。我……我在深入研究那个中心极限定理方面不如以前了。我对那个没那么好奇了。但我关心……我发现很多事情探索起来令人兴奋。嗯……我认为这是一种天赋。但也……这是一种你可以……我认为这是一种你可以通过探索不同事物来培养的天赋。或者也许它只是遗传的,你被困在你所处的任何水平上。我不知道。

Dwarkesh (嘉宾): 嗯……希望我正在达到那个境界,但你肯定……已经有机会并且正在这样做:如果你做了一千次采访,并且显然……过去也做过自己的研究等等,你意识到了……在如此多不同领域中的矛盾、开放性问题、不同假设、谜团。这是一种非常有益的体验。因为当你……当你还是个孩子或什么时候,你可能会问一个问题,你很好奇,但那是一种常常被……非常轻率地回应的好奇心:“哦,你知道,天空为什么是蓝色的?”“哦,有这个解释”或什么的。然后随着时间的推移……通过其中的一些对话,你开始和这些学者交谈,你会发现:“没有人知道这个。”他们有一个假设。我的意思是,类似于你提到的Dario说的:“这是一个经验趋势,我们不知道它为什么有效。”尤其是在AI领域,有如此多的这类问题。但即使在AI之外,比如……David Reich,我……在采访他之后的好几个月里,我都在痴迷地思考这次采访,因为我学到的是,我们……很多我们以为知道的关于人类进化的事情,实际上就像……我们并不真正知道。我们不知道它们。我们不知道它发生在哪里,比如,有多少是人类群体或欧洲以外的尼安德特人混回非洲的人类基因库?我们不知道它确切发生的时间。嗯……我们不知道它是如何发生的,比如,什么样的突变或文化变化?以及这种完全的冲击和……我所拥有的那些开放性问题,其中一些甚至David的实验室也还没有找到答案。能够做到……我的意思是,世界是如此无穷无尽地引人入胜,而我们的工作就是找到任何特定领域最聪明的人,然后就用我们的开放性问题去“轰炸”他们:“为什么是这个?为什么是那个?怎么会不是这个?这些是如何联系起来的?”这就是我们的工作。这……嗯……我对此感到无比高兴。

Russ (主持人): 我今天的嘉宾是Dwarkesh Patel。Dwarkesh,感谢你参与EconTalk。

Dwarkesh (嘉宾): 谢谢你,Russ。

(音乐)

旁白: 这里是EconTalk,隶属于经济与自由图书馆(Library of Economics and Liberty)。欲了解更多EconTalk内容,请访问econ.org。在那里您还可以评论今天的播客,并找到与今天对话相关的链接和阅读材料。EconTalk的音响工程师是Rich Goyette。我是主持人Russ Roberts。感谢收听,周一再会。

(音乐)


要点回顾

一、 引言与核心主题

二、 规模化的核心作用(The Scaling Era)

三、 关键技术与当前进展

四、 AI的能力、局限与应用

五、 AI发展的本质与未来展望

六、 社会影响与人类福祉

七、 播客制作的反思与好奇心