Linguista

「讲座-Demis Hassabis@剑桥2025」加速科学发现与 AI

讲座介绍

引言

本次演讲于 2024 年诺贝尔化学奖颁发后不久在其母校剑桥大学举行,Hassabis 先生作为 Google DeepMind 的联合创始人兼 CEO,分享了他从早期对智能的好奇到引领人工智能前沿研究的历程。

讲座首先回顾了他个人受国际象棋和剑桥学习经历的启发,进而阐述了创立 DeepMind 的初衷——旨在构建通用人工智能(AGI)并将其应用于解决世界上最严峻的挑战。Hassabis 详细介绍了 DeepMind 在游戏 AI 领域取得的里程碑式成就,如 AlphaGo 击败围棋世界冠军,并解释了这些系统背后的学习和搜索原理,强调了它们发现新知识的能力。

演讲的核心部分聚焦于将 AI 从游戏领域拓展至科学发现,特别是以荣获诺贝尔奖的 AlphaFold 项目为例。他深入浅出地讲解了蛋白质折叠问题的复杂性与重要性,以及 AlphaFold 如何通过 AI 技术实现突破性进展,并介绍了其对全球生物医药研究产生的深远影响。Hassabis 进一步展望了“数字生物学”的未来,以及 AI 在材料科学、药物研发、物理学等更广泛科学领域的应用潜力。

最后,他探讨了通往 AGI 的路径、相关的技术进展,并强调了负责任地发展 AI 的重要性,包括安全、伦理和社会参与。讲座还包含了一个问答环节,Hassabis 就 AI 与神经科学、技术局限、经济影响、脑机接口及游戏开发等问题进行了回应。

内容纲要

├── 引言 (主持人 Alistair Barisford)
│   ├── 欢迎 Demis Hassabis 回到剑桥
│   ├── 介绍 Demis 的背景
│   │   ├── 剑桥校友 (计算机科学)
│   │   ├── 早期成就 (国际象棋大师, 游戏开发《主题公园》)
│   │   ├── 学术回归 (UCL 认知神经科学博士)
│   │   └── DeepMind 创立与被谷歌收购
│   ├── 强调其科学贡献
│   │   ├── AlphaGo
│   │   └── AlphaFold (及其 2024 年诺贝尔化学奖)
│   ├── 提及对剑桥大学的支持
│   └── 点明讲座主旨:AI 加速科学发现与激励下一代
├── Demis Hassabis 演讲主体
│   ├── 个人历程与 AI 启蒙
│   │   ├── 对剑桥的特殊情感与渊源
│   │   ├── 国际象棋经历引发对“思考”本身的兴趣
│   │   ├── 通过早期象棋电脑接触 AI 并产生编程兴趣 (Amiga 500)
│   │   └── 剑桥经历的塑造作用
│   │       ├── 受到科学先驱 (Crick, Watson, 图灵等) 和剑桥氛围的激励
│   │       └── 诺贝尔奖经历与早期启发的呼应
│   ├── DeepMind 的创立与愿景
│   │   ├── 创立背景 (2010 年,AI 尚处早期)
│   │   ├── 类比“阿波罗计划”,目标是 AGI
│   │   ├── 核心使命:解决智能 -> 用智能解决一切
│   │   └── 方法论选择:学习系统 vs 专家系统
│   │       ├── 专家系统 (如深蓝) 的局限性:僵化、无法处理未知
│   │       └── 学习系统 (受神经科学启发) 的潜力:从数据学习、超越已知
│   ├── AI 在游戏领域的突破
│   │   ├── 游戏作为 AI 的理想试验场 (Atari, DQN)
│   │   ├── 围棋挑战 (AlphaGo)
│   │   │   ├── 围棋的复杂性 (10^170 局面) 与暴力搜索的不可行性
│   │   │   ├── 击败李世石及其意义:不仅获胜,更创造新策略 (Move 37)
│   │   │   └── 展示 AI 发现新知识的潜力
│   │   ├── AlphaGo/AlphaZero 工作原理
│   │   │   ├── 自对弈 (Self-play) 训练神经网络
│   │   │   ├── 迭代优化:生成数据 -> 训练新模型 -> 对弈验证 -> 替换
│   │   │   └── 神经网络引导搜索:缩减搜索空间,高效找到优解
│   │   └── 国际象棋与其他游戏 (AlphaZero)
│   │       ├── 击败顶尖程序 (Stockfish)
│   │       └── 发现新颖棋风 (重机动性轻子力),影响人类顶尖棋手
│   ├── 从游戏到现实科学问题
│   │   ├── 游戏 AI 算法的通用性
│   │   └── 筛选适用科学问题的标准
│   │       ├── 巨大的组合搜索空间
│   │       ├── 清晰的优化目标函数
│   │       └── 充足的数据或精确的模拟器
│   ├── 核心案例 - AlphaFold
│   │   ├── 蛋白质折叠问题的重要性 (生命基石,结构决定功能)
│   │   ├── 问题的挑战性 (列文塔尔悖论 10^300 构象 vs 毫秒折叠)
│   │   ├── CASP 竞赛作为评估平台
│   │   ├── AlphaFold 1 (2018): 引入深度学习,显著进步
│   │   └── AlphaFold 2 (2020): 重新架构,达到原子级精度,被认为“解决”问题
│   │       └── 工作机制可视化:迭代构建与精炼结构
│   ├── AlphaFold 的影响与拓展
│   │   ├── 开放共享 2 亿蛋白质结构数据库 (与 EMBL-EBI 合作)
│   │   ├── 对科学研究的巨大加速作用 (“十亿年博士时间”)
│   │   ├── 广泛应用实例 (塑料降解、抗生素耐药、药物发现、基础生物学等)
│   │   ├── 持续发展
│   │   │   ├── AlphaFold 3: 预测分子间相互作用 (蛋白质-蛋白质/DNA/RNA/配体)
│   │   │   └── AlphaProteo: 蛋白质设计 (反向问题)
│   │   └── 安全性考量:咨询专家,评估风险
│   ├── “数字生物学”与更广泛的科学应用
│   │   ├── 提出“数字生物学”概念:AI 作为理解生物复杂性的语言
│   │   ├── Isomorphic Labs: 用 AI 重构药物发现,加速流程、降低成本
│   │   ├── 展望:虚拟细胞 (in silico 实验)
│   │   └── AI 在其他科学领域的应用 (材料、聚变、算法、气象、量子计算等)
│   │       └── 鼓励跨学科合作
│   ├── 通往通用人工智能 (AGI) 的道路
│   │   ├── 在世界模型上的进展 (VEO 视频生成, Genie 游戏世界生成)
│   │   ├── 未来方向:结合搜索/规划 (AlphaGo 式) 与大型通用模型 (Gemini 式)
│   │   ├── 下一代助手 (Project Astra)
│   │   └── 机器人技术的潜力
│   ├── AI 安全与社会责任
│   │   ├── 从 DeepMind 创立之初就考虑安全伦理
│   │   ├── 技术措施 (SynthID 水印)
│   │   ├── 倡导审慎、负责任的发展态度 (反对“快速行动,打破常规”)
│   │   └── 强调广泛社会参与和国际合作的重要性 (如 AI 峰会)
│   └── 总结与未来展望
│       ├── 对经典计算潜力的再思考 (AI 或能解决部分曾认为需量子计算的问题)
│       ├── 猜想:自然界可发现的模式原则上可被经典学习算法建模
│       └── 重申终极愿景:AGI 作为理解宇宙和人类自身的工具

└── 问答环节 (Q&A)
    ├── Q1: 神经科学中的根节点问题与 AI/生物智能理解? (A: 记忆/想象力/规划/海马体;创造力/意识等大问题;AI 是研究工具)
    ├── Q2: DeepMind 早期心态 & 对梯度下降效果的惊讶 & 自然是否次优? (A: 早期押注学习系统+强化学习;对收敛效果确有惊讶;自然经进化可能接近最优)
    ├── Q3: 高带宽脑机接口与植入式模块的前景? (A: 关注并支持;目前主要用于功能恢复;未来增强可能性;与现有技术共生关系的延伸)
    ├── Q4: AI 发展速度对经济和职业规划的影响? (A: 变化快带来颠覆与机遇;编程仍重要但门槛降低;需适应快速学习)
    ├── Q5: 是否存在当前深度学习无法建模的生物过程? (A: 目前有,但理论极限不确定;若物理可解/有结构,原则上可学习;人造系统如密码学可能不同)
    └── Q6: AI (Genie) 在未来游戏开发中的整合与作用? (A: 多方面:资产生成、游戏平衡、Bug 测试、智能 NPC、最终可能实现“全息甲板”)

讲座内容要点

讲座框架:

  1. 开场介绍 (Alistair Barisford): 介绍主讲人 Demis Hassabis 及其背景、成就(尤其 AlphaFold 与诺贝尔奖)以及与剑桥的渊源。
  2. 个人历程与 AI 启蒙: Demis 分享其从国际象棋神童到对 AI 产生兴趣,再到剑桥学习及受到的启发。
  3. DeepMind 的创立与愿景: 阐述 DeepMind 的创建初衷、核心使命(解决智能,再用智能解决一切)以及早期 AI 方法论(学习系统 vs 专家系统)。
  4. AI 在游戏领域的突破: 详细介绍通过游戏(雅达利、围棋、国际象棋)训练和验证 AI 的过程,重点是 AlphaGo 和 AlphaZero 的成就、原理及意义。
  5. 从游戏到现实科学问题: 论述如何将游戏 AI 的算法思想应用于解决复杂的现实世界科学问题,并提出筛选适用问题的标准。
  6. 核心案例 - AlphaFold: 深入讲解蛋白质折叠问题的重要性、挑战性,以及 AlphaFold 1 和 AlphaFold 2 的研发历程、技术突破(达到原子级精度)和在 CASP 竞赛中的成功。
  7. AlphaFold 的影响与拓展: 展示 AlphaFold 数据库的开放共享、对全球生物学研究的巨大加速作用、广泛应用实例,以及后续的 AlphaFold 3(处理分子相互作用)和 AlphaProteo(蛋白质设计)等发展。
  8. “数字生物学”与更广泛的科学应用: 提出“数字生物学”概念,展望 AI 在生物医药领域的未来(如 Isomorphic Labs 与药物发现),并列举 AI 在材料科学、物理、数学、医学等其他科学领域的应用实例。
  9. 通往通用人工智能 (AGI) 的道路: 介绍 DeepMind 在通用 AI 方面的进展,如视频生成模型 (VEO)、交互式世界模型 (Genie),以及结合搜索规划与大型模型的未来方向。
  10. AI 安全与社会责任: 强调负责任地开发 AI 的重要性,提及 DeepMind 在安全伦理方面的投入(如 SynthID 水印技术),以及与社会各界沟通合作的必要性。
  11. 总结与未来展望: 总结 AI(特别是基于经典计算的 AI)在解决复杂问题上的潜力,提出对计算理论的思考,并重申 AGI 作为理解宇宙终极工具的愿景。

要点内容:

加速科学发现与 AI - Demis Hassabis 爵士讲座实录

开场介绍 (Alistair Barisford)

大家好,我是 Alistair Barisford,现任计算机科学与技术系(即计算机实验室)主任。今天下午,我非常荣幸地欢迎 Demis 回到剑桥。Demis 于上世纪 90 年代在剑桥学习计算机科学,那时实验室就在这个演讲厅旁边。我很高兴地说,Robin Walker 今天也在场,他是 Demis 在女王学院的学业指导老师。我早些时候和 Demis 讨论过,我们认为这里是他第一次在剑桥听讲座的地方——米迦勒学期第一个星期四早上 9 点的数学课。所以,这似乎是他回归的一个恰当之地。

Demis 在来到剑桥之前就已经取得了几项令人难以置信的成就。他是一位国际象棋大师,也是世界排名第二的 14 岁以下棋手。在提前一年完成学业后,他没有选择背包环游欧洲,而是在电脑游戏行业找到了一份工作,在那里他联合设计并担任了电脑游戏《主题公园》(Theme Park) 的首席程序员。

以一等学位从剑桥毕业后,Demis 回到了游戏行业,起初在 Lionhead Studios 工作,随后成立了自己的公司。然而,他对基础科学研究显然怀有热情,因此 Demis 重返学术界,这次是在伦敦大学学院 (UCL) 攻读认知神经科学博士学位,并于 2009 年毕业。他在 UCL 一直待到 2011 年,然后离开并联合创立了 DeepMind,一个 AI 研究实验室,该公司于 2014 年被谷歌收购。

Demis 和他在 Google DeepMind 的同事们为科学做出了几项开创性的贡献。亮点包括 AlphaGo,这是第一个在围棋棋盘游戏中击败人类职业选手的计算机程序;以及 AlphaFold,一个能够预测蛋白质结构的计算机程序。正是 Demis 对 AlphaFold 的贡献,使他分享了 2024 年诺贝尔化学奖。

如今,除了他在此期间令人难以置信的智力贡献外,他还一直是大学的杰出支持者,包括资助学术职位,以及为计算机实验室和女王学院来自代表性不足群体的学生提供重要支持。Demis 对下一代计算机科学家的热情和支持是我们今天讲座的动力。我相信他不仅会帮助我们理解如何用 AI 加速科学发现,还会激励在座的下一代学生去改变世界。

现在,让我们欢迎 Demis 上台。

个人历程与 AI 启蒙

谢谢 Alistair 精彩的介绍。回到剑桥真是太棒了,每次回到剑桥,我总有一种温暖的感觉,特别是这个演讲厅。正如 Alistair 提醒我的,我想这确实是我进入的第一个演讲厅,它一直是我最喜欢的演讲厅。我记得告诉过——我看到很多我在剑桥时期的老朋友在这里,Aaron,我想——也许有一天我会回到这里做演讲,谈论宣布通用人工智能 (AGI),也许一个机器人会走上台,让所有人惊叹。我今天不会这样做,让大家失望了,但也许几年后我会再回来做那个演讲。

但你知道,这是一个了不起的地方,一个如此鼓舞人心的地方。我将稍微谈谈剑桥实际上如何启发了我的整个职业生涯,并希望它也能为在座的许多学生做同样的事情。

对我来说,我的 AI 之旅始于游戏,特别是国际象棋,正如 Alistair 提到的。我从四岁开始下棋,并且非常认真地为英格兰青少年队效力。这让我开始思考“思考”本身:我们的头脑是如何想出这些计划和想法的?我们如何解决问题?我们如何改进?显然,当你在年幼时下棋并试图参与竞争时,你会努力改进这个过程。对我来说,这很迷人,甚至比我下的棋局本身更迷人的是其背后的心智过程。

事实上,AI 和计算机,我第一次接触到它们是在国际象棋的背景下。我试图使用非常早期的象棋计算机,比如右边这个,我想这是我第一台象棋电脑。它们是实体棋盘,你实际上必须按下棋格来移动棋子。当然,我们本应使用这些象棋电脑来训练开局理论,学习更多关于国际象棋的知识。但我记得让我着迷的是,有人编写了这个无生命的塑料块,让它能和你下得非常好。我真的对这是如何完成的,以及如何有人能编写出这样的东西感到着迷。

在我十几岁早期,我自己开始用 Amiga 500 电脑进行实验,这是 80 年代末 90 年代初令人惊叹的家用电脑。我开始自己构建那种 AI 程序来玩像《奥赛罗》(Othello) 这样的游戏。那真是我第一次接触 AI,从那时起我就着迷了。我很早就决定,我的整个职业生涯都要致力于推动这项技术的前沿。

然后,这引领我来到了剑桥。我在这里的三年对我来说极具塑造意义。我来自北伦敦的一所综合学校,在人们的记忆中,从未有人去过牛津或剑桥。但我想来剑桥的原因,是我听到的所有关于剑桥发生的鼓舞人心的故事,所有那些我曾经阅读其传记和了解其工作的了不起的人。特别是像左上角的克里克 (Crick) 和沃森 (Watson)。我特别记得一部 80 年代的电影《争夺双螺旋》(The Race for the Double Helix),一部很棒的电影,如果你没看过的话。杰夫·高布伦 (Jeff Goldblum) 早期的角色之一,他带着他饰演所有角色时所具有的那种热情,扮演沃森。他们在剑桥漫游,探索发现,研究像 DNA 这样的东西,度过了非常愉快的时光。我想,看,这就是我想要的,我想体验一下处于发现前沿的感觉,还有什么比这更令人兴奋的呢?那部电影确实生动地展现了那可能是什么样子。

当然,还有我所有的科学英雄,他们中的许多人都曾在剑桥学习,像艾伦·图灵 (Alan Turing) 和查尔斯·巴贝奇 (Charles Babbage),当然,就在我们现在所在的这个以他命名的演讲厅里。甚至像老鹰酒吧 (Eagle Pub) 这样的地方,如果你从女王学院开始,他们第一天给你的导览之一就是去看看那张他们讨论 DNA 结构的传说中的桌子。你情不自禁地会被这些所激励。沿着国王大道 (King's Parade) 散步,我几乎感觉过去那些思想巨匠的声音仿佛从石头中向你诉说。这就是我的感受,比如深夜去 Gardies 买个汉堡时。激励我的是所有这些走过同样道路的了不起的人们,历经数百年。这就是剑桥无与伦比的历史,我认为我们今天仍然可以从中汲取灵感。然后是我和 Aaron 的一张照片,他是女王学院我最好的朋友之一,显然是在数学桥上。

最后,当 Alistair 提到诺贝尔奖时,你知道,去年 12 月去斯德哥尔摩领奖是我一生的荣幸。那是一个为期一周的精彩活动,但我最喜欢的活动是当你可以在诺贝尔基金会签署诺贝尔名册时。这就是那本名册,以及我拍的一张照片。我开始翻阅那本书,你签上你的名字,然后往回翻,想知道克里克是否在里面,当然他在。再往前翻,爱因斯坦的签名也在那里。这真是令人难以置信。我花了一个小时拍下了那本书的每一页。所以,对我来说,从看到那张照片(指克里克和沃森),到 80 年代末看到那部电影,再到真正看到(诺贝尔名册),这形成了一个完整的循环。

DeepMind 的创立与愿景

然后在 2010 年,我们在伦敦创立了 DeepMind,当时我们将其视为一种“阿波罗计划”式的努力,旨在构建通用人工智能 (AGI),即真正通用、能够执行人类所有认知能力的 AI。它将是一个真正通用的 AI 系统。事实上,这个想法真正源于图灵和图灵机,即能够计算任何可计算之物的机器,正如丘奇-图灵论题所示。对我来说,这一直是基础,也是我从剑桥这里的讲座中学到的主要东西之一,那就是计算机科学和计算理论的所有这些理论基础,如图灵和香农在 40 年代和 50 年代所做的著名工作。

我们始于 2010 年,令人惊讶的是,这已经是 15 年前了,在某些方面这并不算太久。但当我们创立 DeepMind 时,几乎没有人研究 AI,这在今天看来难以置信,因为现在似乎几乎每个人都在研究 AI。仅仅十多年,事情就以令人难以置信的速度加速发展。显然,我们一直是这段激动人心的旅程的一部分。

我们 DeepMind 从一开始的使命是……我们谈论“负责任地构建 AI 以造福人类”,但我们刚开始时阐述它的方式是一个两步过程:第一步,解决智能;第二步,用它解决其他一切问题。这在 2010 年时听起来非常离奇。你可以想象试图基于这个使命向风险投资家进行推介,这看起来相当疯狂。但我今天仍然从根本上相信这一点,而且我认为越来越多的人意识到,以这种通用方式构建的 AI 可能对几乎任何领域产生深远和变革性的影响。这显然是该使命宣言的第二部分。我认为,对我来说,这包括加速科学发现本身、医学以及增进我们对周围宇宙的理解。

回到我们刚开始的时候,基本上有两种方式构建 AI,事实上,当我在 90 年代在这里学习时也是如此。广义上说,有两种方式:一种是专家系统的方式,即你直接用解决方案预先编程一个专家系统。像深蓝 (Deep Blue) 这样在 90 年代(实际上是我在这里学习期间)非常著名地击败了加里·卡斯帕罗夫 (Garry Kasparov) 的系统,大概是专家系统的巅峰范例。但这些专家系统的问题在于,这也是它们从未真正扩展到完全通用智能的原因,它们无法处理意外情况。如果你遇到未曾预料到的情况,系统中没有任何东西能让它应对。它们有点受逻辑系统的启发,因此相当僵化、脆弱和易碎。

而现代的方法是基于学习系统。这些系统能够自己学习,直接从经验或数据中、从第一原理开始学习。它们更多地受到神经科学思想的启发。显然,我们今天拥有的这些系统的潜力在于,它们可能超越我们作为程序员或系统设计者已经知道如何解决的知识。当然,这在科学发现等领域极具价值。

AI 在游戏领域的突破

我们在 2010 年代初开始涉足游戏领域。当然,我一生中多次使用游戏:首先是训练我自己的思维,然后我为电脑游戏构建游戏和 AI,最后是第三种方式——训练我们的 AI 系统。游戏是 AI 系统的完美试验场。你可以从非常简单的游戏开始,比如 70 年代的雅达利游戏。这个系统 DQN,是第一个真正构建出能够直接从原始数据中学习的端到端学习系统。在这种情况下,原始数据是屏幕上的原始像素。它没有被告知任何关于游戏的信息,也不知道它在控制什么,只是被告知要基于这个视频流输入(像素流输入)来最大化得分。我们在 2013 年左右能够掌握所有不同的雅达利游戏。

然后,我们将这些系统扩展到我认为是游戏 AI 的终极挑战:你能否创造出能在围棋游戏中达到世界冠军水平或超越的系统?围棋可能是人类发明的最复杂的游戏。它有数千年的历史,所以也是最古老的游戏之一,也是最优雅的游戏之一。衡量围棋复杂性的一个方法是,围棋中大约有 10 的 170 次方种可能的局面。这远超可观测宇宙中的原子数量。关于这一点的重要意义在于,你无法通过暴力搜索技术在围棋中找到策略,这是不可能的,完全不可行。所以你必须做一些更聪明的事情。

我们在 2016 年著名地赢得了一场百万美元的挑战赛,对手是十次世界冠军、围棋传奇人物之一的韩国大师李世石 (Lee Sedol)。全球有 2 亿人观看了这场比赛。我们的系统 AlphaGo 不仅赢得了那场比赛,重要的是,它实际上提出了新的、原创的围棋策略。尽管我们下围棋已有数千年历史,职业化也有数百年,它仍然能够找到前所未见的策略。最著名的是第二局中的第 37 手,这里的红色标记。如果你看关于这个的纪录片(在 YouTube 上有),你会看到世界上最好的棋手们(当时正在评论比赛)对这一步有多么惊讶。这在当时是难以想象的一步,然而它在 100 手之后决定了第二局的胜负,让 AlphaGo 获胜。这再次告诉我,这类系统具有发明和发现新知识的潜力。当然,这里我们谈论的只是游戏知识,但我的梦想显然是将这种能力推广到科学发现的所有领域。

那么这些系统是如何工作的呢?我们基本上通过一种自对弈 (self-play) 的系统来训练这些神经网络。这实际上是 AlphaGo 以及后续系统 AlphaGo Zero 和 AlphaZero 的做法,它们将我们为围棋所做的工作推广到可以从零开始玩任何双人游戏。你从一个对游戏规则一无所知、只会随机下棋的系统版本 1 开始。让这个系统与自己对弈,比如说 10 万局。这就创建了一个包含这 10 万局游戏棋局的新数据库。基于此,你训练出第二个版本,一个稍微好一点的模型,版本 2。训练它的目标是预测在任何给定位置最可能下的棋步,以及哪一方(黑棋或白棋)更可能从该位置获胜,以及他们获胜的百分比概率是多少。然后你可以用版本 2 对抗版本 1,进行一场 100 局的比赛。如果它以显著优势获胜(比如 55% 的胜率),你就用版本 2 替换版本 1,并创建一个新的、质量稍高的游戏数据库。然后你学习一个版本 3 的系统。如果你重复这个过程大约 17、18 次,你就能从早上随机下棋,到 24 小时或更短时间后,你的版本 17 或 18 就比世界冠军水平还要强。看到这个自我改进过程在如此短的时间内发生,是相当不可思议的事情。

如果我们思考这些神经网络在做什么,它们实际上是将那个难以处理的、拥有 10 的 170 次方种可能性的搜索空间,缩减到在几分钟计算时间内更易于处理的范围。它是通过使用神经网络有效地引导搜索机制来实现这一点的。如果你把这个可能性的树形结构想象成,树中的每个节点都是一个围棋局面,那么你就不必查看每一种可能性,而是可以利用神经网络引导你只沿着最有趣、最有用的路线(分支)进行检查。在这种情况下,就是蓝色的那些。然后,当你的思考时间用尽时,你选择迄今为止看到的最佳路线,即最有希望的路线。在这个例子中,就是这条紫色的路线。

这接着引出了……我们不仅玩了围棋,还玩了任何双人完美信息游戏。它要么能够发现新的策略,要么能够发现新的下棋风格,比如国际象棋。考虑到当时的国际象棋计算机已经非常强大,这本身就非同寻常。像 Stockfish 这样的程序,而 AlphaZero 能够击败当时的 Stockfish,这几乎是不可能做到的。它不仅击败了 Stockfish——这里 AlphaZero 执白,对手 Stockfish 执黑——而且在这个特定的局面中,这是 AlphaZero 下过的最著名的棋局之一,被称为“不朽的被迫失措”(Immortal Zugzwang) 棋局。白方在这里获胜,因为它偏爱机动性而非子力。大多数国际象棋计算机偏爱子力,你会看到黑方(如果你下棋的话)拥有更多的子力,但实际上它的任何棋子都无法移动,都被困在角落里。AlphaZero 为了这种机动性牺牲了子力。对于人类特级大师和顶尖棋手来说,这不仅是非常有效的风格,也是非常优美、具有美感的下棋风格。所以,AlphaZero 能够发现这种新的、充满活力的下棋方式,真是令人惊叹。

事实上,一些世界顶尖棋手对此发表了评论。我一直以来最喜欢的棋手加里·卡斯帕罗夫说:“程序通常反映了程序员的优先考虑和偏见。但因为 AlphaZero 是自己学习的,我会说它的风格反映了真理。” 然后,当时的世界冠军马格努斯·卡尔森 (Magnus Carlsen) 阅读并研究了这些棋局,以及关于 AlphaZero 的书籍,他说:“我最近受到我一位英雄的影响,其中之一就是 AlphaZero。” 所以他实际上将很多这些想法融入了自己的棋局中,统治了棋坛近十年。

从游戏到现实科学问题

我们在游戏 AI 领域取得了所有这些里程碑式的突破,大概是在 DeepMind 存在的第一个十年里。但当然,这些只是我们想要做的事情的训练场,只是达到目的的手段,本身并不是目的——尽管我热爱游戏。目的是创造出能够普遍用于解决现实世界问题的算法。

那么,我们在现实世界问题中寻找什么呢?不仅是科学问题,实际上也包括工业问题。我们寻找符合三种不同标准的问题,这些标准使得问题适合用我们为玩游戏而开发的这类 AI 系统、思想和算法来解决。

第一,我们寻找可以被描述为巨大的组合搜索空间的问题。通常情况下,组合过于复杂,可能性太多,无法暴力破解解决方案。但也许存在某种结构,我们可以用我们的神经网络学习到,从而非常有效地引导搜索。

第二,我们寻找可以被描述为具有清晰目标函数或某种可以优化的度量标准的问题。在游戏中这很简单,比如最大化得分或赢得比赛。但实际上,有很多现实世界的问题可以归结为几个你试图最大化的度量标准或目标函数。

第三,当然,你需要相当多的数据或经验来学习。或者,理想情况下,是“和”——你需要一个准确且高效的模拟器,这样你就可以生成更多的合成数据来增强你拥有的真实数据。

事实证明,如果你从这个角度看待问题,有很多问题可以被归结为这些术语,包括科学领域中许多许多重要的问题。

核心案例 - AlphaFold

而我一直记在心里的一个问题,实际上是从我在剑桥读本科时第一次接触到这个问题开始的,那就是蛋白质折叠问题。我为那些不了解生物学和蛋白质的人简单描述一下。蛋白质极其重要,它们是生命的基石。生物体中的几乎每一个功能都依赖于蛋白质,从你的神经元放电到你的肌肉纤维抽搐。所以,真正使生命成为可能的是蛋白质。

蛋白质折叠问题描述起来其实很简单。基本上,一个蛋白质由其基因序列定义,基因序列指定了氨基酸序列。在自然界中,这个氨基酸序列会自发地折叠成通常非常漂亮的蛋白质结构。所以你从基因序列得到蛋白质结构。蛋白质的三维结构之所以非常重要,是因为它在很大程度上决定了它的功能,即它在体内做什么。它并不能完全描述功能,但在它实际在自然界中做什么方面起着重要作用。

那么,蛋白质折叠问题就是这样一个问题:你能否直接从这个一维的氨基酸序列预测出蛋白质结构?你能否通过计算从那个序列预测出那不可思议的三维结构?

为什么这是一个如此困难的问题呢?嗯,列文塔尔 (Levinthal) 是一位 60 年代著名的蛋白质研究者,他描述了一个后来被称为“列文塔尔悖论”的猜想。他计算出,一个普通蛋白质大约有 10 的 300 次方种可能的形状。然而,在自然界和身体中,这些蛋白质在毫秒级别内自发折叠。这就是悖论:如果可能性如此之多,自然界是如何做到的?基本上,物理学是如何实现这一点的?这给了我们希望,即这个问题在计算上一定可以在合理的时间内解决,因为物理学在我们的身体里每秒钟解决这个问题数十亿次。

此外,吸引我研究这个问题的是,有一个两年一度的竞赛叫做 CASP 竞赛 (Critical Assessment of protein Structure Prediction),你可以把它想象成蛋白质折叠领域的奥运会。它每两年举办一次,由一些杰出的人士领导,包括马里兰大学的 John Moult 教授。它自 1994 年开始运行,是一个很棒的竞赛,因为他们与实验科学家合作。实验科学家们 painstakingly(煞费苦心地)使用非常奇特和昂贵的设备,如电子显微镜,来发现这些结构。他们将新发现的、尚未发表的结构放入竞赛中。所以实际上,竞赛组织者知道基准真相 (ground truth),但计算团队——每年有数百个团队参加每次竞赛——他们尝试用他们的计算方法来预测那些结构。竞赛中通常有大约 100 个蛋白质。然后在夏天结束时,他们公布真实的结构,你就可以比较预测的结构与真实结构的距离(预测中的误差)。

我们在 2018 年首次参加了 AlphaFold 1。我们实际上在 2016 年开始了 AlphaFold 项目,差不多就在我们从韩国首尔的 AlphaGo 比赛回来后的第二天。我们觉得,我也觉得,我们的技术已经足够成熟,准备好应用于游戏之外的领域,去尝试解决真正有意义的问题。我们称之为“根节点问题”(root node problems),因为如果它们能被解决,就能开辟出全新的分支和发现途径,可以在其基础上进行构建。蛋白质折叠就是这方面的一个典型例子。

所以我们从 2016 年开始工作。AlphaFold 1 在几年后就绪,我们用它参加了 CASP 13 竞赛。你可以看到,在之前的十年里,这些柱状图显示的是获胜团队在最难类别(即预测最难的蛋白质)中的得分。你可以把它看作是一个准确率百分比,即你有多少氨基酸在特定容差内处于正确位置——你需要在大约一个原子的宽度内进行预测。你可以看到,十年来几乎没有什么进展,我们被卡在这个 60 分的水平。如果我们达到 90 分,那就意味着达到原子宽度内的精度,也就是原子级精度。实验科学家告诉我们,这是必须达到的精度,这样它才能与实验方法竞争。这样,实验科学家才能真正依赖这些预测,而不必一定去做那些费力、 painstaking(煞费苦心)的工作来找到那个结构。根据经验法则,我的生物学家朋友总是告诉我,一个博士生需要花费整个博士生涯,也就是四五年时间,才能找到仅仅一个蛋白质的结构。而科学界已知的蛋白质有 2 亿种,人类蛋白质组中有 2 万种。

所以,通过 AlphaFold 1,我们得以赢得这次竞赛,并且比次优系统好了将近 50%。AlphaFold 1 首次将机器学习技术作为系统的主要组成部分引入。但这还不足以达到原子级精度。我们实际上不得不回到绘图板,利用我们从 AlphaFold 1 中学到的东西,从头开始重新架构 AlphaFold 2,最终达到了这个原子级精度。这使得组织者在 2020 年底宣布该问题已被解决。

这是一个 AlphaFold 如何工作的视觉示例。你可以看到左边是一个非常复杂的蛋白质,基准真相是绿色的,预测的结构是蓝色的。你可以看到蓝色与绿色重叠得多么紧密。然后在右边,你可以看到 AlphaFold 2 是如何工作的:它在一个迭代过程中逐步构建出那个结构。它实际上会自我循环大约 192 步,然后构建出……它开始时像一个皱缩的蛋白质物质(氨基酸)球,然后构建出一个更合理的结构。最后,它会精炼最后的部分,直到得到最终的预测。

AlphaFold 的影响与拓展

我们立即尝试……因为 AlphaFold 不仅准确,而且速度极快,它能在几秒钟内折叠一个普通蛋白质。我们很快意识到,我们实际上可以折叠科学界已知的所有 2 亿种蛋白质。在一年左右的时间里,我们使用了 Google Cloud 上的大量计算机来折叠所有这些蛋白质,然后与我们在 EMBL-EBI(欧洲生物信息学研究所)的同事们(就在剑桥外的桑格中心附近)一起,将它们免费发布在一个数据库上。我们为世界上任何人提供了免费、无限制的访问权限,供其使用。

这 2 亿种蛋白质,如果你想想用实验方法做需要多长时间——四五年——这就像是在一年内完成了十亿年的博士研究时间。所以,想想科学能被加速多少,真是令人惊叹。它开辟了全新的探索途径,因为许多这些结构,特别是对于研究较少的生物体,比如某些类型的植物,它们对科学和农业非常重要。对于农业研究来说,几乎没有任何这些结构是被发现和可用的。但现在它们都可用了。而且有了 2 亿个结构,你可以在聚合层面上观察它们,观察跨物种的结构,观察元结构,看看进化过程中的共性。所以现在结构生物学领域正在探索一些非常有趣的新分支。

当然,我们从一开始就考虑到了安全问题。我们非常认真地对待我们在 AI 前沿的责任。在这种情况下,我们咨询了 30 多位生物安全和生物伦理专家,以确保我们向世界发布的东西,其益处远远超过与之相关的任何风险。

现在我很自豪地说,有超过 200 万研究人员正在使用它,几乎来自世界上每个国家。它已经被引用超过 3 万次,现在已经成为生物学研究中的标准工具。在座的许多博士生,希望你们正在使用它并从中受益。它现在只是生物学研究标准规范的一部分。

看到其他研究人员利用所有这些技术和结构所做的工作,真是令人惊叹。我只列举了六个我最喜欢的例子:朴茨茅斯大学的一个研究小组正在用它来解决环境中的塑料污染问题,试图设计能够消化塑料的新酶(酶是一种蛋白质);我们正与弗莱明中心 (Fleming Centre) 合作研究抗生素耐药性;被忽视的疾病,如影响世界较贫困地区的热带病,我们与被忽视疾病药物研发组织 (Drugs for Neglected Diseases initiative, DNDi) 合作。这是一个很好的例子,说明我们如何能在这些领域加速研究,比如疟疾、利什曼病、寨卡病毒等,很多这些结构是未知的,但现在他们可以直接进行药物发现,因为他们掌握了关于那些病毒和细菌结构的大量信息。

还有很多基础研究正在进行,比如发现核孔复合体 (nuclear pore complex) 的结构,这是一种非常重要的蛋白质,它让营养物质进出细胞核;布罗德研究所 (Broad Institute) 在药物递送方面做了出色的工作,设计分子注射器,重新设计能够将药物靶向递送到身体特定部位的蛋白质;它甚至被用于研究生育机制。它被应用的领域之广,几乎涵盖了生物学和医学研究的每一个领域,现在都在利用 AlphaFold。

在过去的几年里,我们继续开发更多的……更多的进展,并改进系统。我们在今年早些时候发布了 AlphaFold 3,供学术界使用。我们现在已经将 AlphaFold 3 扩展到处理相互作用。你可以将 AlphaFold 2 看作是静态蛋白质结构的图片,但生物学实际上是一个动态过程。所以你需要理解不同的生物元素之间是如何相互作用的。当然,蛋白质与其他蛋白质相互作用,但蛋白质也与其他对生命重要的分子相互作用,比如 DNA 和 RNA,还有配体 (ligands)——即小分子,比如药物化合物,蛋白质如何与该化合物结合。

然后我们有另一项独立的工作,AlphaProteo,它做的是 AlphaFold 的逆向工作,但仍然利用了 AlphaFold 的技术。如果你想设计一种自然界中可能不存在的新型蛋白质,用于特定的工作、特定的功能,那么能够产生该结构的氨基酸序列和基因序列是什么?所以,这有点像反向运行它,试图设计出能做新颖事情的新结构。这在设计药物以及像抗生素和抗体这样的东西方面,可能极其有用。

“数字生物学”与更广泛的科学应用

那么,退一步看,如果我回顾过去 15 年我们所做的所有工作,这对科学以及机器学习意味着什么?如果你思考我们首先在游戏领域所做的工作,然后是我们现在正在进行的科学工作(其中 AlphaFold 是我们最好的例子),这一切都是关于让搜索变得可行。你有一个极其复杂的问题,这个问题有非常非常多的可能解决方案,你必须在那个巨大的组合搜索空间的“大海捞针”中找到最优解。你无法通过暴力搜索做到这一点。所以你必须学习这个神经网络模型。它有点像学习问题的拓扑结构,这样你就可以有效地引导搜索,以达到你设想的目标的最大化或找到最优解。

我认为这是一种极其通用的方法,一种极其通用的解决方案,可以用来处理各种各样的问题。所以我们回想一下围棋的例子:我们试图用这些系统找到最佳的围棋着法。但你也可以把那些节点改成化学化合物,现在你试图在化学空间中找到最佳分子。而最佳分子……这是药物设计的开端,这个最佳分子能特异性地与你感兴趣的靶点结合,但不与其他任何东西结合,从而减少该化合物的副作用和毒性。我们现在为了设计这些分子而使用的技术,与(围棋中使用的)是非常非常相似的技术,这是我们下一步的工作,因为我们越来越深入地进入药物发现领域。

所以我认为,至少在生物学领域,我感觉我们现在正在进入一个我喜欢称之为“数字生物学”(digital biology) 的新时代。我认为生物学在其最基础的层面上是一个信息处理系统,它试图抵抗周围的熵,我认为这基本上就是生命。当然,它是一个极其复杂和涌现的信息处理系统。我认为这就是 AI 发挥作用的地方。就像数学,我在这间教室里学到的数学,是物理学以及物理现象的完美描述语言一样,我认为 AI 可能是生物学的完美描述语言。它非常适合处理像生物学这样的动态系统中所出现的复杂性、涌现行为和相互作用。我认为 AlphaFold 就是一个证明点。我希望当我们 10 年后回顾时,它不会是一个孤立的突破,而是真正预示了这个数字生物学新时代、黄金时代的到来。

我们自己也在努力推进这一点。我们成立了一家新的衍生公司 Isomorphic Labs,以我们的 AlphaFold 技术为基础,更多地进入我刚才谈到的化学领域,并尝试用 AI 从第一原理出发重新构想药物发现。目前,开发一种药物平均需要 10 年时间,而且成本极其高昂,耗资数十亿甚至上百亿美元。所以我在想,为什么我们不能用这些技术将研发时间从几年缩短到几个月,甚至有一天可能缩短到几周?就像我们将蛋白质结构的发现时间从潜在的几年缩短到现在的几分钟甚至几秒钟一样。所以我们把这看作是以“数字速度”做科学 (doing science at digital speed)。我们试图将我们在技术领域的最佳实践带到自然科学领域。

我未来的梦想是有一天能够创造出一种虚拟细胞,一个计算细胞,也许是某种非常简单的东西,比如酵母细胞。你可以在上面进行硅基 (in silico) 实验,从虚拟细胞中得到的预测实际上会告诉你信息,指导你在实验室进行的真实世界实验。你可以减少大量在湿实验室 (wet lab) 中进行的搜索工作,而更多地将湿实验室用于验证步骤,而不是那个非常昂贵和缓慢的搜索过程。

当然,AI……我们不仅在生物学中使用 AI,它还可以更广泛地应用于科学、数学、医学等领域。我们取得了一系列突破,不仅在生物科学领域,还包括从视网膜扫描中识别眼疾等健康领域、发现新材料、帮助等离子体约束聚变反应堆、更快的算法(AI 为自己发现更好的算法,如更快的矩阵乘法)、进行天气预测,甚至帮助量子计算机进行量子计算中的纠错。这只是我们在过去两三年里所做工作的一小部分例子。我认为 AI 几乎将适用于每一个领域。我总是鼓励大学开始非常认真地思考跨学科工作,将 AI 应用于特定专业领域的正确问题上。我认为未来 5 到 10 年,通过这样做可以取得非常非常多的进步。

通往通用人工智能 (AGI) 的道路

我最后会稍微谈一点更宏观的视角,不仅是 AI 用于科学,还有通往 AGI 的道路,我们离它有多近,以及我们关于 AGI 原始使命的更广泛的工作。我们在理解世界的所有通用方面都取得了很大进展。我们有时称它们为“世界模型”(world models)。我们对我们新的视频模型 VEO(Video generation model)感到特别自豪,它是在去年年底发布的,是视频生成领域的顶尖水平。它能够仅从文本描述或单个静态图像生成这些视频。

你知道,虽然其中一些视频可能看起来不那么令人印象深刻,但如果你想想那个切西红柿的视频,这就像是视频模型的图灵测试。因为通常你会看到西红柿神奇地复原,或者你切到了手指,或者刀移动到了别处。如果你想想系统为了真正理解世界的物理原理必须做什么,或者这个蓝莓周围的气泡,它只是从文本(“蓝莓掉进一杯水里”)生成出来的,并且它正确地处理了所有物理过程,或者这些小卡通人物的运动,或者这里的蜜蜂……这真是令人难以置信。我想,即使你在五年前告诉我,这可以在不内置任何特殊物理理解的情况下实现,我也会告诉你这似乎不太可能。但不知何故,这些学习系统能够仅仅通过观看,你知道,非常非常多的 YouTube 视频,就学习到真实世界的物理知识。这真是太疯狂了。

我们更进一步,开发了 Genie。当然,这里我又戴上了我的游戏帽子。这是将那些 VEO 模型更进一步。现在,通过文本指令,你可以生成一整个游戏。比如这里,我们在底部说:“生成一个可玩的世界,扮演一个在未来城市中的机器人。” 它就生成了这个,你可以用 QWE 键和箭头键来控制它。目前,它只能保持几秒钟的一致性,但我们正在努力将其扩展,让游戏世界的一致性持续几分钟。这样你就真正拥有了我所说的世界模型,真正理解了真实世界,以及真实世界中的相互作用如何运作,真实世界的物理如何运作。

我们现在正在构建我们自己的大型多模态模型,试图将我向你们展示的所有这些不同模型的优点整合到一个系统中。我们称之为 Gemini 系列。我们最新的是 Gemini 2.0,你们有些人可能已经试用过,它在许多领先的基准测试中都处于顶尖水平。我们正在用它来进一步……我非常期待下一代的助手,我称之为通用助手 (universal assistants),我们称之为 Project Astra。实际上,你可以把它放在手机上,或者其他设备上,也许是眼镜,它开始成为一个你可以随身携带到现实世界中的助手,在日常生活中帮助你,丰富你的生活或让你更有效率。

AI 的下一步是将我向你们展示的 AlphaGo 这类基于智能体 (agent-based) 的模型——它们能够在有限领域内(这里是游戏)有效地搜索并找到问题的良好解决方案——与像 Gemini 这样更通用的模型(这些理解真实世界如何运作的世界模型)结合起来。然后它们就能在真实世界中进行规划并实现目标。当然,这对于像机器人技术这样的领域至关重要。我认为在未来两三年内,这将是一个巨大的领域,将会取得巨大的进步。

AI 安全与社会责任

当然,我们一直非常努力地研究这方面的安全问题。从 2010 年一开始,我们就在为成功做规划,尽管当时几乎没有人研究 AI。我们设想这将是一个 20 年的使命,令人惊讶的是,15 年过去了,我们某种程度上还在按计划进行。我们当时就在为成功做规划:如果我们真的要构建这类变革性的系统和技术,随之而来的将是巨大的责任,要确保它们以安全和负责任的方式部署。

我们构建的技术之一叫做 SynthID,它使用一个 AI 系统(对抗性 AI 系统)来无形地添加水印,对像素、文本或音频进行微小的调整,人耳或人眼无法察觉,但检测系统可以检测出这些是合成生成的图像(无论是音频、图像还是视频)。当然,随着这些技术被广泛部署,能够轻松区分合成生成的图像和真实图像将变得越来越重要。

AI 具有令人难以置信的潜力,可以帮助我们应对从气候到健康等最严峻的挑战。但显然,这将影响到每一个人。所以我认为非常重要的是,我们不仅要让技术专家来决定这一切,还要与社会各界的广泛利益相关者进行接触。在过去几年里,我很高兴看到 AI 成为主流的一个后果是,许多政府都对此产生了兴趣,社会各界的所有部门也都如此。我认为看到这些国际峰会是件好事,实际上英国几年前在布莱切利园 (Bletchley Park) 主办了第一届峰会,将政府首脑与学术界和公民社会聚集在一起,讨论这些技术、如何设置正确的护栏、如何确保我们拥抱机遇,同时减轻未来可能出现的风险。我认为,考虑到我们看到的这些技术的指数级改进,这一点将变得越来越重要。

我对此的简短概括是,你知道,硅谷很多公司试图遵循的信条是“快速行动,打破常规”(move fast and break things)。当然,这创造了很多进步,很多我们今天每天都在使用的技术。但我认为,对于这种变革性技术,这种做法在我看来是不合适的。我认为,相反,我们应该尝试使用科学方法,并以这种技术应得的谦逊和尊重来对待它。我们不知道很多事情,围绕这项技术将如何发展存在很多未知数,它是如此之新。但我认为,通过格外的小心和远见,我们可以获得所有的好处,并最大限度地减少其负面影响。但我认为,只有当我们现在就开始相关的研究和辩论时,才能做到这一点。

总结与未来展望

最后,让我稍微推测一下,这一切意味着什么?如果我们回想图灵以及他为奠定计算机科学基础所做的所有工作,我认为……如果你看到我们所做的工作,我把自己看作是某种图灵的拥护者,想看看图灵机和这种经典计算的思想能走多远。

我感觉,可能我在这个房间里听过的最喜欢的讲座之一是关于 P=NP 问题的思考,这是计算机科学中一个著名的问题:什么样的问题在经典系统上是易解的?显然,在量子计算系统方面有很多出色的工作正在进行,很多在剑桥这里,谷歌也有世界上顶尖的量子计算研究组之一。有很多被认为需要量子计算才能解决的问题,很多我们想要理解和建模的真实世界系统。

我的猜想是,实际上经典的图灵机,基本上就是这些 AI 系统所构建的经典机器,能做的事情比我们以前认为的要多得多。如果你想想 AlphaFold 和蛋白质折叠,你知道,蛋白质是量子系统,它们在原子尺度上运作。人们可能认为你需要量子模拟才能真正找到蛋白质的结构。然而,我们能够用我们的神经网络来近似这些解。所以我想,这里一个可能的想法是,任何可以在自然界中生成或发现的模式——即具有某种真实的物理结构——都可以被像 AlphaFold 这样的经典学习算法有效地发现和建模。如果这被证明是真的,我认为这对量子力学乃至基础物理学都有各种各样的影响。这是我希望探索的,也是我的许多同事希望探索的,也许借助这些经典系统的帮助,来帮助我们揭示现实的真实本质可能是什么。

这又让我回到了我多年前开始 AI 之路的根本原因:我一直相信,以这种方式构建的 AGI 可能是理解我们周围宇宙以及我们在其中位置的终极通用工具。

谢谢。

问答环节

问:谢谢您的精彩演讲。因为您有神经科学背景,并且非常喜欢从根节点问题的角度思考,您在神经科学中是否遇到过您认为值得解决并且仍然值得解决的根节点问题,以便更好地理解生物智能和人工智能?

答:是的,有很多。实际上,这正是我博士期间研究的内容,主要是记忆,但也包括想象力——即面向未来的思考,有点像规划。我非常想了解大脑是如何做到这一点的。结果发现海马体两者都参与其中。所以也许我们可以用这些算法中的一些来模仿它。所以我认为其中有很多关键的东西。当然,还有所有关于创造力、做梦、意识等重大问题。我认为构建 AI,然后将其与人类心智进行比较,是我们将在这些根节点问题上取得进展的最佳方式之一,比如意识的本质是什么?大脑基质的实例化与在硅基中算法化地模仿它之间是否存在某种特殊之处?

问:我有两个问题。首先,既然 DeepMind 是在深度学习革命之前创立的,我想知道如果深度学习没有兴起,您的心态会是怎样?或者说您打算如何推进?这是第一个问题。第二个问题是,既然您对如此具有挑战性的问题、如此高维的问题有过深入的体验,并且我们知道梯度下降的变种无法收敛到最优解,只能收敛到局部最优解,那么您是否对这些系统在任何时候竟然能起作用感到惊讶?您是否认为自然界大部分是次优的,因此我们有可能构建一个更优的自然?

答:嗯,这两个都是很棒的问题。第一个问题,看,这就是我们为什么部分称之为 DeepMind 的原因,因为 Deep 指的是深度学习 (Deep Learning)。深度学习当时……嗯,早期部分,那时还不叫深度学习,但它正开始变得普遍。有杰弗里·辛顿 (Geoffrey Hinton) 发明的玻尔兹曼机 (Boltzmann machines) 之类的东西,就在几年前,2006、2005 年,这些分层神经网络。即使在当时,对我们这些在学术界接触到它的人来说,这似乎也是一个非常有前途的想法。我们押注的另一件事是强化学习 (Reinforcement Learning),以及这两者的结合。这又开始流行起来了,但它对我们解决像 AlphaGo 这样的问题也很重要。你需要这两部分:你需要深度学习来模拟环境和世界,然后你需要强化学习来制定计划、解决方案并在世界中采取行动。所以我们押注它有两个原因,即使在它刚起步的时候:一是因为我们知道经典方法,即那些专家系统,是无法扩展的。实际上,这也是我在这里以及在麻省理工学院做博士后时学到的东西之一,那些地方可以说是经典方法(专家系统)的殿堂。实际上,你在这里还可以学到另一件事:在你的大学课程中,不仅要学做什么,还要学不做什么,以及为什么它可能不行。比如我思考过,我觉得它永远无法扩展到我想用 AI 解决的那种问题。而学习系统似乎具有无限的潜力,尽管一开始让它们做任何有意义的事情要困难得多。这就是问题所在,因为它们没有被充分扩展。我们 2010 年创立 DeepMind 的另一个原因是,我们也能看到计算范式在硬件方面正在发生变化,GPU 和其他东西……当然,这些也是为游戏发明的,结果发现一切都是矩阵乘法,对吧?智能、游戏和计算机图形学都是。所以所有这些不同的影响因素汇集在一起。而且神经科学和功能磁共振成像 (fMRI) 机器以及神经科学在那之前的 10 年里也进步了很多。所以我感觉在 2010 年,是时候将所有这些整合在一起了。我们押注它,不一定是因为我们知道它会成功,而是因为我们相当确定其他方法行不通。这就是 AI 寒冬的原因,基本上是人们试图推动那些专家系统。

第二个问题,你知道……嗯,我不会说……首先,其中一些东西能够收敛确实令人惊讶。实际上我们也不确定。你知道我展示的那些雅达利的东西吗?最初几年,什么都不行。我们甚至无法在……你们有些人可能记得 Pong,最早的电脑游戏之一,那个像网球拍和球的游戏,我们甚至无法得一分。最简单的你能想象的游戏,我们都得不了一分。所以我们当时在想,我们是不是早了 10 年、20 年?就像巴贝奇在他的差分机上那样,对吧?了不起的想法,它确实有效,但他最终只是早了 50 年或 100 年。我总是说,你想要比时代领先 5 年,而不是 50 年,否则,你知道,你会经历很多痛苦,就像巴贝奇那样。所以我们担心过这个。但后来它确实收敛了,这给了我们信心去解决更难的问题。我想如果你问……我想你问题的最后一部分是关于自然界中的事物。嗯,我在想的是,它们不是次优的,它们实际上可能非常接近最优。因为它们经历了一个进化过程,不仅仅是生命与生物学,实际上在地质学和物理学上也是如此。你知道,小行星和物理现象结合在一起,它们能存在一段时间,是因为它们在时间上是稳定的,对吧?如果它们在时间上是稳定的,那么可能存在某种可学习的结构。这会是我的猜想。

问:您如何看待构建高带宽脑机接口以及可植入的记忆和推理模块,以便人类能够更有力地进行发现,而不是仅仅在云端与 AI 对话?

答:我……我喜欢那个领域,并且一直仔细关注它,并帮助那些构建像脑电图帽 (EEG caps) 之类东西的人。当然,问题在于这些东西的分辨率,从大脑读取输出,理想情况下你希望它既能读又能写。但我对像 Neuralink 这样的项目非常着迷,或者你知道,大脑中的芯片。显然,目前那是为了帮助退伍军人和残疾人士恢复身体功能。我认为在这方面会有惊人的进展,人们如果脊椎受伤等将能够重新行走。我认为在医学科学领域会有一些令人难以置信的进步,那将是惊人的。但除此之外,也许……如果事情……如果它变得常规化,手术安全,并且有安全的方法来做这件事,我可以想象那将是我们跟上技术的一种方式。在某种意义上,这与我们今天周围已有的技术没什么不同。我们都有手机,你知道,几乎 7*24 小时带着,还有电脑和其他东西。所以我们几乎已经与我们的技术共生了。当然,拥有那个(植入物)将是更进一步。但我不太确定……我的意思是,也许这要由在座的哲学家来回答,如果技术是附着在你身上的,和你一直随身携带的东西之间,界限在哪里,是否存在差异。

问:您如何看待人工智能发展的速度及其对经济发展的影响?现在有很多人正在规划职业生涯,但鉴于形势的快速变化,这使得预测他们应该进入哪个领域变得非常困难。

答:是的,这是一个非常复杂的问题。因为正如你所说,事情正以闪电般的速度变化。我们刚才还在和 Alistair 讨论,即使是设计三年的计算机科学课程也相当困难,因为基础材料的变化周期比三年还要短。我想我们唯一能确定的是,将会发生很多变化。但我认为这同时带来了颠覆和机遇。我给你举个编程的例子,我不知道你是不是计算机科学家,但是,你知道,我仍然建议你学好编程和数学,因为我认为如果你理解这些新工具是如何构建的,你就能以更深入的方式使用它们。但另一方面,我认为编程将变得更容易为更多类型的人所用,因为 AI 的方式……你将可能能够用自然语言编程,而不是相当复杂的计算机语言。这将为有创造力的人开辟领域,去构建游戏、制作电影、制作应用程序,也许这种平衡更多地偏向创造性方面,而不是工程方面。但我也认为,这将使工程师能够做到他们今天能做的 10 倍。所以我仍然……我认为很难知道(具体会怎样)。但我会说的是,专注于在业余时间拥抱那些工具,并训练自己能够非常快地掌握新信息。因为我认为这基本上就是未来 10 年将要发生的事情。

问:您认为是否存在任何生物过程、行为或模式是现有深度学习技术无法建模的?我不是说投入更多计算资源让它工作,或者只是把模型做得越来越大。您认为是否存在一些过程,从物理上就无法用我们现有的架构来建模?

答:嗯,当然有很多过程是今天无法建模的。但……但这又有点回到我在演讲结尾所说的。我不确定在极限情况下是否存在。我认为最终,如果物理学能够解决它,并且存在某种结构可供学习,那么通过足够多的例子,可能可以反向工程出一个该(生物系统)的模型。然后……我看不出任何理论上的原因,为什么一个经典系统——尽管可能非常复杂——不能对那个生物系统进行预测或模拟。所以我真的看不到在极限情况下,这方面的限制可能是什么。当然,有很多抽象的东西,比如大数分解、密码学,这些有点像人造系统,对吧?其中可能没有任何结构。我的意思是,自然数中可能存在结构,很多人推测存在。如果存在,那么那也将是可学习的。如果不存在,并且它是一种均匀分布,那么你就需要量子计算机来……你知道,破解密码学之类的东西。所以这些是悬而未决的猜想。但我认为自然界中的大多数事物都经过了进化,跨越了地质或生物物理时间。所以这向我表明,存在某种结构可供学习。这使得搜索或预测具有潜在的可行性。

问:这个问题代表剑桥大学游戏开发协会提问。您提到了 Genie 2 模型,以及它目前如何能在几秒钟内保持一致性,并且您希望最终能达到几分钟。但我想我们协会的问题是,我们实际玩的游戏具有无限的一致性。你知道,当你玩《我的世界》(Minecraft) 时,你期望转过身村庄还在那里,对吧?那么,您认为您目前的模型会被整合到工作流程中吗?或者确切地说,您如何看待 AI、您的模型以及您正在研究的东西,在未来几十年内如何融入游戏开发?

答:好的,看,我认为 AI 进入游戏开发的方式有很多种。一种是构建游戏所需资源的工具,比如 3D 模型、动画。我认为这些都将在未来几年内出现。你也可以考虑用 AI 来进行游戏平衡。想象一下,你设计了一款游戏,一夜之间它可以进行一百万次游戏测试。然后在早上,作为游戏设计师,你就能得到一份报告,比如“这些东西不平衡”,或者“降低这个单位的能力”等等。我认为还有用于开放世界游戏的 Bug 测试。我以前制作过模拟游戏、开放世界游戏,它们的 Bug 测试简直是噩梦。因为它们的核心就在于玩家几乎可以做任何事情,然后游戏会对你做出反应。那么你如何测试一千万人通过你的游戏走出各自独特的旅程呢?实际上,在你发布之前让 AI 玩家来玩,可以帮助你解决很多 Bug。

最后,我认为令人兴奋的是,还有像更逼真的 AI 角色,它们能推动故事情节发展。我曾经梦想过大型多人在线世界,其中的 AI 角色是智能的,并且会根据玩家的行为更新它们的信念和故事情节,让世界感觉更像一个活生生的、现实的世界。我认为我们正处于构建这类游戏的风口浪尖。

最后,我们正在构建的世界模型,更多的是关于通用 AI,以及你是否真的能模拟……它是一种衡量你的模型是否理解世界的表达方式。你的模型理解世界吗?好吧,如果它能在一段时间内生成它,那么显然它在某种意义上必须理解……这叫经验证据,证明它理解了底层物理学的某些东西。所以,那更多的是为了通用智能,而不是……我想我们可能有一天会拥有那种全息甲板 (Holodeck) 式的东西,你只要想象一下,它就全部在你周围了。可能一旦我们拥有了 AGI,我们就能拥有那个。但我认为那还有一段距离。

(Alistair Barisford): 好的,以一个关于游戏的问题结束似乎很不错,回到了游戏主题。非常感谢大家的到来,特别感谢 Demis 今天来给我们做演讲。谢谢大家。