Linguista

与 Gemini 3 共迎智能新时代「Google」

阅读需 12 分钟

Gemini 3 是我们目前最智能的模型,助您将任何创意变为现实。

概要

Google 推出了 Gemini 3,这是其最智能的 AI 模型,增强了推理和多模态能力。您现在可以通过 Gemini 应用、AI Studio 和 Vertex AI 等 Google 产品访问 Gemini 3。面向 Ultra 订阅用户的 Gemini 3 深度思考(Deep Think)模式即将推出,随后将有更多模型问世。

要点

摘要由 Google AI 生成。生成式 AI 为实验性技术。

探索其他风格:

黑色背景前的 Gemini 3 logo,带有由蓝色圆点组成的数字 3

黑色背景前的 Gemini 3 logo,带有由蓝色圆点组成的数字 3

Google 和 Alphabet 首席执行官 Sundar Pichai 的寄语:

大约两年前,我们开启了 Gemini 时代,这是我们要作为一家公司所承担的最宏大的科学和产品事业之一。从那时起,看到人们如此喜爱它,真是令人难以置信。AI 概览(AI Overviews)现在每月拥有 20 亿用户。Gemini 应用的月活跃用户超过 6.5 亿,超过 70% 的云客户在使用我们的 AI,1300 万开发者使用我们的生成式模型进行构建,而这仅仅是我们所见影响力的冰山一角。

得益于我们在 AI 创新方面独特的全栈式方法——从领先的基础设施到世界级的研究、模型和工具,再到覆盖全球数十亿人的产品——我们能够比以往更快地将先进能力带给世界。

每一代 Gemini 都在上一代的基础上构建,让您能做更多事情。Gemini 1 在原生多模态长上下文窗口方面的突破扩展了可处理信息的种类和数量。Gemini 2 为代理(agentic)能力奠定了基础,并拓展了推理和思考的前沿,协助处理更复杂的任务和想法,使得 Gemini 2.5 Pro 连续六个多月在 LMArena 占据榜首。

现在,我们隆重推出 Gemini 3,这是我们最智能的模型,它结合了 Gemini 的所有能力,助您将任何创意变为现实。

它在推理方面处于业界领先地位,旨在掌握深度和细微差别——无论是感知创意中的微妙线索,还是抽丝剥茧般地拆解难题的重叠层级。Gemini 3 在理解您请求背后的背景和意图方面也更加出色,因此您只需更少的提示即可获得所需内容。仅仅两年时间,AI 已经从简单的阅读文字和图像进化到能够“察言观色”(reading the room),这着实令人惊叹。

从今天开始,我们正以 Google 的规模全面推广 Gemini。这包括在搜索中的 AI 模式(AI Mode in Search)中使用 Gemini 3,带来更复杂的推理和全新的动态体验。这是我们首次在发布首日就将 Gemini 应用于搜索。Gemini 3 今天也同时也登陆了 Gemini 应用,并面向 AI StudioVertex AI 中的开发者,以及我们新的代理开发平台 Google Antigravity——更多详情见下文。

像前几代产品一样,Gemini 3 再次推进了技术发展的最高水平。在这个新篇章中,我们将继续拓展智能、代理和个性化的前沿,使 AI 对每个人都真正有用。

希望您喜欢 Gemini 3,我们将不断改进它,并期待看到您用它构建的一切。更多精彩还在后头!


隆重介绍 Gemini 3:我们要目前最智能的模型,助您将任何创意变为现实

Google DeepMind 首席执行官 Demis Hassabis 与 Google DeepMind 首席技术官兼 Google 首席 AI 架构师 Koray Kavukcuoglu 代表 Gemini 团队

今天,我们在通往通用人工智能(AGI)的道路上又迈出了一大步,发布了 Gemini 3。

它是世界上多模态理解能力最强的模型,也是我们要迄今为止最强大的代理和“氛围编码”(vibe coding)模型,提供更丰富的可视化效果和更深层次的交互性——所有这一切都建立在顶尖推理能力的基础之上。

我们通过发布预览版 Gemini 3 Pro 并于今天在 Google 全系产品中上线来开启 Gemini 3 时代,以便您在日常生活中使用它来学习、构建和规划任何事情。我们还推出了 Gemini 3 深度思考(Deep Think)模式——这是我们增强的推理模式,将 Gemini 3 的性能推向更高水平——并在向 Google AI Ultra 订阅用户开放之前,先让安全测试人员进行体验。

具有前所未有深度和细微差别的顶尖推理能力

Gemini 3 Pro 凭借其顶尖的推理和多模态能力,可以将任何创意变为现实。它在每一项主要的 AI 基准测试中都显著优于 2.5 Pro。

它以 1501 Elo 的突破性高分登顶 LMArena 排行榜。它在“人类最后一次考试”(Humanity’s Last Exam,37.5%,未使用任何工具)和 GPQA Diamond(91.9%)中取得了最高分,展现了博士级的推理能力。它还在数学领域为前沿模型树立了新标准,在 MathArena Apex 上达到了 23.4% 的业界新高。

除文本之外,Gemini 3 Pro 以 81% 的 MMMU-Pro 得分和 87.6% 的 Video-MMMU 得分重新定义了多模态推理。它还在 SimpleQA Verified 上取得了 72.1% 的领先成绩,显示在事实准确性上的巨大进步。这意味着 Gemini 3 Pro 在解决科学和数学等广泛主题的复杂问题方面能力极强,且具有高度的可靠性。

Gemini 3 与其他 AI 模型的评估对比表

Gemini 3 在一系列关键 AI 基准测试中处于业界领先地位。查看我们的评估方法详情。

Gemini 3 Pro 还为每一次互动带来了全新的深度和细微差别。它的回答聪明、简洁且直接,摒弃了陈词滥调和奉承,代之以真正的洞见——告诉您需要听到的,而不仅仅是您想要听到的。它就像一个真正的思维伙伴,为您提供理解信息和表达自我的新方式,从通过生成高保真可视化的代码来转化晦涩的科学概念,到创造性的头脑风暴。

Gemini 3 可以编写代码来可视化托卡马克(tokamak)中的等离子体流,并写一首诗来捕捉聚变物理学的精髓。

Gemini 3 深度思考(Deep Think)

Gemini 3 深度思考模式进一步突破了智能的边界,实现了 Gemini 3 在推理和多模态理解能力上的阶跃式提升,帮助您解决更复杂的问题。

在测试中,Gemini 3 深度思考模式超越了 Gemini 3 Pro 在“人类最后一次考试”(41.0%,不使用工具)和 GPQA Diamond(93.8%)上本已令人印象深刻的表现。它还在 ARC-AGI-2(包含代码执行,ARC Prize Verified)上取得了前所未有的 45.1% 的成绩,展示了其解决新颖挑战的能力。

Gemini 3 深度思考模式的评估图表

Gemini 3 深度思考模式在一些最具挑战性的 AI 基准测试中表现出色。查看我们的评估方法详情。

Gemini 3 助您学习、构建和规划任何事情

学习任何事物

Gemini 从一开始就是为了跨越文本、图像、视频、音频和代码等多种模态,无缝综合任何主题的信息而构建的。Gemini 3 拓展了多模态推理的前沿,通过结合其顶尖的推理、视觉和空间理解、领先的多语言性能以及 100 万 token 的上下文窗口,帮助您以最适合自己的方式进行学习。

例如,如果您想学习家族传统的烹饪方法,Gemini 3 可以破译并翻译不同语言的手写食谱,将其整理成可分享的家庭食谱书。或者,如果您想学习一个新主题,您可以提供学术论文、长视频讲座或教程,它可以生成交互式抽认卡、可视化图表或其他格式的代码,帮助您掌握材料。它甚至可以分析您的匹克球(pickleball)比赛视频,识别您可以改进的地方,并生成针对整体姿势改善的训练计划。

Gemini 3 可以帮助您学习和保存家庭烹饪传统。在 Gemini Canvas 中试用。

为了帮助您更好地理解网络上的信息,搜索中的 AI 模式现在使用 Gemini 3 来启用新的生成式 UI 体验,例如沉浸式视觉布局以及交互式工具和模拟,所有这些都是根据您的查询完全即时生成的。

构建任何事物

基于 2.5 Pro 的成功,Gemini 3 兑现了为开发者将任何创意变为现实的承诺。它在零样本生成方面表现出色,并能处理复杂的提示和指令,以呈现更丰富、更具交互性的 Web UI。

Gemini 3 是我们要迄今为止构建的最好的“氛围编码”(vibe coding)和代理编码模型——使我们的产品更加自主,并提升了开发者的生产力。它以 1487 Elo 的高分登顶 WebDev Arena 排行榜。它还在 Terminal-Bench 2.0(测试模型通过终端操作计算机的工具使用能力)中得分 54.2%,并且在衡量编码代理的基准测试 SWE-bench Verified(76.2%)上大幅超越了 2.5 Pro。

您现在可以在 Google AI Studio、Vertex AI、Gemini CLI 以及我们新的代理开发平台 Google Antigravity 中使用 Gemini 3 进行构建。它也可在 Cursor、GitHub、JetBrains、Manus、Replit 等第三方平台中使用。

编写具有更丰富视觉效果和改进交互性的复古 3D 太空飞船游戏。在 AI Studio 中试用。

推出全新的“代理优先”开发体验

随着 Gemini 3 带来的模型智能加速,我们有机会重构整个开发者体验。今天,我们发布了 Google Antigravity,这是我们新的代理开发平台,旨在让开发者能够在更高、更面向任务的层面上进行操作。

利用 Gemini 3 先进的推理、工具使用和代理编码能力,Google Antigravity 将 AI 辅助从开发者工具箱中的工具转变为积极的合作伙伴。虽然 Google Antigravity 的核心是熟悉的 AI IDE 体验,但其代理已被提升到一个专用的界面,并可以直接访问编辑器、终端和浏览器。现在,代理可以代表您自主规划并同时执行复杂的端到端软件任务,同时验证自己的代码。

除了 Gemini 3 Pro,Google Antigravity 还紧密结合了我们要最新的用于浏览器控制的 Gemini 2.5 Computer Use 模型,以及我们顶级的图像编辑模型 Nano Banana(Gemini 2.5 Image)。

Google Antigravity 使用 Gemini 3 驱动航班追踪应用程序的端到端代理工作流。代理独立规划、编写应用程序并通过基于浏览器的计算机使用验证其执行。

规划任何事情

自 Gemini 2 开启代理时代以来,我们取得了很大进展,不仅提升了 Gemini 的编码代理能力,还改进了其在更长时间范围内可靠规划的能力。Gemini 3 通过在 Vending-Bench 2 上占据榜首证明了这一点,该测试通过管理模拟自动售货机业务来测试长期规划能力。Gemini 3 Pro 在一整年的模拟运营中保持了一致的工具使用和决策能力,在不偏离任务的情况下实现了更高的回报。

展示 Gemini 3 Pro 在长期规划方面优于其他 AI 模型的图表

Gemini 3 Pro 展现了更好的长期规划能力,与其他前沿模型相比能产生显著更高的回报。

这意味着 Gemini 3 可以更好地帮助您处理日常生活中的事务。通过结合更深层次的推理和改进的、更一致的工具使用,Gemini 3 可以代表您采取行动,从头到尾处理更复杂的、多步骤的工作流——比如预订本地服务或整理收件箱——所有这些都在您的控制和指导下进行。

Google AI Ultra 订阅用户今天就可以在 Gemini 应用中通过 Gemini Agent 尝试这些代理能力。在改进 Gemini 的代理能力过程中我们学到了很多,我们很高兴随着很快扩展到更多 Google 产品,看到您将如何使用它。

负责任地构建 Gemini 3

Gemini 3 是我们迄今为止最安全的模型,并且经过了 Google AI 模型迄今为止最全面的安全评估。该模型表现出更少的阿谀奉承(sycophancy),更强的抗提示注入(prompt injections)能力,并改进了针对网络攻击滥用的保护。

除了针对我们的前沿安全框架(Frontier Safety Framework)中关键领域的内部测试外,我们还与世界领先的主题专家合作进行评估,向英国人工智能安全研究所(UK AISI)等机构提供早期访问权,并获得了 Apollo、Vaultis、Dreadnode 等行业专家的独立评估。更多信息,请参阅 Gemini 3 模型卡

Gemini 的下一个时代

这仅仅是 Gemini 3 时代的开始。从今天起,Gemini 3 开始推出:

对于 Gemini 3 深度思考模式(Deep Think mode),我们将花更多时间进行安全评估并听取安全测试人员的意见,然后在未来几周内向 Google AI Ultra 订阅用户开放。

我们计划很快发布 Gemini 3 系列的更多模型,以便您能利用 AI 做更多事情。我们期待收到您的反馈,并看到您用 Gemini 学习、构建和规划的一切。