安爸-超级家庭

Lex Fridman 对谈谷歌 CEO:追上进度后,谷歌接下来打算做什么?

安爸 发布于

久违的 Lex Fridman 又来采访 AI 行业的关键人物了。

这次是 Google CEO Sundar Pichai。过去半年,Google 凭借 Gemini 2.5 完成了 AI 竞赛的追赶,某种意义上说,Google 和 OpenAI 现在站在了同一起跑线。

Lex 的播客一向聊的广且深,这次也不例外,Pichai 这一年的困境、核心产品搜索的未来方向、模型和 Sclaing Law,AI 编程、具身智能、AGI、ASI 还是 AJI 的探讨。

很多时候,问对了问题,好的采访就完成了一大半。Pichai 的回复,确实有蛮多干货。

2 小时多的播客,编译时我们做了一些删减。

原始播客:https://www.youtube.com/watch?v=9V6tWC4CdFQ&t=2711s

TLDR:

  • 谷歌对于未来搜索的设想是,在搜索中部署了最强的模型,这些模型会围绕每一个查询执行多路径检索,并整合信息,最终把用户引向真正有价值的内容。
  • 随着 AI Mode 功能的成熟,谷歌会将其迁移到主页面上,可以看作是一个连续的统一体:AI 模式会为用户提供最前沿的体验,而其中验证有效的部分会流入 AI 概览与主搜索体验中。
  • 从第一性原理角度出发,模型的深度思考、推理不是靠人为地堆规则,而是从科学角度去构建模型的推理能力——比如处理数学、物理、历史这类话题时,要确保模型的理解和推理逻辑是扎实的。
  • 大约 30% 的代码是在 AI 提示的帮助下生成的。但最重要的指标,也是我们仔细衡量的,是我们如何评估 AI 对公司整体工程开发速度的影响。
  • 计算领域最好的创新往往都来自于范式 IO 的变革,比如从命令行到图形界面(GUI),再到移动设备上的多点触控和后来的语音交互。AR(增强现实)是下一个 IO (交互)范式。「Project Astra」项目对于未来的 Android XR 生态至关重要。
  • 我们现在正处于 AJI 阶段,即 Artificial Jagged Intelligence(非均衡人工智能)。尽管整体进步显著,但仍然存在不少不足。到 2030 年我们可能还达不到 AGI,需要更长的时间。
  • AI 最独特的核心在于,它能够递归式地自我改进。AI 是第一种能极大地加速「创造」本身的技术,创造新事物、构建新东西,它可以自行改进和实现。它最终产生的影响将远远超过我们以前见过的任何技术。
  • 一种说法是,未来内容会极大丰富,有时你会为了效率去消费 AI 生成的内容。但你所珍视的顶级体验,可能还是源自于人类本质的某种体现。

超 6000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群:

进群后,你有机会得到:

  • 最新、最值得关注的 AI 新品资讯;
  • 不定期赠送热门新品的邀请码、会员码;
  • 最精准的AI产品曝光渠道

01

从输到赢,

Pichai 这一年做了什么

Lex Fridman :去年我们一起散步时,我不记得有没有谈到这个,但我记得在那之后,我看到了几十篇由分析师和专家撰写的文章,说 Sundar Pichai 应该下台。因为当时人们普遍认为,在快速发展的技术格局中,Google 已经明确地输掉了 AI 竞赛,失去了它的魔力。

而现在,一年后,情况变得疯狂。你展示了过去一年发布的所有产品的图表,这太不可思议了。就在我们今天谈话的时候,Gemini Pro 在许多基准测试和产品上都处于领先地位。带我回顾一下那段经历,当所有文章都说你是领导 Google 度过难关的错误人选,说 Google 迷失了方向,完蛋了的时候,到今天 Google 再次获胜。在那段时间里,有哪些低谷时刻?

Sundar Pichai:这里有很多东西可以细说。显然,我作为 CEO 做出的主要赌注就是确保公司以「AI 优先」的方式处理一切事务,为负责任地发展 AGI 做好准备,并确保我们推出的产品能体现这一点,即对人们非常非常有用的东西。所以,即使在去年那样的时刻,我对自己内部正在构建的东西也有很好的了解。

我已经做出了许多重要决定,比如将 Brain 和 DeepMind 这样高水平的团队整合在一起,成立了 Google DeepMind。还有像我们十年前就决定投资 TPU 这样的事情,所以我们知道我们正在扩大规模并构建大模型。

我很擅长排除噪音,从噪音中分离信号。管理 Google,就像执教巴塞罗那或皇家马德里一样,总会有赛季不佳的时候。所以有这方面的原因。你要能排除噪音,同时留意信号。从噪音中分离信号很重要。有时外面会有优秀的人提出很好的观点,所以你想听取,想吸取那些反馈。但你必须专注于内部所做的一系列重大决策。

作为领导者,你要做很多决定,大部分其实是例行性事务,推动日常运营,但随着时间的推移,你发现日常做的大多数决定并不重要,你做它们只是为了让事情继续运转。但你必须做出少数几个关键的、有深远影响的决定。我们已经组建了正确的团队,有了正确的领导者,我们拥有世界一流的研究人员,我们正在训练 Gemini。

内部有一些因素,是外部人士可能没有意识到的。比如,TPU 很了不起,但我们也需要扩大 TPU 的规模,这需要时间来实际扩展以获得所需的计算能力。但我能从内部看到我们所处的发展轨迹,我对公司未来的可能性感到非常兴奋。对我来说,那一刻感觉是我们公司未来最大的机遇之一。未来十年、二十年的机遇空间比过去发生的一切都要大。我认为我们比世界上大多数公司都更有能力去实现那个愿景。

Lex Fridman :你确实做出了一些重大而果断的决定,比如你提到的合并 DeepMind 和 Google Brain。也许是我的看法,仅仅是基于对人性的了解,我确信这其中涉及了很多个人意志和自尊,合并团队是非常困难的,而且我肯定你做出了一些艰难的决定。你能带我了解一下你思考这个问题的过程吗?你是如何下定决心并做出那个决定的?其中有哪些痛苦的时刻?

Sundar Pichai:我们很幸运拥有两支世界级的团队,但你说得对,这就像有人来告诉你,把斯坦福和麻省理工合在一起,创建一个顶尖的系,说起来容易做起来难。但我们很幸运,这两支团队都很了不起,各有优势,运营方式也截然不同。Brain 当时有很多多样化的项目,自下而上,从中诞生了许多重要的研究突破。而 DeepMind 当时对于如何构建 AGI 有着清晰的愿景,他们在追求自己的方向。但幸运的是,在那些时刻,Jeff 表达了想回归更偏向科学的个人贡献者角色的愿望,他觉得管理工作占用了他太多时间。而 Demis 自然而然地,他当时在运营 DeepMind,成为了一个自然的人选。

但你说得对,我们花了一段时间才把团队整合起来。这要归功于 Demis、Jeff、Koray 以及所有在那里的优秀人才。他们非常努力地工作,在组建那个新团队时,结合了两个团队的精华。在整合的过程中,确实有过一些不眠之夜。我们很有耐心地处理这件事,以确保它能长期良好地运作。

Lex Fridman :在那段时期,无论是合并团队还是应对外界的噪音,有没有过让你感到挫败感爆棚的时候?

Sundar Pichai: 也许有,你说得对。在某种程度上,确实有一段时间我们都在全力以赴。当你在战壕里满怀激情地工作时,总会有意见不合、争论的日子。但所有这些,都只是高强度工作过程中的一部分。归根结底,我们所有人做我们正在做的事情,都是因为它可能产生的影响,我们被此所激励。

对我们许多人来说,这是一段长期的旅程,所以它一直非常激动人心。积极的时刻远远超过了那些充满压力的时刻。就在今年年初,我有幸在两天内接连庆祝了 Geoff Hinton 获得诺贝尔奖,第二天又庆祝了 Demis 和 John Jumper 获得诺贝尔奖。当你和这样的人一起工作时,所有的一切都非常鼓舞人心。

Lex Fridman :有没有过那种情况,你必须坚定立场,也许是用更少的话语,或者直接说: 我是 CEO,我们就这么做

Sundar Pichai: 回到我之前提到的那些有深远影响的决定,有些决定你做出后,人们可能会激烈地反对,但到某个时候,你做出了一个明确的决定,然后就要求大家去执行。

你可以不同意,但现在是时候「求同存异,付诸行动」(disagree and commit),这样我们才能继续前进。至于这算不算「坚定立场」,这是我们所有人都必须做的自然而然的一部分。我认为你可以平静而又非常坚定地做出决定,如果你能清晰地做出决定,随着时间的推移,人们实际上会尊重这一点。

我发现在做这类决定的会议上,听取每个人的意见非常有效。有时你听到的东西实际上会影响你的思考方式,你会反复斟酌并做出决定。有时你有一个明确的信念,你就会说出来,比如「看,这是我的感受,这是我的信念」,然后你就下注,继续前进。

Lex Fridman 有没有类似这样的重大决策?我猜合并团队就是其中之一。

Sundar Pichai:我认为合并团队是当时我们能为公司做出的最关键决策之一。还有很多其他的事情,比如我们成立了一个 AI 基础设施团队,扩大我们所需的计算能力。

我们还让不同地区的人物理上聚集在一起,比如让 DeepMind 团队留在伦敦,而我们在山景城的团队则聚在 Gradient Canopy 办公大楼,那是 Google DeepMind 的总部。我每周都例行去几次,那里聚集着我们最顶尖的研究人员,他们正在训练模型,Sergey 也经常在他们中间,关注最新的模型进展、查看损失曲线等。我认为,让团队重新凝聚起来,带着活力,这种文化部分最终也发挥了重要作用。

02

搜索和广告,

未来都会迁移切到 AI 模式

Lex Fridman: Google 搜索可以说是互联网的门户。那个极简的页面,上面只有十个蓝色链接,已经成为一种传奇。当人们想到互联网时,他们就会想到那个页面,而现在你们开始改变它了:AI 模式 (AI Mode) 作为一个独立的标签页,然后又将 AI 集成到搜索结果中,我猜在你们的会议上,一定引发了不少争论吧?

Sundar Pichai:在某种程度上,当移动时代开始,人们希望得到更多问题的答案,所以我们其实一直在不断地演进。但你说得对,在这个时刻,由于底层技术变得更加强大,这种变化变得更加显著。AI 可以提供大量的上下文信息,但我们一个重要的设计目标是,当你来到 Google 搜索时,你会得到极其丰富的上下文,但你最终还是会去网络上发现很多东西。无论是在 AI 模式下,还是在 AI 概览(AI overviews)中,这一核心原则始终不变。

回到我们之前的对话,我们仍然提供传统的网页链接,但 AI 成为了一个辅助层,它能够整合上下文和摘要。在 AI 模式下,你甚至可以通过对话方式一步步探索信息,但整个过程依然围绕着「让用户更好地了解世界」。所以我们在原则上并没有背离搜索的初衷。我们在搜索中部署了最强的模型,这些模型会围绕每一个查询执行多路径检索,并整合信息,最终把你引向真正有价值的内容。这是我们对搜索未来的思考方式。

Lex Fridman:我有机会听了 Elizabeth Reid (Liz) 的一些讲解,有两点让我印象深刻。一点是「查询扇出」(query fan-out),我之前都没想过,就是它能为你整合网络上的大量信息,这非常强大。它提供了上下文,让你能决定接下来要访问哪个页面。另一点非常重要,是生产力的飞跃。

你可能不太了解的一点是,AI 模式特别有助于非英语用户,在搜索信息时也能将英文网页内容纳入推理过程。当然,你可以用翻译工具阅读页面内容没错,但在信息检索的早期阶段,这种语言能力才是真正的「能力解锁」。如果你设身处地去体会世界上大多数非英语用户的处境,就会发现他们在互联网上能获取的内容范围其实小得多。而现在,借助像 Gemini 这样的模型,这个障碍在逐渐消失。

Sundar Pichai:是的。Gemini 的多模态能力、翻译能力、推理能力,正在融入到搜索流程中,深度嵌入至产品中。特别是 AI 概览(AI overviews)功能,我们看到产品变得好多了,用户反馈也非常积极。从多个指标来看,它确实推动了产品的增长。同时,我们一直在测试 AI 模式,现在已经有数百万人用上了,早期的指标非常鼓舞人心。所以,我对搜索的下一个篇章感到兴奋。

Lex Fridman:对于不了解当前搜索变化的人来说,可以这样理解:现在的模式是在十个蓝色链接的顶部有一个 AI 概览,它提供了一个很好的摘要,你也可以展开查看更多信息。

Sundar Pichai:是的,而且现在摘要里还嵌入了来源和链接。

Lex Fridman: 我记得 Liz 曾经提到过,AI 概览里其实也包含广告。我倒是没注意到。AI 模式目前好像没有广告。Sundar,你觉得什么时候会在 AI 模式中加入广告?毕竟,广告让我们可以免费使用大量服务,广告不仅提供收入,也在理想情况下提供了相关信息,而且形式优雅、不打扰。你觉得未来 AI 模式里,广告会以怎样的方式出现?

Sundar Pichai: 有两点。在 AI 模式的早期阶段,我们显然会更专注于原生的体验,以确保我们把它做对。我认为广告的价值在于它支撑起了服务的大规模部署,能服务数十亿用户。

其次,我们一直认真对待广告的原因是,我们视广告为商业信息,但它仍然是一种信息。所以我们用同样的质量标准来衡量它。对于 AI 模式,我认为 AI 本身将帮助我们找到最自然、最优雅的方式来呈现广告。AI 提供丰富的上下文,因此也能解释清楚,「这里有一条商业信息」。这就像你主持播客时在特定时段插入广告,找到最契合节奏的方式一样。这种做法未来也许会迁移到 AI 模式中。

不过,我们会重新思考广告的形式。你已经看到我们在 YouTube 上现在采用了订阅和广告混合的模式。显然,现在我们的多个产品线也都在引入订阅机制,因此整个商业模型的平衡点也会发生变化。

Lex Fridman: 在未来某个时间点, AI 模式可能会完全取代现在的「十个蓝色链接+AI 概览」这种组合形式吗?

Sundar Pichai:我们目前的计划是,AI 模式将作为一个独立的标签页存在,供那些真正想体验的用户使用,但它目前还没有达到我们主搜索页面的水平。但随着功能的成熟,我们会继续将它迁移到主页面上,所以你可以把它看作一个连续统一体:AI 模式会为你提供最前沿的体验,而其中验证有效的部分会流入 AI 概览与主搜索体验中。

Lex Fridman: 而 AI 模式依然会把用户引导到人类创作的网站内容上,这一理念还会保留吗?

Sundar Pichai:是的,这将是我们的一个核心设计原则。

Lex Fridman: 所以最终还是由用户决定,对吧?他们来驱动这一切。

Sundar Pichai:是的。

Lex Fridman: 这很令人兴奋。但也有点吓人,因为它可能会改变互联网,因为 Google 一直以来都以一种非常特定的外观和理念主导着互联网的样貌。当你转向 AI 模式时,那是一种完全不同的体验。我想 Liz 谈到过,你也提到过,你会问更多的问题,问更长的问题。

Sundar Pichai:是的,而且是完全不同类型的问题。

Lex Fridman:确实如此,它甚至激发了我的好奇心。我会不断向这个「黑盒」一样的系统提出问题。 AI 概览也很有趣,因为我依然重视人类内容,最终我还是会回到那些由人类创作的网页。但就像你说的,AI 提供的上下文实在太有帮助了。

Sundar Pichai:它帮助我们提供更高质量的引荐,人们更容易找到他们真正想要的信息。他们在探索,他们充满好奇,他们的意图得到了更好的满足。从各项用户指标来看,我们都看到了正向变化。

Lex Fridman: 你之前还有 Dennis 都提到,未来的网络会有一部分专门为 AI agents 服务。我们可以把互联网分为两个层次:一个面向人类,另一个面向 Agent。你觉得未来为 Agent 构建的那一层会持续扩张吗?五到十年后,为人类创作的网页还会有意义吗?还是最终一切都由 Agent 掌控?

Sundar Pichai:就像今天,不是所有人都在线购物,有些人还是喜欢去商店里走走、挑选商品,享受那个过程。但与此同时,你也在用外卖或电商平台。所以这两种体验是并行存在的。网站设计也会因人类使用而变得更友好——AI 实际上可能会帮助网站变得「更适合人类」。

所以我期望网络会变得更丰富、更有趣、更好用。同时,我认为也会有一个「Agent 网络」出现,但要让它良性发展,就需要建立清晰的商业价值体系与激励机制,让更多人愿意参与其中。

但我认为两者会共存。当然,AI Agent 不需要像人类那样的 UI 和交互设计范式。

03

Less Structure,

More Intelligence

Lex Fridman 早期版本的 Gemini 在回答某些问题上有点过于谨慎。但我很高兴地发现,Gemini 1.5 Pro 变得不那么谨慎了。我最近研究成吉思汗、阿兹特克人以及两次世界大战,那段历史充满暴力。早期 Gemini 会表现出一种「你确定要了解这些吗」的感觉,而现在它非常实事求是、客观,能够深入、细致地谈论人类历史上艰难的部分,这真的很好。

但我想 Google 必须把握好一个度,如何在大规模上应对各种奇怪查询,这也是一个工程挑战。你能谈谈这个挑战吗?如何让 Gemini 在说一些「疯狂」的东西的同时,又不会太过火?

Sundar Pichai:我认为这里一个很好的见解是,随着模型变得越来越强大,它们实际上非常擅长处理这类事情。所以在某种程度上,也许一年前,模型还没有完全到位,所以它们会更频繁地犯一些愚蠢的错误。因此,你试图处理那些边缘案例,但你在处理这些边缘案例时又会犯错,导致问题叠加。但我们特别发现,对于 1.5 版本,一旦模型的智能和复杂性超过某个水平,它们就能够很好地对这些微妙的问题进行推理。

我觉得用户其实是希望能尽可能接近「原始模型」的,他们希望看到模型真正的能力和判断力。未来,我们也应该让用户能更多地自定义提示、进行实验等等,这也是我们持续探索的方向。

我们想要思考的第一性原理是, 不是靠人为地堆规则,而是从科学角度去构建模型的推理能力——比如处理数学、物理、历史这类话题时,要确保模型的理解和推理逻辑是扎实的。这才是构建 AI 系统的正确方式,而不是让一小部分人硬编码一些东西在上面。我认为这是我们一直在采取的方向,你会看到我们继续朝这个方向努力。

Lex Fridman 我做了一堆笔记,然后把它们交给 Gemini 说:「你能不能根据这些笔记,再问一个我没想到的问题?」结果它真的提出了一个很特别的问题——「你曾说过,Gemini 每月处理 480 万亿个 token。那么,在这片信息海洋中,是否存在一句由五个词组成、足以改变人生的话?」这问题是 Gemini 问的,挺哲学的。

虽然我知道你不可能真的回答这个问题,但它让我意识到,这些 token 的背后,其实是一个个小小的「顿悟」时刻。人们通过好奇心发问,然后发现某些东西,有可能就此改变人生。

Sundar Pichai:是的,很多年前,我刚接触搜索的时候就有类似的感受。在过去的 12 个月里,我们每月处理的 token 量增长了 50 倍。

Lex Fridman :顺便问一下,那个 480 万亿的数字准确吗?

Sundar Pichai:是的,是准确的。我很高兴它算对了。12 个月前,这个数字是每月 9.7 万亿个 token。现在已经增长到 480 万亿,这是 50 倍的增长。人类的好奇心是无限的。我认为现在就是这样一个时刻,虽然今天还没到,但也许有一天,会有一个五个词的短语,说出宇宙的真相或某些非常有意义的东西,但我觉得我们还没到那一步。

04

Scaling Laws 仍然有效,

算力依然受限

Lex Fridman :你认为规模法则(scaling laws)在预训练和后训练 阶段 是否依然有效?换句话说, AI 的进步会不会在某个阶段遭遇瓶颈?

Sundar Pichai:这是我们偶尔会在公司茶水间常聊的话题,比如 Demis 来访时,或者当 Demis、Koray、Jeff、Norm、Sergey 这些人聚在一起时,我们就会聊这个。我们的共识是,前方还有很大的提升空间。我们一直在优化和改进所有方面:预训练、后训练、测试时计算、工具使用,以及随着时间的推移,让这些模型更具「Agentic」。我们的目标是朝着更通用的「世界模型」方向发展。

比如 Veo 3 在物理理解上比 Veo 1 就有了显著提升。几乎所有维度上都在进步,而我们也认为,还有更多空间可挖掘。更重要的是,我很幸运能和这个星球上一些最优秀的研究人员一起工作,他们也认为这里还有更多的发展空间。所以我认为我们未来的发展轨迹会非常激动人心。很难说具体会怎样,但每年我都会问自己:如果我们在明年投入 10 倍算力,是否会看到明显进展?目前看来,答案是肯定的。我对未来一年的进展抱有很大信心。

Lex Fridman 你有没有感受到某些方面的限制,比如算力、数据或研究上的瓶颈?还是说现在一切都在顺利推进?

Sundar Pichai: 我认为在某种意义上是 受算力 限制的。我们之所以推出 Flash、Nano Flash 和 Pro 模型,而没有推出 Ultra 模型,部分原因就在于此。

Pro 模型的能力大约可以达到 Ultra 模型的 80%-90%,但速度更快、使用成本更低。而 Ultra 虽然更强,但推理速度慢、服务成本高。

所以我们的方法是,在下一代产品中,让 Pro 模型达到上一代 Ultra 的水平,同时又能以快速、易用的方式提供服务。所以我确实认为 Scaling laws 是有效的,但在任何一个时间点,我们最常使用的模型可能都比我们能提供的最强能力落后几个月,因为最强的那个版本不会是最快、最容易使用的。

Lex Fridman 是的,而且在智能方面,衡量「性能」也变得越来越难。就像你们的 Gemini Flash,虽然比 Pro 更轻量,但因为延迟极低、反应非常快,它在很多实际场景下的「影响力」甚至更大。

有时候,低延迟比「更聪明」更重要,尤其当智能水平差距不大的时候。而 Flash 本身也已经足够聪明了。所以衡量模型能力,已经不能只靠传统的基准测试,而是要看它在现实世界里的影响力、实用性和效果。

05

AI 编程

让谷歌的 工程 效率 提效 10%

Lex Fridman 我得问你一个关于编程的问题。 AI 在编程方面正变得非常出色。Gemini,无论是作为 Agent 还是作为大型语言模型, 表现都令人惊艳 。所以很多程序员非常担心他们会失去工作。 你觉得他们该有多担心?如何适应一个 AI 编写大量代码的新世界?

Sundar Pichai:我认为有几点。以 Google 为例,我们给出了各种统计数据,大约 30% 的代码是在 AI 提示的帮助下生成的。但最重要的指标,也是我们仔细衡量的,是我们如何评估 AI 对公司整体工程开发速度的影响。虽然这很难衡量,但我们严格地尝试去衡量它,结论是目前我们整体的工程效率提升了大约 10%。

在整个公司层面上,10% 的开发效率提升已经非常显著了。而且我们计划明年招聘更多的工程师,因为我们能做的事情的机会空间也在扩大。

所以我认为,至少在短期到中期,对于许多工程师来说,AI 会释放出更多时间和精力——哪怕是在编码领域,也总有一些部分是枯燥的,比如重复性的工作。相比之下,架构设计、系统构建、问题求解,这些才是更有趣的部分。AI 的加入,能够把繁琐的部分自动化,让你有更多时间去专注于创造性工作、解决复杂问题,以及和同事们集思广益。

其次,我认为 AI 能让创造力的门槛降低,让更多人都能参与进来。这意味着会有更多的工程师做更多的事情。所以 AI 会不会取代人类,很难完全预测。但总的来说,目前,人们会采纳这些 AI 工具,成为更好的程序员。至少从我们在 Google 的观察来看,现在的趋势整体是积极的。

Lex Fridman 确实。我听说一些非常优秀的程序员已经能生成大量代码,虽然他们不一定用得上全部代码,还是需要很多编辑,但就算对我这种把编程当副业的人来说,我也感觉自己的生产效率提高了五倍。我想,对于像 Google 这样拥有庞大代码库的公司来说,未来的生产力应该会有更大提升。

Sundar Pichai:最大的突破,会出现在我们让「AI Agent」能力更强的那一刻。我认为,那将开启下一波真正的飞跃。别看只是 10%,但当你有成千上万名工程师时,10% 就是一个惊人的数字。人们常提到「AI 编写了多少比例的代码」,但我更关注的是实际的生产力。这是两个完全不同的维度,而后者才是更重要的衡量标准。但我相信效率还会继续提升。没有哪个工程师在效率翻倍后会就此止步,相反,他们会去创造更多有价值的东西,从而在工作中获得更深的满足感。

Lex Fridman 是的,还有很多方面会随之改变。比如 Google 的代码库本身也可能变得更标准化,更易于理解和维护。AI 能在这方面发挥很大作用,帮助工程师在整个代码库中快速理解上下文,也会进一步增强 AI 自身对代码的理解。

我一直在大量使用 Cursor 作为一种用 Gemini 和其他模型编程的方式。它强大的地方之一是它能感知整个代码库,这让你能向它提问。它允许 Agent 以一种非常强大的方式在代码库中「自由穿行」。我的意思是,这是一个巨大的突破。

Sundar Pichai:是的没错。比如说做代码迁移、重构老旧代码库等。一旦我们能以一种比今天更好、更稳健的方式完成所有这些工作,就会带来巨大价值。

Lex Fridman 重构,是的。最终,我猜所有程序都将用 JavaScript 写,然后在 Chrome 里运行。说到这个,Google 以对工程师面试严格著称,尤其是白板面试非常有名。在 AI 时代,这种面试方式会发生变化吗?我猜白板上是不能用 AI 提示的吧?

Sundar Pichai:这是一个很好的问题。我们正在确保至少为人们引入一轮现场面试,只是为了确保基础知识扎实。我认为这最终会很重要,但这也是一项同等重要的技能。如果你能利用这些工具生成更好的代码,我认为这是一种资产。所以总的来说,我认为 AI 的出现对于工程师来说是一个巨大的积极因素。

Lex Fridman 那对于那些对编程感兴趣,但不是全职从业者的人,或者我们说「氛围编程」(vibe coding)爱好者,你是否还建议他们去接受传统的计算机科学教育呢?

Sundar Pichai:我会建议的。如果你对计算机科学有热情,那就值得去学习。计算机科学远不止编程,它更多的是一种对系统性思维和底层逻辑的训练。所以我不认为 AI 会改变学习这些东西的价值。而且,AI 的影响是跨领域的,它正在影响所有行业。未来具体会如何变化,现在很难预测。但任何能够训练你「第一性原理」思维能力的教育,我认为都是非常值得的。

06

AR 是下一个重要的 IO 范式

Lex Fridman: 你和团队改变了很多行业,其中 Android 系统更是颠覆性的。它的未来会是什么样?会更加以 AI 为中心吗?尤其是在加入了支持 AR 和 VR 的 Android XR 之后。

Sundar Pichai:计算领域最好的创新往往都来自于范式 IO 的变革。比如从命令行到图形界面(GUI),再到移动设备上的多点触控和后来的语音交互。我认为,AR(增强现实)就是下一个 IO (交互) 范式。

之前它一直受两方面制约。一方面,制造好的 AR 设备的系统集成挑战非常非常大;另一方面,你需要 AI 的辅助。否则,传统的输入输出方式太复杂,无法为 AR 提供自然无缝的交互体验。因此,AI 变得至关重要,这也是为什么「Project Astra」项目对于未来的 Android XR 生态如此关键。

我相信,当你戴上 AR 眼镜时,你会惊讶于它的实用性。所以,我认为这对 Android 来说是一个真正的机会。XR 是一种让它真正实现的方式, 但同时,它也给了我们一个重新思考移动操作系统的机会。我们一直生活在应用程序和快捷方式的范式中,所有这些都不会消失。

但同样,如果你想在操作系统层面完成一些事情,它需要更具「Agentic」,这样你就可以描述你想做什么,或者它能主动理解你试图做什么,从你一遍又一遍的做事方式中学习,并不断实现个性化。这正是我们需要解锁的潜力。

Lex Fridman: 我体验过那款 AR 眼镜的原型,非常惊艳。那种毫无延迟、信息呈现恰到好处的流畅感,背后一定是在操作系统层面解决了很多难题,才能让 AI 如此无缝地整合进来吧?

Sundar Pichai:这是一个很好的登月项目,你知道吗?

Lex Fridman:是的,这太疯狂了。

Sundar Pichai:我喜欢这个挑战。而且我相信,相比其他「登月项目」,我们离现实更近。我们预计今年晚些时候能将眼镜交到开发者手中,明年交到消费者手中。所以这是一个激动人心的时刻。

07

自动驾驶最困难的部分

在于最后的 20%

Lex Fridman: Waymo 是我见过最疯狂、最具远见的登月项目之一。十多年前,当我第一次看到一辆 Waymo 车辆,也就是 Google 的自动驾驶汽车时,对我来说,那是一个关于机器人的「顿悟」时刻。它让我比以前更爱机器人技术,让我窥见了未来的一角。同时,恭喜你们完成了 1000 万次付费的机器人出租车(Robotaxi)服务。你从这个长期项目中获得了哪些重要的教训?

Sundar Pichai:我对 Waymo 的进展感到无比自豪。自动驾驶的挑战在于最后的 20%,它比前面 80% 更难、更耗时。我认为我们当时确实在 Waymo 上经历了那个阶段,我意识到了这一点,但我们知道正处于那个阶段。

我们知道,尽管当时有很多其他自动驾驶公司,且技术差距是存在的。在别人质疑 Waymo 的那一刻,我反而做出了更多投资 Waymo 的决定。所以在某种程度上,这有点反直觉。但我认为,我们一直是一家深耕技术的公司,而 Waymo 就是构建一个能良好工作的 AI 机器人的一个版本,所以我们会被这类问题所吸引。那里的团队水平非常高,都是现象级的团队。

我们始终将宏伟目标和安全性放在同等重要的位置,对两者都同等投入并努力推进。今年,我们确实扩大了很多规模,并且在 2026 年会继续扩大。

Lex Fridman: 特斯拉也在推进 Robotaxi 项目。你怎么看待他们的进展?你喜欢这种技术上的竞争吗?

Sundar Pichai:我们其实是 SpaceX 的早期投资者,对他们一直都很支持。我认为,我们不直接与特斯拉竞争。我们不生产汽车,而是专注于开发通用的 L4/L5 自动驾驶系统。

我一直默认埃隆无论做什么都会成功,所以我对此毫不怀疑。这个领域足够广阔,我看到的是一个巨大的蓝海市场,特斯拉会做得很好,Waymo 也会做得很好。

Lex Fridman: 其实 Waymo 本质上就是一个「有四个轮子的机器人」。你认为,未来下一个机器人领域的突破会在哪里发生?

Sundar Pichai:Demis 和 Google DeepMind 团队非常专注于 Gemini 机器人技术。我们正在开发基础模型,也在这方面投入了大量资金,我认为我们的研究也处于相当前沿的水平。我们在思考和布局机器人的应用,目前正在与一些公司合作,这是一个值得期待的领域。

我们还没有完全向外界阐述我们的计划,我认为 AI 最终会推动机器人的巨大进步。这个领域已经被耽搁了一段时间。硬件已经取得了非凡的进步,软件一直是挑战。基础模型的出现给机器人领域带来了突破的可能性。

08

我们正处于 非均衡人工智能 阶段

Lex Fridman :很多人在讨论 AGI(通用人工智能)或 ASI(超级人工智能)的 到来时间 。AGI 的宽泛定义是在人类追求的许多主要领域达到专家水平 ,而 ASI 是指在这些领域中远超人类智能的阶段,可能是通过 AGI 的自我改进演化而来。你觉得我们什么时候能拥有 AGI?2030 年有希望吗?

Sundar Pichai:我们应该再加一个术语,虽然我不知道最早是谁提的,也许是 Karpathy,叫做 AJI——Artificial Jagged Intelligence(非均衡人工智能)。

你听说过这个说法吗?有时候这确实是个很贴切的描述。我们看到模型在某些方面取得巨大突破,但同时它们还会犯很低级的错误,比如搞错数字,或者数不清「strawberry」里有几个「r」——这类问题大多数模型仍然搞不定。

所以我觉得,我们现在正处于 AJI 阶段,尽管整体进步显著,但仍然存在不少不足。不过,如果你的问题是:到 2030 年我们能否实现 AGI?这就要看你怎么定义 AGI 了。我们其实一直在不断重新定义它的边界。比如我在旧金山街头坐上一辆 Waymo,车子在人群中穿梭,有时候似乎还有点「不耐烦」,努力寻找出路;或者你在使用 Gemini Live 的 Astra,向它提问世界上的各种问题,那些时刻你会觉得:「这不就是 AGI 的影子吗?」

你能看到一些端倪,所以我用 AJI 这个词,但同时也很清楚,显然我们离 AGI 还很远。因此,我喜欢用「AJI」这个词来描述现在的状态,因为它反映出这种非对称的智能表现。

至于你的问题,我还是想回答一下。我的判断是,到 2030 年我们可能还达不到 AGI,那需要更长一点的时间。当然,我也不觉得「是否达到 AGI」这个定义本身那么重要,更重要的是:到 2030 年,我们将在许多维度上取得飞跃式的进步,无论是积极的效应,还是我们必须认真应对的负面影响,这些变化都将是巨大的,我对此深信不疑。

你可能会说,也许到时候 Gemini 会告诉我们,「现在就是 AGI 的时刻」。但在我看来,即便它不能那样宣布,变化也将是深远的。我记得 2010 年 DeepMind 初创时,就曾设想 20 年内实现 AGI,如今已过去一大半,那种回望过去的视角本身也很有趣。

比如 2012 年,Jeff Dean 展示了神经网络能够识别出猫的照片,那是 Google Brain 的早期成果。到 2014 年,我们收购了 DeepMind。对于我来说,这是一段我们已经谈论了十几年的旅程,我不认为 AGI 会在 2030 年完全实现,更可能再晚一些。

不过我再次强调,重点不在于「定义是否成立」,而是:我们正处于快速演进的阶段,也许 AI 到时候已经可以自动生成视频了。我们作为一个社会,需要有相应的机制来标注和披露这些内容,否则我们如何区分现实和 AI 生成内容?

Lex Fridman 你说得非常有意思。回顾 Google Brain 的早期成果,当时 TensorFlow 还没开源,连工具都很原始。后来 GitHub 的兴起促进了代码共享,再到 Transformer 的问世,现在是 Diffusion 模型。也许未来又会有一个看似简单但彻底改变一切的新想法,比如在训练后期或推理阶段的突破。

我记得 shadcn 发过一条推文,说 Google 其实只差一个出色的 UI(用户界面)就能赢得 AI 战争,这其实也是强调 UI 在整个系统中的重要性。现在我们发布的是 LLM 模型,但未来的发布可能是完整的系统。在你看来,系统的呈现方式、它如何展示自己给世界,是不是特别重要?

Sundar Pichai:非常重要。有很多简单的 UI 创新改变了世界,未来几年我们会看到更多进步,因为 AI 本身就是一个能够自我改进的系统,UI 也包含在其中。今天,我们在某种程度上还在限制模型的表达能力,让它们无法通过 UI 真正展示自己。但从理论上讲,既然模型本身具备编程能力,它们应该能写出最适合表达自身思想的界面。

Lex Fridman: 这是一个绝妙的想法。 API 已经开放了,所以你可以创建一个非常好的 Agent 系统,不断改进你与 AI 对话的方式。 但说到底,核心问题还是界面本身。而 Google 一直在推动的是那种真正多模态的交互方式。

Sundar Pichai:是的,这些模型是原生多模态的。它们可以轻松接收任何格式的输入,并生成各种形式的输出,它们可以设计出优雅的 UI,未来甚至可以理解你的个人偏好。所以这一切都是未来的发展方向。这也回到了我们谈话的起点,我认为未来几年将会有巨大的演变。

Lex Fridman 现在有个挺热的话题叫做 「P(doom)」(灾难概率),即 AI 导致人类灭绝的可能性。你对这个说法怎么看?你认为它被夸大了吗?还是说,人类确实存在被 AI 摧毁的风险?

Sundar Pichai:是的,我有想过。我一直对 AI 非常兴奋,但同时也一直觉得,对于这项技术,你必须更多地思考其风险。

关于 p(doom) 的问题,这也是我们在茶水间偶尔会谈起的话题,这并不奇怪。毕竟这项技术太强大了。也许我们该换个角度思考:当你运营一个大型组织时,如果你能协调好组织的激励机制,你几乎可以实现任何事情。如果你能让所有人都朝着一个目标、以一种使命驱动的方式前进,那简直无所不能。

但要以这种方式组织全人类是非常困难的。不过我认为,如果 p(doom) 真的很高,到某个时刻,全人类都会团结起来,确保这种情况不会发生。因此,我们实际上会在应对这个问题上取得更多进展。所以讽刺的是,这里面存在一个自我调节的因素。我认为,如果人类集体下定决心去解决一个问题,无论是什么问题,我们都能做到。因此,我对于 p(doom) 的情景持乐观态度。我认为潜在的风险确实很高,但我对人类能够奋起迎接那一刻抱有很大的信心。

Lex Fridman 说得非常好。当威胁变得更加具体和真实时,人类确实会团结起来,把事情办好。另外,我认为人们不常谈论的是没有 AI 的毁灭概率。人类还有很多其他方式可以自我毁灭,而且很有可能,至少我这么认为,AI 会帮助我们变得更聪明,对彼此更友善,更有效率。它将帮助世界上更多地区繁荣发展,减少资源限制,而资源限制往往是军事冲突和紧张局势的根源。所以我们也要考虑到这一点,没有 AI 的 p(doom) 是多少?因为很有可能 AI 将是拯救我们,拯救人类文明免受所有其他威胁的东西。

Sundar Pichai:我同意你的看法,这确实很有启发性。就像你说的,我觉得要解决一些最棘手的问题,最好有 AI 来帮助你,比如 Pear 一类复杂系统。

09

AGI 到来时,

问的第一个问题是什么?

Lex Fridman:如果有一天,谷歌真的创造出了能回答任何问题的通用人工智能(AGI),你会想和它聊些什么?

Sundar Pichai:这是个很好的问题。也许到那时它已经很主动了,会告诉我一些我应该知道的事情。但如果非要我问它,我想它会帮助我们以一种会让我们惊讶的方式更好地了解自己。所以也许是这个。你已经看到人们在用产品这么做了,但在 AGI 的背景下,我认为那会非常强大。

Lex Fridman :是在个人层面,还是关于普遍的人性?

Sundar Pichai:个人层面。

Lex Fridman :好的。

Sundar Pichai:所以你和 AGI 交谈,我认为它很有可能以一种非常深刻的方式理解你,我认为这是一种可能性。当然,还有一个显而易见的事情,也许它能帮助我们更好地理解宇宙,以一种拓展我们对世界理解边界的方式。那将是超级令人兴奋的事情。但说实话,我真的不知道。我还没接触过那么强大的东西,但我认为这些都是可能性。

Lex Fridman :我认为在个人层面上,问一些关于自己的问题,一系列关于什么让我快乐的问题,我想我们会非常惊讶地通过一系列问答发现,我们可能会探索一些深刻的真理,就像有时伟大的艺术、伟大的书籍、与爱人的伟大对话向我们揭示的那样。那些事后看来显而易见,但在被说出来时却很美好的东西。

但对我来说,首要问题是,宇宙中有多少外星文明?百分之百。

Sundar Pichai:这会是你的第一个问题?

Lex Fridman 第一个,有多少存活的和已经灭亡的外星文明?可能还有一堆后续问题,比如它们有多近?它们危险吗?如果没有外星文明,为什么?或者如果没有先进的外星文明,但到处都有类似细菌的生命,为什么?阻止它们发展到那个阶段的障碍是什么?是不是因为当你变得足够聪明时,你最终会自我毁灭?因为你需要竞争才能发展出先进的文明,而竞争会导致军事冲突,冲突最终会杀死所有人。我不知道,我会进行那样的讨论。

Sundar Pichai:给费米悖论找个答案,是吧。

Lex Fridman :正是如此。并且就此进行一场真正的讨论。我现在意识到你的答案更具建设性,因为我不确定我会用那些信息做什么。但也许它揭示了 Liz 谈到的普遍的人类好奇心,我们都只是非常好奇,而让世界信息变得可及,能让我们一部分好奇心得到满足。有了 AI ,我们可以变得更好奇,更多地了解世界,了解我们自己。这样做的时候,我总是在想,不知道你是否能评论,是否有可能衡量,不是我们谈到的 GDP 生产力的提升,而是 Google 通过 Google 搜索,以及现在通过 AI 模式和 Gemini,所解锁的人类知识的广度和深度。这是一个很难衡量的事情。

Sundar Pichai:很多年前,我记得是麻省理工学院的一项研究,他们估算了 Google 搜索的影响。他们基本上说,这相当于,按人均计算,每年为每个人创造了数千美元的价值。但是,是的,这些东西很难捕捉,对吧?当这些东西出现时,你把它视为理所当然,而前沿在不断移动。但你如何衡量像 AlphaFold 这样的东西随时间推移的价值呢?

Lex Fridman :还有当你学到更多东西时生活质量的提升。我得说,在我用 AI 完成的一些编程工作中,出于某种原因,我反而对编程更感兴趣了。

Sundar Pichai:是的。

Lex Fridman: 对于知识也是如此,发现关于世界的事情,会让你对活着更感兴奋。它让你更好奇,而你越好奇,生活和体验世界就越有意思。这很难……我不知道这是否让你更有生产力,可能远不及它让你对活着感到快乐的程度。而衡量生活质量的提升是很难的,但其中一些东西确实做到了。

10

放在人类史,

AI 将是比电还要重要的科技发明

Lex Fridman: 纵观人类数万年的技术创新史,从农业革命到工业革命,再到电力,诞生了无数生产力倍增器。你认为,一千年后,当后人修史时,人工智能(AI)能否位列榜首?

Sundar Pichai:这是个很好的问题。大概在 2017、2018 年左右,我当时说,AI 是人类将要面对的最深刻的技术,它将比火或电更具深远影响。我现在仍然这么认为。

你问这个问题时,我确实也在思考,我们是否存在「新近度偏误」(recency bias)?在体育界,人们很容易将当前看到的球员称为史上最佳。但我从第一性原理出发,依然认为,AI 将比所有那些发明都更重要。当然,我没有经历过那些时代。两年前,我做了一次手术,我当时在想,曾经人们在做这些手术时是没有麻醉的。那一刻,我觉得麻醉一定是人类有史以来最伟大的发明。我们无法体会生活在那个时代是什么感觉。

你提到的很多东西,比如电力或互联网,都是普适性的,几乎影响了所有领域。但我认为,我们见过过一种技术,它既发展得如此之快,能力变得如此强大,以至于其上限都难以估量。

AI 最 独特的核心在于,它能够递归式地自我改进。

事实上,它是第一种能极大地加速「创造」本身的技术。创造新事物、构建新东西,它可以自行改进和实现。我认为这是它最与众不同的一点。所以,它最终产生的影响将远远超过我们以前见过的任何技术。当然,随之而来的是许多需要我们思考和应对的重要问题,但我对此深信不疑。

Lex Fridman: 尤其是当 AI 在自身研究上,展现出超越人类的能力时。它或许有能力日复一日地,以比昨天更高效的方式创造自己。

Sundar Pichai:就像 AlphaGo 研究中的第 37 手棋一样,AI 能够进行新颖的、自我导向的研究。当然,在很长一段时间里,我们都希望人类能始终参与其中。这些都是需要讨论的复杂问题。但是,当你亲眼目睹 AlphaGo 如何从零开始,在一天之内变得比任何人都强时,那种震撼是发自内心的。

即使是像 Veo 3 这样的模型,如果你在它们完成 30% 和 60% 时分别审视其生成的内容,再对比最终的成品,你会看到这一切是如何融合在一起的。作为人类,我会说这既鼓舞人心,又有点令人不安。我想,这两种感受都是真实存在的。

Lex Fridman 回顾第一次农业革命,它并不是单一的技术,而是催生了陶器、社会等级、早期政府等一系列连锁效应的「技术包」。尽管难以预测,但你认为我们今天能看到「AI 技术包」中哪些早期的二阶或三阶效应?

Sundar Pichai:其实大部分我们今天可能还不知道,但有一点我们现在可以切实看到的是,随着编程能力的进步,有一点已经可以切实感受到:将你头脑中的想法转化为实际存在的东西将变得非常容易。这是「AI 技术包」的一部分,它将赋予几乎全人类创造和表达的能力。

过去你可能只能用语言表达,未来你可以将想法直接构建成现实。也许今天还不能完全做到,我们还处于「氛围编程」(vibe coding)的早期阶段。但我对人们用 Veo 3 在网上发布的作品感到惊讶。虽然目前还需要一些技巧,比如将一系列提示词拼接起来,但这一切都将持续进步。我一直在想:在任何特定时刻, AI 都处于它有史以来最差的状态。

Lex Fridman :你首先想到的是创造力获取的指数级增长,这很有趣。

Sundar Pichai:无论是编写软件、创作内容,还是开发未来的游戏,所有这些创造性活动的门槛都将大大降低。

Lex Fridman: 我认为最重要的是它降低了门槛,解锁了全部 80 亿人的认知能力。

Sundar Pichai:我同意。想想 40 年前,也许在美国只有五个人能做你现在做的事情。

想想看,今天通过 YouTube 和其他产品,有多少人在做同样的事。我认为这就是科技的作用。当互联网催生了播客,你听到了更多人的声音。但有了 AI,我认为这个数字将不再是几十万,而是数千万,甚至可能是十亿人,以更深刻的方式向世界展示他们的作品。

Lex Fridman 这种创造力格局的改变,让许多传统媒体感到紧张,因为任何人都有可能成为创作者。未来甚至可能出现比人类制作更出色的 AI 播客。创作者必须不断进化,这虽然带来了压力,但也预示着一个激动人心的未来。

Sundar Pichai:但我想说的是,在一个拥有 AI 的世界里,人类会更加珍视和主动选择某些东西。就像在国际象棋中,你我绝不会去看 Stockfish 10 和 AlphaGo 两个 AI 对弈,那对我们来说会很无聊。但马格努斯·卡尔森和古克什的比赛会更有趣。所以,这很难说。

一种说法是, 未来内容会极大丰富,有时你会为了效率去消费 AI 生成的内容。 但你所珍视的顶级体验,可能还是源自于人类本质的某种体现。比如梅西的运球,也许未来会有机器人的球技远超梅西,但我不确定它能否在我们心中唤起同样的情感。这会是一个值得观察的有趣现象。

Lex Fridman 或许未来,播客中纯粹的信息传递部分可由 AI 高效完成,而人类的价值则体现在努力理解、解读信息并与自身情感结合的过程中。就像 YouTube 改变了媒体一样,AI 会继续重塑我们发现、消费和创造信息的方式。

Sundar Pichai:YouTube 成就了无数的创作者,这一点你比任何人都清楚。我毫不怀疑,AI 将成就比以往任何时候都多的电影制作人。我们会赋予更多人力量。所以我认为,AI 的赋能和扩张潜力,其价值被低估了。它将以前所未有的方式释放人类的创造力。这其中的深远意义,我们今天还很难完全领会。唯一的类比是,如果你把一个上世纪四五十年代的人带到今天,让他看看 YouTube,他一定会被彻底震惊。同理,在未来一二十年里,我们也将被 AI 所开启的可能性深深震撼。

Lex Fridman: 你认为未来多少年后,顶尖的优质内容中可能会有一半是由 Veo 系列模型 生成?

Sundar Pichai:我认为这取决于内容是什么。也许你看看今天的电影,里面大量使用 CGI,但仍然有伟大的电影制作人。你仍然会关注导演是谁,以及他们如何使用这些技术。有些电影制作人根本不用它,而你也珍视这一点。还有些人则运用得令人难以置信。而另一些人,比如詹姆斯·卡梅隆,则能将技术运用到极致。

但我认为会有更多的内容被创造出来。就像今天的作家使用 Google Docs 一样自然,未来的创作者也会无缝地使用这些 AI 工具的升级版本,对他们来说,这根本不是什么大不了的事。


(文:Founder Park)

Lex Fridman 对谈谷歌 CEO:追上进度后,谷歌接下来打算做什么?最先出现在每时AI


扫描二维码,在手机上阅读