站在技术奇点的山麓:Google I/O 揭示的务实之路
原文:Notes From the Foothills of the Singularity | 作者:Alex Duffy | 2026-05-22

去年的Google I/O大会上,该公司一口气发布了惊人的100项公告,其中包括AI视频模型Veo 3,它在当时远远领先于其他任何产品。而今年,惊艳感虽有所减少,但多了一份脚踏实地的迭代。Gemini 3.5 Flash比谷歌之前的前沿模型更快、能力更强。搜索引擎现在能够实时构建恰当的小工具来回答你的问题。Gemini智能助手甚至可以在你的笔记本电脑合上后继续运行。即便是名为Gemini Omni的新型多模态世界模型——它能直观理解重力、动能和流体动力学,并很可能用于训练机器人——目前也被定位为“视频版的Nano Banana”(一种轻量级工具)。
在同行们或激进或摇摆的一年里,谷歌的发布算不上耀眼。但填补AI本身“锯齿状智能”的鸿沟,并贯穿其全线产品,同时将这些工具交付给真正会使用它们的人,其重要性可能要高出好几个数量级。
OpenAI继续四处出击,曾大肆宣扬其视频模型Sora 2是“视频领域的ChatGPT时刻”,其前负责人Bill Peebles甚至称其将“演变成一个微型平行现实”,结果却在同年晚些时候将其关闭。Anthropic的首席执行官Dario Amodei则一边深耕劳动力市场,一边谈论AI“摧毁入门级工作岗位”的潜力。
今年谷歌I/O的与会者,背景是该公司湾景园区灵感源自绵延山景的屋顶。(所有照片由Alex Duffy提供)
Google DeepMind的首席执行官Demis Hassabis将当下这一刻称为“技术奇点的山麓”。他认为通用人工智能距离我们“仅有几年之遥”,其总体影响力将是工业革命的10倍,而且到来速度也将快上10倍。我们现在有能力将几乎任何能捕获到可靠数据的事务自动化,但最大的障碍之一,是说服社会相信这项投资是值得的。眼下,大多数人并不这么认为。
Hassabis明确指出:“我们有责任,我们这个领域、AI领域和整个行业,有责任更清晰、更具体地展示其毋庸置疑的益处。”在参加完今年的会议后,我的印象是,谷歌清楚地看到了当下的脆弱性,而其庞大的规模赋予了它一个罕见的地位,能够为此做些什么。
谷歌的飞轮
谷歌的运行循环如下:研究人员寻找新的数据,改进模型架构,并训练一个新模型。这个模型会经过专门的训练,以适配其名为“反重力”的框架,从而获得编写和运行代码的能力,并借此能力去完成几乎所有事情。接着,公司将其应用到每一款产品中:搜索、文档、YouTube、Gmail、安卓,无所不包。用户尝试使用,并通过行为隐式地提供反馈,或通过点赞/点踩显式地反馈。下一个模型因此得到改进。这一切都发生在谷歌的完整技术栈上——从它设计的芯片、自有的数据中心、模型、部署管道,到横跨六七个核心应用的数十亿用户。过去一年,谷歌一直在进行组织调整,以大规模运行这个循环。
内部工具正被重写,速度提升20倍,并为智能体而生。谷歌正在研究组织内外专家的工作方式,收集高质量数据,识别潜在的能力差距,然后训练模型来克服它们。
这体现在一个能实时为你问题构建定制化小组件的搜索框中,帮助加深理解,而不仅仅是看个标题。或者体现在更易用的Gemini应用中,其月活用户已突破9亿,并将很快拥有一个全天候的个人智能体,它可以跨你的邮件进行研究,捕捉任务并异步执行,最终返回草稿、报告、行程单等。谷歌正在向其应用家族的更多界面,如地图和购物,添加新的智能体,它们都由Gemini 3.5 Flash和“反重力”框架驱动。正是这个组合,能够在12小时内,用93个子智能体,以不到1000美元的成本构建出一个可运行的操作系统。这些在六个月前还是不可能的。而现在,数十亿人将使用这些工具去追求他们的目标,而且常常是在毫无察觉的情况下。
谷歌DeepMind首席执行官Demis Hassabis在会议第二天“AI与科学前沿”环节的现场。
行业责任
一年前,谷歌每月处理480万亿个令牌(tokens)。上个月,这个数字是3200万亿,即每天3万亿,每三周翻一番。其今年的资本支出约为1800亿美元,几乎是2022年的六倍。但迄今为止,普通公众并未被说服这笔投资是值得的。相反,大多数人看到的是白领失业、耗费大量资源的数据中心在后院拔地而起,以及一小部分人变得极其富有。
我从山景城回旧金山的Uber司机54岁,仍在建筑行业工作,他根据自己对城市活动的熟悉来优化行车路线。他从未听说过Hassabis,也不知道游戏如何帮助训练AI,但他对I/O大会上发生的事很好奇。他打开话匣子,表达了对裁员、富人愈富的担忧,并提出了一个疑问:最后还有谁能在经济中消费?我问了很多问题,并提到Hassabis强调行业的义务是“更清晰地展示AI毋庸置疑的益处”。我分享了我对Hassabis明确、公开地专注于治愈所有疾病,以及AlphaFold迄今所取得进展的钦佩。我们还谈到,一个人现在就能完成过去一个团队才能做的事,以及这如何为更多小企业开辟空间,尽管这条路上可能布满裁员的荆棘。当我们抵达旧金山时,他已经把收藏的YouTube纪录片调到了待看列表的最前面。
我认为人们内心是渴望兴奋起来的。这份承诺是真实的——AI是我们为科学事业所拥有的最好的通用工具。数据中心已经承担了某些县一半的房产税收入,减轻了普通人的负担,并且在水等资源利用上提供了远超替代品的回报。地平线上,有我们几十年来一直追寻的治愈方法,有能提高能源效率同时减少环境足迹的材料,还有能适应学习者的教育。自动驾驶汽车每年可以拯救数万美国人的生命,并为许多人提供出行的自由。它也将取代我那位司机的饭碗。承诺是大规模到来的,但代价却是一户一户地降临。除非这个行业能展示出与今天(无论是实际的还是感知到的)负面影响同样切实的正面效益,并首先投资于被取代的人群,否则进步将会放缓。
谷歌及Alphabet研究、实验室、技术与社会总裁James Manyika(左)与谷歌量子AI创始人兼负责人Hartmut Neven对话,后者手持一枚谷歌Willow量子芯片。
机会之窗正敞开着。谷歌和其他公司已经建立了大规模运行此周期并将其交付到数十亿人手中的基础设施。就在上周,数学家们利用一个前沿模型,揭示了一个困扰我们80年的数学秘密,推翻了一个离散几何中长期存在的猜想。这过去需要一个博士或一个团队,现在可能只需要一个充满好奇心的人和一个编程智能体。剩下要做的,就是将这些工具指向那些真正值得解决的问题,那些能为个人和社区带来可见益处的问题。像旨在实现这一目标而设立的Gemini XPRIZE这样的公告,表明该公司理解当下的紧迫性。而将工具简单地交到更多人手中也同样重要,尤其是当学习曲线像提问一样简单时。
我对机器人技术更新和正在构建的用于模拟的世界模型感到兴奋。那些更大的“登月”项目正在酝酿。但此刻最值得做的工作,是摆在我们面前的工作,是与我们身边的人们一起进行的工作。用Hassabis的话说,未来尚待书写。但我们必须谨慎把握方向,不能把忙碌误认为成就。赌注很高。我们今天的对话、我们所讲述的故事,以及我们使用这些工具的方式,将定义明天的面貌。
核心启示:谷歌今年的I/O大会展现了一种从“惊艳”转向“补齐短板、大规模集成”的战略定力,其核心是一种基于全栈能力的“研究-训练-应用-反馈”高速循环。文章的核心洞见在于,AI的真正瓶颈或许不再是技术能力,而是社会信任与应用落地。在巨额投资与公众因失业、资源消耗等问题产生的疑虑之间,AI行业必须将展示“毋庸置疑的益处”作为一项紧迫的、关乎自身存续的义务。
Notes From the Foothills of the Singularity 的发芽报告
材料核心
Alex Duffy 在 2026 年 Google I/O 后观察到,AI 行业的竞争重点正从发布“炫技性”模型转向系统性的“填缝”工程——通过整合全栈基础设施、产品生态和用户反馈回路,将 AI 能力无缝嵌入数十亿人的日常工具。但技术部署的速度远超社会信任的建设速度,如果行业不能兑现“用 AI 治愈疾病、解放个体”的承诺,而只让公众感受到裁员与资源消耗,奇点将止步于山麓。
发芽 01:重新定义“震撼”——从技术奇观到系统整合的沉默革命
种子
媒体和公众习惯于寻找 iPhone 时刻式的单体突破,但 Duffy 捕捉到的深层逻辑截然不同:今年的 Google I/O 没有去年的“Wow”,却通过“Antigravity”代码执行框架、异步代理和跨产品集成,完成了比发布单一强模型更关键的系统工程。这不是衰退,而是价值创造模式的转移——从交付一个“会说话的机器”,转向编织一张“会行动的网”。
19 世纪末,电力最初进入工厂时,企业家们争相购买最强大的发电机,试图直接替换蒸汽机。这类似于今天企业争相接入最大参数的语言模型。但真正的电气化革命发生在 20 世纪初,当工厂不再围绕中央动力轴布局,而是用“单元驱动”将小型马达分散嵌入每一台机器、每一道工序时。电网和分布式马达的组合重塑了生产流程,带来了 300% 的生产率飞跃。今天的 Antigravity 框架和 Gemini 3.5 Flash 组合——能在 12 小时内用 93 个子代理构建操作系统——正是 AI 走向“单元驱动”的例证。力量不再凝于一个天才对话者,而是渗透进 Search 的动态编程、Maps 的即时规划、Docs 的异步研究。真正的革命不是制造更响的雷声,而是让闪电悄然接入千家万户的电路。
Aha 瞬间
“当电力从‘替代中央蒸汽机’转向‘分布式嵌入每一道工序’时,世界才真正改变。AI 今天正跨越同样的分水岭:从模型的独白,走向代理的交响。”
发芽 02:承诺的漂移——当技术利益抽象化、成本具象化
种子
Duffy 与 54 岁 Uber 司机的对话揭示了 AI 叙事的一个结构性裂缝:Hassabis 谈论 AlphaFold 可能在未来十年消除所有疾病,而司机感受到的是本周租金的威胁。AI 的收益被描述为全人类的、长周期的宏大叙事,而其代价却是具体的、即刻的、由特定个体承担的。这种收益与成本在不同时间尺度和人群间的分配错位,正成为阻碍 AI 投资合法性的核心。
20 世纪 60 年代,美国政府推动的“绿色革命”引入高产小麦和水稻品种。其承诺是终结全球饥饿。十年内,亚洲粮食产量确实翻番,诺曼·博洛格后来获得诺贝尔和平奖。但在承诺兑现前,印度旁遮普邦和北方邦的数百万小农因无力承担新种子所需的化肥、杀虫剂和灌溉设备,在 1965—1975 年间大规模破产,土地被兼并。饥饿的抽象解决与农民的具体破产共存,导致了持续至今的政治怨恨。这正是 Duffy 所说的“承诺大规模来临,代价却一户户敲门”的历史先声。更严峻的是,1945—1953 年间,美国电话普及率从 46% 升至 76%,创造了共同的经验基础。而 AI 时代,技术传播越快,认知鸿沟越深——当一部分人用代理编写操作系统时,另一部分人甚至不知道 Hassabis 的名字。如果不将历史教训转化为再分配机制(如数据中心税收的具体返还、过渡期收入支持),AI 将重蹈“绿色革命”的信任裂痕,而非实现其普遍启蒙的承诺。
Aha 瞬间
“绿色革命教会我们:一项技术若不能将其成本从‘个体痛苦’转化为‘集体投资’,它的宏大承诺终将被那些尚未看见未来的群体的否决票所埋葬。”
你的思考空间
- Duffy 承认他的 Uber 司机将被自动驾驶取代,但相信技术的整体利益。当一个行业领袖宣称“我们必须展示明确利益”的同时,他所在的行业又在积极部署摧毁客户就业的工具,这种“建设性的否定”在道德上是否可以自洽?边界在哪里?
- 如果我们接受 AI 的收益是长周期、全社会共享的,而成本是即时、个人承受的,什么样的机制(如专项税收、公民分红、终身学习账户)能真正将这两条曲线对齐,而不仅仅是公关修辞?
- 中国在 2010—2020 年间通过智能手机和移动支付几乎跨越了 PC 互联网时代,直接进入数字社会。AI 的“无感嵌入”(如文中描述的用户甚至不知道自己在使用 AI)是否可能在特定社群中创造类似的跨越式获益,而不仅仅是削减岗位?
- 文中提到数学家使用前沿模型破解了 80 年的猜想。当一个业余爱好者加上编码代理就能做出过去需要博士团队才能完成的工作时,“专业知识”的定义本身是否在发生质变?这对教育体系意味着什么?