Google I/O:代理,代理,还是代理
原文:https://every.to/context-window/google-i-o-agents-agents-agents
本周的绝对主角是 Google I/O,来自山景城的信号毫不掩饰:代理不再是辅助功能,它就是产品本身。由 Gemini 3.5 Flash 驱动的全新搜索和一系列永远在线的个人助手,构成了这次发布的核心。再往深一层看,Anthropic 被曝以约 3 亿美元收购了 Stainless——因此,我们重新回顾了《AI & I》播客中与 Stainless 公司 CEO Alex Rattray 的那期对话。他在几个月前就阐述了如何为 AI 代理设计可读软件的原则。另外,我们对 Figma 新推出的画布内代理(in-canvas agent)进行了一次迷你 Vibe Check,看看它是否真的解决了“空白画布”难题。——Kate Lee
焦点
Alex Rattray,Stainless CEO 与 MCP 背后的布道者
那些吸睛的前沿模型发布往往吸走了 AI 生态中绝大多数的注意力。但没有可靠的方式让 AI 代理访问这些模型,它们的能力就会受限。这类“管道设施”或许容易被忽略,但它却是构建一个“代理原生互联网(agent-native internet)”不可或缺的组件。
这不必只听我们的一面之词。周一,Anthropic 宣布已收购高质量 API 软件平台 Stainless,以扩展 Claude 连接数据与工具的能力。Alex Rattray 是 Stainless 的CEO 兼创始人,他在去年十月就已经在《AI & I》播客中与 Dan Shipper 深入探讨过,为什么教会模型使用软件如此困难,以及哪些设计原则能让模型上下文协议(Model Context Protocol,MCP,一种让 AI 代理与外部软件对话的开放标准)服务器对大型语言模型(LLM)来说更直观。
换句话说,他当时的洞见是:让代理可用的工具数量应保持精简、为工具赋予精准的命名,并致力于生成定义严密的输出。在那期节目中,Alex 详细拆解了 Stainless 如何让 AI 代理更顺畅地使用互联网——这些来之不易的洞察,现在看来,最终导向了一笔由顶级模型公司发起的、价值可观的收购案。
阅读 Anthropic 关于收购 Stainless 的官方公告,然后观看 Rattray 在《AI & I》的那期节目。
信号
Google 全面押注代理
我们正飞速冲向一个 AI 新格局,其中的代理可以被清晰地划分为两类:一类是你与之协作的代理,另一类是你向其委派任务的代理。Google 在本周旧金山举办的旗舰开发者大会 I/O 上发布的新品,恰好严整地落在了这条分界线上。
头条发布是 Gemini 3.5 Flash,Google 刚刚宣布的前沿模型。据介绍,它的运行速度是同类大语言模型的四倍,而成本只有一半。它正是驱动以下大多数代理功能的核心引擎。
在“与你协作”的范畴里
AI 模式与全新搜索框: Google 正在对搜索进行 25 年来最大规模的界面变革。除了扩展搜索框以容纳用户更长、更具对话性的提问和术语外,此前就已推出的“AI 模式”,正成为默认的搜索模式。通过 2026 年的更新,你现在可以直接在搜索中构建自定义的迷你应用,比如一个个性化的健身追踪器,或者交互式可视化图表。
Antigravity 2.0:Google 的代理开发平台正在蜕变为一个用于管理代理团队的桌面应用,它配备了一个新的命令行界面工具,并提供了用于构建自定义工作流的 SDK。你来负责统筹协调(orchestrate),代理们则负责编码、设计,或者完成任何你希望它们达成的目标。
在“向其委派”的范畴里
Gemini Spark:Google 将其定位为一个 7×24 小时全天候的私人代理。它栖身于云端,在你的设备关闭时也能工作,并且可以跨 Gmail、Docs、Workspace、Chrome 操作,未来还会通过 MCP 覆盖第三方工具。“你可以就把任务往后一扔,”Google Labs、Gemini 与 AI Studio 副总裁 Josh Woodward 在主题演讲中说,“Spark 会接住它们,然后自行处理。”
Daily Brief(每日简报):新版 Gemini 应用中一个开箱即用的代理。它会在夜间工作,扫描你的收件箱、日历和任务清单,以便在清晨为你递上一份按优先级排序的摘要。
Universal Cart(通用购物车):Google 新推出的跨商家通用购物车,是“通用商务协议”的一部分。每当你向购物车中添加一件商品,它就会自动在整个互联网上监控这件商品的信息,包括降价情况、价格历史,以及商品是否补货。它还会分析购物车中的全部商品,主动标记潜在问题——比如,当你正在攒一台 PC 时,你选择的处理器和主板是否不兼容。
Google I/O 场内观察
人人都能做菜
周二开幕主旨演讲中发布的 Gemini 3.5 Flash,似乎是在“快且便宜”的方向上迈出的实质性一步,而这正是要可靠地处理大多数人日常求助的那种个人化、日常化事务所需要的模型特质。
一个模型什么时候才算“足够好”?这是我在 Google I/O 第一天结束后,走回酒店时问自己的问题。我经常派代理去执行耗时数小时的编程任务,也需要从多个账户和渠道拉取数据来协调我的工作日。在这些场景下,每一次新模型的发布似乎都比上一个更好用,于是我也就忙不迭地从一个跳转到另一个。
但另一方面,对于像家庭简报、追踪我的日记和冥想习惯,以及轻量的网页开发这类简单的个人任务,我则忠于 Sonnet 4.6——尽管有时候我也不得不叫它去请 Opus 或 GPT-5.5 帮忙。
Gemini 3.5 Flash 自成一个象限。(图片由 Jack Cheng 提供)
由此带来的问题是:当一个模型已经聪明到足以处理我丢给它的任何个人事务时,我还能对它有什么期待?
我期待它能快如闪电,这样我在实时协作时就不必等待响应。我还希望它的用起来成本近乎为零。
Gemini 3.5 Flash 或许恰好提供了这两点。
如果基准测试可信,那么 Gemini 3.5 Flash 以四倍的速度提供了 Opus 4.7 级别的智能。精准、近乎即时的响应,让 Google 可以信服地将用户从搜索结果页无缝引入其“AI 模式”,而用户甚至意识不到自己进入了一种新状态。毕竟,聊天界面与搜索框的差别并非天差地别。但要让那个聊天界面感觉上依然像 Google 搜索,它就必须和传统搜索一样迅捷。
随着本周开始的全球推送,用户将如何接受更深度的 AI 模式整合,还有待观察。但 Google 表示,已有 25 亿用户使用搜索结果页顶部的“AI Overviews”,而这些摘要现在将允许你针对性地提问。每一次搜索都成为与 AI 代理对话的开端,这个代理能生成文本和图像、启动研究代理、编码出交互式小组件和迷你应用,不一而足。
这可能会让更多人经历他们与 AI 的第一次“顿悟时刻”(aha moment)。Google 在速度和规模上的核心竞争力,在 Gemini 3.5 Flash 的发布中体现得淋漓尽致。
更重要的是,Google 已经通过用户的 Gmail、Google Calendar 和 Google Docs 账户掌握了他们的信息上下文。这扫清了设置 AI 代理的一个主要障碍。Google 或许是世界上仅有的两家拥有如此规模“护城河”的公司之一——另一家是 Apple。不久,数十亿人可能会开始使用代理式 AI,去“烹饪”出能让他们的生活以某种微小方式变得更轻松或更愉快的工具和工作流。
耐人寻味的是,到目前为止,Google 在 I/O 上的发布并未触动那些身处 AI 浪潮浪尖的我们。Every 的 Slack 中对当天发布的反响并不热烈。但我认为,Google 的关键并非说给那些捣鼓 OpenClaw,或者使用、构建 Codex 原生应用(Codex-native apps)来处理邮件和学钢琴的人听的。
对我而言,在铺天盖地的发布中,Gemini 3.5 Flash 和 Google AI 搜索宣告的重要性,被第一天最后一场开发者环节中最后几页幻灯片之一所点明。上面写着:
“我们是第一代创造工具的建造者,为一个任何人都能创造任何事物的世界而造。” ——Jack Cheng
Mini-Vibe Check:Figma 代理
Figma 让空白画布不再空白
2026 年 3 月,Figma 向外部 AI 代理开放了它的画布。这次更新让 Claude Code、Cursor 和 Codex 这类编程工具通过 MCP 连接到 Figma,并将设计稿直接写入 Figma 文件。
今天,Figma 发布了自己的、内置于 Figma 的代理。它能直接编辑你的画布——切换组件状态(即一个设计元素的不同变体,比如一个按钮在悬停时是一种样式,点击时又是另一种)、重新设计布局,并生成新的界面。它基于 Google 的 Gemini Flash、Anthropic 的 Claude Sonnet 以及 Figma 自有精调模型的混合体构建。Figma 用户再也无需离开画布,或将工作移交工程师,就能得到一个 AI 生成的初版设计稿。
Every 在发布前一天获得了访问权限。市场主管 Douglas Brundage、高级设计师 Daniel Rodrigues 及创意设计师 Benjamin Ose 花了一天时间进行测试。以下是他们的发现。
做得好的地方
当提示词具体时,该代理能产出扎实的早期探索方案,很好地保留文案,并给设计师提供可以继续工作的基础,而不是一个空白画布。
正如 Daniel 所说:“再也没有从零开始的借口了。”
代理能快速探索视觉方向,不过其保真度和渲染仍需设计师审核。(图片由 Douglas Brundage 提供)
它也非常适合快速勾勒产品想法。Benjamin 用它来制作一个挖掘 X(原名 Twitter)提及的褒奖,以收集客户证言的 SaaS 仪表盘模型,并得到了可行的初步探索。这是他初始的提示词:
设计一个 SaaS 仪表盘,用于监听你的 X 账号被提及的情况,使用 AI 提取客户证言(正面的叫好、评价、背书),并将其存储在一个可搜索的库中。支持一键导出到网站,作为嵌入式组件、小工具或 API——风格上类似 Grammarly 简洁的校对流程,融合 Stripe 的可嵌入元素。提供免费增值入口:基础抓取功能免费,AI 策展和分析功能付费。
Benjamin 使用代理生成了一个证言挖掘类 SaaS 仪表盘,产出了一个结构化的早期探索,可供清理和迭代。(图片由 Benjamin Ose 提供)
待改进之处
在处理精细化工作时,代理就没那么有用了。标签页渲染不当、按钮重叠、组件偏离对齐线,还有些输出分辨率异常偏低。它能搭好结构,但设计师仍然需要亲手去修正细节。目前,代理无法将图片或链接作为视觉参考。眼下,代理完全依赖于提示词撰写技巧或一个已有的 Figma 画框。
Benjamin 还提到,如果代理能基于现有的设计系统去工作,而非从零发明,那它会更有用——也就是直接调用团队已在 Figma 中使用的组件、颜色、间距和样式。理想情况下,它还能调用设计师常用的参考工具,例如 Mobbin。
我们的结论
Figma 的代理还不是一个完全值得信赖的设计副驾驶,但它解决了早期设计工作中的“空白画布”难题。它的工作是将设计师从“零”带到“初稿”,这样设计师的精力和时间就可以转移到判断和打磨上。
在探索、布局起步和快速迭代方面,它兑现了这一承诺。但在达到值得在生产环境中信赖的程度之前,它依然需要更好的保真度、更强的细节处理能力,以及更丰富的参考输入。——Katie Parrott
核心启示:Google I/O 2026 揭示了一个清晰的未来:AI 代理正在从实验品蜕变为横跨搜索、开发和个人助手的主流产品层,其价值链的上下游(从 API 管道设施到设计工具)也随之迎来根本性的重组。

Google I/O: Agents, Agents, Agents 的发芽报告
材料核心
Google I/O 2026 传递了一个明确信号:AI 代理(Agent)不再是实验性功能,而是产品的核心形态。从搜索框的重构到 24/7 云端个人助手,Google 正在将代理能力嵌入数十亿用户已有的日常工具中,同时 Anthropic 以超过 3 亿美元收购 Stainless 的举动,揭示出代理生态的另一个关键战场——让 AI 可靠地连接外部工具和数据。
发芽 01:从智力竞赛到可靠性竞赛
种子
模型能力的军备竞赛正在降温,真正决定代理能否落地的,不是智商高几个百分点,而是它能不能稳定地执行任务。材料中 Gemini 3.5 Flash 的卖点不是“最聪明”,而是“够聪明且够快、够便宜”——这是代理可靠性的基础设施。而 Anthropic 收购 Stainless 的深层逻辑同样指向可靠性:当代理调用外部 API 时,不一致的输出格式、模糊的工具描述、过大的工具集都会导致失败。代理时代的核心竞争力,正在从“模型能想多深”转向“模型能多可靠地行动”。
1863 年,伦敦开通了世界上第一条地铁——大都会线。当时人们争论的不是火车能跑多快,而是它能不能准时到站、车门能不能可靠开关、信号系统能不能防止追尾。地铁真正的突破不是速度,而是可预测性——市民可以把出行时间精确到分钟,城市才得以向地下扩展。
这很像今天的 AI 代理生态。Gemini 3.5 Flash 的“四倍速度、一半成本”不是在追求极致智能,而是在追求像地铁时刻表一样的可预测性:用户抛出一个任务,代理能在可接受的时间内稳定返回有效结果。同理,Stainless 所做的 API 设计原则——保持工具数量少而精、工具命名精确、输出格式严格定义——本质上是在为代理修建轨道和信号系统。没有这些,再聪明的模型也会在开放式任务中“脱轨”。
Aha 瞬间
“当 AI 从‘偶尔惊艳’变成‘始终可用’的那一刻,才算真正走出实验室——速度、成本和接口的标准化,比智商重要得多。”
发芽 02:搜索框的消失与代理的隐身化
种子
材料中 Google 将 AI Mode 设为默认搜索模式,本质上是将“搜索”这个行为从“用户主动查询”重新定义为“代理持续理解并响应”。搜索框不再是输入关键词的终端,而是对话起点。这背后隐藏着一个更激进的设计哲学:最好的代理界面,是用户感知不到的——就像材料中提到的,Google 希望用户“没意识到自己进入了新的交互状态”。
1980 年代,施乐 PARC 的研究者 Mark Weiser 提出了“普适计算”(Ubiquitous Computing)概念,用一句话概括就是 “最深的技术是那些消失的技术”(The most profound technologies are those that disappear)。他举例说,文字是深刻的——但你阅读时从不会注意到墨水的形状;电机是深刻的——但它藏在你汽车引擎盖下,你只体验加速感。
Google Daily Brief 代理在用户睡眠时扫描邮件、日历,早上递交一份优先级摘要——用户无需下达指令,这个过程就完成了。Gemini Spark 被设计成“让你把任务随手往后扔”的存在。这些代理的共同点是:它们的工作界面不是 prompt 框,而是你的日程表、收件箱、购物车。代理正在“隐身”成日常工具的一部分,就像电机藏进了引擎盖。当 Anthropic 收购 Stainless 来夯实 API 调用这条“地下管道”时,它同样是在为代理的隐身化铺路——用户不需要知道 Claude 调用了哪个 MCP 服务器,只需要知道事情办成了。
Aha 瞬间
“代理的终极形态不是更聪明的聊天窗口,而是你开始不再注意它存在的那一刻——就像你不会去想引擎是怎么点火的。”
发芽 03:从“任何人可以搜索”到“任何人可以构建”
种子
I/O 开发者会议结尾那句“我们是第一代建造者,为‘任何人都能建造任何东西’的世界创造工具”触及了 Google 真正的野心:不是让用户用 AI 搜索信息,而是让用户用 AI 构建工具本身。材料中提到的搜索框内生成“定制迷你应用、交互式可视化”就是雏形——用户从信息的消费者变成了工具的瞬时创造者。
1980 年代,HyperCard 为 Macintosh 带来了一个革命性想法:不需要编程背景,普通人就能创建包含链接、按钮和动态内容的应用。HyperCard 本身没有统治世界,但它孕育了一代“思考者-建造者”(thinker-makers)——游戏设计师、教育软件开发者,甚至早期的维基概念原型。今天那些精通 Excel 宏或 Notion 公式的“平民开发者”(citizen developers)是同一个谱系的延续。
Google 正在将“搭建工具”这个行为压缩到一次搜索对话中。当用户能随口说“给我建一个跟踪冥想习惯的小应用”,并立刻在搜索结果中得到可用产物时,“软件构建”的定义就从工程行为变成了表达行为。这很像 HyperCard 的精神继承者,但区别在于:Google 拥有 25 亿用户的上下文(邮件、日历、文档),代理不需要用户从零描述需求——它已经知道你的行为模式。
Aha 瞬间
“当工具构建成本趋近于零,‘想法到产品’的距离就只剩下一段对话。软件不再是工程师的特权,而是语言的新延伸。”
你的思考空间
- 如果代理真正“隐身”到日常工具中,用户如何判断什么时候是 AI 在做决策、什么时候应该重新掌控?界面应该提供怎样的可感知线索?
- 当数十亿用户开始通过搜索对话生成自己的定制工具,这些碎片化的小应用会产生什么样的生态问题(安全、维护、互操作性)?谁来负责它们?
- 模型能力“够用即止”这个判断,会不会限制了前沿模型的投资动力?如果可预测性和低成本成为主流需求,长尾的高难度任务由谁来推动突破?
