AI 工作正在一分为二
原文:https://every.to/context-window/ai-work-is-splitting-in-two
你好,周日愉快!本周的主角是 AI 智能体(agents)。OpenAI 在 5 月 5 日下午 5:55 为 GPT-5.5 举办了一场“低调”的发布派对,这个时间点是模型自己选的。次日,Anthropic 举办了第二届年度 Code with Claude 开发者大会,公司在会上发布了其托管智能体(Managed Agents)产品的三项新功能,更令人意外的是,还宣布了与 SpaceX 的 Colossus 超级计算集群的合作。
Every 在旧金山现场参与了 Code with Claude 大会。结合 Codex 在 Every 内部逐渐渗透的方式,我们可以更容易看清,战线正沿着两个方向展开:一边是桌面应用,它可以和你实时协作;另一边是长时间运行的智能体,比如 OpenClaw 或 Claude 托管智能体,团队可以把工作完全移交给它们。这也正好对应了 Every 内部智能体 分化为两种 的模式:一种是我们委派任务的,另一种是我们与之协作的。而前沿实验室正在 向大型企业派驻员工 的信号也印证了这一趋势。
往下看,你能看到周末特别版《AI & I》,邀请了两位 Anthropic 的工程负责人;可以借鉴的使用 Codex 实现收件箱清零的工作流,或者 决定哪些 AI 工具值得测试的方法;还有 Every 的首席运营官 Brandon Gell 如何在他刚出生的儿子以及他自己身上培养好奇心。我们也一直在关注 Elon Musk 与 OpenAI 的官司。证据开示程序已经浮现出许多八卦的、偶尔令人瞠目结舌的短信,但到目前为止,对普通用户的日常使用还没什么实质影响。——Kate Lee
“AI & I”:来自构建者团队的 Claude 平台秘密
未来,你只需要给 Claude 一个目标和预算,它就能帮你达成目标。
这是 Anthropic 在本周的 Code with Claude 开发者活动中宣布的新托管智能体功能所构建的方向。其基本理念是:将 Claude 封装在云端的一台计算机中,你可以按需启动、扩展和管理。Anthropic 正在接手那些导致大多数智能体产品失败的底层基础设施,并确保它能够规模化,以满足 24/7 全天候运行智能体的需要。
在一期于 Code with Claude 现场录制的《AI & I》特别节目中,Dan Shipper 与 Claude 平台工程负责人 Jiang 和 Katelyn Lesse 探讨了构建一个 AI 基础设施平台需要什么。对于任何试图将智能体从演示推向实际生产的人来说,这都是一期必看节目。可以在 X 或 YouTube 上观看,或者在 Spotify 或 Apple Podcasts 上收听。
错过了某集?你可以回看 Dan 近期与 Stripe 的 Emily Glassberg Sands、Every 的 Brandon Gell 和 Willie Williams、Linear 联合创始人 Karri Saarinen 等人的对话,了解他们是如何使用 AI 来思考、创造和建立联系的。
知识库
《深入 Anthropic 2026 开发者大会》 作者: Dan Shipper、 Marcus Moretti 和 Katie Parrott / 思维链(Chain of Thought): Dan 和 Cora 总经理 Kieran Klaassen 参加了 Anthropic 2026 年的 Code with Claude 大会,这篇文章是现场的报道。核心是 Anthropic 新的托管智能体功能, Spiral 总经理 Marcus Moretti 一直在他的工作流中测试这些功能,以及 Kieran 最感兴趣的新“Dreaming”功能。阅读本文,了解 Anthropic 发布了什么,什么才是重点,以及这些工具在实际中是如何被使用的。
《我让 ChatGPT 管理我的一周工作》 作者:Katie Parrott/加班中(Working Overtime): Katie Parrott 自称是项目管理灾难,过去 15 年她通过在脑中记截止日期和回避大项目来弥补这个短板。随着工作变得越来越复杂,老办法难以为继。于是她搭建了一个 ChatGPT 智能体,这个智能体可以读取她的 OKR、日程表、Notion 和 Slack,然后告诉她接下来该做什么。阅读本文,了解她的搭建方案、AI 无法解决的局限性,以及驱动整个系统的可复制提示词。
《AI 工程文化》 作者:Noah Brier / 立论(Thesis): 软件工厂的比喻在 AI 工程领域无处不在,但 Alephic 联合创始人 Noah Brier 认为这个比喻是错的。经营一家软件公司不像 亨利·福特(Henry Ford) 的流水线,而更像安迪·沃霍尔(Andy Warhol) 的工作室:真正的难题不是产量,而是让所有人都朝着同一个愿景构建。Brier 采用了 斯图尔特·布兰德(Stewart Brand) 的节奏分层框架,并将其改造为一个五层次的文化堆栈,用以对齐人类和智能体。阅读本文,理解为什么对智能体的入职引导,与对工程师的入职引导一样重要。
《Codex 原生应用的黎明》 作者:Katie Parrott/上下文窗口(Context Window): AI 工作正在分化为两种模式——委托(delegation)和协作(collaboration)——而新的元技能是知道哪种模式适合当前任务。阅读本文,探索为什么 分配经济 的论点只对了一半的工作有效,以及另一半是什么。
《OpenAI 反转剧本》 *作者:Laura Entis/上下文窗口:*在 Dan Shipper 写下 OpenAI 需要迎头赶上的三个月后,他和增长负责人 Austin Tedesco 已将 Codex 作为他们处理战略文档、招聘及其他知识性工作的日常工具。🎧 🖥 在 Spotify 、 Apple Podcasts 上收听他们的《AI & I》节目,或者在 X 或 YouTube 上观看视频。
来自 Every 工作室
Spiral 让你从一张空白页开始,并能中途叫停 AI。 Spiral 是首批在生产环境中使用 Claude 新多智能体功能的产品之一。当你使用 Spiral CLI 请求多个草稿时,一个 托管智能体 会启动多个 Opus 级别的子智能体来并行撰写你的草稿——将每个草稿的响应时间缩短了 20 到 30 秒。Spiral 还对核心应用流程做了改进。除了新建聊天消息,你现在也可以从一个空白草稿开始会话。如果你的上一条消息有内容需要增改,你可以在 Spiral 回复中途将其停止。此外,根据用户反馈,Spiral 输出中对 AI 文风的防范机制也得到了改善。——Marcus Moretti
Alignment 专栏
保持乐观的理由。 任何产品的圣杯都是低边际成本和高价值。这就是为什么软件能吞噬世界,以及为什么投资者热爱它。然而,生物技术恰恰相反。一种新药需要数亿美元的研发成本,之后还得通过审批,然后才能生产。而且,每 100 个候选药物中,只有两三个能最终到达药房的货架上。一旦药品出货,毛利率还算可观,但通向上市的过程漫长且昂贵。
生物技术永远不会像软件那样规模化。但是,生物技术的研发生产率正在多年以来 首次上升,那些曾把生物技术称为“资金黑洞”的投资者也重新回到了谈判桌上。这背后有几个原因。
我们对生物学的理解比十年前好了太多,因为我们能在进行实验之前就缩小搜索范围。AlphaFold——Google DeepMind 用于预测蛋白质三维结构的 AI 程序——在一年内绘制了大约 2 亿个 蛋白质结构。研究人员不再需要花数年时间去搞清楚一个靶点的结构,现在他们可以一开始就在已有信息的基础上展开工作。
第二个原因是基因组读取成本的 急剧下降。2001 年,测序一个人类基因组的成本约为 1 亿美元,而现在只需约 200 美元。我们能够进行人口规模级的测序,一旦做到这一点,你就会开始看清哪些基因变异会驱动疾病,哪些只是背景噪音。

我们现在拥有的蛋白质、基因和细胞图谱,正开始组成对疾病的连贯理解。在医学史的大部分时间里,我们是在器官层面工作的,所以能看到疾病,却不知其根源。现在,我们的工作层面正是疾病发生的层面——一个基因变异产生异常折叠的蛋白质,这个异常蛋白质扰乱了一条细胞通路,而细胞层面的紊乱就是疾病本身。
当然,一种药物的边际成本永远不会归零。但是,去追问疾病是什么、以及从何处寻找答案的边际成本正在崩塌。更低的研发成本意味着更多的突破性药物,这意味着患者能活得更久,投资者也能赚钱。这一次,激励的方向难得地指向了同一个目标。——Ashwin Sharma
核心启示:AI 工作的未来明确地分为“委托”(完全交给智能体)与“协作”(人与智能体实时互动)两种模式,理解并掌握何时使用哪一种,正在成为全新的核心技能。
AI Work Is Splitting in Two 的发芽报告
材料核心
Every 的观察揭示了AI工具正在分裂为两种不同的使用模式:“委托式”的后台自动运行智能体(如 Claude Managed Agents)和“协作式”的实时互动桌面应用(如 Codex)。更深层的追问是,这一分裂并非暂时现象,而是对人类认知工作节奏的一次根本性重组。
发芽 01:横向关联 — 人类协作史的“同步”与“异步”在此重演
种子
AI工作的分裂,并非技术独创的产物,而是人类协作历史上“同步”与“异步”之争的又一次重演。材料将这种分裂描述为“协作”与“委派”,这恰好对应了人类沟通中实时对话与离线信件、GitHub的实时编码与Jira的工单追踪。问题不在于哪个模式更好,而在于我们如何为不同性质的认知任务分配合适的节奏。
故事主体:从软件开发的版本控制史看工作节奏
软件工程领域经历过一次深刻的“同步/异步”大辩论,其结果可以为今天的AI工具分裂提供精确的参照系。
2005年,Linus Torvalds 创建了 Git,一个为 Linux 内核开发而生的分布式版本控制系统。在 Git 出现之前,主流的版本控制工具如 Subversion(SVN)要求开发者始终与中央服务器保持连接,每一次提交都是一次“同步”操作。而 Git 的革命性在于,它允许每个开发者在本地完全“异步”地工作,创建分支、提交、回滚,所有这些操作都不需要联网。当工作完成,他们再通过 Pull Request(PR)将成果“委托”给项目维护者进行合并。
PR 机制正是“协作”与“委派”的完美结合。一个开发者可以在自己的分支上“与代码深度协作”,反复修改、推敲、测试,这个过程是实时的、交互的、充满实验性的。但他发起 PR 的瞬间,工作模式发生了转换:他将一段相对完整的工作成果“委派”给另一个人(或一个系统)进行审查和集成。GitHub 在2008年将这一机制产品化后,彻底改变了全球软件开发的方式。
现在回看 Every 的描述:“长期运行的智能体(如 Claude Managed Agents)接手团队交付的工作”与“实时协作的桌面应用(如 Codex)”。前者就像是那个在后台处理 PR 的审查系统——它不需要你盯着看,它按自己的节奏运行,完成后再将结果返还给你。后者则像是你本地编辑器中的 AI 结对程序员——它必须实时响应你的每一次按键、每一次思考的偏转。
2003年,软件架构师 Martin Fowler 和 Matt Foemmel 撰写了一篇名为《Continuous Integration》的文章,提出了一个关键区分:有些集成工作必须“同步”地高频进行,否则成本会指数级上升;而有些探索性工作必须在“异步”的隔离状态下完成,否则会拖垮整个团队的生产率。这个区分至今仍适用于 AI 工具。用 Codex 写策略文档,需要的是高频、实时的思维碰撞——这是同步工作。让 Claude 智能体在后台爬取和分析市场数据——这是异步任务。用错了模式,就如同要求 Git 必须每秒钟向服务器 commit 一次,或要求 PR 审查者在你的屏幕上实时评论你的每一行代码。
Aha 瞬间
“AI 工具的分裂不是创造了一个新问题,而是迫使人类第一次正视一个老问题:我们的认知工作中,哪些必须是对话,哪些必须是信件?”
发芽 02:深度解读 — 为什么“分配经济学”理论只说对了一半
种子
材料提到,“分配经济学”的论点只对了一半——它能解释委派给智能体的工作,却无力处理与人协作的另外一半。为什么?因为人的判断力无法被简单地“分配”出去;它只能在人与 AI 的实时交互中被“生成”出来。
故事主体:通用汽车与丰田的“管理即生产”之辩
1980年代初,美国汽车工业面临一个深刻的管理哲学危机。通用汽车(GM)的管理者信奉一种我们今天可能称为“委派式”的管理:高层制定战略和指标,然后将它们分配下去,通过层层KPI系统追踪执行结果。在这种模式下,管理者的核心工作是在办公室中做出决策,再将决策“委托”给组织执行。
同一时期,丰田生产系统(TPS)开始引起世界关注。丰田的管理哲学截然不同:管理者必须亲自走到生产线现场,与工人、机器、材料进行实时互动。这就是著名的“现地现物”(Genchi Genbutsu)原则。丰田的工程师不是在办公室里看完报告再做决策,而是必须站在发生问题的机器前,用自己的眼睛观察,用自己的双手触摸。新乡重夫(Shigeo Shingo)在1980年代为美国管理者讲解丰田方法时,反复强调一个看似矛盾的观点:“改善不是从报告中产生的,它产生于观察与对话的瞬间。”
为什么这至关重要?因为报告可以告诉你“产量下降了5%”,但它无法传达机器的异常震动、工人的微妙犹豫、材料的难以言说的质感变化。这些信息只有在实时协作中才能被感知,而它们往往是真正创新和根本解决的来源。
将这场管理哲学冲突映射到今天的 AI 工具分裂上,材料中描述的“委托”模式就像是通用汽车式的管理:定义目标、分配任务、等待结果。它在处理边界清晰、判断标准明确的任务时效率极高。但“协作”模式更像是丰田的现场主义:你不能把“写一篇直击痛点的战略分析”委托出去,因为“直击痛点”的判断标准本身就是模糊的,它需要在你与 AI 的来回对话中逐渐被“看见”和“生成”。
这就是为什么“分配经济学”解决了委派的效率问题,却无法触及协作的本质。美国管理学者亨利·明茨伯格(Henry Mintzberg)在1973年的经典著作《管理工作的本质》中早已指出,管理者的工作中充满了“软信息”——闲聊中捕捉到的情绪、表情中的犹豫、走廊里偶然听到的抱怨。这些信息无法被写入报告,因此无法被委托。AI工具的分裂,恰恰暴露了知识工作中那条最古老的裂缝:能被形式化的任务走向了委派,而仍需要主体感知和判断的工作必须留在人与 AI 的协作现场。
Aha 瞬间
“你可以将‘写一篇分析报告’的任务委派给智能体,但你不能将‘判断什么值得分析’的眼光委托出去——因为眼光不是在任务终点被接收的,而是在协作现场的摩擦中被擦亮的。”
发芽 03:哲学升华 — 从“工作”到“引导”,注意力经济下的新主体性
种子
当 AI 工具开始分裂,“工作”本身的定义也随之裂变。人类角色正在从任务的“执行者”转向“引导者”:在协作模式中,你引导AI的注意力;在委派模式中,你引导 AI 的方向。问题不再是“我该做什么”,而是“我该引导什么”。引导力正成为新的核心能力。
故事主体:从管弦乐团指挥的诞生看“引导者”角色
19世纪以前的欧洲音乐演奏中,并无“指挥”这个独立的职业角色。乐团通常由第一小提琴手或羽管键琴演奏者边演奏边给出提示来维持协调。指挥作为一种不从属于任何乐器的独立角色,是在19世纪中叶才正式确立的——这与乐队规模扩大、作品复杂性剧增直接相关。
1843年,赫克托·柏辽兹(Hector Berlioz)出版了他的《管弦乐法》,系统论述了如何组织大规模的乐器编制。同一时期,费利克斯·门德尔松(Felix Mendelssohn)在莱比锡格万特豪斯管弦乐团确立了现代指挥的基本范式:指挥家不再演奏任何乐器,他的全部工作就是“引导”——用手势、眼神和身体的微小动作,向演奏者传达速度、力度、句法和情感意图。指挥家不产生任何物理上的声音,但乐团的每一丝声音都是他意志的延伸。
这个历史转折与今天的 AI 工具分裂之间存在一个平行的哲学结构。当一个任务可以被完整地编码、明确其边界和验收标准时,它就可以被“委派”——就像乐团中每一位演奏者独立完成自己声部的技术执行。但“协奏模式”更接近指挥的角色:你不需要亲自演奏每一个音符,但你必须在音乐流动的每一刻都参与其中,用实时反馈引导方向、校正音色、调整情感张力。
哲学家吉尔伯特·赖尔(Gilbert Ryle)在1949年区分了“知道什么”(knowing-that)和“知道如何”(knowing-how)。传统的知识工作侧重于前者:知道事实、掌握信息、完成具体操作。但引导者的位置要求的是后者:知道如何感知一个协作过程的走向,知道何时介入、何时放手,知道如何在不控制细节的情况下塑造整体。这是一种高度内化、难以言传的行动中的知识。
材料中 Every COO Brandon Gell 谈到如何在新生儿子和自己身上“灌输好奇心”,这看似与 AI 无关,实则触及了引导者角色的深层本质:好奇心不是可以被委派的查询任务,而是一种只有在实时响应和不断调整中才能保持活性的状态。当AI接管了执行层,人类的价值将愈发集中在一个古老而难以自动化的区域:保持好奇、保持对质量的感知、保持对意外发现的开放——这些都是引导,不是执行。
Aha 瞬间
“当机器学会了工作,人必须学会引导。而引导的第一课是:引导者不演奏乐器,但他使所有人的演奏成为音乐。”
你的思考空间
- 在你当前的工作中,哪些任务是你正在尝试“委派”给AI的,哪些任务是你仍需要“协作”的?这种分界线在过去三个月里是否发生过移动?移动的方向说明了什么?
- 如果“引导力”成为未来的核心能力,我们现有的教育体系和绩效评估系统如何能够识别和培养这种能力?或者,它们是否正在系统性地压制它?
- 当AI同时承担“协作者”和“被委派者”两种角色时,我们对“信任”的定义是否需要被重新校准?我信任一个协作中的AI与我信任一个后台运行的智能体,这两种信任的本质区别是什么?
- 材料中提到生物技术的R&D成本在AI帮助下下降。如果“提一个好问题”的成本正在归零,那么“什么是好问题”的判断力是否会自动增长?还是说,提问成本越低,判断力反而越稀缺?