构建于变动之上
6月12日,Anthropic 禁用了 Fable 5——这是 Every 团队用过的最强大的编程模型。一项美国政府禁令迫使该公司向所有用户关闭了它。没有预警,也没有迁移窗口。我们依赖的模型,原来并不属于我们:一家公司——或者一个政府——可以在一夜之间将其关停。
这种不稳定性,构成了我们本周工作的底色。

高级应用 AI 工程师 Nityesh Agarwal 花了数周时间围绕 Claude 的局限性进行构建,却眼睁睁看着 Anthropic 新的动态工作流一夜之间解决了这个问题——他说,这就是在前沿工作的代价。Laura Entis 和 Katie Parrott 报道了 loops(循环工作模式:你给智能体一个目标,它分轮次工作,每轮审查结果并重新提示自己,直到成果足够好)正从工程领域快速进入非技术性工作。增长负责人 Austin Tedesco 用同样的方式,一夜之间构建了一个 NBA 模拟器,并重构了 Every 的订阅流程;Katie 写的那部分文章,则是一份当某个前沿模型突然消失时的应对手册。而 Mike Taylor 尝试了一件更为奇特的事:他构建了 GitHub 首席运营官 Kyle Daigle 的 AI 分身,这样真实的对话就可以聚焦于那些公开记录无法告诉他的事——你可以在本周的 AI & I 节目中听到这次对话。此外,Hoop 的联合创始人兼 CEO Stella Garber 重构了一个内部工具,使其原生支持智能体——然后开始将其交付给客户。周四的版本将完善本周内容,包括团队给自己设定的可以跳过的 AI 话题、一个把你的 Slack 机器人当作同事对待的工作流程,以及 Mistral 出人意料地出现在 G-7 AI 谈判桌上。——Kate Lee
知识库
“我采访了 GitHub COO 的 AI 版本——然后跟真人聊了聊” 作者 Mike Taylor / Also True for Humans:在微软 Build 大会上采访 GitHub COO Kyle Daigle 之前,Mike Taylor 先用基于 Daigle 公开记录构建的 AI 版本过了一遍他的问题。这个模拟版本未能回答的地方,恰好标记了公开信息的边界。他把真实的对话集中在模型无法知道的事情上:Daigle 周末在三台机器之间切换编程的习惯、GitHub 的自动模型路由机制,以及 Daigle 用来评估自己沟通方式的一个智能体循环。阅读这篇文章,了解这种采访前的模拟技术。
🎧 🖥 “GitHub 如何应对每月 1700 万个 Pull Request” 作者 Mike Taylor / AI & I:随着智能体涌入 GitHub——提交量从去年的 10 亿次跃升至今年预计的 140 亿次——客座主持 Mike Taylor 询问 COO Kyle Daigle,平台如何帮助开发者应对这股浪潮,同时避免告诉社区该信任哪些 pull request。观看或收听这个节目,了解这个世界代码家园在人人用智能体交付代码时如何适应。🎧 🖥 在 Spotify 或 Apple Podcasts 上收听,在 YouTube 上观看,或在 X 上关注讨论。
“Anthropic 如何让 Claude 更可靠” 作者 Laura Entis / Context Window:Anthropic 新的动态工作流让 Claude Code 能够自己制定计划,并通过一项长任务运行多个子智能体。高级应用 AI 工程师 Nityesh Agarwal 对此感受直接:他花了数周时间为 Every 的 AI 项目经理 Claudie 构建的自定义变通方案,一夜之间就过时了。阅读这篇文章,了解 Mini-Vibe Check 以及动态工作流在哪些场景下真正发挥作用。
“为非编程人员准备的循环工作模式” 作者 Laura Entis 和 Katie Parrott / Context Window:循环——即智能体达到一个停止点后,自己编写新的提示词并继续前进——已经从工程领域跨越到了日常非技术性工作中。增长负责人 Austin Tedesco 用了与一夜之间构建 NBA 模拟器相同的设置来重构 Every 的订阅流程和定价页面。此外,Katie Parrott 还提供了一份应对手册,告诉你当依赖的模型像 Fable 那样突然消失时该怎么做——保存你的会话记录,在窗口期抓紧构建,并弄清楚哪些工作真的需要用到前沿模型。
“我们构建了自己的原生智能体工具。它彻底改变了我们构建软件的方式。” 作者 Stella Garber / Every:Stella Garber 和 Hoop 的两位联合创始人——他们都不是工程师——构建了一个内部 AI 工具,以一种智能体原生的方式整理他们散落的客户通话笔记。他们将模型交给几个工具,让它在 Slack 内部进行推理,而不是编写一系列固定的提示词——这种架构现在他们也交付给了自己的客户。阅读这篇文章,了解智能体原生的构建过程。
核心启示
我们正在构建的 AI 工作流,脚下的地基是别人的产品——理解这种不稳定性,并为之做好预案,本身就是前沿工作者需要内化的能力。 无论是 Anthropic 动态工作流一夜淘汰了手工构建的变通方案,还是美国政府一纸禁令让 Fable 模型瞬间消失,这些事件共同揭示了一个真相:在这个领域,你控制不了的远比你控制得了的多。那些看似前沿的能力,既可能被平台的一次更新化为己用,也可能被外力突然收回。真正持久的,不是对某个模型的依赖,而是你围绕“变动”建立的适应机制——比如保存会话记录、在窗口期快速构建、以及诚实判断哪些工作根本不需要前沿模型。
Built on Moving Ground 的发芽报告
材料核心
在 AI 模型随时可能因政府禁令或公司决策而消失的现实中,Every 团队记录了一周的技术实践与反思——从被禁用的 Fable 到 Anthropic 一夜之间让定制工作过时的动态工作流,再到循环(loops)从工程领域溢出到非技术工作,最终落点在 AI 无法替代的人类经验中那种无法预料的真实感。
发芽 01:当基础设施有了开关
种子
原文开篇的事件——美国政府禁令导致 Anthropic 禁用 Fable 5,毫无预警,没有迁移窗口——揭示了一个被技术乐观主义掩盖的残酷事实:我们正在把认知劳动的基础设施建立在“别人的土地上”。这不只是 AI 模型的商业风险,它暴露了一种新的依赖性结构,其中生产工具的“所有权”已经变成了“访问权”,而这个访问权随时可以被一个不在同一时区的决策者切断。
1956 年,美国电话电报公司(AT&T)在反垄断和解协议中被迫开放其晶体管专利,任何公司只需支付 25,000 美元即可获得授权。这一决策催生了硅谷,因为它把一项关键技术的控制权从单一公司的围墙里释放了出来。但今天的 AI 模型走的是相反的路。Anthropic、OpenAI、Google 不仅持有模型权重,还控制着推理端点、上下文窗口大小、安全过滤层和地理可用性。当 Fable 被禁用时,Every 失去的不只是一个模型——他们失去了建立在那个模型上的工作流、提示工程积累、以及团队围绕它形成的协作节奏。
这种脆弱性在历史上的类比不是软件停服,而是 1970 年代石油禁运。当 OPEC 在 1973 年切断对美国的石油供应时,暴露的不是石油的物理稀缺,而是整个经济体系对一种外部控制的资源的深度依赖。加油站排起长队只是表面,真正被颠覆的是“廉价能源永远在线”的假设。Fable 的消失是对 AI 从业者的一个缩微版石油危机:它告诉你,那些嵌入工作流最深的模型,恰恰是地基最不稳固的。
Aha 瞬间
“你花钱买到的不是工具,是工具的临时访问券——而发券的人可以随时把门关上。”
发芽 02:劳动沉淀的保质期
种子
Nityesh Agarwal 花了几周时间围绕 Claude 的局限性构建定制化解决方案,结果 Anthropic 的动态工作流一夜之间让这些努力变得多余。他称之为“在前沿工作的代价”。但这不只是个人成本的故事,它揭示了 AI 时代一个更深层的结构问题:当平台的能力更新速度快于你消化上一次更新的速度时,你投入的劳动不是被“替代”了,而是被“作废”了——它们从未进入可积累的资产池。
经济学里有一个概念叫“创造性破坏”,熊彼特用它来描述新技术摧毁旧产业的过程。但创造性破坏假设淘汰的是“旧范式下的资本存量”——比如蒸汽机淘汰了帆船。而 Nityesh 的经历指向的是另一种东西:他的工作不是被“更好的方案”淘汰,而是被“同一供应商的版本更新”清零。这更像是你在手工砌墙,砌到一半,砖厂通知你砖头升级了,但新砖的尺寸和旧砖不兼容,你砌好的那半堵墙需要拆掉重来。
这种劳动沉淀的脆弱性在软件开发的历史中有迹可循。1990 年代,企业花费数百万美元部署 SAP 系统,定制了成千上万行 ABAP 代码。当 SAP 推出新版本时,这些定制代码中的相当一部分需要重写——不是因为逻辑错了,而是因为底层接口变了。但 SAP 的升级周期是三到五年,企业有时间摊薄迁移成本。而 AI 模型的迭代周期按月计算——Anthropic 的动态工作流从研究到上线只需数月——劳动沉淀的保质期被压缩到可能还不如一袋面包。
GitHub COO Kyle Daigle 在接受 Mike Taylor 采访时提到的一个细节与此形成有趣的对照:GitHub 正在构建自动模型路由器,让开发者不用关心底层用的是哪个模型。这是在为“地基不稳”提供抽象层——如果你不在任何一块地基上停留太久,那么任何一块地基的沉陷都不会让你跌倒。但抽象层本身也是需要维护的劳动沉淀,谁来保证那个路由器的稳定性?
Aha 瞬间
“在更新以月为单位的世界里,你能积累的不是解决方案,而是‘知道解决方案会过时’的经验本身。”
发芽 03:不可复制的那个句子
种子
Ashwin Sharma 在“Alignment”板块写下的段落是本材料最具情感张力的部分。他读着詹姆斯·鲍德温 1953 年的《向高山宣告》,被鲍德温的一句话击中——“约翰的心对主刚硬。他的父亲是上帝的牧师,天国之王的大使,而约翰若不先跪拜他的父亲,就无法跪拜恩典的宝座。”然后 Ashwin 回忆了一场 AI 写的婚礼致辞——那个本该说出“无法复制的话”的时刻被交给了机器,输出的却是“可以写给任何人”的泛泛之词。
这个对比不是关于“AI 写得不好”——AI 写的东西在语法和结构上可能没有缺陷。问题在于,AI 在生成文本时运作的是概率分布,而鲍德温的句子之所以有穿透力,恰恰因为它不在任何概率分布的中心。鲍德温写“约翰不能跪拜上帝因为必须先跪拜父亲”这件事,不是从训练语料中检索到的宗教父子关系的典型表达,而是从一个具体的、历史的、身体的体验中长出来的——一个 1930 年代哈莱姆区黑人少年,站在教堂里,感受到父亲的目光像秤砣一样压在自己后颈上。
这里可以引入维克多·什克洛夫斯基在 1917 年提出的“陌生化”概念:艺术的目的是打破感知的自动化,让人重新“看见”事物而不是“认出”事物。什克洛夫斯基举的例子是托尔斯泰,他会从一匹马的视角描述人类社会的财产制度,让你突然意识到“私有财产”这个你每天都理所当然活在其中却从未真正思量过的概念有多荒诞。AI 生成的致辞之所以失败,不是因为缺乏技巧,而是因为它的运作机制本质上是“自动化”的反面——它从语料的平均分布中取样,输出的是对“婚礼情感”这个类别的最高概率估计,而不是对一个特定的人、一个特定的关系的“陌生化”呈现。
鲍德温的句子能让你从自动化中醒过来。AI 的致辞只能让你停留在自动化里面。这两者的差距不是一个技术优化的问题,而是一个本体论的问题——你正在处理的东西,是“经验的表达”还是“表达的模拟”。
Aha 瞬间
“能打动人的不是写得多好,而是写得只有你才能写出来——而‘只有你’这个条件恰好是概率模型无法满足的。”
你的思考空间
如果你今天发现你最依赖的 AI 工具明天会消失,你手头有什么是独立于那个工具仍然有效的?你的工作流中哪些部分是可以迁移的,哪些是和工具“长在一起”的?
Nityesh 花费数周建立的定制方案被一夜淘汰——你上一次投入大量精力却很快被技术更新清零是什么时候?那段经历给你留下了什么可以跨平台携带的能力?
你上次写下或说出一句“只有你能说出来”的话是什么时候?在什么情境下你会倾向于把表达交给 AI,而在什么情境下你必须自己说?那个边界在哪里?