非编码者的循环之道

原文:Loops for Non-coders


AI 既令人振奋,又让人不安。就在你以为自己的配置已经稳定下来时,一个强大的新模型突然发布——或者,就像 Anthropic 的 Fable 5 那样,被突然禁用。今天,我们从多个角度来探讨这种不稳定性:特约撰稿人 Katie Parrott 描绘了伴随 Fable 禁令而来的悲伤(以及应对机制),并分享了一份实用手册,供你在依赖的模型消失时参考;增长负责人 Austin Tedesco 解释了循环(loops)如何促使他重新思考与 AI 协作的方式;GitHub 首席运营官 Kyle Daigle 则向 AI & I 客座主持人 Mike Taylor 讲述了公司如何应对由智能体(agent)生成的提交量激增。


“AI & I”:GitHub 能服务于每一个人吗?

今天,我们发布了一期新的播客节目 AI & I。技术咨询负责人 Mike Taylor 本周担任客座主持,与 GitHub 首席运营官 Kyle Daigle 探讨了在每个人——以及他们庞大的智能体军团——都能交付代码的当下,公司如何应对。

数量级极其惊人:去年,GitHub 上有 10 亿次提交(commits)。Daigle 表示,今年这个数字将毫无悬念地超过 140 亿次。这把 GitHub 推到了一个重要但微妙的境地:它必须帮助开发者处理智能体生成的代码,但不能去规定各社区应该信任或合并哪些拉取请求(pull requests)。

可以在 XYouTube 上观看,在 SpotifyApple Podcasts 上收听,或阅读文字记录。若想了解播客制作的幕后故事,可以看看 Mike 的文章,他放弃了常规的准备工作,转而构建了一个 AI 版 Daigle 并进行模拟访谈。

以下是核心要点:

  • 开发者与非开发者的界限正在消失:GitHub 长久以来对“谁算开发者”持宽泛看法,但 AI 彻底打破了这个定义。法务、财务、销售和市场营销专业人员都在使用 GitHub Copilot 应用来构建原型和应用。“很多业界所称的知识工作者,或者说那些本职并非开发者的人,都在使用这些工具,”Daigle 说道。
  • 智能体可以编写和审查代码,但由人类决定发布什么:GitHub 已构建了智能化的代码审查和合并工具,以帮助开发者应对激增的拉取请求。但运营开源项目的人,最终应自行决定合并哪些外部提交。“我们希望提供工具,”Daigle 说,“但真正把控制权留给他们。”
  • Daigle 每天都对自己运行一个循环:在 AI 领域,循环(loop)指的是这样一个周期:智能体完成工作,根据目标或标准评估结果,吸收反馈,然后重复这一过程,直到任务完成或输出得到改善。Daigle 用同样的工作流来改进自己的沟通风格——每天,一个智能体会审查他过去七天滚动的电子邮件和 Slack 消息,识别其中的模式,提供建设性反馈,并检查他是否采纳了它的建议。

错过了之前的节目?可以回听 Dan 近期与 LinkedIn 联合创始人 Reid Hoffman、构建了 Claude Code 的团队 Cat WuBoris Cherny、Vercel 联合创始人 Guillermo Rauch、播客主 Dwarkesh Patel 等人的对话,了解他们如何利用 AI 来思考、创造和连接。


Every 内部视角

循环,循环,还是循环

“我完全被循环说服了(super loop-pilled),”增长负责人 Austin Tedesco 说道。他不是唯一一个。循环——让 AI 通过迭代周期来处理一个目标,即完成一部分任务、审查结果、吸收经验,然后生成下一步——最近已成为 Every 内部热议的话题。

虽然有些人已经用了一段时间——比如 Kieran Klaassen ,他是基于循环的工程哲学——复合工程(compound engineering)之父——但更新、更强大的模型使得这种方法也能应用于非代码的工作流。

对 Austin 来说,Fable——愿它安息,至少是暂时的——是让他领悟到循环威力的关键。那个“顿悟”时刻,发生在他给模型一个简单提示的时候:

给我做一个类似《足球经理》的 NBA 模拟游戏:基本上就是没有比赛操作的《NBA 2K》王朝模式。我想假装自己是一名 NBA 总经理,进行真实的交易。通过 /LFG 流程来构建——即那个进行头脑风暴、规划、构建、审查和改进的复合工程工作流——然后让它循环运行一整夜。

当他醒来时,他得到了一个可运行的 NBA 球队管理层模拟器。让他震惊的是模型处理任务的方式:Fable 会到达一个停顿点,检查缺少了什么,给自己写一段新的单段落提示,然后继续前进。在某个时刻,它意识到游戏需要 NBA 特有的薪资上限逻辑,包括球队在 7 月 1 日前放弃自由球员的规则。它还模拟了一个完整的赛季并记录了发生的情况,以便检查游戏的行为。

Austin’s one-shotted NBA front-office simulator. (Image courtesy of Austin Tedesco.) Austin 一次性构建的 NBA 球队管理层模拟器。(图片由 Austin Tedesco 提供)

Every 的增长团队已经使用相同的设置来改进我们的订阅流程,并创建了一个全新的定价页面。我们提供了目标、背景和期望的输出,然后智能体就循环完成了其余部分。

尽管 Fable 暂时无法访问,Austin 正尝试在 Codex 中使用 /goal 功能来重现该周期的部分内容。/goal 这个功能能为 Codex 提供一个持久的目标,使其在更长周期的会话中持续为之努力。

获取 CEO Dan Shipper用于循环的 Fable 提示词,或者直接借鉴 Austin 的工作流:

  1. 定义问题和输出。 例如:“我们的订阅流程和定价页面转化效果不理想。找出薄弱环节,并提出可以在 Figma 中实现或模拟的新实验。”
  2. 给智能体一个审查自己工作的方法。 提供它判断一个想法好坏所需的材料:为谁而建,这些用户想做什么,他们当前的体验是怎样的,数据显示人们在哪里卡住了,竞争对手有哪些不同的做法,以及它需要遵守哪些限制条件。然后,要求它在写下一个提示之前,对照这些背景来测试每个想法。
  3. 启动循环。 告诉智能体:“当你到达一个停顿点时,为自己写一段单段落提示,说明下一步如何改进,然后继续,直到结果有实质性改善。”让它生成定价页面变体、Figma 实验或网站改动。然后审查输出,并决定哪些值得采取行动。

脉动检查

你最喜欢的模型总会消亡

当 Every 测试过的最佳编程模型 Fable 在 6 月 12 日关闭时,科技社区经历了一个压缩版的悲伤五阶段。这预演了每当一个模型消失时你应该期待什么。以下是哪些做法有帮助,以及下次模型权重消失时该怎么做。

在需要之前,先保存会话

当你依赖的模型即将发生变化时,不要急于寻找替代品——首先,停止丢弃证据。模型的计划、编辑、测试、失误和修复都存在于 Web 应用的聊天记录和你电脑的日志文件中,你可以重复利用这些记录。

一位以 CuddlySalmon 名义发帖的 Fable 用户,在服务关闭前保持了一个会话,并报告说在 Claude 回退到 Opus 4.8 后,该会话似乎仍承载着 Fable 的上下文——尽管他们承认这可能是一厢情愿。另一位用户使用 Codex 辅助智能体,从旧的 Fable 运行记录中挖掘设计选择。

现在就做: 从你所依赖的任何模型中导出几个会话,保存它所做工作的完整轨迹,而不是整洁的摘要。那些奇怪的小选择正是你以后会需要的。

趁有机会时赶紧构建

当关闭的消息传到 Every 的公司 Slack 时,Dan 给团队下了一道命令:“赶紧,把所有东西都构建出来。”在我们拥有的三天时间里,Every 最大限度地利用了这个机会。我们用 Fable 构建了一个指环王版本的图形编辑器 Kid Pix、一个开源的卡牌构建工具,以及一个交互式着色器工具,每个都只用了一个下午。

现在就做: 当一个全新的前沿模型问世时,给你的团队时间和空间,在最初几天进行实验。你可能不会再有第二次那样的三天冲刺。

确定哪些工作真正需要前沿模型

关闭后的第二天早上,Dan 问团队,如果 Fable 真的消失了,他们会怎么做。Kieran 说他会像以前一样使用 Opus。负责我们语音应用 MonologueNaveen Naidu 说他会回到 Codex。Every 的平台负责人 Willie Williams 则会把 Codex 作为日常工具,并将 Plus One 工厂迁回 Opus。

你的大部分工作从一开始就不需要顶级模型。但有些确实需要。在用 Fable 构建开源幻灯片工具 hands-on-deck 时,Every 的高级 AI 工程师 Nityesh Agarwal 注意到,他的要求越雄心勃勃,模型的输出也就越雄心勃勃——两者相互推高。在 Opus 上,这种牵引力消失了。他仍然可以完成工作,只是失去了尝试更大版本的推动力。

现在就做: 拿一个真正的 Fable 量级的任务,在你备用的模型上运行。如果它通过了,那这项工作从来就不需要顶级模型,所以别再为它多付钱了。如果失败了,你就找到了值得保护的工作,也知道了该把精力放在哪里。

为模型的消失而构建

把这次服务中断看作是一次在不同模型间迁移工作的消防演习。这意味着工作必须是可移植的,而且你必须能够检查错误。

在可移植性方面,运营非营利组织 Blockchain Commons 的 Christopher Allen 构建了一个 Claude 工作流套件,它以 Git 跟踪的纯文本文件形式,捕捉了目标、待办事项列表、做出的选择、吸取的教训、当前任务、下一步和阻碍因素。因为所有东西都存在于文件中而不是聊天记录里,所以新模型可以立即接手工作——任何关键信息都不会滞留在已不存在的对话中。在验证方面:如果你无法判断工作是否正确,仅有可移植的交接是不够的。你还需要一个内置的检查——一个模型可以明确通过的“完成”规则测试——来证明工作确实完成了。

本周就做:
  • 通过备用模型运行一个实际任务。 选一个你经常做的、其输出你可以评判的任务。
  • 写下新模型无法恢复的内容。 将这些选择、示例、偏好和“完成”规则移入项目文件中。
  • 添加一个证明工作已完成的测试。 最快的备份方式,是那个能展示其工作的模型,即使它的风格让你毫无感觉。

Fable 可能会回来。但无论如何,你接下来要依赖的模型,都不应该有能力让你的工作随之崩溃。—— Katie Parrott


讨论

“我感觉自己像是搭上了最后一班离开越南的飞机。我认为我无法再规划一个正常长度的职业生涯了,至少在这个领域是这样。”—— Christopher Pack,软件开发者,在《华尔街日报》上说道

几十年来,技术学位一直是最可靠的、通往稳定高薪工作的门票。(因此才有了那么多针对文科生的“学编程吧”的嘲讽。)如今,MVP 申请者、初级和中级软件工程师们正在为日益减少的岗位而竞争,因为 AI 接手了他们越来越多的工作。据《华尔街日报》报道,即使是经验丰富的程序员也在为裁员做准备,他们囤积现金、进行高风险的股票市场押注,或者考虑转行。


核心启示:AI 模型的快速迭代和不确定性,要求我们不仅要学会驾驭当下的工具,更要建立一套不依赖于任何单一模型的工作习惯和系统架构,让知识和流程本身具备可移植性。

原文配图

Loops for Non-coders 的发芽报告

材料核心

当 AI 模型突然消失或能力降级时,非编程人员可以通过“循环”——让 AI 在自我审视和迭代改进中自主推进复杂任务——将前沿模型的价值从一次性代码生成扩展为持续的、可迁移的创造力基础设施。


发芽 01:从工具到流水线——循环如何将创造力规模化

种子

Austin 一觉醒来获得 NBA 模拟器的那一刻,真正令人震撼的不是 AI 能写代码,而是循环将“孤立的生成行为”变成了“有记忆的建造过程”——模型不仅能完成任务,还能自己找出缺失的逻辑、弥补漏洞,并继续前进。这种能力转变的本质,是把 AI 从听从指令的工具变成了拥有内部反馈回路的建造系统。

1851 年,水晶宫博览会上展出了一件令参观者困惑的展品——美国军械工人制造的六把步枪,每一把的零件被拆散混在一起后,随机挑选零件仍能重新组装出六把完整的枪。在此之前,枪械是手工逐一打造的,每把枪的零件都是独特的,损坏就意味着整体报废。伊莱·惠特尼的可互换零件系统改变了这一切:生产不再是围绕单一成品,而是围绕可组装、可替换的标准件。这不是更快地制造枪,而是从根本上改变了制造的可能性——规模化、维修、升级都变得可能。

Austin 的循环工作流实现了类似的范式跃迁。当 Fable 自动识别出“需要 NBA 薪资帽逻辑”并自行研究“球队在 7 月 1 日前放弃自由球员的规则”时,它不是在执行预设指令,而是在一个可积累、可复用的构建流程中插入了一个标准化组件。Christopher Allen 的 “Claude 工作流套件”更进一步——将目标、待办事项、决策、经验教训全部以纯文本文件形式保存在 Git 中。这意味着循环的输出不再绑定于某个特定模型的对话历史,而是变成了可被下一个模型接手的“标准化零件”。

这就是循环为非编程人员打开的局面:创造力不再是一次性的喷射,而是可积累、可移植、可规模的流水线。你不需要知道如何写代码,但你需要知道如何设计一个能自我完善的建造系统。

Aha 瞬间

“循环不是让 AI 替你做事,而是让 AI 建立一个能持续改进的可互换零件系统——模型的更替不再是灾难,而是流水线的正常升级。”


发芽 02:驯养与野生之间——模型消失的生态学启示

种子

Fable 的突然关闭在技术社区中引发了一场压缩版的哀伤五阶段,这不是一次普通服务的下线,而是人与 AI 之间关系深刻转型的预演。Katie 的建议——保存会话、趁热打铁、区分什么工作需要前沿模型、为模型消失而构建——其实指向同一个核心问题:当 AI 既是工具又是合作者时,我们如何保持自主权?

1998 年,生态学家 Daniel Janzen 在研究哥斯达黎加热带森林时提出了一个反直觉的观点:没有完整生态系统,物种保护注定失败。他观察到,即使将濒危的卷柏鹟圈养繁殖,一旦放回野外,它们仍会因无法完成迁徙循环而死去——因为迁徙路线上的特定补给森林已经被砍伐殆尽。Janzen 的结论是:“你无法在动物园里拯救生态关系。”一个物种的生命力,深嵌在它与其他物种、栖息地、季节性节律的关系网络中。

AI 模型也是如此。Fable 不是孤立的工具,它是一个被 Every 团队“生态化”了的实体——他们建立了提示库、设计了 /LFG 工作流、形成了将 Fable 能力特性映射到任务类型的集体认知。当 Fable 消失时,失去的不仅是一个模型,还有围绕它生长的整个实践生态。这解释了为什么 Dan 会喊出“quick BUILD EVERYTHING”——他是在抢救生态关系,趁栖息地消失前尽可能多地完成生命周期的循环。

但 Katie 的最终建议指向了更深层的答案:不要让你的工作依赖于单一模型的关系网络。Christopher Allen 的工作流套件实际上是在创造一个模型无关的“生态系统骨架”——目标、约束、测试标准、决策记录——让任何新模型都能像新来的物种一样,迅速接入已有关系网络。非编码人员的终极能力不是驯化某个模型,而是培育一个模型可以来去的生态系统。

Aha 瞬间

“你不是在驯养一个 AI,而是在为创造力构建一个生态系统——模型来了又走,生态关系留下了。”


发芽 03:软件与自我——循环作为认知扩展术

种子

当 GitHub COO Daigle 描述他每天运行的“自我改进循环”——AI 审查他七天内的邮件和 Slack 消息,识别模式,提供反馈,并检查他是否接受了建议——我们很容易误以为这是在优化沟通。但更深层的事情正在发生:循环正在模糊工具使用与自我反省的边界,AI 从任务执行者变成了认知过程的参与者。

1960 年代,英国哲学家 Gilbert Ryle 在他的著作《心灵的概念》中区分了“知道什么”(knowing-that)和“知道如何”(knowing-how)。前者是陈述性知识——你可以写成手册的东西;后者是程序性知识——嵌入在行动中的能力,比如骑自行车、讲一个好笑话、写出有说服力的邮件。Ryle 的核心论点:知道如何不能还原为知道什么。你永远无法通过背会游泳动作的物理公式就学会游泳,你必须下水。

Daigle 的循环之所以有力,是因为它触及了 Ryle 意义上的深层转变。传统上,AI 工具帮我们处理“知道什么”——总结信息、生成代码、翻译文本。但当一个循环让 AI 反复观察你的邮件模式、向你呈现行为趋势、并追问你是否改了,它开始涉足“知道如何”的领域——帮你看到你自己看不到的沟通习惯,一种曾经只能通过长期师徒制或痛苦自我觉察才能获得的程序性知识。

这解释了为什么最好的非编程工作流——无论是 Austin 的 NBA 模拟器还是 Every 的定价页改进——都需要“给 AI 评审自己作品的材料”。评审不仅仅是质量控制,它是让循环成为认知扩展的外壳:AI 不只做,它还“看”,并根据所看调整所做的。而这正是人类学习的方式。你不需要成为程序员才能使用这个能力,但你确实需要的是一种以前只有程序员才有的思维习惯——将判断标准外化、将试错过程显性化、将改进循环制度化。

Aha 瞬间

“编程是让机器做事,循环是让机器在做的同时观察自己如何做事——这是非编程人员获得的不只是自动化,而是一种新的认知方式。”


你的思考空间

  • 如果你的团队今天失去了最依赖的 AI 工具,哪些已完成的工作会因为依赖“冻僵”的模型关系而无法复现?你有哪些决策理由、测试标准、失败教训是只活在对话记录里而没有沉淀为独立文件的?
  • Daigle 用循环审查自己的沟通风格——你不觉得被一个没有血肉的实体审视自己的行为模式会改变“自我反省”的意义吗?当观察者本身没有羞耻、没有宽恕、没有共情能力时,我们接受它的反馈机制和接受人的反馈机制会有何不同?
  • 如果你把 Austin 的“一觉醒来获得完整模拟器”的体验推得更远——当循环不再需要人类给出目标,而是开始自己定义“什么值得改进”时,创造力是从人类转移到了机器,还是在人与机器之间创造了一种新的混合体?你准备好被称重的不是你的生产力,而是你的判断力了吗?