当编辑发现我写得像AI——现在AI会先一步抓住我
原文:My Editor Caught Me Sounding Like AI. Now AI Catches Me First.
在最近与Every主编 Kate Lee 的一对一沟通之前,我打开共享文档,发现一份我自己的写作败笔清单正盯着我。我的草稿沾染了太多AI的痕迹——那种你我从老远就能认出来的特征:对称的句子结构、那种修辞上的清嗓子式铺垫、乍一听深刻但细看空洞无物的措辞,还有那些恼人的“三点式”排比。
最糟的是,我本该更懂行。我就是Every那个“用AI写关于用AI写作”的人。我有定制化的智能体、风格指南、编辑工作流,还有一种似乎无底线的热情,要把每一条教训都变成一套系统。然而,我依然多次让机器的流畅假象代替了自己的判断力,以至于编辑们觉得必须出手干预。
那次会后,我做了一件每当学到新东西时通常都会做的事——不管是令人尴尬的还是其他类型的:我把它编入了智能体的文档中。我打开笔记,提取出Kate标注过的模式,将它们列在一个名为 /guardrails 的新技能里。这个技能会把任何与我协作写作的智能体,变成一位严苛的编辑专家,让我保持诚实。
/guardrails 这类审查技能永远不会真正完工,因为我自己那些人类特有的小毛病和倾向会像个扭动的幼儿一样到处乱窜。但我宁愿犯新错误,也不想重复旧错误。审查技能就是我的实现机制。它们是另一种形式的编辑,能在那些令人恼火的薄弱环节变成人类编辑的麻烦之前,先把它们揪出来。
我的guardrails技能的开头部分,这里汇集了所有会导致我提交的内容达不到标准的具体方式。(图片均由Katie Parrott提供)
用AI写作常被描绘成一笔交易:机器做得更多,因此人类就做得更少。但根据我的经验——这也是Every CEO Dan Shipper 在《自动化之后》一文中论点的一个缩影——AI改变的是人类做什么,而非减少工作量。我必须清晰地定义自己的标准,好让模型能够理解。这确实产生了更多工作——但这帮助我自己更好地理解了这些标准。
设置 /guardrails 这类审查体系需要时间、注意力,以及对 Codex 或 Claude Code 这类工具的熟悉。但一旦审查程序就位并运转起来,我就可以花更多时间把草稿从好推向卓越。现在我的草稿干净多了,我对自己偏好的了解也不再那么模糊,因为我不得不反复思考和谈论它们,以至于它们在我的大脑中刻下了新的沟回。
我将展示几个我依赖的审查器及其内部构造(我会把这组审查器随本文一起发布在Every的GitHub上)。但这应当作为示例,而非蓝图;这整套流程的独门秘方,在于设定并执行你自己的一套风格要求。
万物皆为技能
任何好的护栏系统,其开端都是技能。
在机制层面,一个技能就是一个内含指令的Markdown文件。但实质上,它是一种打包判断力的方式。当我调用 guardrails 技能时,我是在要求模型通过一组透镜来审读草稿:寻找AI痕迹、模糊论断、回避性措辞、软弱的开篇,以及所有那些让一篇行尸走肉般的草稿看起来完成品一样,实则全无灵魂的细微方式。
我对命名惯例已经到了狂热的地步。毕竟,技能名字得好记,你才能在需要时想起它——尽管随着模型版本的每一次更新,这一点正变得不那么重要,因为AI越来越擅长自行决定需要哪些工具来完成任务。即便如此,“评估叙事动力”听起来像是某人放进项目管理工具里的任务,而之后不久所有相关人员都会丧失活下去的意愿。所以我没有使用临床诊断式的描述,而是给了那些更具编辑性质的技能它们自己的“人格”:Sorkin 是一位身负职责的审查者。他想让文章始终保持边走边聊的节奏,而不是陷在无关紧要的细节泥潭里。类似地,Mom想知道,那些不像我一样对AI过度着迷的读者,会在哪里迷失方向。Asshole 则想攻击论点中最薄弱的版本,这很烦人——因为有时候那最薄弱的版本恰好就是我写的。
每个审查者都在问一个不同的问题。它们加起来,给了我一种在把草稿交给人类编辑之前对其进行压力测试的方法。我希望人类编辑的注意力,能花在只有人类编辑才能解决的问题上。我们的大脑应该用在文章的切入角度、核心主张、叙事方式和受众匹配度上。你知道,就是那些有意思的部分,而且带着点利害关系。
穿越护栏考验
下面这张图可以让你感受一下,在把一篇文章交给编辑之前,我所做的一个典型的终审是什么样子:
一份全面的清单,展示了12个智能体在草稿提交给编辑前进行审阅的流程。
这份起飞前检查清单,是在我对一篇文章已经完成了起草、争辩、重写和反复阅读很多遍之后才开始的。到了这个阶段,写作是我的,无论AI在起草阶段是否参与其中。AI的工作是寻找那些我最可能错过的东西,因为我累了,我投入了感情,或者我太深地陷在草稿的逻辑里,已经看不清它真正的面目了。
这个终审阵容可能看起来过度了——它确实过度。当一个模型能帮你快速搞出一个看起来挺像样的草稿时,危险在于,那种一眼看去貌似深刻的文字,实际上只是AI在自我陶醉。我设计这些审查者,就是为了进行尽可能严密的检查。
不同阶段,不同审查者
有了我的护栏系统,真正有意思的地方在于,把我所有的焦虑能量都引导到写作过程的每个阶段去调用它们。
在提纲阶段,我要对论点施加压力。在起草阶段,我要行级的审查来抓住我的小毛病。一旦有了完整的草稿,我要审查者与整篇文章进行辩论。而在我把它交给编辑之前,我需要一份检查清单,来扫除我那疲惫大脑错过的所有东西。
就是这篇文章的guardrails审查输出的开头部分。
提纲阶段:痛击论点
第一轮护栏发生在提纲阶段,这时候我还没有成文的散文可以让我变得斤斤计较。我把结构发给那些职责是寻找弱点的审查者。Hitchcock 寻找张力。Sedaris 寻找幽默感。而当我真的想自我折磨时,还有 /asshole,它被设定为对论点进行最不友善的诠释,这样我就可以强化它。
Hitchcock技能正在审阅草稿的悬念感。是否存在一颗“桌子下的炸弹”,能让读者想继续读下去?
在这个阶段,我要看到鲜红色标出的结构性问题,无论是读者无法跟上的论断、出现得过早的章节段落,还是没有回报的铺垫。提纲是我还可以对作品的大部分进行重新编排和重新框定,以形成最强论点的阶段。
章节初稿:尽早抓住弱句
等到我准备好进入起草阶段时,我已经完全处于混乱模式,所以我倚赖那些能帮我清理问题的技能。我逐个章节地写,每写完一个章节,在继续下一个之前,我会先运行 /ai-check 和 /guardrails。我在试图趁那些标志性的平滑痕迹还只限于局部时,就把它们抓住。
我还会运行 Every 的资深编辑 Jack Cheng 的 /tighten-draft 技能。Jack 根据自己多年的编辑直觉构建了这个技能,用来发现那些会在草稿中积累、并让读者读起来负担很重的冗余。这便是技能的快乐之一:编辑 品味 变得可以被分享。我的工作流可以承载我的标准、Kate 的反馈、Jack 的编辑规则、Every 的机构风格,以及任何一个我在深夜11点,因为某篇草稿以全新的方式惹恼了我而决定发明出来的奇奇怪怪的审查者。
完整草稿:让文章还嘴
一旦我有了完整的草稿,审查的重点就会从细节移回到大方向上。我运行一次发展性审查,检查论点、结构、利害关系和收尾回报。然后我运行一个针对特定专栏的审查:比如给这篇文章运行 /working-overtime,或者其他任何适合该稿件的专栏技能。这一轮检查,会看这篇文章是否完成了我在风格指南中列出的所有标志性结构动作:从活生生的个人摩擦出发,展示混乱的中间过程,将个人经历与更宏大的AI时代工作问题连接起来,最后递交给读者一些实质可用的东西。
这也是我调用一种更高级的技能构建形式的地方:编排,即将多个技能和智能体串联起来执行更复杂的任务。我创建了一个名为 /panel 的命令,它会召集一组我的审查者,进行一次更全面的审查。首先,审查组阅读草稿的上下文:文章类型、目标读者、所处阶段和写作目标,这些信息它都从构思采访阶段和我的 Working Overtime 风格指南中获知。然后,它会就面前的问题提出适合的审查者人选——或者让我自己挑选。就这篇草稿而言,我让它运行了 Mom 负责可理解性,Hitchcock 负责张力,Sorkin 负责动力,Sedaris 负责幽默。这和逐个召唤智能体不同,因为其产出是对它们所有反馈的综合,而不是针对某一件特定事物的检查。
/panel 召集了一组审查者,对一篇趋于提交的草稿发表意见。
在所有审查者并行运行之后,一个综合器会统一审读它们的反馈。它寻找共识性的发现、富有建设性的矛盾、独到的见解、建议的优先级,以及这篇文章一直在绕着走的最为棘手的一个大问题。某个审查者可能想删掉一个章节,另一个可能会认为那个章节恰恰是全篇最有生命力之处。综合报告会原样保留这种分歧,因为这种张力告诉我,这篇文章正在要求我做出怎样的决定。然后,我,一个人类,得去琢磨如何做出这个决定。
以下是审查组给我这篇草稿留下的最后一大问题:
“这到底是一篇关于一个正在顺利运转的系统的文章,还是一篇关于一个写作者因为自身的默认设定总是在失灵,而不得不持续构建基础设施的文章?审查者可以告诉你,这篇文章目前正在和稀泥——在中间兜售系统,在角落里暗示着失控滑坡。开篇、中段和结尾都会因这个答案的不同而改变。Hitchcock 说得最直白:这种剧情感只有在情况属实时才成立。那么,它到底是哪种?”
终审:运行团队清单
最后,我让这篇稿子跑一遍团队积累下来的编辑肌肉记忆,这些记忆已被打包在我们共享的技能中。我重新运行 /ai-check,因为修订过程可能会重新引入那种“助手腔”。我也重新运行 /guardrails,而且通常来说,它总能找到一些我在写作过程中要么新增出来的、要么因为太自恋而舍不得在前几轮杀掉的小习惯。
然后我再运行 /tighten-draft,外加 /kate-top-edit——一个基于 Kate 审核期望构建的技能:含糊的“这个”、“这些”开篇句,无来源的数据,没有依托的引语,未标明身份的人,未经解释的术语,缺失的 Every 链接,回避性措辞,营销腔,句子片段,以及我们编辑团队不惜一切代价学会规避的AI痕迹。
人类审查是最终的微调
到了工作流的这个节点,整个系统看起来像是在提供针对AI的防护。更全面的真相是,它很大程度上是在保护我,不让我自己的盲区伤害自己,尤其当我已经疲惫到无法活出最佳自我时。用AI写作,用哈利·波特里疯眼汉穆迪的话说,需要“时刻保持警惕”。但话说回来,不使用AI的写作,同样如此。
有些审查者抓住的是模型的习惯,比如过于干净的过渡,以及用对称结构替代思考的句子。另一些则抓住的是 Katie 本人的习惯:我使用过于频繁的措辞,我比读者更享受的聪明句构,以及那些当时觉得机灵但隔天早上再看就令人尴尬的小修辞花招。
这个过程是持续且不完美的。我们是容易犯错的生物,我们的机器也一样,所以总会有新的怪癖需要驱逐。养成更新旧技能、增加新观察项的习惯非常重要,同时,也要不断创建新技能来强制执行你在沿途发现的新标准。
这也是为什么我把这篇文章配上一个共享仓库发布。我希望你能把技能拉取下来,打开它们,并为自己的AI写作冒险——及其各种翻车事故——所用。
下面是起步指引:
- 打开 GitHub仓库。点击 “Code”,再点击 “Download ZIP”,解压整个文件夹。
- 在 Codex 或 Claude 应用中打开该文件夹。
- 告诉你的智能体:“阅读 README 文件,并帮我安装这些审查者技能。用通俗的语言解释每一步。”
- 选择一个审查者,在你熟悉的一篇草稿上运行它。
- 记下它抓住了什么,弄错了什么,以及遗漏了什么。请求你的智能体根据这些反馈更新审查者的 SKILL.md 文件。
- 再次运行,重复这个过程,直到反馈变得真正有用。
你不需要以 fork 仓库的方式来起步。Fork 是在GitHub上创建自己的副本,如果你想要追踪自己的改动或接收未来更新的话,这会很有用。
拿走这个仓库。给审查者们起些有意义的名字。把那些纯粹代表 Katie个人病理特征的给删了。添加新的来预防你自己的坏习惯,不管是法律上的过度引申、没有根据的主张、虚假的深刻、行业术语,还是炒作话术。教会机器保护作品,防止它落入默认设定之中——不仅是机器的默认设定,更重要的是,你自己的默认设定。
核心启示:这篇文章真正的力量不在于展示一套自动查错系统,而在于揭示了一个深层转变:当你不得不把模糊的写作标准翻译成AI能理解的精确指令时,你也在被迫将自己的隐性知识显性化——在这个过程中,你不再只是写得“更干净”,而是更清晰地理解了自己的思考方式、审美标准和那些一犯再犯的思维惰性。换句话说,教机器做你的编辑,到头来是在让你成为自己最清醒的批评者。

My Editor Caught Me Sounding Like AI. Now AI Catches Me First. 的发芽报告
材料核心
Katie Parrott 在被编辑指出稿子充满AI痕迹后,没有放弃使用AI,而是反向将编辑的批评、同事的品味和自身的弱点打包成一系列AI审查技能,在交稿前用机器来捕捉自己——无论是人类还是AI——的默认低质量输出。
发芽 01:从“减负”到“换负”——AI重新分配了认知劳动
种子
材料中有一句点睛之笔:AI写作“改变了人类做什么,而不是减少了工作量”(it changes what the human does instead of reducing the workload)。这不是一个技术观察,而是一个劳动哲学命题。我们通常将自动化等同于“少干活”,但Katie的经历揭示了一个更微妙的现实:AI取消了某些劳动(如初稿生成),却迫使人类承担起一种更陌生、更费力的新劳动——将隐性判断转化为显性规则。
为了不让稿件听起来像AI,她必须把自己阅读文章时那种“说不上哪里不对,但就是不对劲”的直觉,拆解成AI能理解的具体指令。这是一种前所未有的认知外化:把品味、风格、甚至“有脉搏”的感觉,从人类大脑的神经网络迁移到AI的指令文件里。
故事主体:泰勒的“科学管理”反转
1911年,弗雷德里克·温斯洛·泰勒(Frederick Winslow Taylor)出版了《科学管理原理》。他手持秒表走进工厂,将熟练工人的身体动作分解成最小单位,剔除所有“多余”动作,然后将这些最优序列写进操作手册,交给任何一个未经训练的工人去执行。泰勒的核心理念是:把工人的隐性知识从他们脑子里拿出来,装进管理者的系统里。结果呢?工人变成了执行系统指令的肉体机器,他们的判断力被系统吞噬了。
Katie做的事情,在形式上与泰勒如出一辙:她把编辑和自己大脑里那种“这个开头太虚”“这个三段式排比是AI在自嗨”的判断,分解、命名、写进 Markdown 文件,然后让AI代理来执行审查。但本质上的区别才是关键:泰勒系统的受益者是管理者,被简化的是工人;而Katie系统的受益者是作为作者的她自己,被简化的是粗糙的初稿。
泰勒制把人的隐性知识剥夺了,交给了机器(和资本);Katie的/guardrails系统把AI的隐性缺陷(以及她自己的写作恶习)暴露出来,交给了另一台机器去纠察。人类从“被系统约束的对象”变成了“设计约束系统的主体”。这不是人服从机器,而是人把一部分自我审查的认知负担卸载给了机器,以便把大脑留给真正需要人类判断的事——文章的立意、叙事节奏、情感共振。
Aha 瞬间
“自动化最深刻的影响不是让人类变懒,而是逼迫人类面对一个更难的问题:我们到底想要什么?”
发芽 02:命名即驯服——人格化审查者如何解锁自我认知
种子
Katie给审查技能赋予人格化名字——Sorkin, Mom, Asshole, Hitchcock, Sedaris——这个行为表面上是一种记忆术(好记的名字比“narrative_momentum_assessor”更容易在疲惫时被想起),但它的深层价值远不止于此。
当我们无法清晰定义自己所有标准时,人格化是一种认知捷径:把“让文章保持行走和对话的节奏”这个概念,打包进一个叫“Sorkin”的角色里,比写一个精确的算法定义容易得多。更关键的是,这些角色迫使你站在外部视角审视自己的作品。你不是在问“我写得怎么样”,而是在问“Asshole觉得我最弱的论点是什么”。
故事主体:荣格的“积极想象”与多重自我
卡尔·荣格(Carl Jung)在1913年至1930年间发展了一种名为“积极想象”的技术。在与弗洛伊德决裂后,荣格陷入了一段深度的心理迷失期。他的方法不是压抑内心的声音,而是主动与那些从无意识中浮现的人格——智慧老人、影子、阿尼玛——进行对话。他将这些内在角色视为独立实体,认真聆听他们的观点,与他们争论,甚至记下他们的对话内容。荣格认为,人格本身就是一个“多重体”,完整的自我不是消灭那些不同声音,而是学会在不同的声音之间穿行、整合。
Katie的审查者团队是荣格“积极想象”在写作工作流中的技术化实现。她创造了Asshole(专门攻击论点最弱版本)、Mom(担心非极客读者迷路)、Hitchcock(寻找悬疑感)——这些不是花哨的名字,而是她内在编辑声音的外部投射和具体化。当你是一个人坐在电脑前写作时,你很难同时扮演“创作者”“冷酷批评者”“小白读者”“叙事顾问”四个角色。大脑的单线程特质决定了你一次只能用一种声音思考。
AI代理改变了这一点。它们可以并行运行,各自忠实于自己那个简化的、极端的视角,然后让Katie这个人类来做最后的综合判断。/panel命令的设计尤其精妙:它保留了不同意意见之间的张力——“一个审查者认为某段应该砍掉,另一个认为它是全文最有生命力的部分”——然后把这个未解决的矛盾交还给人类。这恰好是荣格心理整合过程的技术翻版:不是选择其中一个声音,而是与矛盾共存,让矛盾指引你走向更深层的理解。
Aha 瞬间
“我们不是在训练AI更像人类;我们是在用AI把自己训练成一个更好的团队。”
发芽 03:编辑体系的“时间折叠”——活的品味库
种子
材料中有一个容易被忽略的细节:Katie的工作流不仅包含她自己的技能,还纳入了Jack Cheng的/tighten-draft技能(基于他多年的编辑直觉)和团队共用的/kate-top-edit技能(封装了主编Kate的审稿标准)。这意味着,当她运行审查时,她不是在调用一个静态的语法检查器,而是在同时与多个编辑的积累智慧对话——包括那些此刻并不在她身边的人。
这是一个关于“组织记忆”的全新可能性:编辑品味,这种通常需要通过数年师徒制、海量批注和无数次“你这里写得不够好”的模糊反馈才能传递的东西,现在正被部分地编码为可运行的指令文件。
故事主体:中世纪的学徒制与现代编程的抽象层
在14世纪的欧洲,要成为一名石匠大师,一个年轻人需要从学徒做起,花7到10年时间与师傅同吃同住同劳动。师傅不会给学徒一本《石匠操作手册》;学徒通过观察、模仿、纠正,逐渐将师傅的判断力“内化”到自己手上和眼里。这种知识转移是高度人际化、缓慢且不可复制的。一个师傅终其一生只能带出寥寥几个徒弟,而一旦师傅去世,他那些“知道这面墙这样砌才稳当”的隐性知识就永远消失了。
现代编程有一个核心理念叫“抽象层”:底层复杂的硬件指令被封装进操作系统,操作系统被封装进高级语言,高级语言被封装进库和框架。每次封装都让后来者不必再重复造轮子,可以站在前人的肩膀上直接解决更高层级的问题。
Katie的审查技能体系在做一件类似的事:将Kate的编辑判断、Jack的删减本能、她自己在深夜写作中发现的模式,封装成一个个可重复调用、可共享的“品味层”。新加入Every的写作者不再需要花三年时间坐在Kate旁边感受她“这个开头太虚”的编辑哲学;他们可以拉取Katie的GitHub仓库,运行/kate-top-edit,立即获得Kate品味的一个近似版本。
这当然有局限——一个技能文件不可能完全等于一个人多年的判断力,就像抽象层总有泄露底层细节的时候(leaky abstraction)。但它做了一件重要的事:让品味变得可累积和可传递。一个编辑退休或离开,她大脑里的隐性知识不再彻底消失;一部分会被留在那些Markdown文件里,成为组织肌肉记忆的一部分。
Aha 瞬间
“未来的大师不会只活在三五个关门弟子的肌肉记忆里;他们的品味被编译成文件,在每一个需要他们的深夜审查中醒来。”
你的思考空间
Katie的系统是用AI来审查AI的痕迹和人类的弱点。如果有一天,AI学会绕过这些审查技能,开始写出“听起来不那么像AI,更像Katie的弱点刚刚好”的文本时——我们是应该升级审查规则,还是重新思考“真实性”的定义?
当编辑品味可以被封装为技能文件并跨组织共享时,“经过某个编辑之手”这件事还有多少价值?如果全行业的优秀AI写作者都在使用类似的审查技能库,写作风格会不会走向一种新的、更狡猾的同质化?
Katie将自己的写作弱点暴露给了她的AI代理团队。在这个过程中,她究竟是在“认识自己”,还是在把自己规训成一个“符合系统标准的高效输出者”?自我认知和被系统规训之间的那条线在哪里?
如果塔勒布读到这篇文章,他可能会问:当你建立了如此精密的审查防线来消除一切脆弱性时,你是否也同时过滤掉了那些只有“不完美”才能带来的反脆弱收益——那些笨拙但真实、断裂但有力、偶然但天才的东西?