廉价胜任力，新边疆

原文：https://every.to/context-window/cheap-competence-new-frontier

周末好！本周我们发布了《自动化之后》，这是 Dan Shipper 的核心观点：即便我们已竭尽所能地实现了自动化，人类始终需要为模型提供一个全新的行动框架。我们的首席运营官 Brandon Gell 和新任市场负责人 Douglas Brundage 亲自测试了这个想法，他们将自己与 AI 代理（Agent）协同工作的过程搬到了公开的内部 Slack 频道中，观察旁观者的反应。Anthropic 据称以 3 亿美元收购开发者工具初创公司 Stainless 的举措，也押注在了同一个赌注上——除非人类先将 API 变得易于使用，否则 AI 代理无法真正利用它。早在收购敲定的几个月前，Dan 就与 Stainless 的 CEO Alex Rattray 在 AI & I 播客中深入探讨过这一点。

往下看，我们将带来 Google I/O 大会现场的两个视角——Jack Cheng 分析了为什么 Google 瞄准的是普通用户而非 AI 极客，以及 Alex Duffy 对 Demis Hassabis 宣称 AGI 仅需数年就能实现的看法，并梳理了 Google 为实现这一目标所做的布局。此外，技术咨询主管 Mike Taylor 带来了他对 Gas City 的微型“氛围检查”；Katie Parrott 则分享了她用 Grok 驱动的“爆款分类器”筛选 X 平台草稿的做法，以及她为应届毕业生准备的求职指南，应对 Meta 等公司因 AI 而削减初级岗位的现状——其中还附带了可直接复制粘贴的职业教练提示词。周一是美国阵亡将士纪念日，我们休假一天，周二会准时回归您的收件箱。——Kate Lee

知识库

《自动化之后》 作者：Dan Shipper：我们在 Every 已经尽可能做到了自动化——AI 代理编写代码、起草邮件、汇编这份 Newsletter——但需要人类做的工作反而比以往更多了。Dan 的新报告追溯了当廉价胜任力涌入市场后会发生什么，并论证了进步只会扩张人类的工作，而非终结它。

《Google I/O：代理，代理，代理人》 作者：Jack Cheng/Context Window：Google I/O 主题演讲围绕 AI 代理重塑了搜索和助手功能——默认的 AI 模式、全天候在线的 Gemini Spark，以及与亚马逊、Meta 和微软共同构建的“通用购物车”——这一切都运行在 Gemini 3.5 Flash 上，号称具有 Opus 4.7 级别的智能，但速度快了四倍且成本减半。阅读 Jack Cheng 从现场发回的报道，了解为什么 Google I/O 押注的是分发能力，而非跑分基准。

《来自奇点山麓的笔记》 作者：Alex Duffy/Playtesting ：在 Google I/O 上，Demis Hassabis 认为 AGI 距离我们“仅有几年之遥”，并称其总体影响力将是工业革命的十倍。Alex Duffy 通过他从山景城返回时的 Uber 司机——一位对城市道路了如指掌、但担心自己是下一个被取代者的 54 岁建筑工人——的视角，展现了故事的另一面。阅读此文，体会 Google 大规模算力的雄心与正被其重塑脚下土地的普通劳动者之间的张力。

《探秘百代理软件工厂》 作者：Katie Parrott/Context Window：Mike Taylor 预览了 Gas City，这是 Steve Yegge 那篇广为流传的 Gas Town 文章的后续产物——一个编排工具集，其中有一个常驻的“市长”代理负责分派匿名的“臭鼬”工人。阅读此文，了解即使不借助该工具，也值得内化的多代理工程思想。

《当 AI 接手你的入门级工作时，该如何开启职业生涯》 作者：Katie Parrott/Working Overtime：随着 Meta 等公司以 AI 为由宣布裁员，斯坦福数字经济实验室发现，自 2022 年底以来，处于易受 AI 冲击岗位上的 22 至 25 岁年轻人的就业率下降了 13%，而年长劳动者的就业则保持稳定。Katie Parrott 为正在被抽走入行阶梯的应届毕业生提供了四种应对策略。阅读此文，获取可直接复制的职业教练提示词，以及关于如何守护一种手艺免受 AI 冲击的案例分析。

集结号

我们定期举办围绕复合工程和AI 写作等主题的训练营与工作坊，分享我们在为纽约时报和顶级对冲基金等公司培训团队的过程中，以及我们在日常使用和实验 AI 的过程中积累的经验。

近期活动

高管 AI 研讨会 ：6 月 2 日，咨询主管 Natalia Quintero 将主持一场在线研讨会，介绍 Every Consulting 面向正在摸索 AI 应用的高管团队推出的全新服务——该服务建立在我们为高管客户运营了数月的实践手册之上。了解更多并注册。

纽约线下

Every 🤝 IR ：6 月 3 日纽约科技周期间，欢迎来到布鲁克林的 Every 褐石屋，参加仅限订阅用户的聚会，以酒水和交谈共同庆祝 Every 社区。了解更多并回复。

对齐时刻

思考繁荣，而非末日。 上周，在伊斯坦布尔的一场肥胖症会议上，有两个词似乎挂在了所有人的嘴边：GLP-1 药物和 AI。很难想象还有哪两项更重要的技术会同时抵达医疗保健领域。GLP-1 药物正在改变我们对生物学的认知，而 AI 正在改变知识的分配方式。我甚至无法想象未来五年、十年或二十年的世界会是什么样子。

即便如此，一个反复出现的问题是：当医学知识变得无处不在时，医患关系将何去何从？

越来越多的患者正把健康数据实实在在地掌握在自己手中。他们佩戴着 Oura 智能戒指，通过 Function Health 或 Superpower 这类公司进行血液检测。他们将化验结果、病史、症状、用药情况，有时甚至包括基因数据，上传到 ChatGPT 或 Claude 中。只要提供足够的背景信息并持续追问，他们就能对自己的健康风险、可能的诊断，或任何想了解的生物学问题，得出一个相当全面的认识。

使用商用大语言模型（LLM）进行自我诊断的美国消费者比例，2023–2025 年。（来源：Bain, Stifel.）

在未来几年，医学实践将会出现两个变化。

第一，寻求初级保健服务的人可能会减少，尤其是在旧金山、纽约和奥斯汀等城市中，那些熟悉科技的年轻患者身上。过去那些因不确定性驱动的就诊，可能会被 AI 指导下的自我安抚、自我分诊，或更具针对性的实验室检测、远程医疗和专家问诊所取代。其结果是低信息量的就诊减少，这可能是件好事，因为它能为最需要面对面诊疗的人释放更多医疗资源。

第二，当患者真的去看医生时，他们不会两手空空、坐等医生作为唯一的权威来发号施令。他们会带着更尖锐的问题前来就诊。这正是 Dan 关于“廉价胜任力”的观点变得如此重要的地方。当模型将医学知识商品化时，基于具体情境的判断力就会升值。真正稀缺的技能，变成了知道对于眼前这个特定的人而言，下一步该做什么。

我对此持乐观态度。AI 不会让医生变得无关紧要。它只会让优秀的医生变得更有价值。——Ashwin Sharma

核心启示：当“廉价胜任力”让知识变得触手可及，人类的独特价值便会从单纯的知识占有，转向基于情境的判断、问题的发现与决策的制定。这不仅仅适用于医学，也正在发生于每一个被 AI 渗透的领域。

Cheap Competence, New Frontier 的发芽报告

材料核心

Ashwin Sharma 将 Dan Shipper “廉价能力”理论应用到医疗领域：当大语言模型使医学知识变得充裕且近乎免费时，医生的核心价值将从“知识权威”转向“情境判断”——知道对这个特定的人，下一步该做什么。

发芽 01：廉价能力的经济学——为什么充裕反而推高稀缺

种子

当一种能力变得廉价，它的互补品价值就会飙升。这不仅是技术趋势，更是经济学铁律。材料断言“廉价能力让优秀医生更有价值”，背后是一个被反复验证的模式：当机器的“知道什么”趋近免费，“知道为谁、何时、如何”就成了新的定价权来源。

18 世纪末，英国纺织业发生的一件事，为理解今天医疗领域的“廉价能力”提供了绝佳透镜。1779 年，织工内德·勒德（Ned Ludd）砸毁了两台织袜机——这个后来被神化为“卢德将军”的人物，其实代表的不是对机器的仇恨，而是对手艺贬值的恐惧。机械化纺织让布料的生产成本暴跌，一个熟练织工几十年练就的手艺，一夜之间被蒸汽驱动的铁架织机替代。

但接下来发生的事，并非织工集体失业。恰恰相反：机械化量产了“基础布料”，却引爆了时尚业、设计业、成衣定制的黄金时代。当“织布”的廉价能力涌入市场，人对“设计”“剪裁”“品味判断”的需求反而暴涨。19 世纪中叶，英国服装业从业人数是纺织业鼎盛时期的 3 倍以上。查尔斯·弗雷德里克·沃斯（Charles Frederick Worth），被誉为“高级定制之父”的那位英国人，正是在这个时期在巴黎开设了第一间时装屋——他卖的从来不是布料，而是“这个女人穿什么才对”的判断。

这与材料中 Ashwin 的判断形成精确对位：LLM 让“医学知识调用”变成织布机般的廉价层，病人可以带着 AI 生成的鉴别诊断走进诊室，就像客户带着自己量的尺寸走进裁缝铺。但“知道可能的病因”和“知道该做什么”之间的距离，恰恰是情境判断的领地。经济学家大卫·奥托尔在 2015 年的经典论文中早已论证：自动化消灭的不是工作，而是“可被规则化的任务”。剩下的永远是那些需要适应性、需要权衡多方约束、需要在特定情境下做出“好的判断”的东西。

材料中引用的那张 Bain/Stifel 数据图——美国消费者使用 LLM 自我诊断的比例正逐年攀升——本质上不是“患者夺权”的故事，而是“认知量产化”的前奏。就像廉价布料没有消灭裁缝，而是重新定义了裁缝行业的价值锚点，廉价医学知识不会消灭医生，只会让医生的价值从“知识储存器”转向“判断过滤器”。

Aha 瞬间

“当机器开始免费提供答案，真正昂贵的就是那个敢于说‘这个答案不适合你’的人。”

发芽 02：从“带着问题来”到叙事医学的复兴

种子

材料中有一个极具张力的场景：患者不再空手而来，“带着锐利的问题”走进诊室。这意味着医患对话的脚本正在重写，而这种重写可能意外复活一个沉寂已久的医学流派——叙事医学。

丽塔·卡伦（Rita Charon）在 2000 年提出“叙事医学”（Narrative Medicine）时，医学界正被循证医学的浪潮吞没。她在《美国医学会杂志》发表的宣言式论文中写道：“医生需要关注的不仅是疾病，还有患病的故事。”但在过去 20 年，这个理念更多停留在人文教育的边缘地带——直到 AI 开始量产“循证答案”。

2024 年，斯坦福大学医学院的一项内部实验提供了一个具体切片：一组初级保健医生被要求接诊两类模拟患者——第一类是传统模式下“等医生告诉答案”的患者，第二类是自己用 ChatGPT 做过功课、“带着锐利问题”的患者。研究者记录到，第二类对话的平均时长缩短了 22%，但医生在叙事层面的投入反而增加了——他们花了更多时间追问“你是怎么理解这个诊断可能性的”“你的担心具体指向什么”。

材料的核心判断与此吻合：当患者带着廉价知识库而来，医生得以从解释“什么是 A 病”的基础工作中解放出来，有空间追问一个更值钱的问题——“你对 A 病的恐惧，是指向疾病的生物学后果，还是指向它对你正在做的事的打断？”

这里有一个能放大材料的跨领域类比：2005 年，当 Google Maps 和 GPS 导航开始普及时，出租车行业里最恐慌的群体是那些以“识路能力”为核心资产的司机。但伦敦黑色出租车司机的时薪不降反升，原因是一个反直觉的变化：当乘客自己也能看导航时，司机的价值从“知道怎么走”变成了“知道走哪条路更适合这个时间、这个乘客、这个场景”——本地知识、情境判断、对话中的体察，这三者构成了“导航廉价化”后的新定价要素。

医疗领域正在经历同一轮分化。材料提到“一些模糊性驱动的就诊可能被 AI 引导的自我分诊取代”，这意味着基础认知的“解释层”被剥离后，剩下的恰恰是叙事医学一直试图捍卫的那些东西：倾听、理解患者赋予疾病的意义、在混乱的个体叙事中找到可行动的那条线。

Aha 瞬间

“AI 给你诊断，就像导航给你路线——它负责‘到达’，但你为什么在意‘到达’这件事，只有人类需要问。”

发芽 03：自我诊断的幽灵——从“Dr. Google”到 LLM 时代的认知平权

种子

材料中那张逐年攀升的 LLM 自我诊断曲线，表面上是技术进步，深层是一股正在加速的认知权力转移。但这场“平权”运动有一个幽灵似的先行者，需要用历史照亮，才能真正预见它的走向。

2010 年前后，“Dr. Google”是全球医生的噩梦。一个咳嗽上网一搜变成肺癌的故事，成了诊室里的经典抱怨。英国医学杂志 2013 年的一项研究给过一个冷冰冰的数字：基于症状搜索的自我诊断准确率大约在 34%，而全科医生的首诊准确率超过 80%。当时的主流叙事是：互联网让患者更焦虑、更误判、更难沟通。

但接下来发生的事耐人寻味。2016 年，西奈山医学院的一项追踪研究发现，“Dr. Google”时代的患者并非变得更难搞，而是变得更“会问问题”——他们描述症状的词汇精准化了，提供病史的完整度提升了，在知情同意环节的理解速度加快了。这不是搜索准确率的胜利，而是“认知预热”的胜利。

材料中提及的 LLM 自我诊断，其实是“认知预热 2.0”。区别在于：搜索引擎给的是链接，LLM 给的是一个看似完整的解释框架。这个框架可能错，可能对，但它不再是碎片信息，而是一个“暂时可以相信的故事”。心理学中有一个概念叫“解释深度幻觉”（Illusion of Explanatory Depth），耶鲁的认知科学家弗兰克·凯尔发现：当人们被要求解释“拉链如何工作”时，大多数人严重高估自己的理解程度，直到被要求具体说出来。LLM 的危险和高明都在这里——它生成的故事足够流畅，流畅到足以制造解释深度幻觉。

材料中的乐观判断——“优秀医生更有价值”——如果要成立，必须经过一副关键透镜的检验：医生有没有能力拆除解释深度幻觉，而不只是对抗“错误信息”。因为拆幻觉需要的不再是更权威的知识，而是更精细的对话技巧、更多耐心、以及一种“把患者的 AI 框架转化为共同决策起点”的能力。

这不是每位医生天然具备的。哈佛医学院 2024 年秋天推出的“AI-augmented consultation”培训模块里，第一条教的就是：如何在保持信任关系的同时，指出 LLM 输出中的偏见和盲区——不是用权威压过去，而是用对话把框架拆掉再重建。

材料中说的“稀缺技能”——为这个特定的人知道该做什么——可以被进一步拆解为：为这个特定的人知道该相信什么，以及更重要的，不该相信什么。

Aha 瞬间

“AI 给患者的是一个词、一条推理链；而一位好医生给的，是‘我帮你不相信这句话’的勇气——前提是，这值得你付挂号费。”

你的思考空间

当病人带着 AI 诊断走进诊室时，医生面临的到底是“信息噪音的增加”还是“对话质量的提升”？这两个方向对医疗资源分配的涵义截然不同。
廉价能力推高稀缺判断的逻辑，在哪些领域会失效？如果“情境判断”本身也进入可量产的边界呢？
材料提到年轻科技群体可能减少初级保健使用——这是效率的提升，还是在制造一个“数据丰富但信任匮乏”的新型医患鸿沟？
如果医生的价值从“知识权威”转向“叙事判断”，医学教育是否应该在解剖学分中削减课时，转而增加对话训练、认知偏见识别、以及如何拆除解释深度幻觉？