廉价胜任力,新边疆

原文:https://every.to/context-window/cheap-competence-new-frontier


周末好!本周我们发布了《自动化之后》,这是 Dan Shipper 的核心观点:即便我们已竭尽所能地实现了自动化,人类始终需要为模型提供一个全新的行动框架。我们的首席运营官 Brandon Gell 和新任市场负责人 Douglas Brundage 亲自测试了这个想法,他们将自己与 AI 代理(Agent)协同工作的过程搬到了公开的内部 Slack 频道中,观察旁观者的反应。Anthropic 据称以 3 亿美元收购开发者工具初创公司 Stainless 的举措,也押注在了同一个赌注上——除非人类先将 API 变得易于使用,否则 AI 代理无法真正利用它。早在收购敲定的几个月前,Dan 就与 Stainless 的 CEO Alex RattrayAI & I 播客中深入探讨过这一点。

往下看,我们将带来 Google I/O 大会现场的两个视角——Jack Cheng 分析了为什么 Google 瞄准的是普通用户而非 AI 极客,以及 Alex DuffyDemis Hassabis 宣称 AGI 仅需数年就能实现的看法,并梳理了 Google 为实现这一目标所做的布局。此外,技术咨询主管 Mike Taylor 带来了他对 Gas City 的微型“氛围检查”;Katie Parrott 则分享了她用 Grok 驱动的“爆款分类器”筛选 X 平台草稿的做法,以及她为应届毕业生准备的求职指南,应对 Meta 等公司因 AI 而削减初级岗位的现状——其中还附带了可直接复制粘贴的职业教练提示词。周一是美国阵亡将士纪念日,我们休假一天,周二会准时回归您的收件箱。——Kate Lee


知识库

《自动化之后》 作者:Dan Shipper:我们在 Every 已经尽可能做到了自动化——AI 代理编写代码、起草邮件、汇编这份 Newsletter——但需要人类做的工作反而比以往更多了。Dan 的新报告追溯了当廉价胜任力涌入市场后会发生什么,并论证了进步只会扩张人类的工作,而非终结它。

《Google I/O:代理,代理,代理人》 作者:Jack Cheng/Context Window:Google I/O 主题演讲围绕 AI 代理重塑了搜索和助手功能——默认的 AI 模式、全天候在线的 Gemini Spark,以及与亚马逊、Meta 和微软共同构建的“通用购物车”——这一切都运行在 Gemini 3.5 Flash 上,号称具有 Opus 4.7 级别的智能,但速度快了四倍且成本减半。阅读 Jack Cheng 从现场发回的报道,了解为什么 Google I/O 押注的是分发能力,而非跑分基准。

《来自奇点山麓的笔记》 作者:Alex Duffy/Playtesting 在 Google I/O 上,Demis Hassabis 认为 AGI 距离我们“仅有几年之遥”,并称其总体影响力将是工业革命的十倍。Alex Duffy 通过他从山景城返回时的 Uber 司机——一位对城市道路了如指掌、但担心自己是下一个被取代者的 54 岁建筑工人——的视角,展现了故事的另一面。阅读此文,体会 Google 大规模算力的雄心与正被其重塑脚下土地的普通劳动者之间的张力。

《探秘百代理软件工厂》 作者:Katie Parrott/Context Window:Mike Taylor 预览了 Gas City,这是 Steve Yegge 那篇广为流传的 Gas Town 文章的后续产物——一个编排工具集,其中有一个常驻的“市长”代理负责分派匿名的“臭鼬”工人。阅读此文,了解即使不借助该工具,也值得内化的多代理工程思想。

《当 AI 接手你的入门级工作时,该如何开启职业生涯》 作者:Katie Parrott/Working Overtime:随着 Meta 等公司以 AI 为由宣布裁员,斯坦福数字经济实验室发现,自 2022 年底以来,处于易受 AI 冲击岗位上的 22 至 25 岁年轻人的就业率下降了 13%,而年长劳动者的就业则保持稳定。Katie Parrott 为正在被抽走入行阶梯的应届毕业生提供了四种应对策略。阅读此文,获取可直接复制的职业教练提示词,以及关于如何守护一种手艺免受 AI 冲击的案例分析。


集结号

我们定期举办围绕复合工程AI 写作等主题的训练营与工作坊,分享我们在为纽约时报和顶级对冲基金等公司培训团队的过程中,以及我们在日常使用和实验 AI 的过程中积累的经验。

近期活动
纽约线下
  • Every 🤝 IR :6 月 3 日纽约科技周期间,欢迎来到布鲁克林的 Every 褐石屋,参加仅限订阅用户的聚会,以酒水和交谈共同庆祝 Every 社区。了解更多并回复

对齐时刻

思考繁荣,而非末日。 上周,在伊斯坦布尔的一场肥胖症会议上,有两个词似乎挂在了所有人的嘴边:GLP-1 药物和 AI。很难想象还有哪两项更重要的技术会同时抵达医疗保健领域。GLP-1 药物正在改变我们对生物学的认知,而 AI 正在改变知识的分配方式。我甚至无法想象未来五年、十年或二十年的世界会是什么样子。

即便如此,一个反复出现的问题是:当医学知识变得无处不在时,医患关系将何去何从?

越来越多的患者正把健康数据实实在在地掌握在自己手中。他们佩戴着 Oura 智能戒指,通过 Function Health 或 Superpower 这类公司进行血液检测。他们将化验结果、病史、症状、用药情况,有时甚至包括基因数据,上传到 ChatGPT 或 Claude 中。只要提供足够的背景信息并持续追问,他们就能对自己的健康风险、可能的诊断,或任何想了解的生物学问题,得出一个相当全面的认识。

使用商用大语言模型进行自我诊断的美国消费者比例,2023–2025 年。(来源:Bain, Stifel.) 使用商用大语言模型(LLM)进行自我诊断的美国消费者比例,2023–2025 年。(来源:Bain, Stifel.)

在未来几年,医学实践将会出现两个变化。

第一,寻求初级保健服务的人可能会减少,尤其是在旧金山、纽约和奥斯汀等城市中,那些熟悉科技的年轻患者身上。过去那些因不确定性驱动的就诊,可能会被 AI 指导下的自我安抚、自我分诊,或更具针对性的实验室检测、远程医疗和专家问诊所取代。其结果是低信息量的就诊减少,这可能是件好事,因为它能为最需要面对面诊疗的人释放更多医疗资源。

第二,当患者真的去看医生时,他们不会两手空空、坐等医生作为唯一的权威来发号施令。他们会带着更尖锐的问题前来就诊。这正是 Dan 关于“廉价胜任力”的观点变得如此重要的地方。当模型将医学知识商品化时,基于具体情境的判断力就会升值。真正稀缺的技能,变成了知道对于眼前这个特定的人而言,下一步该做什么

我对此持乐观态度。AI 不会让医生变得无关紧要。它只会让优秀的医生变得更有价值。——Ashwin Sharma


核心启示:当“廉价胜任力”让知识变得触手可及,人类的独特价值便会从单纯的知识占有,转向基于情境的判断、问题的发现与决策的制定。这不仅仅适用于医学,也正在发生于每一个被 AI 渗透的领域。

原文配图

Cheap Competence, New Frontier 的发芽报告

材料核心

Ashwin Sharma 将 Dan Shipper “廉价能力”理论应用到医疗领域:当大语言模型使医学知识变得充裕且近乎免费时,医生的核心价值将从“知识权威”转向“情境判断”——知道对这个特定的人,下一步该做什么。


发芽 01:廉价能力的经济学——为什么充裕反而推高稀缺

种子

当一种能力变得廉价,它的互补品价值就会飙升。这不仅是技术趋势,更是经济学铁律。材料断言“廉价能力让优秀医生更有价值”,背后是一个被反复验证的模式:当机器的“知道什么”趋近免费,“知道为谁、何时、如何”就成了新的定价权来源。

18 世纪末,英国纺织业发生的一件事,为理解今天医疗领域的“廉价能力”提供了绝佳透镜。1779 年,织工内德·勒德(Ned Ludd)砸毁了两台织袜机——这个后来被神化为“卢德将军”的人物,其实代表的不是对机器的仇恨,而是对手艺贬值的恐惧。机械化纺织让布料的生产成本暴跌,一个熟练织工几十年练就的手艺,一夜之间被蒸汽驱动的铁架织机替代。

但接下来发生的事,并非织工集体失业。恰恰相反:机械化量产了“基础布料”,却引爆了时尚业、设计业、成衣定制的黄金时代。当“织布”的廉价能力涌入市场,人对“设计”“剪裁”“品味判断”的需求反而暴涨。19 世纪中叶,英国服装业从业人数是纺织业鼎盛时期的 3 倍以上。查尔斯·弗雷德里克·沃斯(Charles Frederick Worth),被誉为“高级定制之父”的那位英国人,正是在这个时期在巴黎开设了第一间时装屋——他卖的从来不是布料,而是“这个女人穿什么才对”的判断。

这与材料中 Ashwin 的判断形成精确对位:LLM 让“医学知识调用”变成织布机般的廉价层,病人可以带着 AI 生成的鉴别诊断走进诊室,就像客户带着自己量的尺寸走进裁缝铺。但“知道可能的病因”和“知道该做什么”之间的距离,恰恰是情境判断的领地。经济学家大卫·奥托尔在 2015 年的经典论文中早已论证:自动化消灭的不是工作,而是“可被规则化的任务”。剩下的永远是那些需要适应性、需要权衡多方约束、需要在特定情境下做出“好的判断”的东西。

材料中引用的那张 Bain/Stifel 数据图——美国消费者使用 LLM 自我诊断的比例正逐年攀升——本质上不是“患者夺权”的故事,而是“认知量产化”的前奏。就像廉价布料没有消灭裁缝,而是重新定义了裁缝行业的价值锚点,廉价医学知识不会消灭医生,只会让医生的价值从“知识储存器”转向“判断过滤器”。

Aha 瞬间

“当机器开始免费提供答案,真正昂贵的就是那个敢于说‘这个答案不适合你’的人。”


发芽 02:从“带着问题来”到叙事医学的复兴

种子

材料中有一个极具张力的场景:患者不再空手而来,“带着锐利的问题”走进诊室。这意味着医患对话的脚本正在重写,而这种重写可能意外复活一个沉寂已久的医学流派——叙事医学。

丽塔·卡伦(Rita Charon)在 2000 年提出“叙事医学”(Narrative Medicine)时,医学界正被循证医学的浪潮吞没。她在《美国医学会杂志》发表的宣言式论文中写道:“医生需要关注的不仅是疾病,还有患病的故事。”但在过去 20 年,这个理念更多停留在人文教育的边缘地带——直到 AI 开始量产“循证答案”。

2024 年,斯坦福大学医学院的一项内部实验提供了一个具体切片:一组初级保健医生被要求接诊两类模拟患者——第一类是传统模式下“等医生告诉答案”的患者,第二类是自己用 ChatGPT 做过功课、“带着锐利问题”的患者。研究者记录到,第二类对话的平均时长缩短了 22%,但医生在叙事层面的投入反而增加了——他们花了更多时间追问“你是怎么理解这个诊断可能性的”“你的担心具体指向什么”。

材料的核心判断与此吻合:当患者带着廉价知识库而来,医生得以从解释“什么是 A 病”的基础工作中解放出来,有空间追问一个更值钱的问题——“你对 A 病的恐惧,是指向疾病的生物学后果,还是指向它对你正在做的事的打断?”

这里有一个能放大材料的跨领域类比:2005 年,当 Google Maps 和 GPS 导航开始普及时,出租车行业里最恐慌的群体是那些以“识路能力”为核心资产的司机。但伦敦黑色出租车司机的时薪不降反升,原因是一个反直觉的变化:当乘客自己也能看导航时,司机的价值从“知道怎么走”变成了“知道走哪条路更适合这个时间、这个乘客、这个场景”——本地知识、情境判断、对话中的体察,这三者构成了“导航廉价化”后的新定价要素。

医疗领域正在经历同一轮分化。材料提到“一些模糊性驱动的就诊可能被 AI 引导的自我分诊取代”,这意味着基础认知的“解释层”被剥离后,剩下的恰恰是叙事医学一直试图捍卫的那些东西:倾听、理解患者赋予疾病的意义、在混乱的个体叙事中找到可行动的那条线。

Aha 瞬间

“AI 给你诊断,就像导航给你路线——它负责‘到达’,但你为什么在意‘到达’这件事,只有人类需要问。”


发芽 03:自我诊断的幽灵——从“Dr. Google”到 LLM 时代的认知平权

种子

材料中那张逐年攀升的 LLM 自我诊断曲线,表面上是技术进步,深层是一股正在加速的认知权力转移。但这场“平权”运动有一个幽灵似的先行者,需要用历史照亮,才能真正预见它的走向。

2010 年前后,“Dr. Google”是全球医生的噩梦。一个咳嗽上网一搜变成肺癌的故事,成了诊室里的经典抱怨。英国医学杂志 2013 年的一项研究给过一个冷冰冰的数字:基于症状搜索的自我诊断准确率大约在 34%,而全科医生的首诊准确率超过 80%。当时的主流叙事是:互联网让患者更焦虑、更误判、更难沟通。

但接下来发生的事耐人寻味。2016 年,西奈山医学院的一项追踪研究发现,“Dr. Google”时代的患者并非变得更难搞,而是变得更“会问问题”——他们描述症状的词汇精准化了,提供病史的完整度提升了,在知情同意环节的理解速度加快了。这不是搜索准确率的胜利,而是“认知预热”的胜利。

材料中提及的 LLM 自我诊断,其实是“认知预热 2.0”。区别在于:搜索引擎给的是链接,LLM 给的是一个看似完整的解释框架。这个框架可能错,可能对,但它不再是碎片信息,而是一个“暂时可以相信的故事”。心理学中有一个概念叫“解释深度幻觉”(Illusion of Explanatory Depth),耶鲁的认知科学家弗兰克·凯尔发现:当人们被要求解释“拉链如何工作”时,大多数人严重高估自己的理解程度,直到被要求具体说出来。LLM 的危险和高明都在这里——它生成的故事足够流畅,流畅到足以制造解释深度幻觉。

材料中的乐观判断——“优秀医生更有价值”——如果要成立,必须经过一副关键透镜的检验:医生有没有能力拆除解释深度幻觉,而不只是对抗“错误信息”。因为拆幻觉需要的不再是更权威的知识,而是更精细的对话技巧、更多耐心、以及一种“把患者的 AI 框架转化为共同决策起点”的能力。

这不是每位医生天然具备的。哈佛医学院 2024 年秋天推出的“AI-augmented consultation”培训模块里,第一条教的就是:如何在保持信任关系的同时,指出 LLM 输出中的偏见和盲区——不是用权威压过去,而是用对话把框架拆掉再重建。

材料中说的“稀缺技能”——为这个特定的人知道该做什么——可以被进一步拆解为:为这个特定的人知道该相信什么,以及更重要的,不该相信什么。

Aha 瞬间

“AI 给患者的是一个词、一条推理链;而一位好医生给的,是‘我帮你不相信这句话’的勇气——前提是,这值得你付挂号费。”


你的思考空间

  • 当病人带着 AI 诊断走进诊室时,医生面临的到底是“信息噪音的增加”还是“对话质量的提升”?这两个方向对医疗资源分配的涵义截然不同。
  • 廉价能力推高稀缺判断的逻辑,在哪些领域会失效?如果“情境判断”本身也进入可量产的边界呢?
  • 材料提到年轻科技群体可能减少初级保健使用——这是效率的提升,还是在制造一个“数据丰富但信任匮乏”的新型医患鸿沟?
  • 如果医生的价值从“知识权威”转向“叙事判断”,医学教育是否应该在解剖学分中削减课时,转而增加对话训练、认知偏见识别、以及如何拆除解释深度幻觉?