你的 AI 战略正在下注。你知道自己下了什么注吗?

原文:Your AI Strategy Is Making Bets. Do You Know Which Ones?


忘掉“AI 外衣”这类模糊的标签吧。The General Partnership 的首席技术官 Dan Pupius 认为,创始人需要一个更稳健的框架,来理解用 AI 构建产品时的风险与机遇。他鼓励创始人全面审视其 AI 战略之下的隐含假设,从智能的成本、模型的自足性、平台的锁定效应,到监管环境。十多年前,我曾与 Dan 在 Medium 共事,他那种沉静、深思熟虑的智慧,在他细致入微的分析中展露无遗。——Kate Lee

我曾基于那些当时被认为是错误的想法来打造产品——然后看着这些想法变得势不可挡。

2005年,当我在 Google 参与重建 Gmail 时,我们的赌注是沟通正变得更快、更具对话性,并且越来越以浏览器为原生环境。因此,我们打造了 GChat,首次将实时聊天置于浏览器内,紧邻用户的邮箱。当我在 Medium 负责工程时,我们的赌注是信息流对于深度思考和发布来说还不够,所以即便 Twitter、Snapchat 和 Vine 的用户增长正呈爆炸之势,我们依然倡导长文写作。

在每一个案例中,我们都从一个关于行为、技术和市场走向的洞察出发,并在此基础上构建我们的赌注。但如今,AI 领域变革的速度之快,意味着支撑一个战略的假设和洞察可能在执行中途发生改变,从而导致这些赌注土崩瓦解。

创始人需要一种更灵活的思维方式来决定下注。与其问“我们认为会发生什么”,不如问自己两个根本性的问题。第一:哪些假设是不可逆的?如果你基于某个单一提供商(比如某个模型提供商)进行了深度构建,那么要离开那个提供商,你就需要重新改造产品。第二:哪些假设是我们还能修正的?假设 Token 会一直很昂贵,这是一个你可以轻松持有的赌注——如果成本下降,你无需重建任何东西就能改变策略。

在 The General Partnership,我们开发了一个框架,旨在帮助创始人理解在用 AI 构建产品时,他们在下什么注,以及哪些赌注他们可以反悔。这个四轴框架将讨论从诸如“AI 外衣”之类的宽泛标签,转向了一家公司正在下注的具体未来。其目标并非更精确地预测未来,而是让你在犯错时能更早意识到,并在市场强迫你行动之前先行一步。

四个决策维度

我们在创始人身上反复看到一个模式。一个团队向我们阐述他们的战略。听起来合理且令人兴奋,但我们越仔细观察,就越会发现这些公司的命运似乎取决于许多他们无法控制的因素。

这些因素对应着初创公司在押注的四个决策维度。理解这一点的公司,知道用 AI 构建产品时的顺风和风险在哪里。而那些不理解的公司,则暴露在了风险之中。

[](https://d24ovhgu8s7341.cloudfront.net/uploads/editor/post/4324/optimized_ecf00d35-8763-4222-8b53-a42f4b7d300e.png)

Token 经济学:稀缺 ↔ 充裕

如果你是 Token 的消费者——大多数 AI 初创公司都是如此——充裕是好消息,而我们当下正处于一个脆弱的 Token 充裕时代。你的利润率会提升。你能做更多事,更自由地实验,并构建出一年前因成本过高而望而却步的功能。Cursor 及其同类产品能作为一个品类存在,正是因为运行 AI 的成本已经低到足以让产品在后台持续运行,并且依然能够盈利。

但充裕也是一个陷阱:如果每个人都能用极低的成本构建你所构建的东西,你的优势何在?作为创始人,你需要清楚,你是在赌成本会高到足以形成壁垒,还是在赌即便成本不构成壁垒,你依然拥有可防御的优势。

问问自己:运行 AI 的成本会高到限制你的发展,还是会趋近于零?

_如果你赌是稀缺,_你需要清楚地阐明,为什么 Token 成本的下降不会摧毁你的优势。一个例子是:需要智能体持续运行,而非仅按需调用的应用——在这种体量下,即便便宜的 Token 也会累积,因此从每次调用中挤出成本变得极其困难。另一个例子是对延迟敏感的工作,比如基于 Vapi 构建的语音智能体,任何延迟都会让对话显得不自然。在这些场景下,即便其他模型变得更便宜,你也只能为最快的模型付费。

_如果你赌充裕会持续,_那么你需要通过以下之一来建立优势:独有的数据、领域专业知识、分发渠道,或是知道该构建什么。我们相信 Token 会持续降价。但我们更看好那些能降低成本波动性的公司——它们能让开销变得可预测,并使客户免受波动影响。一家帮助客户设定账单上限的初创公司,比一家仅在平均价格上竞争的初创公司更具防御性。我们在医疗领域看到了这一点:那些处理海量数据的公司,仍然需要管理其最坏情况下的成本,并避免对文档、转录文件和会话记录进行昂贵的重复处理。即便单个 Token 的价格在下降,能够告诉客户“你的账单不会超过X”仍然极具价值。

模型自足性:需要脚手架支持 ↔ 模型原生处理

这个维度决定了我们通常所说的“模型外衣”公司的命运。如果你正在增强模型的能力——比如增加记忆、改进检索、编排多步骤工作流——你实际上是在隐性地赌,模型未来某一天无法自行做到这些。这是一个有保质期的赌注。也许是个好赌注,也许不是,但你至少应该意识到自己正在下这个注。面向律所的 AI 平台 Harvey 和客服 AI 平台 Sierra,它们都押注于通用模型无法在其细分领域内做到它们所能做的一切。

问问自己:如果模型拥有了无限能力,我的产品还有存在的必要吗?

_如果答案是肯定的,你就是在做集成。_那些主要价值在于集成——将模型连接到混乱的外部系统——的公司,无论模型变得多么强大,都具有竞争力。例如,一家将 AI 引入医疗工作流的公司,就处于这个坐标轴上更具防御性的位置。任何模型都能对医疗信息进行推理;真正具有防御性的是,该产品能够集成到医疗系统早已在运行的记录系统、文件流转和运营限制之中。

_如果答案是否定的,你就是在做脚手架。_那些主要价值在于让模型变得更聪明的公司,面临着被吸收的风险——它们今天提供的东西,是在增强当前模型的能力。一家做 AI 辅助代码审查的公司,可能在构建客户当下需要的东西,但随着模型在捕捉错误和理解更大代码库方面做得越来越好,这家公司必须清楚,除了模型本身,自己还有什么差异化优势。

某些能力已经被模型吸收了——上下文窗口急剧扩展,在许多应用场景中大大减少了将文档切分成小块进行检索的需求,而且我们认为模型会持续变得更强大。其他能力目前看来更具粘性:在不同能力或成本优势的提供商之间进行路由,以及在受监管行业的合规性。一个强大的模型可以学习法规,但不能被信任去检查自己的工作。金融模型风险管理就考虑到了这种张力:美联储(Federal Reserve)已告知银行机构,模型风险管理应包括“有效质询(effective challenge)”,即由独立于模型构建者的各方进行审查。受监管的医疗领域也有同样的结构。当出现问题时,监管机构或企业需要一个可追责的对象,而“模型自我判定合规”显然不是一个合格的对象。

平台结构:锁定 ↔ 商品化

这个维度关乎你构建业务所依赖的工具和基础设施。

问问自己:你是被锁定在一家 AI 提供商上,还是可以在不影响产品的情况下进行切换?

_如果你在单一提供商的生态系统上构建,你要清楚自己正在下这个赌注。_你可能正在针对他们的 API 进行优化,使用他们的微调基础设施,或依赖其模型独有的能力——例如 OpenAI 允许应用在代码中调用其模型的接口,Anthropic 像人类一样控制计算机的能力,或是 Gemini 的网络搜索集成。你越是这么做,就越难在不重建产品核心部分的情况下切换提供商。这本身未必是错的。亚马逊云服务(AWS)的锁定对大多数公司来说都运行良好。你需要思考这个类比是否适用于你的情况。

_如果你构建的东西不依赖单一提供商的生态系统,_你就是押注于模型的选择会随着时间推移变得不那么重要。你可能在构建多模型路由,或是在构建能跨提供商工作的工具——例如 OpenRouter、LiteLLM 或 Vercel 的 AI Gateway。你赌的是切换成本会保持在低位,而让你与众不同的东西存在于你的产品中,而非底层的模型。这里的类比是 Postgres——一种让用户存储和查询结构化数据的开源关系型数据库技术。现在市面上有数十个托管 Postgres 的提供商,它们在执行层面而非核心技术层面展开竞争。

这两种选择都可能正确。答案可能因用例而异——如果为了完成高风险任务,你需要最好的模型,你可能会锚定一家前沿的模型提供商。如果你只需要一个勉强能总结文档的工具,你可能会选择那周最便宜的产品。AI 基础设施领域的集中化趋势表明,最终会有一两家提供商占据主导地位,但这种整合需要数年而非数月。如果未来几年内像 Llama、DeepSeek 和 Qwen 这样的开放权重模型仍是可行的替代方案,你今天就不必非要锁定 OpenAI 或 Anthropic。

现在押注单一提供商并非错误。但我们更欣赏那些思考过如何在必要时实现多元化的创始人,即便他们今天并无此计划。

信任与治理:宽松 ↔ 受限

这个维度关乎你所遵循的规则和合规规范。与其他维度不同,它较少依赖技术本身,而更多地取决于监管机构、企业买家和公众的反应。

问问你自己:是现在就快速行动,将治理问题留待以后解决,赌规则保持宽松?还是从一开始就投资于审计追踪和认证,赌合规只会越来越严?

_如果你正快速行动,并将治理视为未来的问题,_那你就是在赌监管会保持宽松。到目前为止,这在美国市场是一个合理的赌注。它可能会继续合理下去。

_如果你正在早期投资于审计追踪、可解释性基础设施,以及像美国国家标准与技术研究院 AI 风险管理框架(NIST AI RMF)和国际标准化组织 42001(ISO 42001)这类用于管理 AI 风险的标准,还有记录模型训练数据、局限性和预期用途的模型卡(model cards),_你就是在赌监管环境会收紧。你正在接受当前较慢的发展速度,以便在合规不再是可选项时做好准备。

两者都有机会成本。如果治理要求突然变得重要,快速行动者会失去先机。如果宽松的环境持续,早期投入合规者则会失去速度。

这个维度比其他维度更难预测。一次造成无可争辩的公共伤害的重大 AI 事故——大规模医疗误诊、基础设施瘫痪、或是造成人员伤亡的事件——其触发立法响应的速度将快于任何路线图能够适应的速度。如果劳动力替代问题引发足够的政治关注,也可能带来意想不到的监管。或者,也可能发生像 Anthropic 的 Fable 模型经历的那种事

合规也能像病毒一样传播。越来越多的大企业要求其供应商满足 AI 特定标准。如果有几家《财富》100 强公司强制要求进行 AI 审计和提供模型卡,那么每个想向他们销售的供应商都必须遵守,随后这些供应商的其他客户也会开始有同样的期望。这就在没有立法的情况下,创造了事实上的监管。它的传播速度比政府行动更快,也更难预测。

SOC2 安全合规标准的发展轨迹就是一个先例。一旦大企业开始要求其供应商提供 SOC2 报告,它就通过采购链层层传递,直到任何一家 B2B 软件即服务(SaaS)公司——哪怕是早期初创公司——都需要它来赢得企业订单。自动化合规公司 Vanta 就是在这股浪潮上建立起了自己的业务。AI 合规是否会遵循同样的路径,仍是一个悬而未决的问题。

将框架付诸实践

对于每一个维度,向你自己提出四个问题。

我们的隐性赌注是什么? 我们大多数人甚至对自己都没有清晰地阐明过这一点。把它写下来会强制你保持精确。可以将其视作融资演讲稿中经典的“为何是现在”那一页的延伸——解释为什么时机正好,以及你在为哪个版本的未来而建设。

这个赌注要成功,必须满足哪些条件? 如果你赌的是 Token 充裕会改善你的利润率,那么关于成本曲线、你的使用模式、竞争态势,必须为真的是什么?如果你赌的是脚手架会保持其价值,那么关于模型能力提升的速度,必须为真的是什么?

哪些信号会告诉我们,我们错了? 这是大多数战略规划失败的地方。如果你不能说出哪些信号会让你认为自己下错了注,那你就没有真正对你的战略进行压力测试。

如果我们错了,我们能多快适应? 有些公司可以转向。另一些公司则已经做出了技术、组织或合同上的承诺,将它们锁定在一个固定位置上。没有哪个天生就更优越,但你应该知道自己属于哪一类公司。

正如商业战略家 Hamilton Helmer 在《7 Powers: The Foundations of Business Strategy》一书中所论证的,更强大的护城河能在市场变迁中存活。如果你的竞争优势取决于某个特定的成本或监管假设能够成立,那么你是脆弱的。但如果你的优势能在多种可能的未来中发挥作用——无论 Token 变得更便宜还是保持昂贵,无论监管保持宽松还是收紧,你都具备防御能力——那么你就处于一个持久的位置。

同样的逻辑也适用于你如何确定赌注的大小:信念坚定的创始人之所以常常获胜,正是因为他们下了集中的赌注而其他人则在多方对冲,但他们对自己的这个选择心知肚明。

有些赌注可能在一天之内就翻盘。英特尔前 CEO Andy Grove 将此称为“战略转折点(strategic inflection points)”——那些颠覆竞争基础的剧变。Token 成本可能因地缘政治冲击而飙升。模型可能会吸收你在赌它们不会吸收的能力。开放权重模型可能弥合能力差距。一次造成实质伤害的 AI 事故可能在一夜之间触发立法响应。你不需要预测这些事中哪一件会发生,但你需要知道哪些是你的公司的威胁,以及如果它们真的发生,你会怎么做。

明确你的赌注

你的战略已经在对这些维度下注了。问题在于,你是否已经把它们写了下来,使它们变得明确。

拥有明确的赌注能够创造内部一致性。你的团队知道你们在向什么目标建设,以及什么情况会导致转向。他们能够做出与总体方向保持一致的局部决策,因为他们理解决策背后的假设。即使计划改变,他们仍然知道前进的方向。

明确的赌注能够带来更快的适应能力。当信号发生变化时,你能更快地识别出来,因为你一直在关注它们。你已经预先思考过其影响。你不是从零开始。

所以,花一个小时。写下你在每个维度上的隐性赌注,以及它对你的业务意味着什么。然后,写下那些能告诉你“你错了”的信号。

这比听起来要难。大多数团队会发现,他们的赌注并不像他们想象的那么清晰,或者他们一直在同时下着互相矛盾的赌注。如果你无法清晰地阐明它们,你的战略就没有你以为的那么连贯。就从这里开始吧。


核心启示:AI 战略的本质是一系列关于未来的赌注,创始人的关键任务并非精确预测,而是主动识别并定期审视自己在 Token 成本、模型能力边界、平台依赖和监管环境这四个维度上的隐含假设,以便在环境变化时能够率先做出反应。

Your AI Strategy Is Making Bets. Do You Know Which Ones? 的发芽报告

材料核心

Dan Pupius 提出一个四轴框架,将AI创业公司的战略分解为代币经济学、模型自足性、平台结构和治理合规四个维度的隐性赌注。核心观点是:AI行业变化太快,创始人不需要更精准地预测未来,而是需要明确自己正在下什么赌注,并预先定义判断错误的信号,以便在市场迫使你改变之前主动调整。


发芽 01:从“预测未来”到“管理赌注”——战略思维的范式转换

种子

Pupius 框架的真正颠覆性不在于四个轴本身,而在于它重新定义了“好战略”的标准:不是“正确”,而是“可修正”。他反复强调的不是预测能力,而是当你错的时候能多快发现并转向。这让我想起金融领域风险管理的底层逻辑——不是避免亏损,而是控制亏损的规模。

故事主体:长期资本管理公司的“正确”灾难

1994年成立的长期资本管理公司(LTCM)拥有金融史上最豪华的团队:两位诺贝尔经济学奖得主(迈伦·斯科尔斯和罗伯特·默顿,正是期权定价公式的发明者)和一群华尔街最顶尖的交易员。他们的模型极其精确,对市场走势的判断在大多数时候都是正确的。

问题出在模型本身。LTCM的模型假设市场波动符合正态分布,忽略了一个关键变量:1998年俄罗斯债务违约这种“不可能事件”完全不在计算范围内。当它发生时,LTCM在几个月内损失了46亿美元,几乎拖垮整个华尔街,最终由美联储组织救助才避免系统性崩溃。

这个案例的致命之处在于:他们的模型没有定义“什么时候我们错了”这一信号。模型越是精确和自我强化,就越让人看不见那些“不会发生”的事件。

Pupius 的四轴框架本质上是对抗这种认知盲区的工具。他要求创始人回答的不是“你觉得未来会怎样”,而是“如果X发生,我们怎么办”。美国金融市场在LTCM之后引入的“压力测试”机制,和这套框架的逻辑完全相同:不再问“市场会跌吗”,而是问“如果市场跌了30%,我们还活着吗”。

这比听起来难得多。2018年,心理学家菲利普·泰特洛克在《超预测》中追踪了数万名预测者的表现后发现,表现最好的人不是知识最渊博或智商最高的,而是那些反复回头修正自己判断、明确写出“什么信号会让我改变主意”的人。

Aha 瞬间

“LTCM的两位诺贝尔奖得主证明了,即便你精确计算了每一个概率,只要忽略了‘如果我错了呢’这个问题的定义,你就不是在管理风险,而是在为你的自负做数学美颜。”


发芽 02:合规的病毒式传播——当企业采购比政府更快地“立法”

种子

Pupius 在治理轴上提到一个被低估的机制:几家财富100强公司要求供应商提供AI审计和模型卡,就能创造出“事实上的监管”,而无需任何立法程序。他以SOC2安全标准的传播路径作为参照——一旦大型企业要求它,它会沿着采购链向下蔓延,直到每个B2B SaaS公司都必须遵守。这不是法律强制,但比法律更快、更难预测。

故事主体:沃尔玛如何“立法”了全球供应链的可持续性

2013年,孟加拉国拉纳广场大楼倒塌,造成1134名制衣工人死亡。这场灾难让全球服装品牌面临巨大舆论压力。但真正改变游戏规则的不是政府监管,而是沃尔玛。

2014年,沃尔玛宣布要求其全球所有供应商在采购订单中嵌入可持续发展指数——涵盖用水量、碳排放、劳工权益等十几个指标。这是一个采购要求,不是法律义务。但沃尔玛的采购规模(每年超过5000亿美元)意味着,任何想进入北美市场的制造商都必须遵守这套标准。

更妙的是传播机制:供应商为了满足沃尔玛而升级了生产管理系统后,发现这套数据对其他客户也适用。沃尔玛的主要竞争对手塔吉特很快跟进,随后是亚马逊。5年内,这个由零售巨头发起的标准,变成了全球快消品供应链的基础设施。

这与AI合规的逻辑完全一致。当第一波企业客户要求模型卡和审计时,供应商不是“应该”遵守,而是为了一套标准,可以同时卖给自己所有客户。然后,那些习惯看到审计报告的客户,会开始向其他供应商提出同样的要求。不需要任何政府通过法案,合规就变得“病毒式”了。

对企业的影响是反直觉的:先发优势不是“快速推向市场”,而是“抢先定义合规标准”。就像Vanta在SOC2合规浪潮中成为标杆一样,在AI治理轴上赌“合规会收紧”的企业,本质上是在赌自己的合规基础设施会成为新的行业准入门槛——这比任何技术壁垒都更难复制。

Aha 瞬间

“在B2B领域,最大的立法者不是政府,而是采购部门。它们不需要投票,只需要在合同中加一句话:‘请提供你的模型审计报告’——然后这条规则就会像病毒一样,沿着供应链感染整个行业。”


发芽 03:被吸收的“脚手架”——克雷格列表分类的隐喻

种子

Pupius 将AI创业公司分为两类:做“整合”的(连接模型与外部系统)和做“脚手架”的(增强模型现有能力)。后者面临的风险是模型能力吸收——你今天提供的功能,明天可能就是模型的默认功能。他称之为“有保质期的赌注”。这让我想起一个经典案例,说明垂直领域的“深度”何时足以抵抗平台的吸收。

故事主体:克雷格列表与垂直分类信息平台的共生

2000年代初,克雷格列表(Craigslist)统治了美国的分类信息市场。它界面简陋,但免费且覆盖所有城市。有一批创业公司试图为特定品类做“更好的克雷格列表”——比如StubHub做票务、Zillow做房地产、LinkedIn做招聘。

这些公司本质上是在为克雷格列表做“脚手架”:美化界面、增加筛选功能、提供更结构化的数据。逻辑上,克雷格列表完全可以为每个品类做同样的事。但它没有。

原因不是技术做不到,而是克雷格列表的核心价值是“聚合”——海量的、跨品类的人流。当一个垂直平台深度整合进某个行业的交易流程时,它就不再是克雷格列表的“插件”,而成了行业的操作系统。Zillow不只是展示房源,它整合了房产估值模型、贷款预审、经纪人网络——这些不是“分类信息”,而是房地产交易的基础设施。

Pupius 的框架完美匹配这个逻辑:Harvey(AI法律平台)能存活,不是因为它让GPT-4变成了更好的律师,而是因为它嵌入了律所的工作流程、文件管理系统、保密协议模板库、计时收费体系。这些“整合”构成了护城河,即使GPT-7能写法律备忘录,它也无法替代律所已部署的工作系统。

关键区分在于:你的产品变得更像是“模型能做的事”,还是“行业已经在做的事”?

Aha 瞬间

“克雷格列表可以复制StubHub的票务功能,但它无法复制StubHub与体育馆票务系统的整合、与支付网关的对接、以及与黄牛党的反欺诈机制。同样的逻辑适用于所有AI‘模型包装器’公司:如果模型吞噬了你的功能,说明你一直在做模型该做的事,而不是行业该做的事。”


你的思考空间

  • 如果你的AI产品今天被GPT-5作为默认功能直接内置,你的客户会因为什么理由留下?如果答案是“他们不会留下”,你其实在做脚手架生意而没意识到。

  • 假设明天全球所有云服务商突然将API价格降至当前的1%,你最大的竞争对手会是谁?这会暴露你的护城河到底建立在成本优势还是结构优势上。

  • 你的客户合规部门的负责人是否知道你们使用了哪些模型、数据如何流转?如果他们在一次审计中问起这些而你无法在24小时内提供清晰答案,你的护城河可能比想象中更浅。

  • 回顾你团队最近三个月的战略会议,有没有一个“如果我们错了”的讨论环节?如果没有,你们不是在制定AI战略——你们是在一厢情愿地希望未来会配合你们的计划。