本次仅基于已读取内容处理。


知识工作的Codex

原文:https://every.to/guides/codex-for-knowledge-work


人们很容易低估 Codex。第一眼看过去,它像是又一款 AI 编程工具;如果你不是工程师,很自然就会觉得它跟自己没什么关系。

但这样理解就错过了 Codex 真正带来的可能性。

想象一个星期一早上:一份发布计划请求落在你的收件箱里。你把它转发给 Codex——Codex 有自己的邮箱账号,然后你合上笔记本电脑,让 Codex 在云端或者一台像 Mac Mini 那样始终开机的机器上执行任务。在你去办公室的路上,手机弹出一条邮件通知:Codex 已经读完了相关的 Slack 讨论串,从 Google Drive 里提取了客户笔记,在 PostHog 中核对上季度的数据,并在共享的 Notion 文档里搭好了一份市场推广计划的框架。它只需要你确认一个关于时间安排的细节,而你用一个大拇指表情就完成了这件事。等你坐到办公桌前,一份草稿已经准备好,等你审阅。

这就是一个“智能代理化”知识工作者的一天。这一切都基于 OpenAI 的代理 Codex,运行在 Codex 桌面应用中。在本指南中,我们用 “Codex” 指代这个应用。

Codex 是一个为你和你的 AI 代理准备的工作空间。把 Codex 接入它需要的文件、应用和工具,它就会收集上下文,并把任务推送到它能触达的每一块表面——包括你已经连接的应用、浏览器和你本机——来持续向前推进。这使它的价值远不止写代码,而是能够覆盖相当广泛的知识工作。

在 Codex 中与代理协作,有两种模式:委托协作

  • 委托:用于可预测、可重复且风险低的任务。只要给出清晰的、规范的指令,代理就能自主执行,并把完成的工作带回来供你审阅。
  • 协作:用于判断密集型、探索性或迭代式的任务。你会与模型并肩工作,直到产出的结果与你的设想一致。

人工智能已经发展到这样一个阶段:专业知识变得容易被复制。每个新模型都能做到更多从前需要稀缺技能才能完成的事——这既创造了更多机会,也制造了更多噪音。在这种环境中工作最出色的人,知道如何引导 AI 的能力,同时又不会丢掉自己的判断力。他们驾驭模型,而不是被模型淹没。

熟练的 Codex 用户,就是这种能力在实践中最清晰的例子之一。

本指南正是为了让你成为这样的人。它涵盖如何搭建工作空间、如何执行高杠杆的知识工作任务,以及如何把重复性工作沉淀成能够持续改进的持久系统。如果你已经准备好用系统的眼光,而不是单次任务的眼光来看待自己的工作,那么本指南就是为你而写的。

Read with ClaudeRead with ChatGPT

第一部分:理解 Codex

Codex 是什么

Codex 是一个使用工具的代理式工作空间:你给它一个目标,它会规划工作,利用可用的工具和上下文,然后产出一个结果供你审阅。它可以读写你电脑上的文件,通过插件和其他集成连接到外部服务,在不需要额外指导的情况下运行多步骤任务,在任务需要时生成代码和脚本,并在持久的工作空间中保持上下文连贯。

让 Codex 值得使用的具体能力包括:

  • 在多个任务上并行地与你协作
  • 从你连接的应用和文件中提取上下文
  • 在需要屏幕操作时,使用内置支持的浏览器和桌面工作流
  • 检查自己的工作,修正并继续前进
  • 在长时间会话中保持一个持久的目标,而不是把每条消息当成一次性请求
  • 把可重复的任务变成定期执行的工作流
  • 帮助处理来自 Slack、邮箱或表单等渠道的共享请求
  • 让你可以在手机上启动、引导、批准和审阅工作,而 Codex 在云端或一台像 Mac Mini 那样保持唤醒的机器上运行

这些能力使 Codex 既适合委托描述清晰的任务,也适合作为人与代理协同的共享工作空间。判断哪种模式适配哪种需求,是现代知识工作的元技能。

关于“目标”(Goals)的说明

在 Codex 中,用 /goal 命令发起的目标(Goal)是一个持续性的意图,它会塑造整个会话,而不是跟随一条消息生灭。你不必每轮都重新向代理交代背景,只需要告诉它“完成”的标准是什么、如何检验成功、需要遵循哪些约束。之后,Codex 会朝着这个结果不断努力,即使中间有打断或跨会话中断,也不会偏离方向。目标让你可以委托长周期的工作,在协作中不丢失线索,让进展随时间复利叠加,而不是每次都从头开始。

一个判断何时该用 /goal 的简单测试是:如果你会在三句连续的提示中都打出同一句话——“每条事实声明都要标注出处,严格遵循机构风格,没我审阅绝不发出”——那不如把它设成一个目标。

目标 vs 技能。 技能(skill)是一组可复用的打包指令(有时还附带脚本),教会 Codex 如何妥善处理某一类重复性任务。而目标,则是你在某一段工作周期中想要达成的结果。它会引导整个会话,直到目标实现,然后结束。

移动端的 Codex

你也能通过 ChatGPT 移动应用在手机上操控 Codex,遥控正在执行工作的那台机器。移动端适合处理工作流中那些轻量的部分:你可以在任何地方启动一个任务、回答一个问题、批准一项操作,或者审阅一份草稿。真正需要深入审阅的部分,还是应该留给货真价实的屏幕。

Codex 不是什么

(本节内容仅限订阅用户查看)

Codex 知识工作循环

(本节内容仅限订阅用户查看)

第二部分:设置

(本节内容仅限订阅用户查看)

连接你的系统

(本节内容仅限订阅用户查看)

搭建你的 Codex 工作空间

(本节内容仅限订阅用户查看)

第三部分:Codex 使用的五个层级

(本节内容仅限订阅用户查看)

层级一:一次性知识工作

(本节内容仅限订阅用户查看)

层级二:多来源工作流

(本节内容仅限订阅用户查看)

层级三:把重复性杂务变成持久化工作流

(本节内容仅限订阅用户查看)

层级四:当提示词不够用时,构建小工具

(本节内容仅限订阅用户查看)

层级五:让你的 Codex 系统复利增长

(本节内容仅限订阅用户查看)

第四部分:工作流库

(本节内容仅限订阅用户查看)

1. 收件箱清零审阅队列

(本节内容仅限订阅用户查看)

2. 每日未回复消息汇总

(本节内容仅限订阅用户查看)

3. 研究简报生成

(本节内容仅限订阅用户查看)

4. 带有并行审阅循环的写作

(本节内容仅限订阅用户查看)

5. 研究中的资料管理

(本节内容仅限订阅用户查看)

6. 通过音频获取信息

(本节内容仅限订阅用户查看)

7. 市场推广计划生成器

(本节内容仅限订阅用户查看)

8. KPI 报告

(本节内容仅限订阅用户查看)

9. 面向产品工作的客户支持

(本节内容仅限订阅用户查看)

10. 非工程师的 Pull Request

(本节内容仅限订阅用户查看)

11. 招聘调研

(本节内容仅限订阅用户查看)

12. 战略与规划代理

(本节内容仅限订阅用户查看)

13. 个人学习工具

(本节内容仅限订阅用户查看)

第五部分:良好地操作 Codex

(本节内容仅限订阅用户查看)

如何驾驭 Codex

(本节内容仅限订阅用户查看)

安全、信任与风险

(本节内容仅限订阅用户查看)

团队工作流:从个人 Codex 到共享操作系统

(本节内容仅限订阅用户查看)

第六部分:开始上手

(本节内容仅限订阅用户查看)

七日 Codex 高级用户计划

(本节内容仅限订阅用户查看)

仅限订阅用户

升级以在 Every 上解锁完整文章。


核心启示:Codex 的真正价值在于它将 AI 代理从一次性工具升级为能够持续运行、理解上下文、跨应用协作的知识工作操作系统,把重复性工作系统化,让人的判断力与 AI 的执行力形成互相增强的循环。

Codex for Knowledge Work 的发芽报告

材料核心

Codex标志着知识工作范式的根本转变:从“亲自执行任务”到“设计和管理代理执行系统”。真正的竞争力不再是你能否完成某个具体产出,而是你能否设计出可重复使用的智能工作系统,并判断何时该放手让代理运行、何时该深度介入。


发芽 01:从“做事的能力”到“系统设计的能力”

种子

原文区分了“委托”和“协作”两种模式,但更深层的转变是关于工作所有权的重新分配。当你能用一行/goal定义“完成”的标准,然后把执行过程外包给代理时,你的核心能力从“知道怎么做”变成了“知道该做成什么样,以及如何验证它是否做对了”。

故事主体

这个转变有一个绝佳的历史参照:亨利·福特在1913年引入流水线时,汽车工人最恐慌的不是工作变多了,而是他们的“know-how”突然贬值了。过去一个熟练工匠需要理解整辆车的装配逻辑,但在流水线上,他只需要安装一个零件。当时的主流批评声认为这套系统“让工人变笨了”。

但福特看到的是另一层:流水线把隐性的个人经验转化成了显性的系统设计。原来只有少数大师傅能完成的工作,现在可以被拆解、标准化、复制。大师傅的新角色不是继续拧螺丝,而是设计流水线本身——定义工序、质检标准、异常处理规则。

Codex的/goal机制本质上是知识工作的流水线化:你把“写一份上市计划”这件过去需要三个通宵的活儿,拆解成“需要检查哪些数据源”“需要符合哪种风格”“需要经过哪些确认节点”这些可被代理执行的步骤。你的价值不再是熬夜完成那份文档,而是定义“什么是好的上市计划”并设计验证链条

文章在Level 5提到“Compound your Codex system”(组合你的Codex系统),这意味着最成熟的使用者不是在用代理解决单点问题,而是在构建一套相互咬合的自动化系统生态:研究代理的输出自动成为写作代理的输入,写作代理的草稿自动触发审校代理的检查流程。这和福特把发动机装配线、底盘装配线、喷漆线串联成一条完整生产线的逻辑完全一致。

Aha 瞬间

“未来最稀缺的知识工作者,不是那些能亲手做出漂亮交付物的人,而是那些能把‘什么是漂亮交付物’精确翻译成机器可执行的验证标准的人——就像福特留下的不是拧螺丝的手艺,而是一条装配线上的每一个质检节点。”


发芽 02:异步决策权的重新分配

种子

文章描写的通勤场景揭示了一个微妙但关键的权力转移:Codex能在你不在场时跨多个系统独立行动(Slack、Google Drive、PostHog、Notion),但在“需要你确认一个关于时间的细节”时停下来等待你的拇指。这是一套新的人机决策层级协议

故事主体

这个设计逻辑让我想起霍华德·马克斯(橡树资本联合创始人)在投资备忘录中反复强调的一个概念:“一阶思维”和“二阶思维”的区分。一阶思维者只问“这会发生吗?”;二阶思维者追问“如果这发生了,会发生什么?”

在Codex的架构里,一阶判断(拉取数据、对比风格、检索信息)被完全下放给了代理——这些是可以预测且低风险的。但二阶判断(时机选择、敏感信息处理、与人协商的事项)被保留给人类。这不是技术做不到自动决策,而是一个刻意的设计选择:把决策权按照“是否需要理解人类意图、组织政治、情感后果”重新分级。

再看文章提到的具体案例:“你再确认一个关于时间的细节”——这恰好是最典型的人类保留决策区。时间表面上是客观数据,但在这个语境里,它涉及“团队士气”“客户预期”“老板的隐含优先级”,是个高度政治化的判断。Codex可以是超人般的执行者,但它的决策权限被校准到一个关键边界:可验证性。如果一项决策的对错可以通过数据或规则事后明确判断(如“数据是否从PostHog拉取成功”),代理可以自主;如果对错只能在人类意图框架内评估(如“这个时机是否恰当”),必须人来做。

这呼应了原文隐含的设计哲学:信任不是二元的(信任/不信任),而是分级的、有条件的、可审查的

Aha 瞬间

“Codex的权限边界不在于它能做什么,而在于它被设计成在‘可验证性’消失的那条线前停下。这让人机协作从‘我监督你’变成了‘我负责那些无法被算法证明对错的判断’——而那条线,恰好是知识工作尚未被自动化的最后堡垒。”


发芽 03:知识工作的“影子组织”——从个人代理到团队操作系统

种子

文章在Part 5提到“Team workflows: From personal Codex to shared operating system”(从个人Codex到共享操作系统),这是一个看似边缘、实则最具颠覆性的方向。当每个知识工作者都配置了自己的代理后,团队协作的本质将从“人与人协商”变成“人-代理系统与人-代理系统的对接”。

故事主体

这个转变有一个已然发生的先例:高频交易公司的“算法生态系统”。在2000年代初,像文艺复兴科技(Renaissance Technologies)这样的公司发现,当每个交易员都开发自己的算法模型时,真正的超额收益不是来自任何单一模型,而是来自模型之间的信息传递速度和接口设计。一个模型在公开市场发现套利机会的信号,如果能在300毫秒内被另一个负责衍生品定价的模型感知到,就能构成碾压性的竞争优势。

他们不会让交易员拿着Excel表格在会议上讨论策略,而是设计了一套模型间的通信协议。这里的核心启示是:当每个个体都拥有强大代理时,团队的瓶颈不再是个人生产力,而是代理之间的信息流通成本

回到Codex的知识工作场景:如果你的上市计划代理在分析数据时发现一个关键客户洞察,但你的同事的市场分析代理并不知道这个发现存在,那么这个洞察就会消失在组织缝隙里——即使你们各自都达成了本周的工作目标。文章提到的“inbox zero review queue”(收件箱清零审查队列)和“daily unanswered message roundup”(每日未回复消息汇总)这些工作流,本质上是在修补个人生产效率。但当Codex的使用走向Level 5(“Compound your Codex system”)并扩展到团队层面时,真正需要设计的不再是“我的十二个自动化工作流”,而是“我们所有人的代理如何相互通讯、何时升级到人类管理者、什么信息需要被广播给哪些人的代理”。

这引出一个更深刻的组织问题:未来的管理者不仅要管理人的KPI,还要管理代理间的数据流动规则。就像文艺复兴科技用严格的事件驱动架构连接交易模型,知识团队需要一个“代理路由引擎”,决定哪些信号从谁的代理流向谁的代理,哪些需要人类仲裁。

Aha 瞬间

“当每个知识工作者都配置了Codex代理后,团队真正的生产力缺口不在个人效率,而在代理之间的信息流动速度。未来的团队协作,不仅是人与人的对话,更是代理与代理之间的一种‘影子组织’架构——而你能否设计好这套架构,决定了你的团队是十个忙碌的个体,还是一台协同放大的智能机器。”


你的思考空间

  • 关于所有权:如果你的代理在你睡觉时完成了一份上市计划,但漏掉了一个你本来会捕捉到的直觉判断,这个错误属于“系统设计缺陷”还是“监督失职”?这会影响你设计代理指令时的安全边际吗?

  • 关于技能叠代:当Codex能让一个新人产出接近专家水准的交付物时,组织如何区分“有真知灼见的人”和“善于指挥代理的人”?原文提到的“ride the models”是一种需要练习的元技能,但组织是否有能力识别谁真正掌握了它?

  • 关于反思回路:文章强调Codex会“检查自己的作业并修正”,但如果你从未深入审查代理的修正逻辑,你实际上是在信任一个你不理解的黑箱。这会不会让你在长期里丧失对领域知识的深度直觉,就像Google Maps让人的空间记忆能力退化?

  • 关于团队冲突:想象两位同事的代理得出了相反的市场分析结论,而两位人类管理者都信任各自的代理。这种“代理冲突”需要什么样的仲裁协议?它是否会催生组织内的“数据解释权”斗争?

  • 关于新职业鸿沟:文末的七天计划假设读者有动力和能力构建Codex系统。但那些不具备“系统化思维”的知识工作者——他们能执行任务但对设计自动化流程感到无力——会不会成为知识工作流水线上的新工人阶层,被那些能写/goal的人所管理?