Codex 使用技巧:把它当成真正的工程代理
Codex 最容易被低估的地方,不是它会写代码。
而是它可以完整参与一个工程任务:
1 | 读项目 -> 拆任务 -> 改文件 -> 跑命令 -> 验证结果 -> 总结改动 -> 提交代码 |
如果只把 Codex 当成“更聪明的代码补全”,那会浪费它一半以上的能力。
我更建议把它当成一个能在本地仓库里工作的工程代理。你给它目标,它自己去找文件、看上下文、改代码、跑测试,然后把结果交回来。
这篇文章就聊一些真实使用 Codex 时更容易提升成功率的技巧。
一、先让 Codex 读项目,不要上来就改
很多人第一次用 Codex,会直接说:
1 | 帮我实现一个用户登录功能 |
这个提示不是不能用,但风险很高。
因为 Codex 还不知道你的项目结构、技术栈、目录习惯、测试命令、代码风格,也不知道哪些文件不能碰。它当然可以猜,但真实项目里,猜得越多,返工越多。
更稳的第一句应该是:
1 | 请先阅读这个项目,告诉我: |
这一步看起来慢,其实是在省时间。
Codex 一旦建立了项目地图,后面改代码会稳很多。尤其是多文件任务,前期理解越充分,后面越少出现“功能写了,但接错地方”的问题。
二、把需求写成工程任务,而不是聊天问题
Codex 喜欢明确的目标、边界和验收方式。
不要只写:
1 | 帮我优化首页。 |
这个范围太空了。
更好的写法是:
1 | 请优化博客首页的文章列表: |
这类提示会让 Codex 更像工程师一样工作。
它知道哪些地方可以动,哪些地方不要动,也知道最后用什么标准判断完成。
三、给 Codex 一个可以验证的信号
AI 编程最怕一句话:
1 | 看起来应该好了。 |
“看起来”不是验证。
Codex 真正强的地方,是它可以跑命令。所以你应该给它一个明确的验证动作:
1 | 改完之后运行 pnpm build。 |
或者:
1 | 改完之后运行 pnpm test,并修复所有失败用例。 |
如果是前端页面,可以加:
1 | 启动本地服务,打开浏览器检查桌面端和移动端截图。 |
如果是接口,可以加:
1 | 用 curl 调用新增接口,确认返回结构符合预期。 |
没有验证,Codex 只能靠代码静态判断。给了验证,它就能进入闭环:
1 | 修改 -> 运行 -> 看报错 -> 再修改 -> 再运行 |
这才是 agentic coding 的核心。
四、善用权限模式,不要一开始就全自动
Codex 可以在不同权限下工作。
刚接触一个项目时,我建议保守一点:
1 | 先让它读代码和给方案 |
等你确认方向没问题,再让它自动编辑。
对于熟悉的仓库、低风险改动、格式化、文档更新、批量重命名,可以放宽权限。
但涉及这些内容时要谨慎:
- 删除文件
- 数据库迁移
- 权限系统
- 生产配置
- 密钥和环境变量
- 大范围重构
Codex 很能干,但能干不等于每次都应该放开手。权限模式本质上是你和代理之间的刹车系统。
五、让 Codex 先写计划,再执行
任务稍微复杂一点,就不要直接开写。
比如你要改一个后端接口、一个前端页面、一个数据库字段,再加测试。这个时候可以先说:
1 | 请先给出修改计划,列出需要改哪些文件、每个文件改什么、验证命令是什么。先不要修改文件。 |
等计划看起来合理,再说:
1 | 按这个计划执行。 |
这样做有两个好处。
第一,你可以提前发现方向错误。
第二,Codex 自己也会更稳。它会把任务拆成几个阶段,而不是一口气把上下文搅在一起。
六、用 Git 保护你的工作区
Codex 官方文档也会提醒:自动编辑之前,最好确认当前目录在版本控制里。
原因很简单:
1 | AI 改代码之前,Git 是你的安全网。 |
我一般会先做三件事:
1 | git status |
如果当前已经有未提交改动,要先判断这些改动是谁的。
不要让 Codex 随手覆盖你的临时修改。也不要在一个脏工作区里做大重构,最后分不清哪些是原来的,哪些是新改的。
比较稳的习惯是:
1 | 一个任务,一个分支,一个清晰提交。 |
Codex 很适合帮你做提交说明,但提交前还是应该看一下 diff。
七、把项目习惯写进 AGENTS.md
如果你经常在同一个项目里用 Codex,就应该沉淀项目规则。
比如:
1 | 构建命令使用 pnpm build |
这些规则可以写进 AGENTS.md 或项目说明文件里。
不要每次都靠聊天重复交代。
项目规则越清楚,Codex 越像一个熟悉团队习惯的协作者。
八、把 Codex 用在它擅长的任务上
Codex 很适合这些场景:
- 修构建错误
- 重构重复代码
- 写单元测试
- 梳理陌生项目
- 迁移配置文件
- 根据报错定位问题
- 写技术文档
- 做代码审查
- 批量改 Markdown
- 跑本地验证流程
但有些任务仍然需要你给方向。
比如产品取舍、架构边界、核心安全策略、数据库长期演进,这些不是“让 AI 猜一下”就能解决的。
你要做的是给 Codex 清晰的判断标准。
Codex 负责执行和验证,你负责方向和边界。
九、一个我常用的 Codex 提示模板
我日常最常用的是这个模板:
1 | 请先阅读相关代码,找到实现位置。 |
这个模板不花哨,但非常有效。
它把 Codex 从“回答问题”拉回“完成任务”。
十、结语
Codex 的正确打开方式,不是让它替你敲几行代码。
而是让它进入你的工程流程。
让它读项目,让它写计划,让它改文件,让它跑测试,让它看结果,让它总结变更。
当你开始这样使用 Codex,它就不再只是一个聊天窗口,而是一个可以真正交付小任务的工程代理。
这也是 AI 编程最值得关注的变化:
1 | 不是代码生成变快了,而是完整开发闭环开始可以被代理执行了。 |