OpenAI Codex使用指南
汇总自OpenAI官方资料 | 2026年4月更新版
Codex 是 OpenAI 打造的 AI 软件工程智能体(Coding Agent),它的定位是“AI 程序员伙伴”。与单纯的代码补全不同,Codex 更像真实工程团队中的一员:能够独立承接并完成从理解到落地的一整套软件工程工作。
关键信息:
•底层模型:GPT-5.3-Codex / GPT-5.4(基于 o3 优化的定制变体)
•每周超过300 万开发者在使用
•实现路径:由“代码补全工具”逐步升级为可自主交付完整工程任务的 Agent
•能力链路:读项目→ 理解代码 → 修改文件 → 跑测试 → 提交 PR
入口
说明
适合人群
Codex App(推荐)
macOS / Windows 桌面应用,多 Agent 协同指挥中心
主力开发,想获得完整功能体验的用户
CLI 命令行
在终端里执行 codex 命令
偏好命令行工作流的开发者
IDE 扩展
VS Code / JetBrains 插件集成
以 IDE 作为主要开发场景的用户
ChatGPT 网页端
通过 chatgpt.com/codex 进行直接调用
想快速上手、暂不打算安装的用户
1.进入openai.com/codex 产品主页
2.选择点击「下载Windows 版」或 macOS 版
3.安装后用ChatGPT 账号登录即可开始使用
# 前提:Node.js >= 22, npm >= 10
npm install -g @openai/codex
# 验证安装
codex --version
# 启动交互模式
codex
brew install --cask codex
•方式一:ChatGPT 账号登录(推荐个人用户)— 第一次启动会自动打开浏览器授权流程,操作更快更省事
•方式二:API Key 登录— 更适合企业或需要自动化控制的团队,可更好地脚本化管理
export OPENAI_API_KEY="sk-xxxxxxxxxxxx"
codex
适用于快速任务、CI/CD 自动化。任务结束后即刻退出,不保留上下文记忆:
codex "帮我写一个 JSON 解析函数"
codex "修复 UserService.cs 中的空引用问题"
这才体现 Codex 的核心价值——它像一个随时在线的 AI 队友。进入后可以持续对话,并具备完整上下文记忆,适合对复杂需求进行反复迭代:
codex
进入后的典型对话节奏:
•"帮我梳理这个项目的代码结构"
•"在用户模块引入 Redis 缓存"
•"编写单元测试并实际运行验证"
核心优势:具备完整上下文记忆,能够支持对复杂任务进行连续迭代。命令模式更像是“调用 AI”,而交互模式才更像“雇佣 AI”。
OpenAI 在 2026 年 4 月 16 日发布"Codex for (almost) everything"的重大升级,把能力一次打包成六大模块:
1.Computer Use(电脑操控)
Codex 可以直接在你的电脑上执行操作:点击、输入、截屏等。后台运行时不会抢占你的光标。你在一个窗口负责写代码,Codex 在另一个窗口帮你跑测试。目前需要 macOS 的 Screen Recording 与 Accessibility 权限;首批阶段仅支持 macOS,Windows 后续将持续跟进。
2.内置浏览器
能够打开 localhost 的本地页面或访问公开网页。通过在页面上进行标注指示改动位置,Codex 就能知道应该调整哪里——无需截图,也不必冗长描述。后续还会扩展到更完整的 Web 场景(包括自动登录、按用户流程推进)。
3.图像生成(gpt-image-1.5)
用于生成产品概念图、前端 mockup、游戏素材等。生成完成后会自动写入项目目录,并同步调整 CSS 以匹配样式。还支持批量产出风格统一的一整套素材包(例如汉堡店全套暖色调素材)。
4.90+ 新插件
整合 Skills、App Integrations 与 MCP Servers,覆盖 Slack、Gmail、Google Calendar、Notion、JIRA(Atlassian Rovo)、CircleCI、GitLab Issues、Microsoft Suite 等。示例指令:"Check Slack, Gmail, Google Calendar, and Notion — tell me what needs my attention"
5.记忆系统(Memory)
能够记住你的偏好、修正过的内容与技术背景。下次启动时会自动读取,不用再次解释。并且支持主动给出后续建议,帮助你推进下一步工作。
6.自动化(Automations)
支持定时或事件触发的后台任务。保留此前对话的上下文以便继续执行,能够跨天、跨周安排调度。常见用法:PR babysitter(盯紧未合入的 PR)、客户反馈监控(联动 Slack/Gmail/Notion)、CI/CD 告警处理等。
1.提示词四要素结构
一份更高质量的提示词,通常由四个部分组成:
目标:你希望改变什么,或构建出什么?
上下文:用 @filename 指明要关联的文件
约束:包含架构规则、安全要求以及约定
完成条件:例如测试通过、Bug 不再复现等可验证标准
目标:在用户管理模块加入缓存层
上下文:@UserService.cs @UserRepository.cs
约束:不得破坏现有接口签名,且单测必须全部通过
完成条件:所有现有测试通过,同时缓存命中率 >= 80%
2.使用 @ 符号来聚焦上下文
在提示词中加入 @filename,让 AI 只聚焦于相关文件,从而降低 token 消耗。大型项目建议配合 .codexignore 排除 node_modules、构建产物等无关目录。
3.启用 Plan 模式
当任务较复杂时,可以先按 Shift+Tab,或输入 /plan,让 Codex 先收集上下文并制定计划,再开始动手编码。
4.编写 AGENTS.md
将可复用的提示词规范写入项目根目录下的 AGENTS.md,Codex 每次启动会自动加载。示例内容:
## 项目结构
- src/ 源码
- tests/ 测试
## 运行命令
- 测试: npm test
- 构建: npm run build
## 工程规范
- 使用 TypeScript strict 模式
- 所有公共函数必须配套 JSDoc
- PR 必须通过 CI 检查
5.多Agent 并行(桌面应用独有)
借助工作树(Worktree)实现:多个 Agent 能同时在同一仓库中处理不同分支的任务,互不影响。一个窗口即可管理多个项目,切换也更顺畅。
模型
特点
gpt-5.3-codex
默认模型:在速度与能力间取得平衡,适合大多数日常任务
gpt-5.4
推理能力更强:更适合复杂架构工作与大规模重构
gpt-5.2-codex medium
中等配置:更具性价比,适合轻量级任务
切换方式:codex --model gpt-5.4
•需要ChatGPT 付费订阅(Plus $20/月 或 Pro $200/月)
•Pro 用户可使用全部能力(Computer Use、Memory、Automations 等)
•团队启动使用可获得最高$500 额度优惠
•CLI 也可通过 API Key 进行计费(按 token 消耗付费)
1.下载安装→ 访问 openai.com/codex 获取桌面版
2.登录授权→ 使用 ChatGPT 账号一键完成授权
3.克隆项目→ 运行 codex clone https://github.com/your/repo
4.开始对话→ 用自然语言描述你的目标任务
5.编写 AGENTS.md→ 明确项目规范,让长期协作更稳定
6.探索插件→ 安装所需的 MCP 服务并完成应用集成
•产品主页:openai.com/codex
•更新博客:"Codex for (almost) everything"
•开发者文档:developers.openai.com/codex