OpenAI Codex使用指南

发布时间：2026-05-01 07:19阅读：62

汇总自OpenAI官方资料 | 2026年4月更新版

Codex 是 OpenAI 打造的 AI 软件工程智能体（Coding Agent），它的定位是“AI 程序员伙伴”。与单纯的代码补全不同，Codex 更像真实工程团队中的一员：能够独立承接并完成从理解到落地的一整套软件工程工作。

关键信息：

•底层模型：GPT-5.3-Codex / GPT-5.4（基于 o3 优化的定制变体）

•每周超过300 万开发者在使用

•实现路径：由“代码补全工具”逐步升级为可自主交付完整工程任务的 Agent

•能力链路：读项目→ 理解代码 → 修改文件 → 跑测试 → 提交 PR

入口

说明

适合人群

Codex App（推荐）

macOS / Windows 桌面应用，多 Agent 协同指挥中心

主力开发，想获得完整功能体验的用户

CLI 命令行

在终端里执行 codex 命令

偏好命令行工作流的开发者

IDE 扩展

VS Code / JetBrains 插件集成

以 IDE 作为主要开发场景的用户

ChatGPT 网页端

通过 chatgpt.com/codex 进行直接调用

想快速上手、暂不打算安装的用户

1.进入openai.com/codex 产品主页

2.选择点击「下载Windows 版」或 macOS 版

3.安装后用ChatGPT 账号登录即可开始使用

# 前提：Node.js >= 22, npm >= 10

npm install -g @openai/codex

# 验证安装

codex --version

# 启动交互模式

codex

brew install --cask codex

•方式一：ChatGPT 账号登录（推荐个人用户）— 第一次启动会自动打开浏览器授权流程，操作更快更省事

•方式二：API Key 登录— 更适合企业或需要自动化控制的团队，可更好地脚本化管理

export OPENAI_API_KEY="sk-xxxxxxxxxxxx"

codex

适用于快速任务、CI/CD 自动化。任务结束后即刻退出，不保留上下文记忆：

codex "帮我写一个 JSON 解析函数"

codex "修复 UserService.cs 中的空引用问题"

这才体现 Codex 的核心价值——它像一个随时在线的 AI 队友。进入后可以持续对话，并具备完整上下文记忆，适合对复杂需求进行反复迭代：

codex

进入后的典型对话节奏：

•"帮我梳理这个项目的代码结构"

•"在用户模块引入 Redis 缓存"

•"编写单元测试并实际运行验证"

核心优势：具备完整上下文记忆，能够支持对复杂任务进行连续迭代。命令模式更像是“调用 AI”，而交互模式才更像“雇佣 AI”。

OpenAI 在 2026 年 4 月 16 日发布"Codex for (almost) everything"的重大升级，把能力一次打包成六大模块：

1.Computer Use（电脑操控）

Codex 可以直接在你的电脑上执行操作：点击、输入、截屏等。后台运行时不会抢占你的光标。你在一个窗口负责写代码，Codex 在另一个窗口帮你跑测试。目前需要 macOS 的 Screen Recording 与 Accessibility 权限；首批阶段仅支持 macOS，Windows 后续将持续跟进。

2.内置浏览器

能够打开 localhost 的本地页面或访问公开网页。通过在页面上进行标注指示改动位置，Codex 就能知道应该调整哪里——无需截图，也不必冗长描述。后续还会扩展到更完整的 Web 场景（包括自动登录、按用户流程推进）。

3.图像生成（gpt-image-1.5）

用于生成产品概念图、前端 mockup、游戏素材等。生成完成后会自动写入项目目录，并同步调整 CSS 以匹配样式。还支持批量产出风格统一的一整套素材包（例如汉堡店全套暖色调素材）。

4.90+ 新插件

整合 Skills、App Integrations 与 MCP Servers，覆盖 Slack、Gmail、Google Calendar、Notion、JIRA（Atlassian Rovo）、CircleCI、GitLab Issues、Microsoft Suite 等。示例指令："Check Slack, Gmail, Google Calendar, and Notion — tell me what needs my attention"

5.记忆系统（Memory）

能够记住你的偏好、修正过的内容与技术背景。下次启动时会自动读取，不用再次解释。并且支持主动给出后续建议，帮助你推进下一步工作。

6.自动化（Automations）

支持定时或事件触发的后台任务。保留此前对话的上下文以便继续执行，能够跨天、跨周安排调度。常见用法：PR babysitter（盯紧未合入的 PR）、客户反馈监控（联动 Slack/Gmail/Notion）、CI/CD 告警处理等。

1.提示词四要素结构

一份更高质量的提示词，通常由四个部分组成：

目标：你希望改变什么，或构建出什么？

上下文：用 @filename 指明要关联的文件

约束：包含架构规则、安全要求以及约定

完成条件：例如测试通过、Bug 不再复现等可验证标准

目标：在用户管理模块加入缓存层

上下文：@UserService.cs @UserRepository.cs

约束：不得破坏现有接口签名，且单测必须全部通过

完成条件：所有现有测试通过，同时缓存命中率 >= 80%

2.使用 @ 符号来聚焦上下文

在提示词中加入 @filename，让 AI 只聚焦于相关文件，从而降低 token 消耗。大型项目建议配合 .codexignore 排除 node_modules、构建产物等无关目录。

3.启用 Plan 模式

当任务较复杂时，可以先按 Shift+Tab，或输入 /plan，让 Codex 先收集上下文并制定计划，再开始动手编码。

4.编写 AGENTS.md

将可复用的提示词规范写入项目根目录下的 AGENTS.md，Codex 每次启动会自动加载。示例内容：

## 项目结构

- src/ 源码

- tests/ 测试

## 运行命令

- 测试: npm test

- 构建: npm run build

## 工程规范

- 使用 TypeScript strict 模式

- 所有公共函数必须配套 JSDoc

- PR 必须通过 CI 检查

5.多Agent 并行（桌面应用独有）

借助工作树（Worktree）实现：多个 Agent 能同时在同一仓库中处理不同分支的任务，互不影响。一个窗口即可管理多个项目，切换也更顺畅。

模型

特点

gpt-5.3-codex

默认模型：在速度与能力间取得平衡，适合大多数日常任务

gpt-5.4

推理能力更强：更适合复杂架构工作与大规模重构

gpt-5.2-codex medium

中等配置：更具性价比，适合轻量级任务

切换方式：codex --model gpt-5.4

•需要ChatGPT 付费订阅（Plus $20/月或 Pro $200/月）

•Pro 用户可使用全部能力（Computer Use、Memory、Automations 等）

•团队启动使用可获得最高$500 额度优惠

•CLI 也可通过 API Key 进行计费（按 token 消耗付费）

1.下载安装→ 访问 openai.com/codex 获取桌面版

2.登录授权→ 使用 ChatGPT 账号一键完成授权

3.克隆项目→ 运行 codex clone https://github.com/your/repo

4.开始对话→ 用自然语言描述你的目标任务

5.编写 AGENTS.md→ 明确项目规范，让长期协作更稳定

6.探索插件→ 安装所需的 MCP 服务并完成应用集成

•产品主页：openai.com/codex

•更新博客："Codex for (almost) everything"

•开发者文档：developers.openai.com/codex

← 上一篇：2026年AI芯片终局：Token经济取代算力，HBM成新核心下一篇：AI赋能·精益增效誉方医管推出《医院绩效智能一体机》，引领绩效管理数字化变革 →