标签

OpenAI Codex使用指南

发布时间:2026-05-01 07:19来源:微信阅读:18

汇总自OpenAI官方资料 | 2026年4月更新版

Codex 是 OpenAI 打造的 AI 软件工程智能体(Coding Agent),它的定位是“AI 程序员伙伴”。与单纯的代码补全不同,Codex 更像真实工程团队中的一员:能够独立承接并完成从理解到落地的一整套软件工程工作。

关键信息:

•底层模型:GPT-5.3-Codex / GPT-5.4(基于 o3 优化的定制变体)

•每周超过300 万开发者在使用

•实现路径:由“代码补全工具”逐步升级为可自主交付完整工程任务的 Agent

•能力链路:读项目→ 理解代码 → 修改文件 → 跑测试 → 提交 PR

入口

说明

适合人群

Codex App(推荐)

macOS / Windows 桌面应用,多 Agent 协同指挥中心

主力开发,想获得完整功能体验的用户

CLI 命令行

在终端里执行 codex 命令

偏好命令行工作流的开发者

IDE 扩展

VS Code / JetBrains 插件集成

以 IDE 作为主要开发场景的用户

ChatGPT 网页端

通过 chatgpt.com/codex 进行直接调用

想快速上手、暂不打算安装的用户

1.进入openai.com/codex 产品主页

2.选择点击「下载Windows 版」或 macOS 版

3.安装后用ChatGPT 账号登录即可开始使用

# 前提:Node.js >= 22, npm >= 10

npm install -g @openai/codex

# 验证安装

codex --version

# 启动交互模式

codex

brew install --cask codex

•方式一:ChatGPT 账号登录(推荐个人用户)— 第一次启动会自动打开浏览器授权流程,操作更快更省事

•方式二:API Key 登录— 更适合企业或需要自动化控制的团队,可更好地脚本化管理

export OPENAI_API_KEY="sk-xxxxxxxxxxxx"

codex

适用于快速任务、CI/CD 自动化。任务结束后即刻退出,不保留上下文记忆:

codex "帮我写一个 JSON 解析函数"

codex "修复 UserService.cs 中的空引用问题"

这才体现 Codex 的核心价值——它像一个随时在线的 AI 队友。进入后可以持续对话,并具备完整上下文记忆,适合对复杂需求进行反复迭代:

codex

进入后的典型对话节奏:

•"帮我梳理这个项目的代码结构"

•"在用户模块引入 Redis 缓存"

•"编写单元测试并实际运行验证"

核心优势:具备完整上下文记忆,能够支持对复杂任务进行连续迭代。命令模式更像是“调用 AI”,而交互模式才更像“雇佣 AI”。

OpenAI 在 2026 年 4 月 16 日发布"Codex for (almost) everything"的重大升级,把能力一次打包成六大模块:

1.Computer Use(电脑操控)

Codex 可以直接在你的电脑上执行操作:点击、输入、截屏等。后台运行时不会抢占你的光标。你在一个窗口负责写代码,Codex 在另一个窗口帮你跑测试。目前需要 macOS 的 Screen Recording 与 Accessibility 权限;首批阶段仅支持 macOS,Windows 后续将持续跟进。

2.内置浏览器

能够打开 localhost 的本地页面或访问公开网页。通过在页面上进行标注指示改动位置,Codex 就能知道应该调整哪里——无需截图,也不必冗长描述。后续还会扩展到更完整的 Web 场景(包括自动登录、按用户流程推进)。

3.图像生成(gpt-image-1.5)

用于生成产品概念图、前端 mockup、游戏素材等。生成完成后会自动写入项目目录,并同步调整 CSS 以匹配样式。还支持批量产出风格统一的一整套素材包(例如汉堡店全套暖色调素材)。

4.90+ 新插件

整合 Skills、App Integrations 与 MCP Servers,覆盖 Slack、Gmail、Google Calendar、Notion、JIRA(Atlassian Rovo)、CircleCI、GitLab Issues、Microsoft Suite 等。示例指令:"Check Slack, Gmail, Google Calendar, and Notion — tell me what needs my attention"

5.记忆系统(Memory)

能够记住你的偏好、修正过的内容与技术背景。下次启动时会自动读取,不用再次解释。并且支持主动给出后续建议,帮助你推进下一步工作。

6.自动化(Automations)

支持定时或事件触发的后台任务。保留此前对话的上下文以便继续执行,能够跨天、跨周安排调度。常见用法:PR babysitter(盯紧未合入的 PR)、客户反馈监控(联动 Slack/Gmail/Notion)、CI/CD 告警处理等。

1.提示词四要素结构

一份更高质量的提示词,通常由四个部分组成:

目标:你希望改变什么,或构建出什么?

上下文:用 @filename 指明要关联的文件

约束:包含架构规则、安全要求以及约定

完成条件:例如测试通过、Bug 不再复现等可验证标准

目标:在用户管理模块加入缓存层

上下文:@UserService.cs @UserRepository.cs

约束:不得破坏现有接口签名,且单测必须全部通过

完成条件:所有现有测试通过,同时缓存命中率 >= 80%

2.使用 @ 符号来聚焦上下文

在提示词中加入 @filename,让 AI 只聚焦于相关文件,从而降低 token 消耗。大型项目建议配合 .codexignore 排除 node_modules、构建产物等无关目录。

3.启用 Plan 模式

当任务较复杂时,可以先按 Shift+Tab,或输入 /plan,让 Codex 先收集上下文并制定计划,再开始动手编码。

4.编写 AGENTS.md

将可复用的提示词规范写入项目根目录下的 AGENTS.md,Codex 每次启动会自动加载。示例内容:

## 项目结构

- src/ 源码

- tests/ 测试

## 运行命令

- 测试: npm test

- 构建: npm run build

## 工程规范

- 使用 TypeScript strict 模式

- 所有公共函数必须配套 JSDoc

- PR 必须通过 CI 检查

5.多Agent 并行(桌面应用独有)

借助工作树(Worktree)实现:多个 Agent 能同时在同一仓库中处理不同分支的任务,互不影响。一个窗口即可管理多个项目,切换也更顺畅。

模型

特点

gpt-5.3-codex

默认模型:在速度与能力间取得平衡,适合大多数日常任务

gpt-5.4

推理能力更强:更适合复杂架构工作与大规模重构

gpt-5.2-codex medium

中等配置:更具性价比,适合轻量级任务

切换方式:codex --model gpt-5.4

•需要ChatGPT 付费订阅(Plus $20/月 或 Pro $200/月)

•Pro 用户可使用全部能力(Computer Use、Memory、Automations 等)

•团队启动使用可获得最高$500 额度优惠

•CLI 也可通过 API Key 进行计费(按 token 消耗付费)

1.下载安装→ 访问 openai.com/codex 获取桌面版

2.登录授权→ 使用 ChatGPT 账号一键完成授权

3.克隆项目→ 运行 codex clone https://github.com/your/repo

4.开始对话→ 用自然语言描述你的目标任务

5.编写 AGENTS.md→ 明确项目规范,让长期协作更稳定

6.探索插件→ 安装所需的 MCP 服务并完成应用集成

•产品主页:openai.com/codex

•更新博客:"Codex for (almost) everything"

•开发者文档:developers.openai.com/codex