发布日期:2026-06-24 | 话题:AI 编程工具 | 适用人群:开发者、Codex 用户
Codex 的额度限制基于5 小时滚动窗口,而非每天固定刷新——从你发出第一条消息开始计时,5 小时内的消息数累计触顶后限流,窗口过去后逐步恢复,不是睡一觉就满血。官方定价页显示:Plus/Business 套餐下 gpt-5.5 每个 5 小时窗口只有 15–80 条消息额度,一次多文件重构可以在三小时内打空。额度不够时有三条路可走:省着用(缩小任务范围、换轻量模型、用 AGENTS.md 减少上下文)、升级更高套餐(Pro 档 gpt-5.5 额度最高可达 Plus 的 20 倍)、切 API Key 按量计费(绕开额度上限,按 token 消耗付钱,无固定窗口限制)。国内用户还可以用 Fenno 这类兼容 OpenAI Responses API 的 AI 编程网关,把 Codex CLI / IDE 扩展接到第三方 base_url,同时用后台看 Token、费用、模型分布和 Key 额度,避免“窗口额度不够”和“API 账单失控”同时发生。本文整理三套方案的具体配置和选择逻辑。
先搞清楚:Codex 的额度是怎么算的
5 小时滚动窗口 + 周限额双层机制
Codex 同时有两层限制,触顶任一层都会被卡:
第一层:5 小时滚动窗口
- 从本窗口第一条消息起算,5 小时内消息数累计上限
- 触顶后显示
You've hit your usage limit. Try again at HH:MM,时间戳就是窗口重置时间 - 用
codex /status可查看当前剩余和重置时间
第二层:周限额(7 天滚动)
- 与 5 小时窗口独立计算
- Plus 用户连跑 2-3 次多文件重构即可耗尽周限额
- 触顶后显示
You've reached your weekly limit
两层各自独立,可能出现"5 小时窗口还有 30% 剩余,但周限额已满"的情况。
各套餐精确额度(来源:官方定价页)
| 套餐 | gpt-5.5 / 5h | gpt-5.4 / 5h | gpt-5.4-mini / 5h |
|---|---|---|---|
| Plus / Business | 15–80 条 | 20–100 条 | 60–350 条 |
| Pro 中档 | 75–400 条 | 100–500 条 | 300–1750 条 |
| Pro 旗舰档 | 300–1600 条 | 400–2000 条 | 1200–7000 条 |
| Enterprise(灵活定价) | 无固定限制,随用量扩展 | — | — |
区间下限是繁忙时段实际可用量,上限是空闲时段。本地消息与云端任务共享同一窗口配额。
额度为什么消耗这么快
Codex 不是按"提问次数"计费,而是按每次 Agent 循环的 token 消耗折算。以下场景消耗特别快:
- 让 Codex 读整个项目:几百个文件全部装进上下文,一次循环吃掉大量 token
- 需求描述模糊:Codex 多次尝试、反复修改,每次都是一个完整循环
- 同时处理多个任务:本地 + 云端任务共享同一窗口,并行消耗
- 使用旗舰模型处理简单任务:gpt-5.5 做 "修改注释" 这种小事是大炮打蚊子
一次重型 Agent 循环(约 25 万输入 + 2.5 万输出 token)消耗大量额度,而 Plus 周预算有限,连续跑六次此类任务即可触顶。
出路一:省着用(不花钱,先把现有额度用够)
技巧一:缩小任务范围
问题:帮我检查整个项目 → Codex 扫描全部文件,消耗极高
改法:只检查 src/auth/ 目录下的登录逻辑
❌ "帮我重构项目"
✅ "重构 src/components/LoginForm.tsx,只改表单验证逻辑,不改其他文件"技巧二:换轻量模型处理简单任务
gpt-5.4-mini 的额度是 gpt-5.5 的 4-8 倍(同一套餐下 60-350 条 vs 15-80 条):
# 日常补全、写单测、修 lint——用 mini 节省额度
model = "gpt-5.4-mini"
model_reasoning_effort = "low"
# 复杂重构再切 Profile 换旗舰模型
# codex --profile deep用 Profile 切换:
# ~/.codex/mini.config.toml
model = "gpt-5.4-mini"
model_reasoning_effort = "low"
approval_policy = "on-request"codex --profile mini # 日常省量模式
codex # 默认模式(gpt-5.5)技巧三:先规划后执行,减少反复
让 Codex 先输出计划,确认再动文件:
"列出修改计划,不要实际改动文件。
覆盖范围:src/api/ 目录,目标:把所有 axios 调用统一封装成 fetchClient。
列出要改哪些文件、改什么,等我确认再执行。"确认计划后再说 "按计划执行",Codex 已有上下文,不会重新分析整个项目,节省 1-2 个完整循环。
技巧四:用 AGENTS.md 减少重复上下文
在项目根目录放 AGENTS.md,把项目背景、约定、禁止修改的文件一次性写清楚:
# AGENTS.md
## 项目背景
这是一个 Next.js 14 + Prisma 项目,使用 PostgreSQL。
## 约定
- 组件一律放在 src/components/
- API 路由一律放在 src/app/api/
- 样式用 Tailwind,不引入其他 CSS 框架
## 禁止修改
- prisma/migrations/(已有迁移文件不要动)
- .env.local(环境变量不要改)
## 每次任务前
先阅读本文件,明确范围后再行动。有了 AGENTS.md,Codex 不需要每次重新"探索"项目结构,节省前期分析 token。
技巧五:一个对话只处理一个任务
上下文越长,每次循环消耗越高。完成一个任务后新开对话,而不是在同一个对话里堆砌 10 个需求。
出路二:升级到更高套餐
Plus → Pro:额度提升 4-20 倍
| Plus | Pro 中档 | Pro 旗舰档 | |
|---|---|---|---|
| gpt-5.5 / 5h | 15–80 条 | 75–400 条 | 300–1600 条 |
| 相对 Plus 额度倍数 | 1x | 约 5x | 约 20x |
Pro 旗舰划算吗?
如果你每天有效使用 2-3 个 5 小时窗口(正常工作日),Plus 的 15-80 条/窗口实际可能在 3-4 小时内耗尽。Pro 旗舰档的 300-1600 条基本够一天密集开发。
不推荐升级的情况:偶尔用一次就碰壁,大概率是任务写法问题而非额度不足——先用省量技巧观察一周再决定。
Business/Enterprise:团队场景
- Business:额度与 Plus 相同,但支持多人共享、管理后台
- Enterprise(灵活定价):无固定速率限制,额度随用量扩展,适合消耗量大且不规律的团队
出路三:切 API Key 按量计费(最灵活)
原理
绕开套餐的消息数限制,直接按 token 消耗付钱,没有 5 小时窗口或周限额:
# ~/.codex/config.toml
model = "gpt-5.5"
model_provider = "openai-api"
[model_providers.openai-api]
name = "OpenAI API"
base_url = "https://api.openai.com/v1"
env_key = "OPENAI_API_KEY"
wire_api = "responses"export OPENAI_API_KEY="sk-your-openai-api-key"国内用中转服务同理,把 base_url 换成中转地址即可。这里推荐优先选择能同时提供OpenAI Responses API 兼容、用量统计、Key 限额、模型分布的平台,而不是只给一个裸转发地址。原因很简单:Codex 不是普通聊天工具,一次 Agent 任务可能包含多轮读取、修改、测试和重试,如果没有后台账单和 Token 明细,很难知道钱到底花在哪个任务上。
Fenno 接入示例:额度外的按量计费方案
Fenno 的适用场景不是替代 Codex 本身,而是在你用 CLI / IDE 扩展时,提供一个可控的第三方 API 入口。它的核心价值有四个:
- 一个 base_url 接入 Codex 的第三方模型配置
- 每个 API Key 可单独统计今日用量和近 30 天消费
- 支持按用途分 Key,例如
codex-daily、codex-heavy-task、codex-test - 可通过额度限制、速率限制、有效期降低 Key 泄露或误调用风险
Codex 配置示例:
model = "gpt-5.4"
model_provider = "fenno"
model_reasoning_effort = "medium"
[model_providers.fenno]
name = "Fenno"
base_url = "https://api.fenno.ai"
env_key = "FENNO_API_KEY"
wire_api = "responses"
requires_openai_auth = trueexport FENNO_API_KEY="sk-your-fenno-api-key"建议至少建两个 Key:
| Key 用途 | 推荐命名 | 建议限制 |
|---|---|---|
| 日常修改、写单测、修 lint | codex-daily | 低额度 + 低速率 |
| 大型重构、架构分析 | codex-heavy | 单独额度 + 任务后禁用 |
| 测试新模型、新配置 | codex-test | 最低额度 + 短有效期 |
这样做的好处是:如果某个任务突然消耗异常,你可以在 Fenno 后台直接看是哪把 Key、哪个模型、哪段时间烧掉了预算,而不是只看到 Codex 提示“额度不够”。
按量计费的实际成本
按 token 计费,成本与任务复杂度直接相关:
| 任务类型 | 相对消耗 |
|---|---|
| 修改单个函数、改注释 | 低(几千 token) |
| 单文件重构(500 行以内) | 中(数万 token) |
| 多文件重构(5-10 个文件) | 高(数十万 token) |
| 完整功能模块(含测试) | 很高(百万 token 量级) |
具体费率参见 OpenAI 官方定价页(platform.openai.com/docs/pricing)。
国内中转 API 接入
国内用中转服务(按 token 计费,无额度限制):
model = "gpt-5.5"
model_provider = "relay"
[model_providers.relay]
name = "中转服务"
base_url = "https://你的中转地址/v1"
env_key = "RELAY_API_KEY"
wire_api = "responses"API Key 模式的限制:不含 Codex Cloud(Web 版)功能,只支持 CLI / SDK / IDE 扩展。云端并行任务需要 ChatGPT 订阅账号。
怎么诊断当前额度状态
# 查看当前剩余额度和重置时间
codex /status
# 典型输出示例:
# Messages remaining (5h window): 12 / 80
# Window resets at: 14:32 (in 2h 18m)
# Weekly messages used: 240 / 300| 输出信息 | 含义 | 处理方式 |
|---|---|---|
try again at HH:MM | 5 小时窗口触顶 | 等待或切 API Key |
reached your weekly limit | 周限额耗尽 | 等到下周一或切 API Key |
| 显示剩余充足但仍报错 | CLI bug(已知 #19215) | 升级 CLI 版本或重启 |
三条出路怎么选
| 你的情况 | 推荐方案 |
|---|---|
| 偶尔碰壁,任务描述比较粗放 | 先试省量技巧,加 AGENTS.md + 换 mini 模型 |
| 每天都能把 Plus 用完 | 升级 Pro 旗舰档,额度约 20 倍 |
| 用量极不规律(有时密集有时一周不用) | 切 API Key 按量付费,按实际消耗付钱 |
| 国内用户,不想处理 ChatGPT 订阅 | Fenno / 中转 API + 按量计费,CLI 和 IDE 扩展最稳 |
| 想知道 Codex 任务到底花了多少钱 | Fenno 这类带用量统计的 API 网关,按 Key / 模型 / 时间段看消耗 |
| 担心 API Key 被刷或误调用 | 给 Codex 单独建 Key + 设置额度限制,不要全工具共用一个 Key |
| 团队多人使用 | Business/Enterprise,管理后台 + 额度可控 |
常见问题 FAQ
Q1:Codex 的额度是每天重置还是每 5 小时?
5 小时滚动窗口,不是每天固定重置。窗口从你当天第一条消息开始计时,5 小时后重置。另外还有 7 天滚动的周限额,两层独立计算,任意一层触顶都会被限流。codex /status 可以查当前状态和重置时间。
Q2:Pro 旗舰档比 Plus 多了多少额度?
gpt-5.5 每 5 小时窗口:Plus 15–80 条,Pro 旗舰档 300–1600 条,上限提升约 20 倍。如果你每天用量稳定且高,升级值得;如果用量不规律,切 API Key 按量计费通常更划算。
Q3:切 API Key 后还能用 Codex Cloud(Web 版)吗?
不能。API Key 模式只支持 CLI、IDE 扩展、SDK,不含云端并行任务功能。云端任务需要 ChatGPT 订阅账号(Plus/Pro/Business)。如果你主要用 CLI 和 IDE 扩展,API Key 模式功能完全够用。
Q4:Fenno 这种第三方 API 会增加什么价值?
裸中转只能解决“能不能连上”的问题,Fenno 这类 AI 编程网关还解决“用了多少、谁在用、哪个模型贵、Key 怎么限额”的问题。对 Codex 来说,最适合的用法是把 Fenno 当作 CLI / IDE 扩展的按量计费入口:日常任务走轻量模型,大任务单独建 Key,跑完后看模型分布和 Token 消耗,再决定是否继续用旗舰模型。
Q5:Fenno 能替代 Codex 订阅额度吗?
不能完全替代。它适合 CLI / IDE 扩展 / SDK 这类本地或开发工具入口,不包含 Codex Cloud(Web 版)的云端并行任务能力。如果你主要在 Web 版里跑云任务,还是需要 ChatGPT 订阅;如果你主要在本地项目里用 CLI 或 IDE 扩展,Fenno + API Key 会更灵活。
Q6:AGENTS.md 和 CLAUDE.md 有什么区别?
AGENTS.md 是 Codex 的项目级指令文件,作用类似 Claude Code 的 CLAUDE.md——放在项目根目录,每次启动 Codex 时自动读取,相当于持久化的 system prompt,省去每次手动说明项目背景的开销。两者格式相似,但分别被 Codex 和 Claude Code 读取,互不共享。
Q7:gpt-5.4-mini 的编程效果差很多吗?
单文件修改、写单测、格式化、修 lint 等简单任务,mini 和 gpt-5.5 差距不大;多文件重构、复杂架构分析、需要理解全局依赖的任务,差距明显。建议用 Profile 分层:日常低频任务跑 mini(省额度),复杂任务再切 gpt-5.5(用宝贵的窗口额度)。
小结
Codex 额度不够的根本原因通常有两个:任务描述范围太大(让 Codex 读整个项目)、或者用旗舰模型做了可以用轻量模型完成的任务。最先尝试的解法是省量技巧——加 AGENTS.md、换 gpt-5.4-mini、把大任务拆成多步——这通常能把 Plus 的有效使用量提升 2-3 倍而无需升级。如果你每天都能打满 Plus 的上限,再考虑升级 Pro 旗舰档(额度约 20 倍)或切 API Key 按量计费(无上限,按 token 消耗付钱)。
国内用户更推荐“订阅额度 + Fenno/API Key”双轨:Web / Cloud 任务继续用 ChatGPT 订阅,本地 CLI 和 IDE 扩展走 Fenno 这类兼容 Responses API 的网关。这样既能绕开 5 小时窗口,又能通过独立 Key、额度限制、模型分布和消费统计把 Codex 的成本管住。本文数据来源:Codex 官方定价页(developers.openai.com/codex/pricing),2026-06。
参考来源:
- Codex 官方定价页(developers.openai.com/codex/pricing)
- Codex 官方文档(developers.openai.com/codex)
- Fenno 官网:AI 编程
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用@来通知其他用户。