使用 ChatGPT 里的 Codex 已经整整半个月了,我现在的感受很直接:越用越顺手,也越来越觉得,这才是我想象中的 AI Agent 工具。当然,Claude Code 也是这一类工具里的代表,只是这段时间我在老达AI博客和日常内容工作里,明显把更多任务交给了 Codex。
这篇文章不是一篇标准评测,更像是一次个人使用复盘。我想记录一下自己为什么从 OpenClaw 一路折腾到 Claude Code,再到现在越来越想升级 ChatGPT Pro。这里面既有工具体验,也有成本判断,还有一个很现实的问题:当 AI Agent 真的能替你干活以后,Plus 额度到底还够不够用?
从 OpenClaw 开始:第一次感觉 AI Agent 真要来了
老达这一波开始认真使用 AI Agent 工具,是从小龙虾开始的。大概今年 1 月底、2 月初,我开始接触并安装使用它。刚开始它还叫 clawdbot,后来改成 moltbot,再后来才变成现在大家熟悉的 OpenClaw。
刚开始使用 OpenClaw 的时候,我确实很兴奋。那种感觉有点像突然摸到一个新阶段的产品:你在飞书里发一句话,它能去搜索、整理、写文章,甚至尝试发布内容。我当时跟朋友开玩笑说,这有点像 2011 年刚接触比特币时的感觉,不一定马上完全看懂,但能明显意识到它不是普通工具。
2 月份,包括春节期间,我几乎整天都在研究和使用 OpenClaw。写文章、发公众号、整理一些资料,它都能帮上忙。那段时间我对它的期待很高,因为我一直希望有一个 AI 助手,能帮我把内容创作、知识库整理、日常记录和网站更新串起来。
但用到 3 月份以后,问题慢慢出来了。OpenClaw 对我来说,比较稳定的场景还是写写文章、发发公众号;一旦想让它帮我整理工作相关知识库、稳定记录日记和账目,或者执行更长链路的任务,就会不够顺滑。我也越来越意识到,AI Agent 能不能真正好用,底层模型能力太关键了。
AI Agent 真的要用顶级模型
那段时间我主要用的是 GLM、Kimi 等模型。它们不是不能用,但在复杂任务里,经常会出现一个问题:单轮回答看着还可以,真正让它持续执行、理解上下文、改文件、检查结果、再继续迭代时,稳定性就不够。
这也是我后来形成的一个判断:AI Agent 不是普通聊天机器人。普通聊天机器人只要回答一段内容,错一点也许还能人工补;但 Agent 要操作项目、改文章、发网站、调图片、设标签、检查结果。它一旦理解偏了,后面每一步都会跟着偏。
所以我现在越来越觉得,Agent 工具必须配顶级模型。不是说普通模型没有价值,而是当任务变成“持续执行”以后,模型的推理能力、上下文理解、工具调用稳定性、纠错能力,会直接决定最后能不能交付。
这也是为什么我之前写过一篇 把老达AI博客更新从 OpenClaw 转到 Codex 的复盘。不是因为 OpenClaw 没用,而是当任务变成正式发布 WordPress 文章、配置图片、设置标签、检查 SEO、甚至修改主题代码时,我更需要一个稳定执行者。
Claude Code 让我第一次感到“本机执行”有多顺
3 月底的时候,我开始折腾 Claude Code 的会员。这里有一个现实问题:Claude 的 Pro 会员不能直接在 OpenClaw 上使用,所以我就转向桌面端使用 Claude Code。
这一步体验提升很明显。尤其是 Claude 的 Cowork,用在本机上非常顺。它可以直接围绕本地项目执行任务,读文件、改文件、整理内容、迭代结果,整个过程比单纯在聊天窗口里复制粘贴舒服太多。
如果说 OpenClaw 让我第一次感到“AI Agent 的形态快要成了”,那 Claude Code 则让我第一次真正感到“AI Agent 可以在本机干活了”。它不是只给建议,而是可以进入项目上下文,帮你把事情往前推进。
不过使用 Claude Code 时,我一直有一个顾虑:账号稳定性。再加上我本身也想尝试 OpenAI 这一侧的 Codex,于是在 4 月 25 日左右,我找渠道订阅了 ChatGPT Plus,花了 22.99 美元,用上了 ChatGPT 里的 Codex。
Codex 真香:内容、代码、网站维护都能接住
用上 Codex 以后,我的感受就是两个字:真香。
一开始我只是让它做一些内容整理和文章发布,但很快就发现,它能做的远不止这些。比如优化草稿、生成特色图、设置 WordPress 标签、检查 SEO meta、改主题文件、整理发文流程、把重复任务固化成项目内 Skill,这些都可以让 Codex 在同一个项目里完成。
前几天我刚把老达AI博客的发文流程整理成了一个项目内工作流,专门写了一篇 博客发文流程做成项目内 Skill 的复盘。这个过程让我更明显地感受到,Codex 不只是一个写代码工具,它更像是能参与网站运营的项目助手。
尤其是最近模型能力和工具能力继续增强以后,Codex 给我的感觉已经不只是追赶 Claude Code,而是有些场景有超越趋势。比如网站维护、WordPress 发布、文件级修改、流程固化、图片生成和检查结果这些任务,它的稳定性越来越好。
与此同时,我的小龙虾 OpenClaw,好像已经一个多月没有打开了。这不是刻意不用,而是当 Codex 已经能更稳定地完成任务以后,人的选择会自然迁移到阻力更小的工具上。
问题来了:Plus 额度真的不够用了
随着 Codex 使用越来越频繁,我开始遇到一个很实际的问题:Plus 额度不够用。
如果只是偶尔问答、写一两篇文章,Plus 当然够用。但如果周末在家不偷懒,认真盯着 Codex 多线程干活,让它同时整理文章、改网站、生成图片、检查页面、优化标签,一个周末不到,额度就可能被用得很紧。剩下几天只能等刷新,这种感觉很影响工作节奏。
更尴尬的是,我还不敢一直用最强模型。很多时候只能开着相对保守的模型和中等智能模式,想着省一点额度。但问题是,Agent 类任务恰恰最吃模型能力。你越想让它稳定执行复杂任务,就越希望用更好的模型;你越想省额度,就越容易把任务拆碎、降低质量,最后反而增加返工。
这就进入了一个很典型的矛盾:当 AI 只是玩具时,便宜最重要;当 AI 真的参与工作时,稳定和额度就变得更重要。
ChatGPT Pro 现在到底是什么情况?
因为这篇文章涉及套餐信息,我特意按 2026 年 5 月 10 日看到的官方帮助中心信息校准了一下。OpenAI 当前的 ChatGPT Pro 说明里,Pro 已经不是单一档位,而是有 100 美元和 200 美元两个 Pro 层级。
官方的说法大概可以这样理解:Plus 适合轻量使用;Pro 100 美元更适合一周内持续使用高级工具和模型的真实项目;Pro 200 美元则是给更重度、跨项目、持续运行的人。Pro 层级包括 Pro models、Codex、Deep Research、图片生成、记忆和文件上传等能力。
另外,Codex 的消耗也已经进入更细的 credit 计量方式。OpenAI 在 Codex rate card 里说明,Codex 当前按 token 使用来映射 credit,不同模型、输入输出比例、是否使用 fast mode,都会影响消耗。这也解释了为什么我们会感觉“复杂任务很吃额度”:不是每次对话都一样贵,真正重的任务通常会有更长上下文、更多输出和更多工具执行。
所以,如果只是简单问答,Plus 依然很划算;但如果你像我这样把 Codex 当成日常生产力工具,让它维护博客、写文章、改代码、做 SEO、生成图片、跑检查,那升级 Pro 就不再只是“买一个更贵的聊天会员”,而是购买更高的工作吞吐量。
我为什么开始认真考虑升级 Pro?
最直接的原因,是我已经开始把 Codex 当成半个工作伙伴,而不是偶尔体验的新玩具。
它现在帮我做的事情包括:整理手写草稿、优化博客文章、发布到 WordPress、生成与主题相关的特色图、设置栏目和标签、补内链、检查 SEO 输出、修改网站代码、沉淀项目规则。这些任务如果都自己做,耗时并不少;如果外包给人,也不便宜,还要沟通。
所以当我看到 Pro 每月几百到一千多人民币的成本时,第一反应当然还是有点舍不得。但换个角度看,如果它能稳定替我完成一批原本要花几个小时甚至十几个小时的工作,这笔账就不是单纯看“会员费贵不贵”,而是看“它能不能持续创造产出”。
尤其是对老达AI博客这种独立站来说,持续更新、持续优化、持续维护,本来就是一件长期工程。内容写作只是第一步,后面还有 SEO、图片、标签、专题页、旧文更新、技术维护。Codex 如果能把这些环节都接住,Pro 的价值就会更明显。
但我也不会盲目升级
虽然我现在非常想升级 Pro,但我不会把它写成“所有人都应该升级”。这事还是要看使用强度。
如果你只是每天问几个问题、偶尔写篇文章、做一点轻量整理,Plus 仍然够用。没有必要为了心理上的“最强套餐”去多花钱。很多人买高配工具,最后只是偶尔打开,这样就不划算。
但如果你已经开始用 Codex 或 Claude Code 做真实项目,比如维护网站、更新博客、整理知识库、批量处理资料、修改代码、做自动化工作流,而且经常遇到额度焦虑,那 Pro 就值得认真算账。
我的判断标准很简单:如果 AI 每个月能稳定替你节省 10 个小时以上,而且这些时间本来可以转化成内容产出、项目推进或业务价值,那升级就有讨论空间;如果只是为了尝鲜,那先用 Plus 更理性。
老达点评:智能体还是得用好模型
这半个月用下来,我最大的感受不是“某一个工具完美无缺”,而是 AI Agent 这件事终于从概念走向日常工作了。OpenClaw 让我看到入口和自动化想象,Claude Code 让我体验到本机执行的顺滑,Codex 则让我感受到项目级执行和网站维护的稳定性。
我现在越来越确定一件事:智能体还是得用好模型。因为 Agent 干的不是一句话回答,而是一串动作。它要理解目标、读取上下文、调用工具、修改文件、检查结果、继续修正。任何一步理解差一点,后面都可能走偏。
所以我确实在认真考虑,等这个月 ChatGPT Plus 套餐到期后,是否升级到 Pro。可能我会先从 100 美元 Pro 档位开始,看它能不能解决当前最明显的额度焦虑。如果使用强度继续上升,再考虑更高档位。
对我来说,这已经不是“要不要买一个更贵的 AI 会员”的问题,而是“要不要给自己的内容生产和网站运营配一个更强的 AI 执行层”。如果 Codex 能持续稳定地替我完成文章、代码、图片、SEO 和发布流程,那这笔钱大概率是值得的。
更多 AI Agent 和自动化实践,我会继续整理到 AI 智能体与自动化专题;如果你更关心 Codex、Claude Code、Cursor 这类工具的使用体验,也可以看 AI 编程工具专题 和 OpenAI 专题。