因为最近 claude 相当的不做人,不光降智(官方承认),降速,还把 Max 100 的用量砍了一半以上,官方还没有任何补偿,我和小伙伴天天都在“You reached 5 hours limit”的恐惧中度过。
我们两一合计,这钱花的既然不舒服,干脆顺应 reddit 上老哥们呼吁,心一横转投 codex 去了。
一周使用和对比 claude code 之后我们有以下感想:
- sam 还是有钱,我们一周时间基本用满了 codex 的 weekly limit (然后从未被 5 hours limit 卡过),粗略估计了一下 pro plan 的 weekly limit 是十亿 tokens 左右(换算 api 价值$300 上下)。
- codex 对比 claude code 完全是半成品,我觉得 openai 他们做 codex 的理念就是力大砖飞,完全用模型性能弥补产品能力的不足。
- gpt5 (& codex )比现在的 claude4 sonnet 要听话不少,基础改动,修 bug 效率要比现在版本的 claude code 高出一截,最重要的是 gpt5 不会回你 “you are absolutely right” 这句一看到就知道 cc 又把事情搞砸了的话,相反还会评估你的意见,甚至会否决不合理的指令。
- 因为 codex 的半成品性质(里面甚至没有内置文件的 r/w tool ),导致 codex 很喜欢用骚操作来解决问题,包括但不限于写 python 命令就为了读写文件的迷惑操作。
- 上下文大就是可以为所欲为,codex 在开写之前不需要你安排精细设计 prompt ,他自己会去探索你的代码库,直到他认为找到信息为止才开写,经常花费 20%左右的 context 用在探索上,然后 20%的 context 已经是 cc 的 100%了。
- 积极又懒惰,一方面他会尝试用各种手头的工具完成你的任务(哪怕用各种骚操作),另一方面你又很难让他一直工作下去(哪怕你用全自动工作 prompt 引导他),他也会在某一刻停下来不是问你意见。
- slow is fast, 当你使用 gpt high/gpt codex high 然后 one shot 解决问题,哪怕生成速度比 cc 慢,最终解决问题的速度还是会更快。
总之我们这一周对 codex 还是相当满意的,唯一不满的就是 codex 这个本身半成品的存在,对比越来越不做人的 claude 确实可以称得上是一个拿的上台面的替代方案了。