体感 GPT5.4 比 Claude Opus 4.6 更强一点

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 请不要在回答技术问题时复制粘贴 AI 生成的内容

Claude Opus 4.6 是用的 cursor 的 Opus 4.6 MAX(思考),GPT5.4 是用的 codex(最高推理度),同样针对一些需求写计划,claude 写的计划总是能被 GPT 找到问题,而且确实存在。不过 GPT5.4 是后出的,比 Opus4.6 强情有可原...这几天打算先用 gpt 写计划了,claude 只负责把计划写成代码节约一点 codex 额度

GPT5.4

Claude

计划

18 条回复 • 2026-03-21 00:33:42 +08:00

zhouqian

18 小时 25 分钟前

最近使用体验上确实是 5.4 明显能力更强，但是速度比 opus 4.6 慢非常多。

EeveeRibbon

18 小时 23 分钟前

@zhouqian #1 确实，开最高推理度之后一个问题不管大小保底是分钟级起步，opus 快的很明显，不过大部分情况我宁愿用时间来换准确度

009694

18 小时 21 分钟前 via iPhone

opus 4.6 有多语言对齐退化的问题

lujiaosama

18 小时 10 分钟前

@zhouqian 5.4 开 FAST 模式好一点

xfxz

18 小时 6 分钟前

可以用 5.4 超高做规划，5.4/5.3 中写代码。最后再用 5.4 高审核。

beimenjun

PRO

18 小时 3 分钟前

其实不管啥模型，「实现功能」和「检查功能」两者思维路径是不一样的。

「实现功能」重点是实现，把东西运行起来是第一要务。

「检查功能」则是看这个东西是否有可能出错。

A 模型写，A 模型自查自纠，A 模型再一次自查自纠，B 模型检查，B 模型再次检查，A 模型根据 B 模型的反馈进行检查修改，能够有效提升代码质量。

strobber16

17 小时 48 分钟前

lhyannis

16 小时 51 分钟前

准确度来说，的确是 GPT5.4 更强，但速度比 Claude Opus 4.6 慢不少~

YangWaleed

16 小时 43 分钟前

codex 还需要考虑额度的问题？

WithoutSugarMiao

13 小时 45 分钟前

@EeveeRibbon 别开最高推理度，用高那个级别就行。速度和准确率兼顾的。

regent

11 小时 5 分钟前

我最近看到不少从 codex5.4 倒回来用 codex5.3 的，说 5.4 用的不爽

ProphetN

9 小时 29 分钟前

写代码这一步用不用 Opus 都无所谓了。我现在用 GPT5.4 做完 Plan/Spec 之后加一句：详细记录所有会受到影响的文件和方法，以及所需的对应修改。

然后把这份超详细的计划交给 Kimi K2.5 去做，效果也一点不比 Opus 出来的差。

ProphetN

9 小时 28 分钟前

@ProphetN #12 而且我发现这样做比 GPT5.4 直接写代码还要好，GPT5 写代码一直的问题就是可读性差。而 Kimi 的代码风格更接近于 Claude ，可读性好得多。

gp0119

8 小时 14 分钟前

但是 cursor 里面 claude 速度比 gpt 快多了

CuteGirl

8 小时 6 分钟前

但是我在用的时候明显感觉 5.4 没有 5.3codex 的编码能力强啊难道是我的错觉 5.4 写的代码我感觉没有 5.3codex 的好

Saunak

8 小时 3 分钟前

@ProphetN 这个工作流用什么做呢？手动把 5.4 的计划给 kimi 不会很麻烦么？

ProphetN

6 小时 52 分钟前

@Saunak #16 我用的 Factory Droid 。虽然会员里有 GPT5.4 和 Kimi K2.5 ，但是额度太少了。使用 BROY 配置 codex 反代的 GPT5.4 和 kimi Code Plan 。（不开会员也可以配置 BROY ，但是还是要登录）

可以对 Spec 模式单独设置模型，而且 Droid 也支持将 Spec 文件保存到项目目录，我之前是切换到 amp code ，引用 Spec 开始执行。

nzvtac

4 小时 37 分钟前

@CuteGirl 同体感，就代码而言，gpt-5.3-codex xhigh 要比 gpt-5.4 xhigh 好很多很多，基本都是一遍过，但是 gpt-5.4 调用工具更聪明，明显也更快，现在 plan 用 5.4 ，coding 用 5.3-codex xhigh