体感 GPT5.4 比 Claude Opus 4.6 更强一点

3 月 20 日
 EeveeRibbon
Claude Opus 4.6 是用的 cursor 的 Opus 4.6 MAX(思考),GPT5.4 是用的 codex(最高推理度),同样针对一些需求写计划,claude 写的计划总是能被 GPT 找到问题,而且确实存在。不过 GPT5.4 是后出的,比 Opus4.6 强情有可原...这几天打算先用 gpt 写计划了,claude 只负责把计划写成代码节约一点 codex 额度
5204 次点击
所在节点    程序员
22 条回复
zhouqian
3 月 20 日
最近使用体验上确实是 5.4 明显能力更强,但是速度比 opus 4.6 慢非常多。
EeveeRibbon
3 月 20 日
@zhouqian #1 确实,开最高推理度之后一个问题不管大小保底是分钟级起步,opus 快的很明显,不过大部分情况我宁愿用时间来换准确度
009694
3 月 20 日
opus 4.6 有多语言对齐退化的问题
lujiaosama
3 月 20 日
@zhouqian 5.4 开 FAST 模式好一点
xfxz
3 月 20 日
可以用 5.4 超高做规划,5.4/5.3 中写代码。最后再用 5.4 高审核。
beimenjun
3 月 20 日
其实不管啥模型,「实现功能」和「检查功能」两者思维路径是不一样的。

「实现功能」重点是实现,把东西运行起来是第一要务。

「检查功能」则是看这个东西是否有可能出错。

A 模型写,A 模型自查自纠,A 模型再一次自查自纠,B 模型检查,B 模型再次检查,A 模型根据 B 模型的反馈进行检查修改,能够有效提升代码质量。
strobber16
3 月 20 日
lhyannis
3 月 20 日
准确度来说,的确是 GPT5.4 更强,但速度比 Claude Opus 4.6 慢不少~
YangWaleed
3 月 20 日
codex 还需要考虑额度的问题?
WithoutSugarMiao
3 月 20 日
@EeveeRibbon 别开最高推理度,用高那个级别就行。速度和准确率兼顾的。
regent
3 月 20 日
我最近看到不少从 codex5.4 倒回来用 codex5.3 的,说 5.4 用的不爽
ProphetN
3 月 20 日
写代码这一步用不用 Opus 都无所谓了。我现在用 GPT5.4 做完 Plan/Spec 之后加一句:详细记录所有会受到影响的文件和方法,以及所需的对应修改。

然后把这份超详细的计划交给 Kimi K2.5 去做,效果也一点不比 Opus 出来的差。
ProphetN
3 月 20 日
@ProphetN #12 而且我发现这样做比 GPT5.4 直接写代码还要好,GPT5 写代码一直的问题就是可读性差。而 Kimi 的代码风格更接近于 Claude ,可读性好得多。
gp0119
3 月 20 日
但是 cursor 里面 claude 速度比 gpt 快多了
CuteGirl
3 月 20 日
但是我在用的时候 明显感觉 5.4 没有 5.3codex 的编码能力强啊 难道是我的错觉 5.4 写的代码我感觉没有 5.3codex 的好
Saunak
3 月 20 日
@ProphetN 这个工作流用什么做呢?手动把 5.4 的计划给 kimi 不会很麻烦么?
ProphetN
3 月 20 日
@Saunak #16 我用的 Factory Droid 。虽然会员里有 GPT5.4 和 Kimi K2.5 ,但是额度太少了。使用 BROY 配置 codex 反代的 GPT5.4 和 kimi Code Plan 。(不开会员也可以配置 BROY ,但是还是要登录)

可以对 Spec 模式单独设置模型,而且 Droid 也支持将 Spec 文件保存到项目目录,我之前是切换到 amp code ,引用 Spec 开始执行。
nzvtac
3 月 21 日
@CuteGirl 同体感,就代码而言,gpt-5.3-codex xhigh 要比 gpt-5.4 xhigh 好很多很多,基本都是一遍过,但是 gpt-5.4 调用工具更聪明,明显也更快,现在 plan 用 5.4 ,coding 用 5.3-codex xhigh
badgate
3 月 22 日
5.4 能用国内 visa 订阅吗
capric
3 月 23 日
@badgate 走 google play 下载 chagpt 然后订阅就可以了,国内 visa/mastercard 都行

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1199723

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX