体感 GPT5.4 比 Claude Opus 4.6 更强一点

18 小时 34 分钟前
 EeveeRibbon
Claude Opus 4.6 是用的 cursor 的 Opus 4.6 MAX(思考),GPT5.4 是用的 codex(最高推理度),同样针对一些需求写计划,claude 写的计划总是能被 GPT 找到问题,而且确实存在。不过 GPT5.4 是后出的,比 Opus4.6 强情有可原...这几天打算先用 gpt 写计划了,claude 只负责把计划写成代码节约一点 codex 额度
2589 次点击
所在节点    程序员
18 条回复
zhouqian
18 小时 29 分钟前
最近使用体验上确实是 5.4 明显能力更强,但是速度比 opus 4.6 慢非常多。
EeveeRibbon
18 小时 27 分钟前
@zhouqian #1 确实,开最高推理度之后一个问题不管大小保底是分钟级起步,opus 快的很明显,不过大部分情况我宁愿用时间来换准确度
009694
18 小时 25 分钟前
opus 4.6 有多语言对齐退化的问题
lujiaosama
18 小时 14 分钟前
@zhouqian 5.4 开 FAST 模式好一点
xfxz
18 小时 10 分钟前
可以用 5.4 超高做规划,5.4/5.3 中写代码。最后再用 5.4 高审核。
beimenjun
18 小时 7 分钟前
其实不管啥模型,「实现功能」和「检查功能」两者思维路径是不一样的。

「实现功能」重点是实现,把东西运行起来是第一要务。

「检查功能」则是看这个东西是否有可能出错。

A 模型写,A 模型自查自纠,A 模型再一次自查自纠,B 模型检查,B 模型再次检查,A 模型根据 B 模型的反馈进行检查修改,能够有效提升代码质量。
strobber16
17 小时 52 分钟前
lhyannis
16 小时 55 分钟前
准确度来说,的确是 GPT5.4 更强,但速度比 Claude Opus 4.6 慢不少~
YangWaleed
16 小时 47 分钟前
codex 还需要考虑额度的问题?
WithoutSugarMiao
13 小时 49 分钟前
@EeveeRibbon 别开最高推理度,用高那个级别就行。速度和准确率兼顾的。
regent
11 小时 9 分钟前
我最近看到不少从 codex5.4 倒回来用 codex5.3 的,说 5.4 用的不爽
ProphetN
9 小时 33 分钟前
写代码这一步用不用 Opus 都无所谓了。我现在用 GPT5.4 做完 Plan/Spec 之后加一句:详细记录所有会受到影响的文件和方法,以及所需的对应修改。

然后把这份超详细的计划交给 Kimi K2.5 去做,效果也一点不比 Opus 出来的差。
ProphetN
9 小时 32 分钟前
@ProphetN #12 而且我发现这样做比 GPT5.4 直接写代码还要好,GPT5 写代码一直的问题就是可读性差。而 Kimi 的代码风格更接近于 Claude ,可读性好得多。
gp0119
8 小时 18 分钟前
但是 cursor 里面 claude 速度比 gpt 快多了
CuteGirl
8 小时 10 分钟前
但是我在用的时候 明显感觉 5.4 没有 5.3codex 的编码能力强啊 难道是我的错觉 5.4 写的代码我感觉没有 5.3codex 的好
Saunak
8 小时 7 分钟前
@ProphetN 这个工作流用什么做呢?手动把 5.4 的计划给 kimi 不会很麻烦么?
ProphetN
6 小时 56 分钟前
@Saunak #16 我用的 Factory Droid 。虽然会员里有 GPT5.4 和 Kimi K2.5 ,但是额度太少了。使用 BROY 配置 codex 反代的 GPT5.4 和 kimi Code Plan 。(不开会员也可以配置 BROY ,但是还是要登录)

可以对 Spec 模式单独设置模型,而且 Droid 也支持将 Spec 文件保存到项目目录,我之前是切换到 amp code ,引用 Spec 开始执行。
nzvtac
4 小时 41 分钟前
@CuteGirl 同体感,就代码而言,gpt-5.3-codex xhigh 要比 gpt-5.4 xhigh 好很多很多,基本都是一遍过,但是 gpt-5.4 调用工具更聪明,明显也更快,现在 plan 用 5.4 ,coding 用 5.3-codex xhigh

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1199723

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX