V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
EeveeRibbon
V2EX  ›  程序员

体感 GPT5.4 比 Claude Opus 4.6 更强一点

  •  
  •   EeveeRibbon · 18 小时 30 分钟前 · 2588 次点击
    Claude Opus 4.6 是用的 cursor 的 Opus 4.6 MAX(思考),GPT5.4 是用的 codex(最高推理度),同样针对一些需求写计划,claude 写的计划总是能被 GPT 找到问题,而且确实存在。不过 GPT5.4 是后出的,比 Opus4.6 强情有可原...这几天打算先用 gpt 写计划了,claude 只负责把计划写成代码节约一点 codex 额度
    18 条回复    2026-03-21 00:33:42 +08:00
    zhouqian
        1
    zhouqian  
       18 小时 25 分钟前
    最近使用体验上确实是 5.4 明显能力更强,但是速度比 opus 4.6 慢非常多。
    EeveeRibbon
        2
    EeveeRibbon  
    OP
       18 小时 23 分钟前
    @zhouqian #1 确实,开最高推理度之后一个问题不管大小保底是分钟级起步,opus 快的很明显,不过大部分情况我宁愿用时间来换准确度
    009694
        3
    009694  
       18 小时 21 分钟前 via iPhone
    opus 4.6 有多语言对齐退化的问题
    lujiaosama
        4
    lujiaosama  
       18 小时 10 分钟前
    @zhouqian 5.4 开 FAST 模式好一点
    xfxz
        5
    xfxz  
       18 小时 6 分钟前
    可以用 5.4 超高做规划,5.4/5.3 中写代码。最后再用 5.4 高审核。
    beimenjun
        6
    beimenjun  
    PRO
       18 小时 3 分钟前   ❤️ 1
    其实不管啥模型,「实现功能」和「检查功能」两者思维路径是不一样的。

    「实现功能」重点是实现,把东西运行起来是第一要务。

    「检查功能」则是看这个东西是否有可能出错。

    A 模型写,A 模型自查自纠,A 模型再一次自查自纠,B 模型检查,B 模型再次检查,A 模型根据 B 模型的反馈进行检查修改,能够有效提升代码质量。
    strobber16
        7
    strobber16  
       17 小时 48 分钟前
    lhyannis
        8
    lhyannis  
       16 小时 51 分钟前
    准确度来说,的确是 GPT5.4 更强,但速度比 Claude Opus 4.6 慢不少~
    YangWaleed
        9
    YangWaleed  
       16 小时 43 分钟前
    codex 还需要考虑额度的问题?
    WithoutSugarMiao
        10
    WithoutSugarMiao  
       13 小时 45 分钟前
    @EeveeRibbon 别开最高推理度,用高那个级别就行。速度和准确率兼顾的。
    regent
        11
    regent  
       11 小时 5 分钟前
    我最近看到不少从 codex5.4 倒回来用 codex5.3 的,说 5.4 用的不爽
    ProphetN
        12
    ProphetN  
       9 小时 29 分钟前
    写代码这一步用不用 Opus 都无所谓了。我现在用 GPT5.4 做完 Plan/Spec 之后加一句:详细记录所有会受到影响的文件和方法,以及所需的对应修改。

    然后把这份超详细的计划交给 Kimi K2.5 去做,效果也一点不比 Opus 出来的差。
    ProphetN
        13
    ProphetN  
       9 小时 28 分钟前
    @ProphetN #12 而且我发现这样做比 GPT5.4 直接写代码还要好,GPT5 写代码一直的问题就是可读性差。而 Kimi 的代码风格更接近于 Claude ,可读性好得多。
    gp0119
        14
    gp0119  
       8 小时 14 分钟前
    但是 cursor 里面 claude 速度比 gpt 快多了
    CuteGirl
        15
    CuteGirl  
       8 小时 6 分钟前
    但是我在用的时候 明显感觉 5.4 没有 5.3codex 的编码能力强啊 难道是我的错觉 5.4 写的代码我感觉没有 5.3codex 的好
    Saunak
        16
    Saunak  
       8 小时 3 分钟前
    @ProphetN 这个工作流用什么做呢?手动把 5.4 的计划给 kimi 不会很麻烦么?
    ProphetN
        17
    ProphetN  
       6 小时 52 分钟前
    @Saunak #16 我用的 Factory Droid 。虽然会员里有 GPT5.4 和 Kimi K2.5 ,但是额度太少了。使用 BROY 配置 codex 反代的 GPT5.4 和 kimi Code Plan 。(不开会员也可以配置 BROY ,但是还是要登录)

    可以对 Spec 模式单独设置模型,而且 Droid 也支持将 Spec 文件保存到项目目录,我之前是切换到 amp code ,引用 Spec 开始执行。
    nzvtac
        18
    nzvtac  
       4 小时 37 分钟前
    @CuteGirl 同体感,就代码而言,gpt-5.3-codex xhigh 要比 gpt-5.4 xhigh 好很多很多,基本都是一遍过,但是 gpt-5.4 调用工具更聪明,明显也更快,现在 plan 用 5.4 ,coding 用 5.3-codex xhigh
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   885 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 21:10 · PVG 05:10 · LAX 14:10 · JFK 17:10
    ♥ Do have faith in what you're doing.