V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
jdz
V2EX  ›  程序员

O3, O4mini-high, claude3.7, Gemini2.5pro 编程能力该怎么排序

  •  1
     
  •   jdz · 42 天前 via Android · 3594 次点击
    这是一个创建于 42 天前的主题,其中的信息可能已经有所发展或是发生改变。
    28 条回复    2025-05-06 12:24:24 +08:00
    jdz
        1
    jdz  
    OP
       42 天前 via Android
    编程能力
    crackidz
        2
    crackidz  
       42 天前   ❤️ 1
    laogui
        3
    laogui  
       42 天前   ❤️ 1
    事实上 o3 效果最好,用过就知道,但价格太贵,都不在考虑范围之内,都在讨论 Gemini 2.5 Pro 和 Claude 3.7 Sonnet
    dbg
        4
    dbg  
       42 天前
    大模型 前端编程 排行榜
    https://web.lmarena.ai/leaderboard
    icyalala
        5
    icyalala  
       42 天前
    Cursor 官方统计: https://x.com/cursor_ai/status/1917982557070868739
    现在用得最多的还是 Claude3.7 和 Gemini2.5 pro ,但是 o3/o4-mini 增长很快
    Numeron
        6
    Numeron  
       42 天前
    https://aider.chat/docs/leaderboards/
    Leoking222
        7
    Leoking222  
       41 天前
    编程无脑 Claude 3.7 就对了,目前没对手
    lneoi
        8
    lneoi  
       41 天前
    Gemini2.5 pro 很厉害,加上上下文足够大
    murmurkerman
        9
    murmurkerman  
       41 天前 via iPhone
    genimi 2.5 pro
    huluhulu
        10
    huluhulu  
       41 天前
    genimi 2.5 pro ,尤其是大段代码重构的时候,简直无敌。
    nanjoyoshino
        11
    nanjoyoshino  
       41 天前
    我投 Claude 一票,有一次一个关于 redis memory usage 命令的东西,全部问了一遍,只有 Claude 第一次就回答了正确答案,其它的始终都没有给出正确答案
    Zhoukker
        12
    Zhoukker  
       41 天前
    o3 非常强。就是门槛和价格,综合考虑还是 2.5pro
    yibie
        13
    yibie  
       41 天前
    已转 gemini
    ShadowPower
        14
    ShadowPower  
       41 天前
    写前端或者新写独立的代码的时候,claude 3.7 强
    对现有的整个项目或者整个模块做分析、重构、genimi 2.5 pro 强
    godqueue
        15
    godqueue  
       41 天前
    gemini 感觉最新的内容会比较好,比如最新的 springboot3 以上的版本,他就能给出正确的答案;其他的会差一些
    但是编程整体应该是 Claude 最强
    yueyingky
        16
    yueyingky  
       41 天前
    以前用 3.7 ,现在觉得 genimi 2.5 pro 更好用
    ooops
        17
    ooops  
       41 天前
    个人实测 3.7 3.5 > 2.5pro
    aarontian
        18
    aarontian  
       41 天前
    平时用 cursor 写 go 和 python 多些,经常是提出一个比较复杂的需求用 agent 模式一次性写完。感觉写代码 claude 独一档,但 gemini 2.5 pro 规划总结能力和 debug 能力似乎更强(实际写代码时候不那么准确)

    以及 claude 在多轮对话和中断重启的时候容易丢失上下文,我有时候会让 gemini 总结一下我的要求,列计划,然后切换到 claude 3.7 去执行

    o3/o4-mini 没怎么试过
    yulon
        19
    yulon  
       41 天前
    Claude 原生很积极使用 tool ,别的模型估计提示词写多一点也行,但是为什么要写呢
    azraeljack
        20
    azraeljack  
       41 天前
    cursor 里用 gemini 2.5 pro 高血压的次数显著少于 claude 3.7
    Derek0310
        21
    Derek0310  
       41 天前
    怎么选 Gemini 的大多数都把这个单词打错了?
    anivie
        22
    anivie  
       41 天前
    gemini ,断崖领先不是吹的
    morewe
        23
    morewe  
       41 天前
    @Derek0310 你不说我都没注意,然后仔细一看,还真是,没数错的话看到了 4 个,怀疑是不是后面几个人懒得打字,直接复制前面的人的了。结果都抄错了。
    chanChristin
        24
    chanChristin  
       40 天前 via Android
    gemini2.5 吧,主要是能白嫖,claude 没有白嫖到
    godqueue
        25
    godqueue  
       39 天前
    试了下 cursor 里的 gemini2.5-pro 发现真不错;
    代码上下文能力强很多。。比 claude 3.7 好。。claude 3.7 的上下文太小。。经常忘记东西
    godqueue
        26
    godqueue  
       39 天前
    只能用 gemini2.5-pro 做总结,然后写代码细节还是 claude 3.7 好
    solider245
        27
    solider245  
       38 天前   ❤️ 1
    穷人套餐+deepseekv3+geminipro2.5
    jdz
        28
    jdz  
    OP
       38 天前 via Android
    @solider245 关键问题是穷人套餐还很强
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2610 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 12:42 · PVG 20:42 · LAX 05:42 · JFK 08:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.