O3, O4mini-high, claude3.7, Gemini2.5pro 编程能力该怎么排序

2025 年 5 月 2 日
 jdz
5087 次点击
所在节点    程序员
28 条回复
jdz
2025 年 5 月 2 日
编程能力
crackidz
2025 年 5 月 2 日
laogui
2025 年 5 月 2 日
事实上 o3 效果最好,用过就知道,但价格太贵,都不在考虑范围之内,都在讨论 Gemini 2.5 Pro 和 Claude 3.7 Sonnet
dbg
2025 年 5 月 2 日
大模型 前端编程 排行榜
https://web.lmarena.ai/leaderboard
icyalala
2025 年 5 月 2 日
Cursor 官方统计: https://x.com/cursor_ai/status/1917982557070868739
现在用得最多的还是 Claude3.7 和 Gemini2.5 pro ,但是 o3/o4-mini 增长很快
Numeron
2025 年 5 月 2 日
https://aider.chat/docs/leaderboards/
Leoking222
2025 年 5 月 2 日
编程无脑 Claude 3.7 就对了,目前没对手
lneoi
2025 年 5 月 2 日
Gemini2.5 pro 很厉害,加上上下文足够大
murmurkerman
2025 年 5 月 2 日
genimi 2.5 pro
huluhulu
2025 年 5 月 2 日
genimi 2.5 pro ,尤其是大段代码重构的时候,简直无敌。
r6Vm94FFk9u3W6XI
2025 年 5 月 2 日
我投 Claude 一票,有一次一个关于 redis memory usage 命令的东西,全部问了一遍,只有 Claude 第一次就回答了正确答案,其它的始终都没有给出正确答案
Zhoukker
2025 年 5 月 2 日
o3 非常强。就是门槛和价格,综合考虑还是 2.5pro
yibie
2025 年 5 月 2 日
已转 gemini
ShadowPower
2025 年 5 月 3 日
写前端或者新写独立的代码的时候,claude 3.7 强
对现有的整个项目或者整个模块做分析、重构、genimi 2.5 pro 强
godqueue
2025 年 5 月 3 日
gemini 感觉最新的内容会比较好,比如最新的 springboot3 以上的版本,他就能给出正确的答案;其他的会差一些
但是编程整体应该是 Claude 最强
yueyingky
2025 年 5 月 3 日
以前用 3.7 ,现在觉得 genimi 2.5 pro 更好用
ooops
2025 年 5 月 3 日
个人实测 3.7 3.5 > 2.5pro
aarontian
2025 年 5 月 3 日
平时用 cursor 写 go 和 python 多些,经常是提出一个比较复杂的需求用 agent 模式一次性写完。感觉写代码 claude 独一档,但 gemini 2.5 pro 规划总结能力和 debug 能力似乎更强(实际写代码时候不那么准确)

以及 claude 在多轮对话和中断重启的时候容易丢失上下文,我有时候会让 gemini 总结一下我的要求,列计划,然后切换到 claude 3.7 去执行

o3/o4-mini 没怎么试过
yulon
2025 年 5 月 3 日
Claude 原生很积极使用 tool ,别的模型估计提示词写多一点也行,但是为什么要写呢
azraeljack
2025 年 5 月 3 日
cursor 里用 gemini 2.5 pro 高血压的次数显著少于 claude 3.7

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1129424

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX