那个大模型编码能力最好?

2025 年 4 月 29 日
 silenceboychen

在编码领域,哪些大模型的能力比较强?目前一直都在用 claude-3.7-sonnet

12990 次点击
所在节点    程序员
100 条回复
risan
2025 年 4 月 29 日
那显然 chatgpt
TanKuku
2025 年 4 月 29 日
感觉是 claude-3.7-sonnet 和 gemini 2.5 pro, 有时候也用 ds v3 做对比
rockddd
2025 年 4 月 29 日
目前在用 gemini 2.5 pro
raycool
2025 年 4 月 29 日
各有优劣吧。
MIUIOS
2025 年 4 月 29 日
大差不大差,关键是要怎么提示它,如何提问也是一门技术
kkk1234567
2025 年 4 月 29 日
grok 3 感觉也很不错呢。
mingzefei
2025 年 4 月 29 日
claude3.7 速度太慢,gemini 速度和上下文更好。两个模型写的代码没看出太大区别。
Promtheus
2025 年 4 月 29 日
@risan 你是不是除了 chatgpt 没用过其他模型。。
MagicalCarl
2025 年 4 月 29 日
sentinelK
2025 年 4 月 29 日
如果是前端界面,且有设计图,那么 gemini 2.5 pro 比 claude-3.7-sonnet-thinking 强一些。他对于图形界面逻辑的理解比其他大模型优秀。

如果是在既有程序上的修改,或者 debug 。claude-3.7-sonnet-thinking 更理性一点,gemini 2.5 pro 有些过于激进。而且管的太多。

btw:copilot 的 gemini 2.5 pro 明显有问题,至于说是故意的负优化还是提示词没写好,就不得而知了。
houOne
2025 年 4 月 29 日
grok3 用来设计方案,表结构都很不错。
lrigi
2025 年 4 月 29 日
综合来讲 gemini2.5 pro 最好吧,但我一般就用 claude3.7
xugj
2025 年 4 月 29 日
vincentWdp
2025 年 4 月 29 日
o3
Americano
2025 年 4 月 29 日
gemini2.5 pro 体验确实不错,完成度很高
hhharuka
2025 年 4 月 29 日
Gemini 2.5pro
Claude 3.7
ddddd0
2025 年 4 月 29 日
t0:
o4mini
gem2.5 pro
o3
locoz
2025 年 4 月 29 日
通常情况下简单场景最优的:claude 3.5
通常情况下有一定难度的场景最优的:claude 3.7 + 思考模式
上下文少,只需要短输出的:gpt o4-mini
上下文长度中等,可能需要较长输出,且有一定难度的:claude 3.7 + 思考模式
上下文长度长,可能需要较长输出,但不怎么难的:gemini 2.5 pro + 思考模式
上下文长度长,需要较长输出,还有难度的:要么拆分处理,要么 gpt o3 ,其他的犯病概率较高
nunterr
2025 年 4 月 29 日
写代码:claude-3.7--,gemini 2.5 pro
聊事件:grok3
国内搜东西:腾讯元宝的 DeepSeek 联网版
fxxkgw
2025 年 4 月 29 日
claude3.5 3.7

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1128800

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX