那个大模型编码能力最好?

141 天前
 silenceboychen

在编码领域,哪些大模型的能力比较强?目前一直都在用 claude-3.7-sonnet

11254 次点击
所在节点    程序员
100 条回复
zhy0216
140 天前
claude-3.7-sonnet 第一
这个测评 https://roocode.com/evals
liulicaixiao
140 天前
@sweat89 大家都是在编辑器里用,grok 3 的 api 出的太晚了,而且不在默认模型里
RoccoShi
140 天前
claude 3.7 个人感觉还是比 gemini 2.5 pro 厉害一点,但是后者上下文更长,可以一起用
599lee
140 天前
个人觉得 grok 3 和 claude 3.7 比较强,偶尔用下 gemini 2.5 。前几天我拿了两个数据丢给 gemini 2.5 ,它不用我给的数,它自己编,非常优秀👍
lnmxy
140 天前
qwen3
amazingfate
140 天前
gpt4.1 吧 用着比 claude3.7 舒服。
然后还可以用 gemini 2.5pro 二次写,可以写很长也很准。但是 gemini 指令遵循不如前两者。
love2328
140 天前
@lnmxy 并不怎么样的
xinru
140 天前
关注一下代码 AI 工具推荐
anivie
140 天前
Gemini 2.5pro ,我的体感是断崖领先其它所有,包括 claude ,claude 又要领先剩下的一轮
zisen
140 天前
claude3.7 有时候会提取提示词中的关键词然后直接输出缓存中的答案,也不管用户表达的是不是真的这个意思,反正一股脑儿输出就完事了
Vancion
140 天前
应该把具体哪种语言也带上吧
kergee
140 天前
grok3 150 美金感觉赚了
twinsant
140 天前
abellis
140 天前
一个稍微复杂点的 sql 查询,同样的描述,只有 Gemini 2.5pro 一次给出了正确答案,claude ,gpt 管头不顾腚,总是差一点
Wkj1998
140 天前
Claude3.7 、Gemini2.5Pro ,前者比较老实,老老实实按照你的需求编写代码,后者经常有自己独特的想法,一个编码需求,Claude3.7 输出 12 行代码,Gemini2.5Pro 会把各种因素考虑进去,最后给你输出 32 行代码
klo424
140 天前
我一般用 Cursor 的 Claude3.7
wnpllrzodiac
140 天前
c++大项目,修 bug 哪个模型好?
wnpllrzodiac
140 天前
qt 有界面图,想把界面用 ui 文件复刻出来,哪个模型好
dreamage
140 天前
截至目前 claude 41 票 gemini 39 票 遥遥领先
xz410236056
140 天前
@TanKuku 目前感觉 2.5pro 强于克劳德,但是有时候降智

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1128800

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX