那个大模型编码能力最好？

在编码领域，哪些大模型的能力比较强？目前一直都在用 claude-3.7-sonnet

zhy0216

140 天前

claude-3.7-sonnet 第一
这个测评 https://roocode.com/evals

liulicaixiao

140 天前

@sweat89 大家都是在编辑器里用，grok 3 的 api 出的太晚了，而且不在默认模型里

RoccoShi

140 天前

claude 3.7 个人感觉还是比 gemini 2.5 pro 厉害一点，但是后者上下文更长，可以一起用

599lee

140 天前

个人觉得 grok 3 和 claude 3.7 比较强，偶尔用下 gemini 2.5 。前几天我拿了两个数据丢给 gemini 2.5 ，它不用我给的数，它自己编，非常优秀👍

amazingfate

140 天前

gpt4.1 吧用着比 claude3.7 舒服。
然后还可以用 gemini 2.5pro 二次写，可以写很长也很准。但是 gemini 指令遵循不如前两者。

anivie

140 天前

Gemini 2.5pro ，我的体感是断崖领先其它所有，包括 claude ，claude 又要领先剩下的一轮

zisen

140 天前

claude3.7 有时候会提取提示词中的关键词然后直接输出缓存中的答案，也不管用户表达的是不是真的这个意思，反正一股脑儿输出就完事了

abellis

140 天前

一个稍微复杂点的 sql 查询，同样的描述，只有 Gemini 2.5pro 一次给出了正确答案，claude ，gpt 管头不顾腚，总是差一点

Wkj1998

140 天前

Claude3.7 、Gemini2.5Pro ，前者比较老实，老老实实按照你的需求编写代码，后者经常有自己独特的想法，一个编码需求，Claude3.7 输出 12 行代码，Gemini2.5Pro 会把各种因素考虑进去，最后给你输出 32 行代码

wnpllrzodiac

140 天前

qt 有界面图，想把界面用 ui 文件复刻出来，哪个模型好

dreamage

140 天前

截至目前 claude 41 票 gemini 39 票遥遥领先

xz410236056

140 天前

@TanKuku 目前感觉 2.5pro 强于克劳德，但是有时候降智

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.