那个大模型编码能力最好？

在编码领域，哪些大模型的能力比较强？目前一直都在用 claude-3.7-sonnet

herozzm

139 天前

claude-3.7-sonnet
但是 gpt-4.1 好像更胜一筹，观察中

kzfile

139 天前

同一个问题多问问，没有哪一家总是最优

yusf

139 天前

claude-3.7-sonnet 和 gemini 2.5 pro ！我们公司魔改 cline ，只留下这两个大模型

GuluMashimaro

139 天前

用的 gemini 2.5 pro
10 分钟弄了一个待办事项的 chrome 插件

aHR0cHM6Ly9jaHJvbWV3ZWJzdG9yZS5nb29nbGUuY29tL2RldGFpbC8lRTUlQkUlODUlRTUlOEElOUUlRTQlQkElOEIlRTklQTElQjklRTglQjclOUYlRTglQjglQUElRTUlOTklQTgvaWpobG1paHBwZGxqY2JnZGtoaGlnaW1jaWZhbmNlbmc=

InkStone

139 天前

@Linyz 还可以参考一下 openrouter 上的 ranking ，https://openrouter.ai/rankings/programming?view=week

个人感觉 openrouter 上这个用钱投票更有说服力一点……排名靠前的这几个模型贵得令人发指，让我用我是一点都用不下手，能排到这么前面应该说明了实践中表现确实很好。

206n6Q6sFYRg1SwM

139 天前

@InkStone 的确, 感觉比野榜靠谱哈哈

daodao

139 天前

@testliyu 已测，在开源里面可能还行。但在 claude 3.7 sonnet ，gemini 2.5 pro 跟前确实还只是弟弟

huiyadanli

139 天前

Claude 3.5 Sonnet

3.7 实际使用下来提升并不明显

jonsmith

139 天前

cursor 上 claude-3.7-sonnet 模型的使用体验更好，能写出符合预期的代码，可能工程能力更好点。
gemini 2.5 pro 明显智力更高，用来回答一些技术问题或者写一些独立的代码块。

jiangbingo

139 天前

请问楼上诸位，你们在编辑器如何使用 gemini 2.5 pro ？

dcatfly

139 天前

@MagicalCarl 这个榜单类似于跑分，可能可以参考为解决单个问题的能力，但在真实的工程上下文层面体感还是有区别

dcatfly

139 天前

@InkStone 用钱投票还是靠谱些，不过我感觉 roocode 比 cline 好用不少但这里还是 cline 消耗的 token 多

dcatfly

139 天前

@dcatfly #37 https://lmarena.ai/ 榜单还可以参考这个

jonty

139 天前

@jiangbingo #35 cursur 可以使用。也可以使用 mcp 的服务

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1128800

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.