那个大模型编码能力最好?

139 天前
 silenceboychen

在编码领域,哪些大模型的能力比较强?目前一直都在用 claude-3.7-sonnet

11228 次点击
所在节点    程序员
100 条回复
fuckfaker
139 天前
@risan gpt 在 claude 面前,像个新兵蛋子
herozzm
139 天前
claude-3.7-sonnet
但是 gpt-4.1 好像更胜一筹,观察中
kzfile
139 天前
同一个问题多问问,没有哪一家总是最优
testliyu
139 天前
今天新出的 qwen3 可以试试
206n6Q6sFYRg1SwM
139 天前
yusf
139 天前
claude-3.7-sonnet 和 gemini 2.5 pro !我们公司魔改 cline ,只留下这两个大模型
GuluMashimaro
139 天前
用的 gemini 2.5 pro
10 分钟弄了一个待办事项的 chrome 插件

aHR0cHM6Ly9jaHJvbWV3ZWJzdG9yZS5nb29nbGUuY29tL2RldGFpbC8lRTUlQkUlODUlRTUlOEElOUUlRTQlQkElOEIlRTklQTElQjklRTglQjclOUYlRTglQjglQUElRTUlOTklQTgvaWpobG1paHBwZGxqY2JnZGtoaGlnaW1jaWZhbmNlbmc=
InkStone
139 天前
@Linyz 还可以参考一下 openrouter 上的 ranking ,https://openrouter.ai/rankings/programming?view=week

个人感觉 openrouter 上这个用钱投票更有说服力一点……排名靠前的这几个模型贵得令人发指,让我用我是一点都用不下手,能排到这么前面应该说明了实践中表现确实很好。
daodao
139 天前
claude 3.7 sonnet ,gemini 2.5 pro
206n6Q6sFYRg1SwM
139 天前
@InkStone 的确, 感觉比野榜靠谱哈哈
daodao
139 天前
@testliyu 已测,在开源里面可能还行。但在 claude 3.7 sonnet ,gemini 2.5 pro 跟前确实还只是弟弟
huiyadanli
139 天前
Claude 3.5 Sonnet

3.7 实际使用下来提升并不明显
jonsmith
139 天前
cursor 上 claude-3.7-sonnet 模型的使用体验更好,能写出符合预期的代码,可能工程能力更好点。
gemini 2.5 pro 明显智力更高,用来回答一些技术问题或者写一些独立的代码块。
viking602
139 天前
claude 3.7s 目前代码工程最好的
jiangbingo
139 天前
请问楼上诸位,你们在编辑器如何使用 gemini 2.5 pro ?
wufumina
139 天前
我个人提名一下 grok3
dcatfly
139 天前
@MagicalCarl 这个榜单类似于跑分,可能可以参考为解决单个问题的能力,但在真实的工程上下文层面体感还是有区别
dcatfly
139 天前
@InkStone 用钱投票还是靠谱些,不过我感觉 roocode 比 cline 好用不少 但这里还是 cline 消耗的 token 多
dcatfly
139 天前
@dcatfly #37 https://lmarena.ai/ 榜单还可以参考这个
jonty
139 天前
@jiangbingo #35 cursur 可以使用。也可以使用 mcp 的服务

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1128800

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX