那个大模型编码能力最好?

140 天前
 silenceboychen

在编码领域,哪些大模型的能力比较强?目前一直都在用 claude-3.7-sonnet

11241 次点击
所在节点    程序员
100 条回复
leehaoze98
140 天前
日常主要用 cursor 编写代码,一般情况用 Claude 3.7 足矣,复杂情况下 3.7 写出的代码不 Work ,换到 4.1 会有概率解决。

再不 work 的情况,需要把背景、问题说明白,贴给 chatgpt ,多轮交互中,chatgpt 能给出一个 work 的方案
cheman
140 天前
claude 3.7 sonnet ,gemini 2.5 pro , deepseek v3. 在够用且不呆的情况下,ds v3 性价比好点,我用来开发小程序够用。如果想找便宜的 key ,可到 https://api.xlap.top 结合 vscode roocode 使用。
Kason333
140 天前
claude
sweat89
140 天前
就每一个人用 Grok3 ?
我觉得蛮好用的
shellcodecow
140 天前
claude-3.7-sonnet 用来写脚本和代码很不错
jonyJJ
140 天前
Grok3 挺好用的,51 过后可以用 grok 3.5 了 美滋滋
xing7673
140 天前
@herozzm 4.1 不行,虽然代码输出更简洁,但是容易出问题,windsurf 里我都是用 claude 3.7 或者 gemini 来纠正它的问题
PositionZero
140 天前
@InkStone OpenRouter 的 ranking 只是说用的人多,不一定能力强啊。Gemini 2.0 Flash 排在 Claude 3.7 Sonnet (thinking) 前面是因为 Gemini 2.0 Flash 更便宜。
aider 的这个榜不错,既有编程准确度,也有成本 https://aider.chat/docs/leaderboards/ 。
eroneko
140 天前
cursor+o4-mini 很够用了,而且目前是免费的,需要大上下文的先全部塞给 Gemini 2.5 Pro 让它规划要修改的地方,然后丢给 o4-mini 执行。
kasusa
140 天前
@InkStone 用钱投票 666
InkStone
140 天前
@PositionZero 这个是 benchmark 的测试结果,不是投票结果吧。说实话,相比 benchmark ,我还是更倾向于相信大家实践后做出的选择。

价格肯定有很大影响,但 openrouter 上最靠前的 3.7 和 2.5 都很贵,感觉还是能说明一些问题的。
azarasi
140 天前
gemini 2.5 pro, 1M 长上下文,很多程序都可以全部项目代码塞进去
qiaobeier
140 天前
@Linyz #25 Gemini 2.5 那么高了吗?我切换下试试
Gilfoyle26
140 天前
我觉的要看语言,新的语言,新的库往往不行。
AI 好像对 python ,js ,支持的比较好
remember5
140 天前
claude-3.7-sonnet
OldActorsSmile
140 天前
claude-3.7-sonnet-thinking
mumbler
140 天前
无脑 gemini 2.5 pro 即可,其他模型都差 gemini 一大截
silencelixing
139 天前
1. Claude 3.7 Sonnet
2. Gemini 2.5 Pro
答案几乎是确定的,这两个断层的领先。
鉴于 Gemini 2.5 Pro 价格低,甚至可以免费薅,首选 Gemini 2.5 Pro
富哥可以用 Claude 3.7 Sonnet
boyzhang
139 天前
@wxw752 grok 怎么样
Plutooo
139 天前
太久没看这方面内容了,没想到 gemini 都后来居上了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1128800

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX