那个大模型编码能力最好？

在编码领域，哪些大模型的能力比较强？目前一直都在用 claude-3.7-sonnet

leehaoze98

140 天前

日常主要用 cursor 编写代码，一般情况用 Claude 3.7 足矣，复杂情况下 3.7 写出的代码不 Work ，换到 4.1 会有概率解决。

再不 work 的情况，需要把背景、问题说明白，贴给 chatgpt ，多轮交互中，chatgpt 能给出一个 work 的方案

cheman

140 天前

claude 3.7 sonnet ，gemini 2.5 pro , deepseek v3. 在够用且不呆的情况下，ds v3 性价比好点，我用来开发小程序够用。如果想找便宜的 key ，可到 https://api.xlap.top 结合 vscode roocode 使用。

shellcodecow

140 天前

claude-3.7-sonnet 用来写脚本和代码很不错

jonyJJ

140 天前

Grok3 挺好用的，51 过后可以用 grok 3.5 了美滋滋

xing7673

140 天前

@herozzm 4.1 不行，虽然代码输出更简洁，但是容易出问题，windsurf 里我都是用 claude 3.7 或者 gemini 来纠正它的问题

PositionZero

140 天前

@InkStone OpenRouter 的 ranking 只是说用的人多，不一定能力强啊。Gemini 2.0 Flash 排在 Claude 3.7 Sonnet (thinking) 前面是因为 Gemini 2.0 Flash 更便宜。
aider 的这个榜不错，既有编程准确度，也有成本 https://aider.chat/docs/leaderboards/ 。

eroneko

140 天前

cursor+o4-mini 很够用了，而且目前是免费的，需要大上下文的先全部塞给 Gemini 2.5 Pro 让它规划要修改的地方，然后丢给 o4-mini 执行。

InkStone

140 天前

@PositionZero 这个是 benchmark 的测试结果，不是投票结果吧。说实话，相比 benchmark ，我还是更倾向于相信大家实践后做出的选择。

价格肯定有很大影响，但 openrouter 上最靠前的 3.7 和 2.5 都很贵，感觉还是能说明一些问题的。

azarasi

140 天前

gemini 2.5 pro, 1M 长上下文，很多程序都可以全部项目代码塞进去

qiaobeier

140 天前

@Linyz #25 Gemini 2.5 那么高了吗？我切换下试试

Gilfoyle26

140 天前

我觉的要看语言,新的语言,新的库往往不行。
AI 好像对 python ，js ，支持的比较好

mumbler

140 天前

无脑 gemini 2.5 pro 即可，其他模型都差 gemini 一大截

silencelixing

139 天前

1. Claude 3.7 Sonnet
2. Gemini 2.5 Pro
答案几乎是确定的，这两个断层的领先。
鉴于 Gemini 2.5 Pro 价格低，甚至可以免费薅，首选 Gemini 2.5 Pro
富哥可以用 Claude 3.7 Sonnet

Plutooo

139 天前

太久没看这方面内容了，没想到 gemini 都后来居上了

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1128800

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.