那个大模型编码能力最好？

在编码领域，哪些大模型的能力比较强？目前一直都在用 claude-3.7-sonnet

risan

2025 年 4 月 29 日

那显然 chatgpt

TanKuku

2025 年 4 月 29 日

感觉是 claude-3.7-sonnet 和 gemini 2.5 pro, 有时候也用 ds v3 做对比

rockddd

2025 年 4 月 29 日

目前在用 gemini 2.5 pro

raycool

2025 年 4 月 29 日

各有优劣吧。

MIUIOS

2025 年 4 月 29 日

大差不大差，关键是要怎么提示它，如何提问也是一门技术

kkk1234567

2025 年 4 月 29 日

grok 3 感觉也很不错呢。

mingzefei

2025 年 4 月 29 日

claude3.7 速度太慢，gemini 速度和上下文更好。两个模型写的代码没看出太大区别。

Promtheus

2025 年 4 月 29 日

@risan 你是不是除了 chatgpt 没用过其他模型。。

MagicalCarl

2025 年 4 月 29 日

https://livebench.ai/

sentinelK

2025 年 4 月 29 日

如果是前端界面，且有设计图，那么 gemini 2.5 pro 比 claude-3.7-sonnet-thinking 强一些。他对于图形界面逻辑的理解比其他大模型优秀。

如果是在既有程序上的修改，或者 debug 。claude-3.7-sonnet-thinking 更理性一点，gemini 2.5 pro 有些过于激进。而且管的太多。

btw：copilot 的 gemini 2.5 pro 明显有问题，至于说是故意的负优化还是提示词没写好，就不得而知了。

houOne

2025 年 4 月 29 日

grok3 用来设计方案，表结构都很不错。

lrigi

2025 年 4 月 29 日

综合来讲 gemini2.5 pro 最好吧，但我一般就用 claude3.7

xugj

2025 年 4 月 29 日

可以看看这个： https://mp.weixin.qq.com/s/dcQOM0C4cTfTxTAFN5McZg

vincentWdp

2025 年 4 月 29 日

Americano

2025 年 4 月 29 日

gemini2.5 pro 体验确实不错，完成度很高

hhharuka

2025 年 4 月 29 日

Gemini 2.5pro
Claude 3.7

ddddd0

2025 年 4 月 29 日

t0:
o4mini
gem2.5 pro
o3

locoz

2025 年 4 月 29 日

通常情况下简单场景最优的：claude 3.5
通常情况下有一定难度的场景最优的：claude 3.7 + 思考模式
上下文少，只需要短输出的：gpt o4-mini
上下文长度中等，可能需要较长输出，且有一定难度的：claude 3.7 + 思考模式
上下文长度长，可能需要较长输出，但不怎么难的：gemini 2.5 pro + 思考模式
上下文长度长，需要较长输出，还有难度的：要么拆分处理，要么 gpt o3 ，其他的犯病概率较高

nunterr

2025 年 4 月 29 日

写代码：claude-3.7--，gemini 2.5 pro
聊事件：grok3
国内搜东西：腾讯元宝的 DeepSeek 联网版

fxxkgw

2025 年 4 月 29 日

claude3.5 3.7

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1128800

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.