在编程能力方面, Gemini 和 GPT 哪个正确率更高?

175 天前
 freefly111

最近我练算法主要使用 Gemini 和 GPT 。

我发现有时 GPT 会提供一些有错误的代码,这时候 Gemini 也可能会给错误的代码。

但 Gemini 强在速度比较快。

想问问各位的意见。

6485 次点击
所在节点    程序员
43 条回复
MarsOnly
175 天前
我比较喜欢 Claude 3.7 Sonnet ,其次 DeepSeek R1
alwaysol
175 天前
gpt 正确率更高,Gemini 就只剩快了
disorientatefree
175 天前
代码问题个人感受是

开源的东西,Claude 3.7 Sonnet 最好, Gemini / ChatGPT / Grok / DeepSeek 这几家的思考模型差不太多

私有大项目的话,Gemini 靠 context window 大,把整个项目喂进去,稍稍有点优势,但不大
383394544
175 天前
grok3 比 chatgpt 强
wxyrrcj
175 天前
DeepSeekv3
4UyQY0ETgHMs77X8
175 天前
最近用的挺多 windsurf 配合 3.7 很 ok ,部分问题使用 gpt-o3 解决的,至于 DS 为什么还有人觉得厉害我只能说他们没付款用过。用了 trae 的 r1 给我气的半死。做积分活动修改积分方法,解决原子性问题蹦出个死锁,解决死锁蹦出个嵌套事务,然后三个无限循环来来回回改。最后不再信任上下文记忆让兼顾三个问题解决,好嘛,解决完三个问题都出来了,最后用的 o3
4UyQY0ETgHMs77X8
175 天前
@FlorentinoAriza #6 根本没在乎基础业务逻辑,就像面试,光顾着高并发等问题解决最后基础逻辑走不通,仅仅单次调用接口时间 x20 最后来个系统繁忙
daimaosix
175 天前
Gemini 这个鸡毛犟种,打死不用
lihanst
175 天前
Claude 永远的神
cnrting
175 天前
ge-mini 名字不都已经告诉你了么 阉割 mini 模型
masterArcher
175 天前
第一梯队 Claude 3.7 Sonnet 、o3 mini
Claude 更擅长于使用语法糖 有时候容易出幻觉,o3 mini 更适合常规开发

其次是 git commit 的适合 qwen 总结合适

最后 Gemini 快、2M 输出一骑绝尘,正确率堪忧
ACCI
175 天前
推荐 Claude 3.7 Sonnet
williampan
175 天前
flowith.io 怎么看
pkoukk
175 天前
Claude 3.7 Sonnet 速度,准确性,代码质量一骑绝尘
imsoso
175 天前
grok3 目前推广期,免费版比较舍得出力
xz410236056
175 天前
编码来说 claude 断崖领先,deepseek 紧随其后,其余差不多。 人文社科领域感觉 grok 更强
blackocean
175 天前
我只用过 o3 mini ,目前都能满足我的需求。想试下 Claude 3.7 Sonnet 。
jdz
175 天前
我试过几次 Gemini, 就是大废物
sherlockwhite
175 天前
@xz410236056 同这样感觉,现在模型里面 Coding 领域 Claude 断崖领先,不知道那些用 openai 吭哧吭哧写代码的用没用过 Claude 。grok3 在日常使用(非 coding 领域)非常好用
HappyAndSmile
175 天前
基本所有有名的模型都使用过,写代码领域,除了 claude ,其它我都认为是垃圾,总是给我报错的代码,只有 claude 给了我直接替换运行的自信

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1118304

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX