在编程能力方面， Gemini 和 GPT 哪个正确率更高？

最近我练算法主要使用 Gemini 和 GPT 。

我发现有时 GPT 会提供一些有错误的代码，这时候 Gemini 也可能会给错误的代码。

但 Gemini 强在速度比较快。

想问问各位的意见。

MarsOnly

2025 年 3 月 14 日

我比较喜欢 Claude 3.7 Sonnet ，其次 DeepSeek R1

alwaysol

2025 年 3 月 14 日

gpt 正确率更高,Gemini 就只剩快了

d5G7o0xXW0yWM2gP

2025 年 3 月 14 日

代码问题个人感受是

开源的东西，Claude 3.7 Sonnet 最好， Gemini / ChatGPT / Grok / DeepSeek 这几家的思考模型差不太多

私有大项目的话，Gemini 靠 context window 大，把整个项目喂进去，稍稍有点优势，但不大

383394544

2025 年 3 月 14 日

grok3 比 chatgpt 强

wxyrrcj

2025 年 3 月 14 日

DeepSeekv3

4UyQY0ETgHMs77X8

2025 年 3 月 14 日

最近用的挺多 windsurf 配合 3.7 很 ok ，部分问题使用 gpt-o3 解决的，至于 DS 为什么还有人觉得厉害我只能说他们没付款用过。用了 trae 的 r1 给我气的半死。做积分活动修改积分方法，解决原子性问题蹦出个死锁，解决死锁蹦出个嵌套事务，然后三个无限循环来来回回改。最后不再信任上下文记忆让兼顾三个问题解决，好嘛，解决完三个问题都出来了，最后用的 o3

4UyQY0ETgHMs77X8

2025 年 3 月 14 日

@FlorentinoAriza #6 根本没在乎基础业务逻辑，就像面试，光顾着高并发等问题解决最后基础逻辑走不通，仅仅单次调用接口时间 x20 最后来个系统繁忙

daimaosix

2025 年 3 月 14 日

Gemini 这个鸡毛犟种，打死不用

lihanst

2025 年 3 月 14 日

Claude 永远的神

cnrting

2025 年 3 月 14 日

ge-mini 名字不都已经告诉你了么阉割 mini 模型

masterArcher

2025 年 3 月 14 日

第一梯队 Claude 3.7 Sonnet 、o3 mini
Claude 更擅长于使用语法糖有时候容易出幻觉，o3 mini 更适合常规开发

其次是 git commit 的适合 qwen 总结合适

最后 Gemini 快、2M 输出一骑绝尘，正确率堪忧

ACCI

2025 年 3 月 14 日