最近使用几个 AI 编程模型的一点感受

51 天前
 my101du

在对比使用了 WindSurf Pro/Trae Pro/通义灵码 等辅助编程工具后,上周还是决定购买了 Github Copilot Pro 套餐运行在 VSCode 上, 算是暂时在价格和能力之间取得了平衡。

在这几天尝试开发一个浏览器插件的过程中,通过来回切换几个模型,发现他们各自还是挺有特色的。

  1. 最开始用 Claude Sonnet 4 。总结是:适合开荒。 做新项目的时候,基本上能根据要求把结构搭建好,功能完成度很高,但是到后面改一些 bug 的时候似乎总也找不到重点,比如要实现查找页面元素去点击,它一开始就把类选择器的名称搞错了(不去找页面的真实元素,而是根据经验去找带点击特征的元素),当我要求它仔细查找时,它会不断把复杂度加大,去添加很多的匹配规则,甚至还让它去点击里面所有的嵌套元素,跳不出去了。

  2. 当我意识到它进入死胡同后,就切换到 Gemini 2.5 Pro 。总结是:适合改 bug 但小题大做,不适合推进项目。 简单描述 bug 后,它给出了方案,并修复了这个点击问题,但是当我想继续做下一个功能的时候,发现它洋洋洒洒说了一大堆,最后把前面的功能给改没了。后面我发现这个问题挺严重的,它很喜欢边做边重构代码,导致我很沮丧,只能要求它别改,中间还骂了几句,很奇怪的是它道歉了后还真的修复了,整个过程就是挺累的,要来回聊好几次才能把一个功能固定下来。。。 可能是我设置的规则不太对?

  3. 后来切换到 GPT-4.1 , 总结是:适合逐个小功能爆破。 给他一堆要求,没有废话,thinking 一会后就会改一点点地方,让我重试。70%情况是成功修复问题的,剩下 30% 我要求继续检查,它也一样少言寡语,然后只修改一点点。

目前项目核心功能接近稳定,我已经主用 GPT-4.1 了。 主要是它不会有大片的响应文本把整个 agent 窗口占满,因为我仔细看过了,像 Gemini 2.5 pro 在响应文本里解释它多牛逼的,( 1 )牛逼的技术我看不懂 ( 2 )看得懂的代码我自己也会写。 所以, 我为什么要听你絮叨呢?

3751 次点击
所在节点    程序员
28 条回复
webcape233
51 天前
和我感受一样
xuegy
51 天前
写 python 的话,什么模型都能糊弄一段差不离的代码出来。
写 C++的话,GPT4.1 这种的就跟脑子里有💩一样,经常幻想出不存在的头文件然后编的跟真的一样。
带 reasoning 的就好多了,90%一遍编译过,剩下的 9%把编译器报错信息贴进去能改对,最后的 1%让 AI 自己联网查一下就能解决。
spritecn
51 天前
昨天让 kimi2 写个英语句子均衡切分,他真是的一直给我崩专业名词,写出来看着难受 ,超给他说他越顶..什么贪心算法,二段均衡,相邻桶啥的...真的是
gzeng17291
51 天前
用来写 go 后端服务 cursor 用 Claude Sonnet 4 感觉还是很强啊
heliar
51 天前
困难问题,可以尝试 o3
jqknono
51 天前
很多人没试过 o3, 在网上风浪不大, o3 不适合一次性输出很多代码, 它很懒, 但是解决复杂问题独一档. 我的线程死锁问题只有 o3 能解.
bowencool
50 天前
Copilot 聊天经常报错就很烦
Linioi
45 天前
@qwwe01 我也很好奇 Claude Code 的效果,平常用的也是 GitHub Copilot ,想用用 Claude Code 都找不到合适的付费渠道……

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1149334

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX