为什么不同的编程工具使用相同的模型写出的结果大相径庭?

2025 年 8 月 7 日
 madm4n

我试过 claude code sonnet4 ,国际 trae sonnet4 , 后者效果明显差于前者。明明模型一样,为什么在不同开发工具上的表现相差很大?有佬解释一下吗?

2484 次点击
所在节点    程序员
10 条回复
Atoony
2025 年 8 月 7 日
同样一把青龙偃月刀,你来使和关二爷来使那能一样吗
vvxu
2025 年 8 月 7 日
不同工具的内置提示词不一样吧,之前不是 Windsurf 提示词疯狂 pua AI
YanSeven
2025 年 8 月 7 日
我理解,核心技术都是大模型的,基础的 IDE(编辑器)是人家微软的。
各种套皮的 AI IDE 的核心竞争点可能就是内置提示词的不同和提示词的优化技术了吧。
v2er119
2025 年 8 月 7 日
在编码方面,没有绝对的领先之说。同一个问题,有时免费的比 pro 回答的更好。
原来的 cursor 比 trae.ai 用起来更好,现在基本于处同一水平了。
随着时间推移。越到后面,水平只会无限接近。
国产的 AI 也会跟上,因为主流的编码语言特性是可以从穷举到优化的。

如果免费的没有限制,只要你提问的(提示词)次数多一些,也不是不能完成。

好的算法,有先发优势,但这个没有技术护城河,只有算力护城河。
madm4n
2025 年 8 月 7 日
由于囊中羞涩,在考虑 claude code+国产模型(k2/glm4.5), 还是用国际版 trae ? 看到一些人说 claude code 和第三方模型不太兼容,roo code+(k2/glm4.5)比 claude code+(k2/glm4.5)效果要好。augment($50/月、kiro($50/月、claude code sonnet4($20/月,这些属实用不起。所以我在国际版 trae 和 roo code+glm4.5/k2 中犹豫。因为 roo code+glm4.5/k2 我没试过,不知道效果怎么样,特别是我比较关心上下文工程能力。其次是 glm4.5 和 k2 是按量计费,trae 是包月订阅,成本方面不太好评估哪个性价比更高
madm4n
2025 年 8 月 7 日
@madm4n 国际版 trae 作为选择之一,主要是因为提供了 claude sonnet4 模型
TimePPT
2025 年 8 月 7 日
囊中羞涩其实也可以考虑下 Github Copilot ,便宜稳定,也提供 Claude Sonnet 4
fruitmonster
2025 年 8 月 7 日
之前我复制了 A 的结果给 B ,然后告诉他,有人反驳你是错的,他觉得他比你写的更好,两个互相验证就好了
royorange
2025 年 8 月 7 日
他们两者对模型上下文窗口的利用率就不同

毕竟第三方编辑器需要节省 api 消耗,而一方自己的软件不管是对自己模型的理解或者 context 的利用率上一般会更高,两者提示词上应该也有很大的差别。
之前看 claude 的演讲,他们在 claude code 中光是对 compact 压缩上下文但是减少影响这部分就做了非常久的优化,那第三方编辑器作为要适配各个模型的方案,肯定不会在单个上和原生比那么精。

我目前自从使用了 claude code 后,其他的单独用已经很少了
asd999cxcx
2025 年 8 月 7 日
@royorange cc 有啥好的使用姿势吗

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1150556

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX