国产模型能不能不吹牛逼

52 天前
 donggua997
今天没事做,用 claude code 接入了两个模型测试一下:kimi2 和 glm4.5
k2 说很强大实测也很一般般;
glm4.5 也是说什么全面领先,实测代码方法级别优化,他总是忍不住优化这个类(明确说别修改其他方法都拦不住),优化后的代码还出现报红,相同提示词输出内容,和 sonnet-4 差距太明显了。

测试一天总结: 与 sonnet-4 根本就不是一个维度的东西,甚至我感觉单就写代码而言,连 sonnet-3.5 都没法比。
如果没用过 claude 模型,是可以当个辅助工具用一用的。
2736 次点击
所在节点    问与答
23 条回复
Clannad0708
52 天前
老哥现在有什么平台可以稳定使用 claude-4 的 api 吗。我之前用的几个都很卡
7gugu
52 天前
@Clannad0708 raycast
donggua997
52 天前
@Clannad0708 #1 这么很多吗,cursor 、claude code ,海外的 trae
Haaaaaat
52 天前
不吹牛逼的话 哪还有人会去用?
Clannad0708
52 天前
@donggua997 #3 我的意思是专门的 sonnet-4 api 站,比如 raycast 但是我用的经常 502 ,不稳。claude code 直冲又没国外支付途径
nealHuang
52 天前
glm 4.5 真的一坨,吗的,骗我 50
maocat
52 天前
正宗的也不太靠谱啊,我贼



donggua997
52 天前
@maocat #7 失误肯定是有的,正宗的可以完全当生产力工具,其他智能当辅助工具
donggua997
52 天前
@nealHuang #6 新用户注册送那么多 token 都用完了?
duuu
52 天前
自夸就算了,有种感觉现在还收买自媒体去夸。。真无语。当然有可能自媒体是为了流量去夸。
最近出的几个试用下来是能用,但真没夸的那么厉害
nealHuang
52 天前
@donggua997 #9 冲动付费了
jamesxu
52 天前
qwen coder 感觉还行
donggua997
52 天前
@jamesxu #12 有空再试试
qiaobeier
52 天前
能和 sonnet 3.5 差不多的就已经超一线了。。。
XnEnokq9vkvVq4
52 天前
昨天不是还出了个 XBai-o4 ,一个源自 Qwen3 32B 的模型宣称各种跑分全面超越 Claude Opus 4 我也是醉了
phrack
52 天前
为了钱和为了理想为了改变历史的人,

你猜哪个会刷 benchmark
Mark24
52 天前
K2 骗了我 22 元
connecting
52 天前
claude code 是专门为 claude 优化的,有没有提示词不能很好的适配的?
vvxu
52 天前
我在 cursor 中 roo code 使用 glm-4.5-air 感觉还行
iv8d
51 天前
自从冲过一次,再冲是🐕

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1149840

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX