国产模型能不能不吹牛逼

2025 年 8 月 4 日

donggua997

今天没事做，用 claude code 接入了两个模型测试一下：kimi2 和 glm4.5
k2 说很强大实测也很一般般；
glm4.5 也是说什么全面领先，实测代码方法级别优化，他总是忍不住优化这个类（明确说别修改其他方法都拦不住），优化后的代码还出现报红，相同提示词输出内容，和 sonnet-4 差距太明显了。

测试一天总结：与 sonnet-4 根本就不是一个维度的东西，甚至我感觉单就写代码而言，连 sonnet-3.5 都没法比。
如果没用过 claude 模型，是可以当个辅助工具用一用的。

3710 次点击

所在节点

问与答

23 条回复

Clannad0708

2025 年 8 月 4 日

老哥现在有什么平台可以稳定使用 claude-4 的 api 吗。我之前用的几个都很卡

7gugu

2025 年 8 月 4 日

@Clannad0708 raycast

donggua997

2025 年 8 月 4 日

@Clannad0708 #1 这么很多吗，cursor 、claude code ，海外的 trae

Haaaaaat

2025 年 8 月 4 日

不吹牛逼的话哪还有人会去用？

Clannad0708

2025 年 8 月 4 日

@donggua997 #3 我的意思是专门的 sonnet-4 api 站，比如 raycast 但是我用的经常 502 ，不稳。claude code 直冲又没国外支付途径

nealHuang

2025 年 8 月 4 日

glm 4.5 真的一坨，吗的，骗我 50

maocat

2025 年 8 月 4 日

正宗的也不太靠谱啊，我贼

donggua997

2025 年 8 月 4 日

@maocat #7 失误肯定是有的，正宗的可以完全当生产力工具，其他智能当辅助工具

donggua997

2025 年 8 月 4 日

@nealHuang #6 新用户注册送那么多 token 都用完了？

duuu

2025 年 8 月 4 日

自夸就算了，有种感觉现在还收买自媒体去夸。。真无语。当然有可能自媒体是为了流量去夸。
最近出的几个试用下来是能用，但真没夸的那么厉害

nealHuang

2025 年 8 月 4 日

@donggua997 #9 冲动付费了

jwk345

2025 年 8 月 4 日

qwen coder 感觉还行

donggua997

2025 年 8 月 4 日

@jamesxu #12 有空再试试

qiaobeier

2025 年 8 月 4 日

能和 sonnet 3.5 差不多的就已经超一线了。。。

XnEnokq9vkvVq4

2025 年 8 月 4 日

昨天不是还出了个 XBai-o4 ，一个源自 Qwen3 32B 的模型宣称各种跑分全面超越 Claude Opus 4 我也是醉了

phrack

2025 年 8 月 4 日

为了钱和为了理想为了改变历史的人，

你猜哪个会刷 benchmark

Mark24

2025 年 8 月 4 日

K2 骗了我 22 元

connecting

2025 年 8 月 4 日

claude code 是专门为 claude 优化的，有没有提示词不能很好的适配的？

vvxu

2025 年 8 月 4 日

我在 cursor 中 roo code 使用 glm-4.5-air 感觉还行

iv8d

2025 年 8 月 5 日

自从冲过一次，再冲是🐕

第 1 页／共 2 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1149840

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.