智谱开源的 GLM4.5 怎么没人讨论

55 天前
 javalaw2010

官方称 “GLM-4.5 在包含推理、代码、智能体的综合能力达到开源 SOTA 水平,在真实代码智能体的人工对比评测中,实测国内最佳。”

号称拳打 kimik2 ,脚踢 qwen3-coder ,仅比 Claude-4 稍弱( qwen3-coder 不也这么吹的么)。

测不动,真测不动了,哪位老哥有兴趣测完说说体验

4564 次点击
所在节点    程序员
25 条回复
miracleyin
55 天前
官网 chatbot 测试了一下,感觉不太聪明
iorilu
55 天前
随便吹牛逼, 我只信 claude , 除非免费, 那可以试试
sthwrong
55 天前
复杂的我用 claude 4, 弱一点的 claude 3.7, 常规的 k2 。qwen3-coder 比 qwen3 本身还难受,感觉好像过于专精结果丧失了需求的理解能力,更别说 api 真的贵。
thatlazyman
55 天前
审查比较严格,我试一下问个代理问题被禁止回答
zzfly256
55 天前
正在对接,API 和 GLM 4 感觉断档了,多了不少参数
darksword21
55 天前
只用 claude ,除非哪天全网都在说某模型爆锤 claude ,不然为什么要浪费时间关心和对比一堆效果差的模型
kebamt
55 天前

不太好用而且 UI 太乱了,校友送了我两年会员都不想用
kebamt
55 天前
@iorilu Claude 也菜,昨天白白浪费了我快半小时时间
qxmqh
55 天前
只用克劳德。其他的都是浪费时间。
mintist
55 天前
白开了 50 块钱,配合 Claude Code 不太行,,,
oceanclock
55 天前
和 kimi k2 一样的慢,上下文不如 qwen3 ,会过度思考,感觉还是不太行,等官方调优一波
tt67wq
55 天前
50 块的羊毛薅的人估计有点多,卡的狠
hellodigua
55 天前
测试了一下,不太行,速度很慢,不太实用
yb2313
55 天前
用过 kimi 和智谱, 感觉像脑袋尖尖阿诺, 目前使用体验最好的是阿里 qw3 一些新的模型, 然后是 gpt 的, 还有密塔的也不错. 再然后就是 dk 的 r1, 然后代码这一块肯定是 claude4 和 qwcoder. 平时我是用插件同时问多个网页的 ai 的, 基本上所有 ai 都用过, 包括法国团队的那些什么模型. 综合来说 qw 的体验最好, 但不能用国内的 qw, 连暗黑模式都没有, 我用的这插件里也不能强制暗黑模式
coer
55 天前
我最近从 cursor 换到 claude code+kimi k2 ,感觉 k2 的效果还不错,不过可能我写的代码比较简单
cecil2016
55 天前
@coer 价格和速度感觉怎么样? 我看到有人用 cc+k2, 有性价比也行啊
akjarjash
55 天前
因为垃圾不需要评论
Seck
55 天前
内行都知道,国内除了阿里开源,别的都是吹牛逼,什么新技术都不用考虑,习惯了刷榜,大家都麻了!
crytis
55 天前
实测又傻又懒,还不如 deepseek ,更不如同时开源的 Qwen3-235B-A22B-2507
hellopz
55 天前
@Seck 我用下来,阿里的效果不如 Kimi-K2

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1148440

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX