GLM5.2 个人感觉有点被吹大了

4 小时 3 分钟前
 hihihihihi

前几周用了几天 Claude-fable-5 模型,确实很明显的感觉准确率非常高,理解能力也非常高,基本一遍过。在这个之前我大部分使用 Opus4.8 以及 Sonnet4.6, 理论上我用 sonnet 4.6 更多。

这段时间看 GLM 这么火,我也凑热闹去抢了下,一直没抢到,干脆购买了国外版本的 z.ai 的套餐。这几天重度使用了一下,说说我的感受:

前提:我都是用的 claude code cli

  1. GLM5.2 有点话痨,有的时候说一堆话,甚至大段重复,不够言简意赅

    1. GLM5.2 对整个项目的把控不如 claude code ,要 GLM 做一个功能,他有时不先去看程序是不是有什么已经做了的,或者是否影响别的地方,就是感觉整个考虑不周到,要我来指正。 我明白很多时候需要描述更清晰需求,但是有的需求应该是显而易见的。 这点我感觉全局上,fable > opus > sonnet > glm
  2. 慢,卡,经常一个小问题,要搞好几分钟,明显提赶上 claude 效率要更高。

所以总结起来说:相对目前所谓可用模型第一来说,我觉得 GLM5.2 过誉了,理解能力欠缺,整体把控能力不够,效率不够高。总的来说也是国产模型里面一梯队的,但是和 claude 确实还有半年到一年的差距。

PS:个人意见,很主观,仅供参考。

1414 次点击
所在节点    Local LLM
9 条回复
wombat
3 小时 56 分钟前
确实是这样。 昨天对比了 GLM5.2 ,Cursor Composer2.5 ,GPT5.5 ,Opus4.8 。 确实 GLM5.2 还是有差距。慢的话,可能是因为部署的问题? zai 的算力不足? 但相比 GLM5.1 ,确实提升了不少,特别在多 agent 任务上,但感觉思考深度更深,时间更长,知识比较老。
woodnaonly
3 小时 55 分钟前
Cursor Composer2.5 也能放到 GPT5.5 ,Opus4.8 一个梯队了?
@wombat
wombat
3 小时 49 分钟前
@woodnaonly 整体智力上肯定不行。但写日常代码我用起来感觉有点 opus 的感觉。 主要 Composer 速度快,干活还可以。
wombat
3 小时 46 分钟前
@wombat 模型各有各的优点,我觉得 composer 是能干活的,行动不拖泥带水,比 GLM 的行动更简洁。 个人比较喜欢。
toubi
2 小时 1 分钟前
glm5.2 还是可以的,每个人的项目不一样,所以每个人用下来都是有不同感觉的。我整体感觉下来和 gpt5.5 大差不差。至于你说的慢卡,你可以去使用硅基流动的,速度超级快,30 多分钟就花了我 30 元。
MuyuQ
1 小时 52 分钟前
你都把 glm5.2 和 4.8 放一起对比了。
已经是巨大的进步。
期待 glm6.
huanxianghao
1 小时 34 分钟前
Opus4.8 感觉也挺降智,让它编辑个文档,还给我搞重复内容了
zxjxzj9
1 小时 23 分钟前
@woodnaonly 快就是好,好就是快.... 天下武功唯快不破
stararenas
39 分钟前
你居然还真的花钱测试国模啊,有点震惊。不过长个记性也好。下次冲动的时候去隔壁站先看看有没有白嫖的渠道。理性消费!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1221519

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX