智谱开源的 GLM4.5 怎么没人讨论

官方称 “GLM-4.5 在包含推理、代码、智能体的综合能力达到开源 SOTA 水平，在真实代码智能体的人工对比评测中，实测国内最佳。”

号称拳打 kimik2 ，脚踢 qwen3-coder ，仅比 Claude-4 稍弱（ qwen3-coder 不也这么吹的么）。

测不动，真测不动了，哪位老哥有兴趣测完说说体验

miracleyin

55 天前

官网 chatbot 测试了一下，感觉不太聪明

iorilu

55 天前

随便吹牛逼, 我只信 claude , 除非免费, 那可以试试

sthwrong

55 天前

复杂的我用 claude 4, 弱一点的 claude 3.7, 常规的 k2 。qwen3-coder 比 qwen3 本身还难受，感觉好像过于专精结果丧失了需求的理解能力，更别说 api 真的贵。

thatlazyman

55 天前

审查比较严格，我试一下问个代理问题被禁止回答

zzfly256

55 天前

正在对接，API 和 GLM 4 感觉断档了，多了不少参数

darksword21

55 天前

只用 claude ，除非哪天全网都在说某模型爆锤 claude ，不然为什么要浪费时间关心和对比一堆效果差的模型

kebamt

55 天前

不太好用而且 UI 太乱了，校友送了我两年会员都不想用

kebamt

55 天前

@iorilu Claude 也菜，昨天白白浪费了我快半小时时间

qxmqh

55 天前

只用克劳德。其他的都是浪费时间。

mintist

55 天前

白开了 50 块钱，配合 Claude Code 不太行，，，

oceanclock

55 天前

和 kimi k2 一样的慢，上下文不如 qwen3 ，会过度思考，感觉还是不太行，等官方调优一波

tt67wq

55 天前

50 块的羊毛薅的人估计有点多，卡的狠

hellodigua

55 天前

测试了一下，不太行，速度很慢，不太实用

yb2313

55 天前

用过 kimi 和智谱, 感觉像脑袋尖尖阿诺, 目前使用体验最好的是阿里 qw3 一些新的模型, 然后是 gpt 的, 还有密塔的也不错. 再然后就是 dk 的 r1, 然后代码这一块肯定是 claude4 和 qwcoder. 平时我是用插件同时问多个网页的 ai 的, 基本上所有 ai 都用过, 包括法国团队的那些什么模型. 综合来说 qw 的体验最好, 但不能用国内的 qw, 连暗黑模式都没有, 我用的这插件里也不能强制暗黑模式

coer

55 天前

我最近从 cursor 换到 claude code+kimi k2 ，感觉 k2 的效果还不错，不过可能我写的代码比较简单

cecil2016

55 天前

@coer 价格和速度感觉怎么样? 我看到有人用 cc+k2, 有性价比也行啊

akjarjash

55 天前

因为垃圾不需要评论

Seck

55 天前

内行都知道，国内除了阿里开源，别的都是吹牛逼，什么新技术都不用考虑，习惯了刷榜，大家都麻了！

crytis

55 天前

实测又傻又懒，还不如 deepseek ，更不如同时开源的 Qwen3-235B-A22B-2507

hellopz

55 天前

@Seck 我用下来，阿里的效果不如 Kimi-K2

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1148440

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.