glm code plan lite 疑似启用了量化或者什么手段优化降低算力消耗

20 小时 30 分钟前
 defaw

从昨晚上开始,以前长上下文不会出现没有拼写错误硬说有的情况,但是从昨晚上开始,已经碰上两次了,然后就是速度也变快了。 质谱近期适配了很多国产推理卡,也可能是换了推理环境导致的。

607 次点击
所在节点    程序员
2 条回复
iorilu
19 小时 13 分钟前
这还要疑似吗

不会有人真的认为会给你用 700 多 B 的模型把
defaw
18 小时 41 分钟前
@iorilu 671b 的 deepseek 一直都是输入 2 块输出 3 块走缓存还更便宜啊,和参数量有什么关系呢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1192701

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX