没人关注 DeepSeek R1-0528 吗?

107 天前
 cat9life

https://www.zhihu.com/question/1911132833226916938/answer/1911228976870949080

2056 次点击
所在节点    分享发现
5 条回复
szboy
106 天前
cskzhi
105 天前
奇怪了,我这边部署的是原版蒸馏 8B F16 18G 那个版本,中英文分别问了一个 python 脚本,怎么回答都在说梦话?我描述的应该没问题吧,同样的问题给之前的 r1 蒸馏 32B 模型就没问题
cskzhi
105 天前
@cskzhi 更正: 是 15G 的 BF16 版
linuslv
104 天前
@cskzhi #2 有幻觉很正常吧
cskzhi
103 天前
@linuslv 幻觉得厉害主要是,之前用 r1 32B 蒸馏挺正常的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1135048

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX