现在 HF 上的风味代码模型实际体验如何?

17 小时 1 分钟前
 kisshere
HF 上 trending 榜上好多蒸馏大模型的风味模型
WeiboAI/VibeThinker-3B
yuxinlu1/gemma-4-12B-agentic-fable5-composer2.5-v2-3.5x-tau2-GGUF
Mia-AiLab/Qwable-3.6-27b
Jackrong/Qwopus3.6-27B-Coder-MTP-GGUF
.
.
.
.
.
.
等等还有很多,有真正实际部署到本地的网友测试过没,写的代码精美还是弱智?
731 次点击
所在节点    程序员
1 条回复
coefu
8 小时 46 分钟前
我感觉 jackrong 就是个整花活儿的,他可能在疯狂实验 缝合,蒸馏 这些技术的极限。

缝合这种早期技术,没有走太远,就说明了还是少点什么的。至于蒸馏,辅助罢了。

再风味,也摆脱不了 基础模型本身 层数 和 宽度 带来的基本限制。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1221841

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX