大模型什么样的速度是靠谱的

38 天前
 guoguobaba

用了一台昇腾 910b 跑 qwen32b 的模型,

一个 dify 知识库的回答,跑 LLM 用了 30s ,这个正常吗?手头没有 H100 这样 nb 的机器。

https://i.imgur.com/N63dxld.jpg

754 次点击
所在节点    Local LLM
2 条回复
guoguobaba
38 天前
oldlamp
27 天前
粗略来说,得看 tokens/s

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1150300

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX