目前部署 deepseek r1 671b 有生产力的性价比方案

191 天前
 whyorwhynot

业余大模型选手,最近在折腾 deepseek r1 671b 的性价比部署,目标是部署官方满血 fp8 版本( A100 、3090 等不支持 fp8 的老架构就不考虑了),目前调研出的一些方案如下:

因为各种限制,目前倾向于 RTX 5880 Ada 搞双机 8 卡推理,这个方案有问题吗?还有什么别的方案吗?

724 次点击
所在节点    程序员
2 条回复
BobMaster
191 天前
今天看到 Intel 的某方案

DeepSeek-R1-671B-Q4_K_M with 1 or 2 Arc A770 on Xeon

https://github.com/intel/ipex-llm/blob/main/docs/mddocs/Quickstart/llamacpp_portable_zip_gpu_quickstart.md
whyorwhynot
191 天前
刚刚发现 M3 Ultra 512GB 推出了,两台跑 int8 算是最性价比的方案了,可惜就是不支持 fp8

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1116328

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX