业余大模型选手,最近在折腾 deepseek r1 671b 的性价比部署,目标是部署官方满血 fp8 版本( A100 、3090 等不支持 fp8 的老架构就不考虑了),目前调研出的一些方案如下:
因为各种限制,目前倾向于 RTX 5880 Ada 搞双机 8 卡推理,这个方案有问题吗?还有什么别的方案吗?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.