需要购买国产显卡本地部署大模型,哪家的比较好

8 小时 10 分钟前
 Flagship9945
4478 次点击
所在节点    Local LLM
63 条回复
Flagship9945
8 小时 10 分钟前
有没有有经验的老哥
michaelzxp
8 小时 6 分钟前
摩尔 s5000 的 8 卡整机
Jiajin
8 小时 6 分钟前
昇腾 910B2
DeYiAo
7 小时 41 分钟前
@Jiajin 不仅难用,而且马上就要被淘汰
cocogovern
7 小时 38 分钟前
这么厉害的预算,是啥应用啊
DeYiAo
7 小时 38 分钟前
最合适的是 PPU 1 代,16 卡。 最近涨价了预算不知道够不够。
PPPU 2 代,刚发布,8 卡,能买得到应该是最佳。
考虑昇腾系列的前提是,你们技术能力极强且有 10 几人的底层工程师可以调试改 bug ,或者财大气粗让华为的工程师驻场。
Babbitt
7 小时 25 分钟前
最近公司也有这需求,预算差不多,想部署 deepseek v4
Flagship9945
7 小时 24 分钟前
@cocogovern 这预算算少的了
Flagship9945
7 小时 24 分钟前
@DeYiAo 昇腾问题很多吗?
yyttrr
7 小时 22 分钟前
除了华为卡都支持 cuda,但是 cuda 版本可能很老,而且需要的一些其他基础设施要自己实现,不过有大模型写这些也不算什么难事.避坑一些特殊规格的比如一卡两芯的,选比较新的卡都差不多,海光的挺好用的
skuuhui
7 小时 18 分钟前
没经验不推荐国产显卡部署,坑太多了。如果非要部署建议找那种专门承接离线大模型部署业务的公司,直接上门安装包售后那种。
Flagship9945
7 小时 15 分钟前
@skuuhui 信创没办法
Clannad0708
7 小时 8 分钟前
国产显卡性能差,你即使部署了本地大模型效果也远不如网页版的能力,只能说不清楚需求。
vandort
7 小时 2 分钟前
不知道你要部署什么模型,但是现在模型出的这么快,从尽可能支持最新的模型的角度来说,选显存大的,卡内带宽高的( 200W 也做不了多机互联),厂家支持到位的;符合前面三个条件下,选支持 FP8 ,最好能支持 MXFP4 的;这些都满足的情况下,选省电的,便宜的,能稳定供应的
Flagship9945
6 小时 58 分钟前
@Clannad0708 政府项目就这样,领导跟风拍板,最后往往草草了事,样子上说的过去就行。
cpper
6 小时 51 分钟前
这种部署最终都是浪费掉的,说实话
byteX
6 小时 50 分钟前

信创
Flagship9945
6 小时 48 分钟前
@cpper 整条线上的人赚钱了,😃
strobber16
6 小时 47 分钟前
微内核
Flagship9945
6 小时 47 分钟前
有经验的老哥可以合作

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1218631

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX