需要购买国产显卡本地部署大模型，哪家的比较好

DeYiAo

7 小时 38 分钟前

最合适的是 PPU 1 代，16 卡。最近涨价了预算不知道够不够。
PPPU 2 代，刚发布，8 卡，能买得到应该是最佳。
考虑昇腾系列的前提是，你们技术能力极强且有 10 几人的底层工程师可以调试改 bug ，或者财大气粗让华为的工程师驻场。

Babbitt

7 小时 25 分钟前

最近公司也有这需求，预算差不多，想部署 deepseek v4

Flagship9945

7 小时 24 分钟前

@cocogovern 这预算算少的了

Flagship9945

7 小时 24 分钟前

@DeYiAo 昇腾问题很多吗？

yyttrr

7 小时 22 分钟前

除了华为卡都支持 cuda,但是 cuda 版本可能很老,而且需要的一些其他基础设施要自己实现,不过有大模型写这些也不算什么难事.避坑一些特殊规格的比如一卡两芯的,选比较新的卡都差不多,海光的挺好用的

skuuhui

7 小时 18 分钟前

没经验不推荐国产显卡部署，坑太多了。如果非要部署建议找那种专门承接离线大模型部署业务的公司，直接上门安装包售后那种。

Flagship9945

7 小时 15 分钟前

@skuuhui 信创没办法

Clannad0708

7 小时 8 分钟前

国产显卡性能差，你即使部署了本地大模型效果也远不如网页版的能力，只能说不清楚需求。

vandort

7 小时 2 分钟前

不知道你要部署什么模型，但是现在模型出的这么快，从尽可能支持最新的模型的角度来说，选显存大的，卡内带宽高的（ 200W 也做不了多机互联），厂家支持到位的；符合前面三个条件下，选支持 FP8 ，最好能支持 MXFP4 的；这些都满足的情况下，选省电的，便宜的，能稳定供应的

Flagship9945

6 小时 58 分钟前

@Clannad0708 政府项目就这样，领导跟风拍板，最后往往草草了事，样子上说的过去就行。

cpper

6 小时 51 分钟前

这种部署最终都是浪费掉的，说实话

byteX

6 小时 50 分钟前

哎
信创

Flagship9945

6 小时 48 分钟前

@cpper 整条线上的人赚钱了，😃

strobber16

6 小时 47 分钟前

微内核

Flagship9945

6 小时 47 分钟前

有经验的老哥可以合作

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1218631

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.