私有化部署大模型的“终点”是 Mac 还是 Nvidia?

4 月 30 日
 babymonster
自己家里的 5070Ti 跑模型起来太费劲了,用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点,感觉都差不多,所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark
4866 次点击
所在节点    Local LLM
29 条回复
frantic
4 月 30 日
mac studio 顶配二手价格都翻倍了
zenfsharp
4 月 30 日
看部署目的啊。
如果是自己用,那 Mac 的包容性强,起码能塞得下权重,开得起 context 窗口啊,自己用吐答案慢点就慢点。
如果是内部多人用,还得是正经显卡啊,只要能跑起来,比 Mac 的处理器强太多了。
maymay5
4 月 30 日
看咋用吧,另外看要部署多大参数,Mac 说实话挺慢的,不能发个 hi 当测试用例,上下文强度提高点,Mac 的慢就很明显了
stimw
4 月 30 日
个人场景搞私有化的唯一作用就是涩涩,涩涩的话也不需要参数多大的模型
penisulaS
4 月 30 日
mac 方便堆显存,nv 方便堆算力
sentinelK
4 月 30 日
在显存够用的前提下,显卡的解码能力远大于统一内存方案(不管是 GB10 、AMD MAX+395 ,还是 mac )
反之,统一内存方案更容易达到更大的内存级别(能跑更大参数的模型)


所以,如果你要跑快,只能选显卡。
如果你要选能用,可扩展性,尝试更多模型,只能选统一内存。(为了大参数换显卡,基本上你整台 PC 也都要换)
sentinelK
4 月 30 日
@stimw 个人场景最大的优势是不会暴露隐私。而且有去掉拒绝模块的模型可用(可以忽略道德、法律、伦理等因素)。
sentinelK
4 月 30 日
对了,还忘了一点,到了生产力阶段,家庭用显卡就不现实了。

因为生产力显卡的噪音非常大。
mxT52CRuqR6o5
4 月 30 日
现在这些产品都算不上终点,终点是未来出的专门为这个场景打造的硬件
babymonster
4 月 30 日
@stimw 搞涩涩
liubaicai
4 月 30 日
@mxT52CRuqR6o5 那不就是 DGX Spark 么
andlp
4 月 30 日
噪声大的难以忍受了....
iorilu
4 月 30 日
临时用用可以租 gpu 把

自己随便玩玩没必要专门弄个机器感觉

现在模型进化太快, 自己完全瞎折腾, 除非你是想学习自己训练, 微调模型
bwnjnOEI
4 月 30 日
带宽太低 略坑 跑跑 moe 还行
songray
4 月 30 日
是 5 年后捡洋垃圾 h20
mxT52CRuqR6o5
4 月 30 日
@liubaicai #11 哦哦,之前没看清楚以为 OP 在说 5090/H100 这种,Nvidia thor 、DGX Spark 这类产品确实挺可能是「私有化部署」的终点的
diudiuu
4 月 30 日
@mxT52CRuqR6o5
DGX Spark 是个挫货就不用想了,内存+带宽两个都要盯着
hutng
4 月 30 日
自己玩玩可以 mac ,稍微专业点还是得 NV
a0210077
4 月 30 日
建议 N 卡,不止能跑大模型,还能用现成的 ComfyUI 包出图出视频
按照 OP 的配置再往上升主要关注单卡显存大小:价格敏感可以考虑 4080s 32G/4090 48G 的魔改卡,要正品只能 5090 / PRO 5000 / PRO 6000
a0210077
4 月 30 日
#10 按照这个思路,建议 N 卡的设备,但依旧推荐独立显卡而不是统一内存

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1209582

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX