私有化部署大模型的“终点”是 Mac 还是 Nvidia？

自己家里的 5070Ti 跑模型起来太费劲了，用了一下同事的 macbook 顶配版跑模型比 5070Ti 要强一点点，感觉都差不多，所以大佬可以指点下有没有必要搞一个 Mac studio 还是 Nvidia thor 或者 DGX Spark

frantic

4 月 30 日

mac studio 顶配二手价格都翻倍了

zenfsharp

4 月 30 日

看部署目的啊。
如果是自己用，那 Mac 的包容性强，起码能塞得下权重，开得起 context 窗口啊，自己用吐答案慢点就慢点。
如果是内部多人用，还得是正经显卡啊，只要能跑起来，比 Mac 的处理器强太多了。

maymay5

4 月 30 日

看咋用吧，另外看要部署多大参数，Mac 说实话挺慢的，不能发个 hi 当测试用例，上下文强度提高点，Mac 的慢就很明显了

stimw

4 月 30 日

个人场景搞私有化的唯一作用就是涩涩，涩涩的话也不需要参数多大的模型

penisulaS

4 月 30 日

mac 方便堆显存,nv 方便堆算力

sentinelK

4 月 30 日

在显存够用的前提下，显卡的解码能力远大于统一内存方案（不管是 GB10 、AMD MAX+395 ，还是 mac ）
反之，统一内存方案更容易达到更大的内存级别（能跑更大参数的模型）

所以，如果你要跑快，只能选显卡。
如果你要选能用，可扩展性，尝试更多模型，只能选统一内存。（为了大参数换显卡，基本上你整台 PC 也都要换）

sentinelK

4 月 30 日

@stimw 个人场景最大的优势是不会暴露隐私。而且有去掉拒绝模块的模型可用（可以忽略道德、法律、伦理等因素）。

sentinelK

4 月 30 日

对了，还忘了一点，到了生产力阶段，家庭用显卡就不现实了。

因为生产力显卡的噪音非常大。

mxT52CRuqR6o5

4 月 30 日

现在这些产品都算不上终点，终点是未来出的专门为这个场景打造的硬件

babymonster

4 月 30 日

@stimw 搞涩涩

liubaicai

4 月 30 日

@mxT52CRuqR6o5 那不就是 DGX Spark 么

andlp

4 月 30 日

噪声大的难以忍受了....

iorilu

4 月 30 日

临时用用可以租 gpu 把

自己随便玩玩没必要专门弄个机器感觉

现在模型进化太快, 自己完全瞎折腾, 除非你是想学习自己训练, 微调模型

bwnjnOEI

4 月 30 日

带宽太低略坑跑跑 moe 还行

songray

4 月 30 日

是 5 年后捡洋垃圾 h20

mxT52CRuqR6o5

4 月 30 日

@liubaicai #11 哦哦，之前没看清楚以为 OP 在说 5090/H100 这种，Nvidia thor 、DGX Spark 这类产品确实挺可能是「私有化部署」的终点的

diudiuu

4 月 30 日

@mxT52CRuqR6o5
DGX Spark 是个挫货就不用想了，内存+带宽两个都要盯着

hutng

4 月 30 日

自己玩玩可以 mac ，稍微专业点还是得 NV

a0210077

4 月 30 日

建议 N 卡，不止能跑大模型，还能用现成的 ComfyUI 包出图出视频
按照 OP 的配置再往上升主要关注单卡显存大小：价格敏感可以考虑 4080s 32G/4090 48G 的魔改卡，要正品只能 5090 / PRO 5000 / PRO 6000

a0210077

4 月 30 日

#10 按照这个思路，建议 N 卡的设备，但依旧推荐独立显卡而不是统一内存

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1209582

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.