请教关于新款 MacBook Pro M2 Max 的配置问题，用于大模型训练

请教下各位 V 友，新款 MacBook Pro 14inch ，Ｍ 2 Max （ 12 核 CPU 、30 核 GPU 、16 核 NPU ）+32G 内存+1TB 固态硬盘的配置，普通编程+本地大模型训练、学习、研究的需求够用吗？是否还需要升级配置到 38 核 GPU ？或者更大的内存？

https://www.apple.com/shop/buy-mac/macbook-pro/14-inch-space-gray-apple-m2-max-with-12-core-cpu-and-30-core-gpu-1tb#

F281M6Dh8DXpD1g2

2023-03-30 10:21:41 +08:00

32g 大概只能用到 11g 给 gpu,玩大模型老老实实 4090

Tearia

2023-03-30 10:59:02 +08:00

能问出这个问题的真的入门了深度学习了吗？开源代码都是 cuda ，难道你还全部改一遍然后本地跑个几天几夜？有这钱直接找个算力平台冲了就完了。

lrigi

2023-03-30 11:01:22 +08:00

@liprais 4090 的 24G 显存捉襟见肘，模型一大根本放不进去。我反倒觉得 MacBook64GB/96GB 内存倒是一个很好的选择，虽然只有目前的卡几分之一的性能，但是显存堪比 A100 。为什么 32G 只能给 11GB 到 GPU ，这是系统的限制吗？我看人家 8GB 内存的 m2mini 甚至都可以跑不止 8G 显存的模型？也许是我记错了？我最近也想买 64G 的跑 llama

Philippa

2023-03-30 11:01:47 +08:00

别闹了，11g 也就勉强跑跑 512 x 512 ，4k 图生成的 4090 占到 19g 的显存。

Juszoe

2023-03-30 11:17:24 +08:00

槽点有点多，玩大模型，单机 8 卡已经是低配中的低配了，更何况 mac 还没 cuda

neopenx

2023-03-30 18:51:44 +08:00

M2 Max 的 training 算力等价于 3060 。洗洗睡吧。还不如买块 4090

maxmak

2023-03-30 21:14:50 +08:00

M1 Max 24H 64G 跑 chatglm-6b 内存直接爆红了，计算速度好慢，已经换成 GPU 跑了
我觉得 M2 Max 也好不了多少

AOK123

2023-03-31 07:06:16 +08:00

大模型不都是几百张 A100 起吗。。。

小模型你这 3000 刀配个 4090 台式直接秒杀顶配 Mac Studio

ShadowPower

2023-03-31 10:40:41 +08:00

本地大模型训练不太行。最前沿的那些东西其实只支持 NVIDIA 显卡，不用 NVIDIA 显卡就是完全跑不起来或者各种报错。

Pytorch 的 MPS 后端还缺少很多算子，实际上不少是 fallback 到 CPU 跑的。而且还有很多代码实现里，内存布局之类的细节只对 NVIDIA 显卡友好，在 Apple Silicon 上还得多做一些转换工作，额外吃了不少显存（内存）和性能。

bleaker

2023-03-31 11:33:33 +08:00

https://github.com/apple/ml-ane-transformers Apple 最近的确做了一些工作

neopenx

2023-03-31 20:45:49 +08:00

@bleaker ANE 只能跑推理。训练要在 GPU 上跑 Metal/MPS 。搞笑的是 GPU 的 FP32/FP16 算力只有 Ultra 上才能超过 ANE 的 FP16 算力。所以用 AppleSilicon 做训练就是来搞笑的

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/928389

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.