M1 跑分干掉了去年最高端的 16 寸 mbp

2020-11-12 08:53:47 +08:00
 fuzhuo233
https://www.macrumors.com/2020/11/11/m1-macbook-air-first-benchmark/

加上能直接跑 iOS 应用,很牛..

就是感觉硬件配不上 M1 。装进五年前的壳子真的难受
21062 次点击
所在节点    Apple
131 条回复
qoras
2020-11-12 20:19:32 +08:00
@qoras 好像那个泄露的跑分是 a12z 的
icyalala
2020-11-12 20:26:44 +08:00
@qoras Intel 有个跑分软件推荐列表:
https://www.intel.com/content/dam/www/public/us/en/documents/white-papers/role-of-benchmarks-white-paper.pdf

只有 SPEC 现在有跑分,而且是跨平台的,你不信 GeekBench,那 SPEC 2006 说服力大一些吧:
https://www.anandtech.com/show/16226/apple-silicon-m1-a14-deep-dive/4
flippydoo
2020-11-12 20:54:16 +08:00
@shutongxinq #91
@MaverickLee #92
@kaokao123 #98
真就是果粉论坛,且二极管偏多。一涉及到果子的问题,立马不讲逻辑了。

首先,你从我的哪一句话里看出来我没见到 AMD 的进展? AMD 和 Intel 基于 X86 的,和 ARM 是一个赛道吗? 5600X 单核打 10900k 我不知道吗?

拜托,不懂就先去调研一下,X86 和 ARM 是一个指令集吗?指令集设计没有历史包袱吗?性能和功耗没有关系吗?
苹果的 ARM 版 mac 现在支持了几个开发语言编译了?支持了几个大型工业软件了?甚至连 PS 、AE 这样的软件支持了吗?有给出明确的支持软件列表和未来支持时间吗?

单核性能的比较,是基于同功耗的吗?还是把 X86 限到 15W,和 ARM 比出来的数据?

什么“等软件支持起来了”。。。 大型软件利用了多少 X86 复杂指令集的专有指令有调研过吗?软件指令集级别重构要花费多少资金和人力知道吗? X86 指令集里面,有多少是为了兼容那些本应该被扫进历史垃圾堆里的企业级软件而保留的知道吗?

不要一味的狂欢和反驳,只凸显你的无知
KENNHI
2020-11-12 20:57:22 +08:00
@zellalan Java 应该没关系吧,反正都是面向 jvm 编程
KENNHI
2020-11-12 21:03:32 +08:00
微软那边再完善一下 Windows for arm,马上 x86 就可以爬了。这次的惊喜应该是高度集成的 DMA ?纸面性能看他吹不准,好用不好用还得看接下来的用户评测; up tp 16g 实在不够用啊。
话说 999 刀的机器,加内存还那么贵就舍不得上 LPDDR5 ?红米都笑了,我吐了。
话说 arm 也不够开放,快进到 risc-v 一统天下
CRVV
2020-11-12 21:41:28 +08:00
https://browser.geekbench.com/v5/cpu/compare/4653108?baseline=4648107
https://browser.geekbench.com/v5/cpu/compare/4642178?baseline=4648107

下面单项的第一个 AES-XTS 的单核和多核性能

苹果是 4.59 G/s 和 16.7 G/s
5950X 是 7.15 G/s 和 12.4 G/s
i9-9880H 是 1.82 G/s 和 8.41 G/s

3 个处理器都是 8 核的,最快的 16.7 G/s 肯定没到内存带宽。

为什么 5950X 的单核比 9880H 快那么多?
为什么 5950X 的多核速度还不到单核的 2 倍?

这数字要说是瞎编的我都信。
hjc4869
2020-11-12 21:55:08 +08:00
@CRVV AES 多核的瓶颈是内存读写,5950X 128bit 3200 DDR4 内存带宽 51.2 GB/s,M1 128bit 4266 LPDDR4X 内存带宽 68.2 GB/s,多核测出来更高应该算正常。如果把 5950X 的内存超到 4000+,性能可能比这个好。
hjc4869
2020-11-12 21:56:20 +08:00
@CRVV 68.2 / 51.2 = 1.33 = 16.7 / 12.4,刚刚好成比例了
kaokao123
2020-11-12 22:10:29 +08:00
@flippydoo 装逼犯说的就是你。人家是用 MacBook 16 寸跑的,你非要质疑是限制到 15w 。还有软件迁移的问题,苹果都说了要两三年的时间,没说立马就实现。而且苹果当年是从 IBM 迁移到 Intel 的,不是第一次干了。在那里逼逼逼一堆,实际上毫无逻辑。
NilChan
2020-11-12 22:14:51 +08:00
@sundev 其实跟 arm 没什么关系。是苹果牛
NilChan
2020-11-12 22:15:06 +08:00
@nikolai 是 Apple yes 啦
CRVV
2020-11-12 22:17:26 +08:00
@hjc4869

这玩意其实可以直接测,在我的机器上是这样的结果
都是 openssl 1.1.1h

Intel i7 4770HQ

openssl speed -evp aes-256-xts
type 16 bytes 64 bytes 256 bytes 1024 bytes 8192 bytes 16384 bytes
aes-256-xts 203022.96k 825995.49k 1748770.28k 2642286.01k 3120154.71k 3192675.31k

openssl speed -evp aes-256-xts -multi 4
evp 808941.94k 2783501.61k 6091693.65k 9758843.90k 10974879.74k 10624166.57k

四核处理器,单核 3 G/s 多核 10 G/s


AMD Ryzen 7 4700U

openssl speed -evp aes-256-xts
type 16 bytes 64 bytes 256 bytes 1024 bytes 8192 bytes 16384 bytes
aes-256-xts 515543.39k 1919414.38k 4367495.42k 6155646.63k 6991994.88k 7083595.09k

openssl speed -evp aes-256-xts -multi 8
evp 3404665.32k 12602658.88k 27869853.10k 36364921.17k 41717743.62k 41641061.03k

八核处理器,单核 7 G/s,多核 40 G/s

https://www.geekbench.com/doc/geekbench5-cpu-workloads.pdf
这里有说 geekbench 也直接用 AES 指令,说了用 4k block,说了 256 bits AES

我更怀疑 geekbench 的代码有问题了
hjc4869
2020-11-12 22:26:15 +08:00
@CRVV openssl 是对着非常小的 block 测,最大才 16K,全部在缓存里。GB 看测出来的数值非常贴近一个缓存外的 AES XTS 理论测试结果,AES 一读一写,XTS 一读一写,把结果乘以 4 差不多刚好就是内存带宽。

另外 Intel 的旧处理器跑 XTS 慢我记得是因为缺乏 VPCLMULQDQ 还是什么指令,外加 AES-NI 只有 128bit,新处理器才有 256bit 的 VAES 单元。
hjc4869
2020-11-12 22:33:15 +08:00
@CRVV 多找了几个例子验证了一下我的猜想,看起来应该是八九不离十。

同样是 64 核的 threadripper,3995WX 跟 3990X 的区别是 8 通道和 4 通道

8 通道的 DDR4 理论速度是 200 多 G,GB 测出来 50GB/s
https://browser.geekbench.com/v5/cpu/4559654

4 通道的 DDR4 理论速度是 100 多 G,GB 测出来 28GB/s
https://browser.geekbench.com/v5/cpu/4614922
hjc4869
2020-11-12 22:55:24 +08:00
@CRVV 我仔细翻了一下 pdf,AES 测试的 working set 是 268,939,264,所以是远大于处理器缓存的。
CRVV
2020-11-12 22:59:11 +08:00
@hjc4869

对的,我直接继续用 openssl 测了,在 AMD Ryzen 7 4700U 上

openssl speed -evp aes-256-xts -bytes 134217728 -multi 1
evp 6355342.75k

增加 -multi,大约到 -multi 4 的时候就会达到最大值了,有两倍多吧
evp 13651520.72k

这台机器的内存是 128bit 2400 DDR4 (38.4 GB/s)
那台 4770HQ 的机器是 128bit 1600 DDR3 (25.6 GB/s),最多能跑到 6776863.34k

所以 openssl 大约能跑到内存带宽 / 3
hjc4869
2020-11-12 23:05:16 +08:00
@CRVV 你内存只有 2400 ?不应该吧。
CRVV
2020-11-12 23:11:03 +08:00
@hjc4869

这个很确定,是 2400 的,不是原装的内存。
是我在买这台机器之前很久另买的 16Gx2
CRVV
2020-11-12 23:16:00 +08:00
如果再回去看 geekbench 的测试结果,那 Intel 这个数字确实太惨了。

5950X 的单核性能比 9880H 快那么多
hjc4869
2020-11-12 23:37:00 +08:00
@CRVV 那毕竟 skylake 是 2015 年的微架构,然后 Intel 硬是拖了 5 年没升级很多产品线。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/724254

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX