意外的发现 Python3.10 标准库 hashlib 的 sha256 比 sha256sum 以及 go1.19 的都要快两倍以上

2022-09-25 01:33:31 +08:00
 Licsber

RT 将近 3 倍的性能提升( 0.7s vs 2.0s )

截止发帖已经知道答案了 Py 不讲武德 调用了 openssl 带了 SIMD 加速
很好奇为啥 go 这么慢 还想着把我的小工具用 go 重写一遍 现在想法没这么迫切了(笑死
另外请教下 go 里怎么同时算 hash 会快一点(同一个超大文件的 md5 、sha1 、sha256 等)

测试原始信息

测试平台 i7 1165G7
缓冲大小均为 4*1024*1024 即 4MiB
其中 py 跑在 wsl1 ( Ubuntu22.04 )里
理论上会比跑在 win 里的 go 更慢(结果快了三倍 笑死

Python 3.10.4 (main, Jun 29 2022, 12:14:53) [GCC 11.2.0] on linux
go version go1.19.1 windows/amd64

openssl 信息
version: 3.0.2
built on: Mon Jul  4 11:20:23 2022 UTC
options: bn(64,64)
compiler: gcc -fPIC -pthread -m64 -Wa,--noexecstack -Wall -Wa,--noexecstack -g -O2 -ffile-prefix-map=/build/openssl-Q8dQt3/openssl-3.0.2=. -flto=auto -ffat-lto-objects -flto=auto -ffat-lto-objects -fstack-protector-strong -Wformat -Werror=format-security -DOPENSSL_TLS_SECURITY_LEVEL=2 -DOPENSSL_USE_NODELETE -DL_ENDIAN -DOPENSSL_PIC -DOPENSSL_BUILDING_OPENSSL -DNDEBUG -Wdate-time -D_FORTIFY_SOURCE=2
CPUINFO: OPENSSL_ia32cap=0xfedaf387ffebffff:0x405fc6f3bfa7ab
The 'numbers' are in 1000s of bytes per second processed.
type             16 bytes     64 bytes    256 bytes   1024 bytes   8192 bytes  16384 bytes
sha256          131816.90k   378560.56k   953040.44k  1468024.83k  1816342.93k  1818028.71k
3866 次点击
所在节点    Go 编程语言
10 条回复
eason1874
2022-09-25 02:12:44 +08:00
Windows 上的 go 好像受安全软件影响,每次运行编译都会被扫描拖慢
nuk
2022-09-25 03:50:46 +08:00
开 cgo ,速度就会快很多
mikewang
2022-09-25 04:06:11 +08:00
其实现在 coreutils 也可以通过 --with-openssl 编译去使用 OpenSSL 的实现了。
只能说纯 C 还是比不过汇编优化后的速度,Go 也一样。
让 Go 去调用 OpenSSL 就能一样快了。
Jirajine
2022-09-25 05:40:11 +08:00
同时算 hash 应该没有什么特别的办法,最多并行计算的时候共享一下 buffer 。

@mikewang go 为了 portability 重新实现很多东西,这些实现不如广泛使用的优化更好很正常。
另外单以 SIMD 来说也不一定非要汇编,c/rust 都是支持的,只是 go 不支持。
iwdmb
2022-09-25 06:49:39 +08:00
LZ 可以试试 Python 3.11 性能有进一步提升
0o0O0o0O0o
2022-09-25 08:28:47 +08:00
ospider
2022-09-25 09:24:35 +08:00
go 就是这样子啊,啥都要纯 go ,不用 c ,对性能肯定有影响
lysS
2022-09-25 11:55:27 +08:00
minio 的用了 SIMD 确实快大约 4 倍:

https://github.com/minio/sha256-simd/blob/master/sha256_test.go:
BenchmarkHash/SHA_/1K-8
1994372 614.2 ns/op 1667.18 MB/s 0 B/op 0 allocs/op

src/crypto/sha256/sha256_test.go
BenchmarkHash1K-8 445884 2299 ns/op 445.46 MB/s 0 B/op 0 allocs/op


考虑到你算大文件的 hash, 大部分性能花在内存拷贝上了,找找有没有系统提供的函数、以零拷贝的方式来算文件 hash 的
lysS
2022-09-25 12:01:58 +08:00
这样做磁盘 IO 压力肯定也是非常高的,查了一下,一般而言,大文件算文件抽样 hash ,遇到冲突时才算全量 hash
wdvxdr1123
2022-09-25 15:28:41 +08:00
可以关注下: https://go-review.googlesource.com/c/go/+/408795
等这个被合并了速度应该会一样。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/882708

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX