如何设计一个可以降低哈希冲突可能的哈希函数?

2019-12-03 16:25:31 +08:00
 1oNflow

有必要重写 Java 基本类型的 hashcode 吗,比如 String 用到的 31,官方已经优化的很好了吧。

如果是求对象的哈希,就递归调用成员的 hashcode,再把他们加在一起,还有比这个更好的方案吗?

4424 次点击
所在节点    Java
10 条回复
OhYee
2019-12-03 17:24:05 +08:00
先把对象成员的值转换成字节数组再对整个字节数组做哈希碰撞概率应该会更低一点(但是感觉不太必要)
真的怕碰撞,可以换成别的哈希函数来实现哈希,比如 SHA3,或者自己魔改下 SHA,把输出长度拓展到更长
reus
2019-12-03 17:31:37 +08:00
sha256 够了,还怕就 sha512。

就,如果你找到了一个冲突,可以出名那种。
crclz
2019-12-03 17:57:45 +08:00
wangyzj
2019-12-03 18:23:32 +08:00
我看到了一个好大的轮子
geelaw
2019-12-03 18:45:42 +08:00
@reus #2 Java 的 hash code 是 32 位,但 SHA-256/512 的输出远远长于 32 位

实际上一个很快速的策略是使用 AES + 固定 key + 截断,因为现代 CPU 有 AES 指令,所以这个可以非常非常快。此外,通常数据如果没有 adversarial behavior,那么 AES hash 的碰撞率比较低。

把数个成员的 hash 加在一起是一个非常糟糕的方案,比如 class X { int a, b; /* details omitted */ } 那么 (1,0) 和 (0,1) 一定会有相同的 hash。
xupefei
2019-12-03 18:50:40 +08:00
用多级哈希。现成的实现是 bloom filter。
zunceng
2019-12-03 18:52:57 +08:00
当年听人吹过暴雪有个 hash 算法 从来没用上过
Raymon111111
2019-12-03 18:54:53 +08:00
楼主的意思是针对任意的槽大小, hash 结果可以均匀分布吧
hzgit
2019-12-03 21:38:56 +08:00
我看到了一个好大的轮子
fluorinedog
2019-12-04 08:31:32 +08:00
用 hash_combine 算法,别自己造轮子

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/625558

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX