V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
SummerWQM
V2EX  ›  问与答

这样解决 Hash 冲突可好?

  •  
  •   SummerWQM · 2018-04-25 15:14:28 +08:00 · 1423 次点击
    这是一个创建于 2186 天前的主题,其中的信息可能已经有所发展或是发生改变。

    当前需要做推荐系统 其中需要收集用户画像 未登录用户准备通过打标签的方式来标记

    实现方式是向用户浏览器存储 hash 值 为了防止 hash 冲突 这边准备用后台单进程程序 预先生成 hash 值

    来分发 而不是实时产生 来避免高并发 或者 恶意攻击带来的 hash 冲突问题 不知道有经验的伙伴儿 一般怎么做?

    4 条回复    2018-04-25 15:52:58 +08:00
    dullwit
        1
    dullwit  
       2018-04-25 15:25:43 +08:00
    虽然不知道你在说什么,但是可以参考 HashMap 与 ConcurrentHashMap。简单看了一下,采用的方式为 CHM 或者 CAS
    ipwx
        2
    ipwx  
       2018-04-25 15:29:26 +08:00
    hash 里面加时间戳、数据中心(机器) ID、随机数,以及同一个时间 slot 的自增序号。

    可以参考 Twitter Snowflake 当年的思路(项目已被移除,不过分析文章应该找得到)。
    SummerWQM
        3
    SummerWQM  
    OP
       2018-04-25 15:38:21 +08:00
    @ipwx 细想了下 实现方式不变 算法里边加盐值 遇到相同的就 递归重试 我想单程序跑 冲突的可能应该很小了
    feverzsj
        4
    feverzsj  
       2018-04-25 15:52:58 +08:00
    cryptographically secure (pseudo) random number generator -> cryptographic hash
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1016 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 22:59 · PVG 06:59 · LAX 15:59 · JFK 18:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.