也不是什么大新闻了。
http://bakatest.github.io/find-my-trousers/
(为了正确渲染 HTML5 页面浏览器需要支持 FlexBox 布局和 ES5 标准函数)
52GB 的数据 uniq 一下剩 12GB 再 format 一下剩 9.4GB 最后一遍 uniq 因为懒就不想做了也不知道最后到底有多少数据。丢进索引程序建了个 845MB 的 Bloom Filter 索引,查询性能是 O(1),误正率 0.1%—— 10000 次查询 1 次假阳性。
输入邮箱和密码,会用 JavaScript 哈希出对应的索引值,把索引值提交给服务器就能知道些什么了。如果在下没有理解错的话应该是足够安全的方法。精确查询意味着低命中啊,试了自己所有的邮箱密码组合,都没中,稍微有点小失望,所以如果你不幸中了求晒个贴图 XD
最后,源代码托管在 https://github.com/kirisetsz/52g 欢迎拍砖吐槽~
http://bakatest.github.io/find-my-trousers/
(为了正确渲染 HTML5 页面浏览器需要支持 FlexBox 布局和 ES5 标准函数)
52GB 的数据 uniq 一下剩 12GB 再 format 一下剩 9.4GB 最后一遍 uniq 因为懒就不想做了也不知道最后到底有多少数据。丢进索引程序建了个 845MB 的 Bloom Filter 索引,查询性能是 O(1),误正率 0.1%—— 10000 次查询 1 次假阳性。
输入邮箱和密码,会用 JavaScript 哈希出对应的索引值,把索引值提交给服务器就能知道些什么了。如果在下没有理解错的话应该是足够安全的方法。精确查询意味着低命中啊,试了自己所有的邮箱密码组合,都没中,稍微有点小失望,所以如果你不幸中了求晒个贴图 XD
最后,源代码托管在 https://github.com/kirisetsz/52g 欢迎拍砖吐槽~