cndenis 最近的时间轴更新
cndenis

cndenis

V2EX 第 18939 号会员,加入于 2012-03-31 18:24:48 +08:00
cndenis 最近回复了
@wxf666 如果需要严格不能丢数据的话, 不能单用布隆过滤器.

假设重复率比较低的的话,, 可以做两轮读取

第一轮边读边构造布隆过滤器, 把发现的冲突的行记录到数据库

第二轮先把数据库中值导入新的布隆过滤器, 然后用它来过滤原表, 对有冲突的行查用数据库确证没重复再输出
如果不是要求严格不能丢数据的话, 可以用布隆过滤器去重, 误判率有公式可以算的, 有几十 GB 级别内存的话, 误判率应该比较低的
为了工作不惜吸 K 粉, 求别这么卷吧...
前线送快递的小哥都不需要打卡, 也没有午休. 这次整的都是坐办公室的.

个人感觉东哥真实把快递小哥当兄弟的
@zshineee 写硬盘是依赖最小的, 万一你的日志服务挂了也不至于直接崩掉业务.

你会在这里问这个问题的话, 估计业务量也大不到单纯日志就能写到硬盘性能不够的程度

网关可以用专门的网关, 比如 nginx, apisix, 或是云上的负载均衡服务之类, 它们都有标准化的日志.
日志直接写硬盘, 部署日志同步程序上传到日志系统, 比如 ELK, 阿里云 SLS 之类
安全有一个原则叫纵深防御, 就是当一个防护被突破后, 有另一层防护, 会更安全.

就好比说数据库已经有密码保护了, 为啥不能往数据库里存用户口令明文呢?

同意#5 的看法, 口令 Hash 可以避免受到中间人攻击时, 口令明文被用于在别的网站上做碰撞
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2204 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 19ms · UTC 12:15 · PVG 20:15 · LAX 05:15 · JFK 08:15
Developed with CodeLauncher
♥ Do have faith in what you're doing.