首页   注册   登录
ONLINE

dingyaguang117

V2EX 第 29021 号会员,加入于 2012-10-29 09:52:13 +08:00
5 G 82 S 49 B
根据 dingyaguang117 的设置,主题列表只有在你登录之后才可查看
dingyaguang117 最近回复了
也可能和焦虑和营养不均衡有关。

缺少 VC 也有可能
7 天前
回复了 fademeter 创建的主题 分享发现 今天上班,看到一个司机哭了
@kokutou

同意,这背后的社会问题不是我辈能解决的,你我都不是人大代表
8 天前
回复了 Hsinyao 创建的主题 问与答 请教一下为什么要用 Jupyter Notebook
方便教学?
8 天前
回复了 moke 创建的主题 编程 爬虫对不规则结构有什么好的解决方案?
自己找规律了
13 天前
回复了 usm8jc 创建的主题 问与答 深圳还是香港买房?
@q409195961 你忘了 1k = 1024 了嘛
@JL1990
数据库唯一性用的是索引,各种树类,时间复杂度是 logN, 不适合高并发查询。
建议上层单独做一层 hash 去重,使用布隆过滤器之类的数据结构。不要把去重负担全部扔给数据库。

另外看你的意思是尽量保证唯一性,但是偶尔有重复也没关系,这样容易多了。可以用一个 hash 数据结构存过期时间,定期清理,还能保持 hash 表大小不增长呢
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   1887 人在线   最高记录 5043   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.3 · 10ms · UTC 00:08 · PVG 08:08 · LAX 17:08 · JFK 20:08
♥ Do have faith in what you're doing.