首页   注册   登录
 bzzhou 最近的时间轴更新

bzzhou

V2EX 第 51183 号会员,加入于 2013-12-03 13:58:29 +08:00
今日活跃度排名 12134
bzzhou 最近回复了
这个纯粹就是个人选择问题
如果想去不加班的公司,那么入职前,就说好,你不接受加班,你想要享受生活

否则,你和一群事业心很重的同事一起工作,你的压力会很大;同时,你每天按时上下班,他们每天 996,对他们也是一种不公平
然后下一个入职的说他原来是用 svn 的,用 git 真蛋疼,想让领导用 svn 咋办
说实话哈,这道题如果要较真,细节要是纠结起来,楼主自己出的题,估计自己做也不合格
如果是按照规范,简单写一个流程可以跑通的,不考虑太多细节的,那么应届计算机写不出来,还是不应该的
> 融资 800 万美金,钱多到花不完。

这个都好意思叫钱多到花不完.......
烧钱烧起来爽,但是真的花起来就不是钱
这算啥,之前 macbook air 键盘坏了,然后预约预约了一个多月才预约上(要是卡在保修期折算谁的)
然后整整折腾了两个月才修好了,而且直接说键盘进水了(但是我丝毫没有任何键盘有浸水的记忆)

还有买了一部港行的 macbook pro,保修期才出来一个月,就直接彻底开机不了了

从我用了快 10 年的经验来说,苹果的品控越来越差了,我问天才吧的人他们自己也默认了

但是没办法,也只能继续买;因为已经离不开他们的生态了
111 天前
回复了 exception 创建的主题 程序员 面试前还需要笔试的反人类公司
> 笔试时候要求做问答题和算法题,并且要求写手写代码的公司,简直智障。

世界上最顶级的这些互联网公司看来很智障了,呵呵
如果仅仅是满足各种标签的组合的检索,而不考虑 ranking 的情况
那么直接利用 bitmap 倒排拉链即可

10 亿电影,每个电影从 0 自增分配 id ;然后每个标签,用一个包含 10 亿个 bit 的 bitmap 来表示是否包含某部电影。

每个标签的存储开支:1,000,000,000bit,大概 120M 的存储空间
那么 1000 个标签,理论上需要 120G 的存储空间

至于检索的性能,如果数据可以全部落入到内存中,那么几个标签的过滤,基本都是 10ms 级别

如果要落入磁盘,那么多准备几块 SSD 也可以

PS:估计 ES 在这个场景下,哪怕单节点,性能也不会差(前提是关闭 ranking )
广告联盟的数据本来就已经不准了
你基于这些不准的数据再来画像,能有效果么
关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   鸣谢   ·   2474 人在线   最高记录 3541   ·  
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.1 · 8ms · UTC 04:46 · PVG 12:46 · LAX 21:46 · JFK 00:46
♥ Do have faith in what you're doing.
沪ICP备16043287号-1