有赞搜索引擎实践(工程篇)

2016-03-22 16:36:36 +08:00
 muxi

随着数据的增长,搜索引擎在很多公司的业务上都是必备的基础设施之一了,有赞也不例外。 经过接近一年的持续迭代,有赞在搜索引擎上也做了一些事情。希望能对于正在寻找解决方案的同学有所启发。

访问地址:

http://tech.youzan.com/you-zan-sou-suo-yin-qing-shi-jian-gong-cheng-pian-2/

有赞技术团队会持续的对外公布这两年积累的一些经验和基础设施源码

有赞的技术发展离不开互联网的各种牛逼人士的贡献,现在有点能力,开始慢慢对外输出自己的积累。

3153 次点击
所在节点    程序员
4 条回复
aszxqw
2016-03-22 16:41:16 +08:00
感觉不错。已收藏。
3dwelcome
2016-03-22 16:57:32 +08:00
支持一下楼主,可惜都是软件使用,没有自研算法介绍啊。

我自己发明一个基于 bitset cache ,全新的 filter 算法,用于论坛的标题全文的检索里,感觉不错,又快又好又 NB 。等有空整理一下,把 blog 里的文章转过来,再附带一篇详细实战教程。
sjtlqy
2016-03-22 17:08:23 +08:00
自研算法? 自研组件?
3dwelcome
2016-03-22 17:12:28 +08:00
可以理解成 bloom filter 的针对全文搜索版本优化版,不过原理完全不一样,虽然都是用 bitset 操作的。全文搜索里基于 bitset 的快速筛选是很重要的一步。

是自研组件,脑洞太大,没办法,什么都喜欢先自研一下。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/265501

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX