大概有 5 亿条中文例句短文本记录,需要做一个搜索引擎功能,用什么样的方案( Java )适合?

2019-11-22 20:19:36 +08:00
 axwz88
有 5 亿多条中文例句文本,长度 100 个字符以内,做一个搜索引擎的功能。搜索有中文分词,查询出相应的文本和出处两个字段,可能还有其他关联字段,总的来说业务并不复杂,但是要求性能和速度,用 java 实现有什么合适的方案呢?
2334 次点击
所在节点    程序员
8 条回复
zxc12300123
2019-11-22 20:30:35 +08:00
Elasticsearch
shawndev
2019-11-22 20:45:30 +08:00
我只想问一句这个语料库能不能共享。
snappyone
2019-11-22 20:57:57 +08:00
elasticsearch +1
kimari
2019-11-22 20:59:57 +08:00
Elasticsearch+1
renhua
2019-11-22 21:05:37 +08:00
@shawndev 同问
daimaosix
2019-11-22 21:55:19 +08:00
Elasticsearch 稳如狗
axwz88
2019-11-22 22:49:05 +08:00
既然大家的意见如此统一,那就决定用 es 了
axwz88
2019-11-22 22:49:27 +08:00
@shawndev

@renhua
公司的数据,不能共享哈

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/622263

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX