类似知网那种几个关键字进行文档标题检索,需要用到哪些算法?

2024-04-02 11:29:24 +08:00
 libasten

假设有个 xx 图书管理系统,存储了海量图书。

现在需要实现一个通过书名关键字检索图书的功能(不考虑正文内容)。

我知道的,先要一个分词吧?

然后在数据库的书名字段中查找分页返回满足条件的条目,业内现在一般用哪些算法?

感觉就是和搜索引擎的算法类似?

我在写一份材料,最好这个算法能和现在热门的大数据、AI 能扯上关系,谢谢!

1282 次点击
所在节点    问与答
10 条回复
EricXuu
2024-04-02 13:27:18 +08:00
搜信息检索,自然语言处理
buaasoftdavid
2024-04-02 13:28:24 +08:00
白嫖?
bigtear
2024-04-02 13:48:50 +08:00
向量数据库
qqjt
2024-04-02 13:53:42 +08:00
全文检索算法? elasticsearch ?
CHchenkeyi
2024-04-02 15:37:08 +08:00
@buaasoftdavid 人家在问答频道发问,又没有要人做,只是需求实现方法,怎么就白嫖了?
CHchenkeyi
2024-04-02 15:38:09 +08:00
向量数据库,ES 的搜索能想到就这些
fridaycatye
2024-04-02 16:20:46 +08:00
es 有自带分词,基本能满足需求
bestcondition
2024-04-02 17:04:28 +08:00
你搜一下 apache lucene
wayne1007
2024-04-02 17:10:12 +08:00
query 分析:分词,纠错,改写,类目/ner 预测
wayne1007
2024-04-02 17:11:37 +08:00
@wayne1007 召回:倒排、相关性召回、向量召回等,粗排/精排:模型打分

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1029066

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX