有没有知识检索系统,检索本地 PDF 内容,提供 web 服务的

2022-06-07 21:57:28 +08:00
 vngghgfjnff
2174 次点击
所在节点    程序员
12 条回复
XhstormR02
2022-06-07 22:03:59 +08:00
同问,还能检索 html 离线网页的,其实我感觉现成搞个类似 es + kibna 这种,剩下无非就是提取 text 出来了
em70
2022-06-07 22:32:28 +08:00
20 年前百度谷歌都推出了本地桌面搜索,后来不知道为什么都不做了
sunnysab
2022-06-07 22:42:45 +08:00
可以看看里面提到的:
https://www.zhihu.com/question/20237918
GHvyuR7N
2022-06-07 22:52:28 +08:00
我用 devonthink 管理 PDF 和 web archive...不仅能全文搜,还有算法按相关性排序
TabGre
2022-06-07 23:23:17 +08:00
@GHvyuR7N server 版本太贵了,不然没有 web 入口
noqwerty
2022-06-07 23:32:17 +08:00
文献类的话,Zotero 提供了 metadata 和 PDF/HTML 附件的全文搜索
gladuo
2022-06-07 23:32:33 +08:00
@XhstormR02 具体还有哪些 term 命中之外的需求呢?其实基本的 mac finder 搜索的时候就在做吧
beyondex
2022-06-07 23:33:53 +08:00
归海桌面搜索可以,不过提供 web 服务功能官网有写但还未开放。
hamsterbase
2022-06-07 23:36:23 +08:00
@XhstormR02

https://www.v2ex.com/t/854379#reply12

纯本地 + web 服务 + 批注 + 全文搜索。
emberzhang
2022-06-08 08:46:28 +08:00
devonthink 呀,上个月 20 周年活动 server 版 7 折
evan6
2022-06-08 11:58:43 +08:00
devonthink
woyaojizhu8
2022-06-09 01:18:53 +08:00
recoll ,开源本地全文搜索工具,可以搜索各种文件。web 的话,可以试试 recoll webui

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/858007

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX