求推荐一个能检索内容的 pdf 文件管理软件

2023-03-14 09:23:12 +08:00
 f1ynnv2

因为平时会把一些论文、文章转成 pdf 保存,时间久了 pdf 文件非常多,所以想找个 pdf 管理软件,想要的特性如下:

  1. 能检索 pdf 标题和内容
  2. 最好能给 pdf 文件打标签
  3. B/S 架构,这样可以部署到一台服务器上,多端访问

谢谢。

2506 次点击
所在节点    问与答
30 条回复
jamosLi
2023-03-14 09:41:48 +08:00
有了踢踢我
koto
2023-03-14 09:42:32 +08:00
abbyy ?不过是收费的
DigitalG
2023-03-14 09:52:38 +08:00
devonthink 有 server 版本,一次性付费,虽然比较贵。
DigitalG
2023-03-14 09:53:33 +08:00
@DigitalG 不过除了 server ,client 只有 Apple 生态的版本
shalingye
2023-03-14 10:00:47 +08:00
calibre ,能写元数据,自带 web 服务,但似乎不能检索 pdf 内容。
virlaser
2023-03-14 10:05:37 +08:00
目前用的 NAS 实现这个功能
对于可以复制文字的 PDF ,NAS 可以直接索引里面的文字,直接搜索
对于不能复制文字的 PDF ,需要先通过 OCR 软件识别一下(之前用的 PDFElement ,不过好像调的还是 abbyy 引擎),在 PDF 上覆盖一层透明的文字层,然后再保存到 NAS 里面,这样就可以索引了
NAS 本身的文件管理提供了打标签、多端访问和索引的功能
mmm159357456
2023-03-14 10:11:52 +08:00
为啥没人说 zotero 和 endnote
tool2d
2023-03-14 10:16:55 +08:00
自己写一个 pdf 搜索并不难。你可以用工具批量 pdf to txt ,然后针对 txt 做文本搜索,就会方便太多。
f1ynnv2
2023-03-14 10:31:15 +08:00
@mmm159357456 调研过 zotero ,这个好像就是个单体软件,只是能通过 webdav 同步,离 web-based 有些远。endnote 没接触过,我去了解下。
f1ynnv2
2023-03-14 10:35:59 +08:00
@tool2d 理论上确实是可以自己写,但是时间花在这上面不太值。
f1ynnv2
2023-03-14 10:43:35 +08:00
找到一个开源的,似乎完美符合我的要求。
https://github.com/papermerge/papermerge-core
litengyu86
2023-03-14 12:35:02 +08:00
@koto abbyy 丢丢贵
TerranceL
2023-03-14 13:05:23 +08:00
mendely
f1ynnv2
2023-03-14 13:12:51 +08:00
@f1ynnv2 试了下,功能是有,但是不稳定。。
NutsoGao
2023-03-14 13:38:06 +08:00
插眼,有了我踢踢我
beyondex
2023-03-14 15:53:05 +08:00
sea desktop search ,满足 1 ,3 B/S 架构,这样可以部署到一台服务器上,多端访问
不过浏览器访问需要手动配置,倒也不复杂,不提供傻瓜化开关。
aitianci
2023-03-14 16:52:29 +08:00
mendeley 和 zotero 确实符合条件,我现在在用的是 zotero ,可以手动导入 pdf 然后它自己会 OCR 搞一套检索,标题内容都能搜索,至于打标签那是基本功能,科研工具就是做笔记方便。另外可以用坚果云的 webdav 同步,多端访问也不成问题。
kukat
2023-03-14 18:08:47 +08:00
paperless-ngx
congjinyebaiya
2023-03-14 18:21:28 +08:00
zotero 貌似可以
wanghaoyang
2023-03-14 18:31:24 +08:00
Confluence

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/923773

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX