玩转个人知识库! Paperless-ngx 增强版: VLM 视觉识别、无限树形目录、Chat with Doc 文档对话

2025 年 12 月 8 日
 510908220

大家好,

相信很多 V 友都有管理发票、说明书、合同和旧纸质文件的烦恼。Paperless-ngx 是目前开源界强大的文档管理系统,支持 OCR 、自动打标签和全文搜索。

但是官方原版在实际部署中(尤其是中文环境下)可能会遇到一些门槛以及 AI 功能支持不足。所以我维护了一个优化版本:CallStorm/paperless-ngx

🚀 相比原版,这个 Fork 解决了什么?

我主要针对中文环境和智能化做了以下核心增强:

1. 真正的“看图说话” (VLM 视觉模型)

原版 Tesseract OCR 面对手机随手拍的歪歪扭扭的票据、皱巴巴的纸张,识别率往往惨不忍睹。

2. 支持无限级“树形目录”

原版 Paperless 强推“标签( Tag )”逻辑,但对于很多习惯 Windows 资源管理器一层层文件夹分类的朋友来说,非常反直觉。

3. 文档对话 (Chat with Doc)

文档存进去不再是死数据。

4. 优化部署

📸 截图预览

🚧 后续计划

目前的版本已经可以稳定满足日常归档需求。后续计划加入语义搜索(不再依赖关键词,搜意思也能搜到)和全局 AI 助手。

希望能帮到同样有收纳强迫症、或者喜欢折腾 NAS 的朋友、或者喜欢打造自己的知识库的人。 如果有 Bug 或建议,欢迎在 GitHub 提 Issue 或 PR ,感谢!

传送门:https://github.com/CallStorm/paperless-ngx


2645 次点击
所在节点    分享创造
1 条回复
TeslaM3
2025 年 12 月 9 日
总之,很牛逼的开源。 👍

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1177561

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX