pdf 文件的文本不能搜索,但导入到 google docs 里就可以搜索,怎么使 pdf 文件解除不能搜索文本的限制?

2022-02-28 18:44:07 +08:00
 kgdb00
2774 次点击
所在节点    程序员
22 条回复
nanvon
2022-03-01 11:41:56 +08:00
@kgdb00 如果光标能够选中文字,那才可以搜索。如果不能选中,那就说明是比较清晰的图片
emhhb2ppy
2022-03-01 14:22:28 +08:00
“双层 PDF”,“可检索 PDF”是你需要的 PDF 。这种文件在创建的时候每个字符对应了带坐标信息的 OCR 步骤。所以才可以检索到。不是阅读软件的问题。上传 g doc ,是 g 自己 OCR 了一遍,所以才可以检索到。g 还开源了 OCR 引擎,叫 Tesseract Open Source OCR Engine ( https://github.com/tesseract-ocr/tesseract)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/836980

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX