PDF 标注导出,从入门到弃坑

2017-11-08 21:05:17 +08:00
 quietjosen

这两天,研究了如果导出 PDF 标注。没搞定,大致列一些关键的点,供大家参考:

总的来看,PDF 还是一小撮玩家在玩的小游戏。既得利益者,牢牢把握着市场;后来者,不太可能进入并有所作为。标准本身,也缺乏与时俱进的动力。我并不看好。

不过,我还是基于 Apple 的 PDFKit 做了个简单的小工具,可以将 PDF 中的标注导出为 csv 文本。需要的朋友,可以单独联系我。

3950 次点击
所在节点    程序员
11 条回复
ossphil
2017-11-08 23:04:18 +08:00
psPDFkit 是 PDFKit 的替代,开发挺活跃。Master PDF Editor 是免费的,windows, macos, linux 下都有,可以标注。福昕的阅读器也可以,奇怪的是在 Ubuntu 下一打开就是 50%的 cpu 占用
Meli55a
2017-11-09 08:29:57 +08:00
我用 知之阅读
XiaoFaye
2017-11-09 09:24:49 +08:00
直接截图然后 OCR 识别行不?当然效率可能不太好。
picone
2017-11-09 09:56:44 +08:00
MigrateNote
picone
2017-11-09 09:57:10 +08:00
MarginNote
quietjosen
2017-11-09 15:59:51 +08:00
@ossphil 好,去了解下。
quietjosen
2017-11-09 16:00:17 +08:00
@XiaoFaye 并不是 OCR,但要涉及字体、编码等信息,才能正确解析。
quietjosen
2017-11-09 16:01:47 +08:00
@picone 恩,这个算是替代方案,但并不能解决已有 PDF 标注的问题。
ossphil
2017-11-11 11:39:28 +08:00
@picone MarginNote 的标注不能被其他 pdf 阅读器识别
cuitor
2017-12-11 13:47:26 +08:00
quietjosen
2017-12-12 08:23:58 +08:00
@cuitor 好,记下了,有空去瞧瞧。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/404737

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX