给大家分享一个 Python 处理扫描后书籍的项目,兼顾阅读质量跟 PDF 体积

2017-07-23 11:24:58 +08:00
 nosugar
使用的开源项目: https://github.com/barrer/scan-helper
使用的处理脚本: https://github.com/barrer/scan-helper/blob/master/scan_helper_png.py

扫描原始文件:4.0G
文件个数:2459 张图片
最终 PDF 大小:527M

操作步骤:
扫描( 600 DPI )
ABBYY 歪斜矫正
ABBYY 另存“ JPEG 彩色”
scan_helper_rename.py ”修改图片名字为数字+英文字符(不能包含空格等特殊符号)
scan_helper_png.py ”生成“ monochrome ”目录下黑白 png
用无损压缩软件( ImageOptim、limitPNG 等)压缩“ monochrome ”目录下的黑白 png (可选操作)
用 Adobe Acrobat DC 合并 png 为单个 pdf

Demo:
链接: https://pan.baidu.com/s/1sli9H7Z 密码: fedv
2417 次点击
所在节点    程序员
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/377322

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX