V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
nosugar
V2EX  ›  程序员

给大家分享一个 Python 处理扫描后书籍的项目,兼顾阅读质量跟 PDF 体积

  •  
  •   nosugar · 2017-07-23 11:24:58 +08:00 · 2414 次点击
    这是一个创建于 2461 天前的主题,其中的信息可能已经有所发展或是发生改变。
    使用的开源项目: https://github.com/barrer/scan-helper
    使用的处理脚本: https://github.com/barrer/scan-helper/blob/master/scan_helper_png.py

    扫描原始文件:4.0G
    文件个数:2459 张图片
    最终 PDF 大小:527M

    操作步骤:
    扫描( 600 DPI )
    ABBYY 歪斜矫正
    ABBYY 另存“ JPEG 彩色”
    “ scan_helper_rename.py ”修改图片名字为数字+英文字符(不能包含空格等特殊符号)
    “ scan_helper_png.py ”生成“ monochrome ”目录下黑白 png
    用无损压缩软件( ImageOptim、limitPNG 等)压缩“ monochrome ”目录下的黑白 png (可选操作)
    用 Adobe Acrobat DC 合并 png 为单个 pdf

    Demo:
    链接: https://pan.baidu.com/s/1sli9H7Z 密码: fedv
    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3359 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 11:58 · PVG 19:58 · LAX 04:58 · JFK 07:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.