V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
sakura39
V2EX  ›  macOS

有导出 pdf 的目录成文本的软件么

  •  
  •   sakura39 · 2020-07-23 20:59:48 +08:00 · 2216 次点击
    这是一个创建于 1365 天前的主题,其中的信息可能已经有所发展或是发生改变。

    看 pdf 学习,想在 md 或者 word 里自动导入 pdf 的目录,节省时间,是否有相关的软件呢

    9 条回复    2021-01-21 13:37:04 +08:00
    lbingl
        1
    lbingl  
       2020-07-23 21:07:25 +08:00 via Android
    PDF 补丁丁(两个丁),可以导出成 XML,然后 Python 或者手动处理一下就 OK 了。
    sakura39
        2
    sakura39  
    OP
       2020-07-23 21:09:44 +08:00
    @lbingl 什么叫补丁丁😅
    忘记补充了,我指的是 pdf 内部没目录,像论文那种点击侧边目录会有的 pdf
    ftu
        3
    ftu  
       2020-07-23 21:11:59 +08:00 via iPhone
    复制粘贴目录出来,不能复制就 OCR
    inframe
        4
    inframe  
       2020-07-23 21:23:00 +08:00
    [pdf 补丁丁 ]是一个软件 p 名字。。。https://www.cnblogs.com/pdfpatcher/
    pyPDF2:这个 python 库支持操作 pdf
    使用 PDFBookmark-Exchanger 从乱码 pdf 提取书签写入不乱码的 pdf
    ynyounuo
        5
    ynyounuo  
       2020-07-23 21:24:27 +08:00 via iPhone
    用英文搜索会有很多解决方案

    一般 PDF 里可以在大部分软件以侧边栏等形式呈现的 ToC 一般就是 PDF spec 里说的树状 Outline,所以你搜索「 PDF extract outline 」就能有大量解决方案了,比如 https://github.com/usualoma/pdf-extract
    sakura39
        6
    sakura39  
    OP
       2020-07-23 21:25:10 +08:00
    @ynyounuo 谢谢
    sakura39
        7
    sakura39  
    OP
       2020-07-23 21:25:21 +08:00
    @inframe 谢谢
    xJogger
        8
    xJogger  
       2020-07-23 22:16:05 +08:00
    贴一个 PDF 补丁丁 的下载,城通网盘有时候不太好下: https://files.catbox.moe/dtzfba.7z
    ctt
        9
    ctt  
       2021-01-21 13:37:04 +08:00
    前段时间也遇到这个问题,搜索解决后,今天又遇到了,又忘记了,好不容易找到,在这也记录一下。
    FreePic2Pdf.exe 这个软件,更改 pdf-从 pdf 取书签,就可以导出,最简单的方式。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2805 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 12:36 · PVG 20:36 · LAX 05:36 · JFK 08:36
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.