V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
patx
V2EX  ›  问与答

有什么好的办法可以管理 mhtml 文件

  •  
  •   patx · 2022-10-06 00:35:07 +08:00 · 1627 次点击
    这是一个创建于 561 天前的主题,其中的信息可能已经有所发展或是发生改变。

    因为网上很多文章容易莫名其妙消失,所以渐渐养成了先存后看的习惯。目前是用浏览器插件保存页面到笔记软件,比如 trilium 、joplin 。会有很多问题,比如:

    • 很多图片截取不了
    • 微信或微博对一些文章有保护,文本截取不了
    • 页面有代码的话,样式混乱

    比较满意的方法是把文章保存为 mhtml ,手机上保存 mhtml 也很方便,用浏览器就可以一键保存。但是这样有个问题,就是有密密麻麻一堆文件,不好统一管理、关键词检索和浏览。

    所以就想问下各位,你们是如何处理这种情况的?有没有管理 mhtml 文件的好办法?

    12 条回复    2022-10-06 12:39:56 +08:00
    leonzym99
        1
    leonzym99  
       2022-10-06 08:53:58 +08:00
    关于文章剪藏,你可以试试 cubox ,我付费用了快一年,体验挺好,公众号啥的也都能存
    hing
        2
    hing  
       2022-10-06 08:54:15 +08:00
    为什么不保存为 PDF 文件?
    patx
        3
    patx  
    OP
       2022-10-06 08:59:32 +08:00
    @hing 假如页面有代码块(比较常见于论坛帖子),又有横向的滚动条,另存为 pdf 后,只会保存可见的部分。
    shinsekai
        4
    shinsekai  
       2022-10-06 09:00:57 +08:00
    保存到 archive.org 不好吗,保存后直接将 archive 网址添加到收藏夹。
    patx
        5
    patx  
    OP
       2022-10-06 09:11:59 +08:00
    @fansvista 这种只能保存公开的页面吧,对于只能登录查看的帖子,行不通
    Rache1
        6
    Rache1  
       2022-10-06 09:28:13 +08:00   ❤️ 2
    emberzhang
        7
    emberzhang  
       2022-10-06 09:34:41 +08:00   ❤️ 1
    mhtml 怎么感觉是 20 年前用的了,现在不都 webarchive 或者 textbundle 么,devonthink 统一管理就行了,但要标注 /高亮 /引用什么的最终还得 pdf
    patx
        8
    patx  
    OP
       2022-10-06 09:57:47 +08:00
    @emberzhang 主要是保存方便,PC/安卓上不需要额外安装软件 /插件,手机上基本都是一键保存。苹果的设备没怎么用过。
    0o0O0o0O0o
        9
    0o0O0o0O0o  
       2022-10-06 10:01:47 +08:00   ❤️ 1
    手动:SingleFile 、Joplin Web Clipper ;
    自动:ArchiveBox 以及一些其余的 archiving 程序,复杂页面用到 puppeteer 等工具来配合 JS 操作 headless chrome (感兴趣也可以看看 ArchiveBox issues #51 );
    存储:个人通过 Joplin 存放和检索,互联网通过 archive org 。
    patx
        10
    patx  
    OP
       2022-10-06 11:15:22 +08:00
    试了一下楼上的 SingleFile ,再加上: https://github.com/nil0x42/singlefile2trilium

    有点麻烦,但是效果还行,后面再用一段时间看有什么问题。
    v2tudnew
        11
    v2tudnew  
       2022-10-06 12:08:09 +08:00
    @Rache1 这个能关闭页面右键选项功能吗?
    Rache1
        12
    Rache1  
       2022-10-06 12:39:56 +08:00   ❤️ 1
    @v2tudnew 可以

    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2734 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 14:48 · PVG 22:48 · LAX 07:48 · JFK 10:48
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.