V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
overthemoon
V2EX  ›  互联网

有什么办法可以比较完整的把一个网页内容保存下来?

  •  
  •   overthemoon · 36 天前 · 1357 次点击
    这是一个创建于 36 天前的主题,其中的信息可能已经有所发展或是发生改变。

    经常看到一些比较好的博文,懒得自己写,又怕博文被删帖,怎样才能保存一个完整的把 html 页面保存下来呢?包括那些样式

    27 条回复    2021-05-07 20:14:08 +08:00
    ClericPy
        1
    ClericPy   36 天前
    chrome 可以保存 mhtml, 直接另存(ctrl S) 就行了

    现在我批量缓存大量网页就用的 mhtml, 会把 css js 图片什么的都打包成 base64, 格式看起来像 Email 那套, 因为这里的 m 代表的不是可移动的, 而是 媒体类型(通常称为 Multipurpose Internet Mail Extensions 或 MIME 类型 )
    catcn
        2
    catcn   36 天前
    全屏截图插件
    geipen
        3
    geipen   36 天前
    @ClericPy mac 电脑用的谷歌浏览器下载,没有 mhtml 选项呀,只有 html
    lostberryzz
        4
    lostberryzz   36 天前
    竟然没有人提到 https://web.archive.org/ 互联网真正的宝藏所在地
    imdong
        5
    imdong   36 天前   ❤️ 1
    打印为 pdf ?
    Jirajine
        6
    Jirajine   36 天前 via Android   ❤️ 2
    Helsing
        7
    Helsing   36 天前 via iPhone
    Web Clipper 剪藏
    SuperMild
        8
    SuperMild   36 天前
    1. 可以截长图
    2. 可以导出 PDF
    3. (推荐!) 使用浏览器插件 SingleFile
    ClericPy
        9
    ClericPy   36 天前
    @geipen 早年间我用的 https://chrome.google.com/webstore/detail/save-page-we/dhhpefjklgkmgeafimnjhojgjamoafof 插件去保存, 比自带的 mhtml 保存貌似省心一点. 后来是自己撸轮子走 CDP 了...

    所以还真不记得怎么开启默认的保存选项(老版本我印象中手动从 flags 里打开的 Save Page as MHTML, 但是新版本没这东西了), 现在我浏览器保存时候选格式里就有...
    wangsongyan
        10
    wangsongyan   36 天前 via iPhone
    有道云笔记收藏网页,反正收藏了也不看🐶
    crab
        11
    crab   36 天前
    @geipen 保存类型有 mhtml 的,只是文件名显示的后缀是 html,要手动改下。
    sephinh
        12
    sephinh   36 天前 via iPhone   ❤️ 1
    直接打印保存 pdf
    leishi1313
        13
    leishi1313   36 天前 via Android
    自建个 wallabag
    Mutoo
        15
    Mutoo   36 天前
    早年间收藏整理了很多文章,时间久了全躺尸在老硬盘备份里了。现在也根本没有动力去翻看。
    christin
        16
    christin   36 天前 via iPhone
    Safari 可以选择保存为网页归档 保存出来的还挺不错
    ispinfx
        18
    ispinfx   36 天前 via iPhone
    archivebox
    beijiaoff
        19
    beijiaoff   36 天前
    @lostberryzz 这个网站收录是什么标准呀?感觉很随机
    Greenm
        20
    Greenm   36 天前
    有好几种方式:

    1. 在线网站:web.archive.org, archive.is

    2. 浏览器手工保存, 可以截图,可以 pdf,可以 singlefile 扩展,各有各的优缺点。

    3. 用工具保存,httrack --list urls.txt 可以把一堆 url 都保存下来,包括多个目录和路径; 包岩村单个 url 的话,wget 其实也能做到。
    leicool520
        21
    leicool520   36 天前
    clip to evernote
    sexoutsex2011
        22
    sexoutsex2011   36 天前
    有跨平台需求,便捷的话就还是印象笔记了
    ZeroDu
        23
    ZeroDu   36 天前
    1,打印 pdf
    2,另存为 mhtml
    3,浏览器插件 https://github.com/gildas-lormeau/SingleFile
    gledos
        24
    gledos   36 天前
    20 与 23 楼把我想说的都说完了,我来补充以下吧。

    使用互联网时光机保存网页可以用 yorkxin/copy-as-markdown 这样的浏览器扩展程序,右键复制该网页标题 + 链接的 markdown 格式,如在本网页中右键选择 `Copy [Page Title](URL)`,生成的链接方便丢进自己的电子记事本。

    关于 gildas-lormeau/SingleFile 的特点有:

    + 生成单页化的 html 文件
    + JS 音频 视频可选是否保存
    + 缩小 html 与 css,合并相同的图片,移除未使用的 css
    Moeyua
        25
    Moeyua   36 天前 via iPhone
    notion 的插件可以直接保存到 notion 中,而且支持导出为 pdf 和 html 等格式
    webshe11
        26
    webshe11   36 天前
    补充一下,https://web.archive.org/ https://archive.today/ 这些都有浏览器扩展程序,遇见想存的网页可以快速一键存档
    dingwen07
        27
    dingwen07   36 天前 via Android
    Internet Download Manager
    或者直接用类似 web.archive.org 的服务
    关于   ·   帮助文档   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2063 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 14:45 · PVG 22:45 · LAX 07:45 · JFK 10:45
    ♥ Do have faith in what you're doing.