V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
AZZERO
V2EX  ›  问与答

为防止内容挂掉,保存网页好文到自己的博客,有哪些优雅的办法?

  •  
  •   AZZERO · 2020-12-02 18:56:26 +08:00 · 2632 次点击
    这是一个创建于 1233 天前的主题,其中的信息可能已经有所发展或是发生改变。

    题主最近看网页收藏夹,结果大批好文章的网站服务器都挂掉了,打不开。

    所以问下各位大佬,有没有优雅存储网页文章到自己博客,或者云服务的方法,

    最好可以一键云采集+自动下载缓存文章插图的。

    印象笔记的剪藏可以缓存照片,很好用,可以需要付费了。

    17 条回复    2021-07-02 01:54:21 +08:00
    zhihaofans
        1
    zhihaofans  
       2020-12-02 19:07:41 +08:00 via iPhone
    图片
    EasonC
        2
    EasonC  
       2020-12-02 19:27:33 +08:00 via iPhone
    截图,保存在 Google Drive 或 Telegram 服务器,或许有人说了,Google Drive 这么硬的公司也抵抗不住图片无限备份,Telegram 又没盈利模式能保持服务器永久运行吗?于是乎最坚硬无比到的服务员横空出世,那就是全世界最大的交友网站 GitHub 喽
    AZZERO
        3
    AZZERO  
    OP
       2020-12-02 19:32:19 +08:00
    @EasonC #2 截图难以搜索啊,有时候可能会通过关键字搜索文章..
    yeqizhang
        4
    yeqizhang  
       2020-12-02 19:38:28 +08:00 via Android
    直接 singlefile 下载下来,放到资料文件夹
    AZZERO
        5
    AZZERO  
    OP
       2020-12-02 19:44:29 +08:00
    singlefile 用过,但是如何云同步+搜索内容呢?
    AZZERO
        6
    AZZERO  
    OP
       2020-12-02 19:44:46 +08:00
    rus4db
        7
    rus4db  
       2020-12-02 19:50:45 +08:00
    作为 NLP 从业者,我认为截图是比较糟糕的备份方式。
    几乎无法索引和检索,保留下来的内容难以盘活,最终只能在硬盘里吃灰,还不如一开始就不备份。
    个人知识管理,首要的是提高筛选门槛、提高信噪比,只保留最有价值的少数内容,以文本的形式。
    shroxd
        8
    shroxd  
       2020-12-02 19:54:03 +08:00 via iPhone
    Notion 和 pocket 的 chrome 插件都可以自动爬取文章生成本地文件并存储下来,不过一些付费文章可能爬不下来
    dagouziwangwang
        9
    dagouziwangwang  
       2020-12-02 19:54:32 +08:00
    @AZZERO singlefile 可以直接保存到 google drive 另外还可以用 shiori 管理书签 可以快照
    AZZERO
        10
    AZZERO  
    OP
       2020-12-02 20:03:45 +08:00
    我理想中的 Web 程序,可以部署到自己的服务器上:

    1.一个入口网页输入 url => 2.服务器自动把你输入的 url 网页加载出来,然后 singlefile 储存 => 3.自动生成一个储存的文章列表,可搜索+管理 。

    找来找去只有 diigo 的付费版,一年 300 块钱,有这个永久 cache 网页功能。
    goodryb
        11
    goodryb  
       2020-12-02 20:10:59 +08:00
    群晖 note station + chrome 插件,永久本地保存,稳妥
    echowuhao
        12
    echowuhao  
       2020-12-02 20:13:43 +08:00
    微软的 oneNote
    AZZERO
        13
    AZZERO  
    OP
       2020-12-02 20:33:43 +08:00
    搜索 note satation 后,在什么值得买 找到一个开源 php 程序,Wallabag,
    这个程序可以缓存正文内容,能剪辑大部分正规图文,能把图片抓下来存在本地。
    可以方便导入导出
    搜索效率高于 note station,你有用过这个吗?
    @goodryb #11
    goodryb
        14
    goodryb  
       2020-12-02 20:36:36 +08:00
    @AZZERO #13 没有,note station 直接是保存在群晖 nas 里面的,做个 raid1,基本不会有太大问题。

    搜索效率还好吧,文本都差不多
    hafuhafu
        15
    hafuhafu  
       2020-12-03 08:25:24 +08:00
    maoxian-web-clipper
    baobao1270
        16
    baobao1270  
       2020-12-03 10:32:33 +08:00 via Android
    1. 确定是只用一次的信息还是要多次使用的信息,如果只用一次,就不需要保存
    2. 是不是有价值的信息,如果是,那就进行下一步
    3. 将文章归纳,写成 Markdown,上传 hexo 个人博客
    lockheart
        17
    lockheart  
       2021-07-02 01:54:21 +08:00 via iPhone
    @AZZERO 推荐 archivebox,在 github 开源,支持全文搜索,自动离线保存多种格式,支持 rss 订阅
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3920 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 31ms · UTC 00:58 · PVG 08:58 · LAX 17:58 · JFK 20:58
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.