V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dada88xyxy
V2EX  ›  程序员

请教一下大伙是怎么样保存互联网文章?

  •  3
     
  •   dada88xyxy · 348 天前 · 12138 次点击
    这是一个创建于 348 天前的主题,其中的信息可能已经有所发展或是发生改变。

    经常会遇到一个事儿,在 pc 的时候,感觉需要保存的文章会收藏在浏览器里面,然后下次就可以点击访问。但是这样会遇到 2 个问题,1 个是 404 了;另外 1 个是不能全文搜索,有时候不记得在哪个网站,只记得某个关键词,想搜索可以找出来。

    在手机浏览器、微信看到的文章亦是如此,请教各位有什么好方式?

    需求:离线保存;全文搜索

    128 条回复    2024-03-05 10:47:07 +08:00
    1  2  
    AItsuki
        101
    AItsuki  
       347 天前
    对不起,我上一条回答和标题关系不大……
    现在我重新回答:本贴的大部分回复都没考虑到手机上使用的情况,推荐的基本都是 pc 端浏览器插件。

    所以我推荐使用 GetPocket ,阅读公众号,或者阅读网页,直接分享到 getpocket 就可以了。如果需要离线保存,需要 PREMIUM 版本(一年 280 )
    pigf
        102
    pigf  
       347 天前
    有道云笔记,复制了一个链接之后会提示你是否要抓取整个页面的内容,非常好用。
    pendulum
        103
    pendulum  
       347 天前
    hamsterbase 应该能满足你的要求
    garipan
        104
    garipan  
       347 天前
    @fengjianxinghun #27 哈哈 但比起其它公司或服务,Google 提供的已经算是非常长寿的了,不是吗……而且关闭之前都可以导出来
    pendulum
        105
    pendulum  
       347 天前
    @hamsterbase #76 期待上线用户管理功能,或者其他方式来保障公网部署服务的安全性
    Yunen
        106
    Yunen  
       347 天前
    VPS 自建 ArchiveBox
    debuggeeker
        107
    debuggeeker  
       347 天前
    用 md 插件把文章下载,然后通过 py 脚本对文章中图片下载的本地替换 md 中远程的图片。
    再配合 SingleFile 下载一个 HTML 的。
    如果图片真的下不了,就没办法了,图片只能手动下载。
    然后放网盘分类。
    hamsterbase
        108
    hamsterbase  
       347 天前 via Android
    @pendulum 这个不是 hamsterbase 的职责。

    如果要暴露到公网,可以在外面套 nginx

    如果是想随时访问,可以用 tailscale
    jieran233
        109
    jieran233  
       347 天前
    浏览器插件 SingleFile ,要搜索的话就用 vscode 打开文件夹搜索

    还有一个 https://webrecorder.net/ ,个人用过最强的网页捕获回放工具,适合捕获各种复杂的动态网页,可以做私人的 web.archive.org
    thiiadoewjwe
        110
    thiiadoewjwe  
       347 天前
    有道云笔记
    alfawei
        111
    alfawei  
       347 天前 via iPhone
    @zololiu iOS 手机没有好用的客户端
    kawaii303
        112
    kawaii303  
       347 天前 via iPhone
    @toloric notion 的网页剪藏不好用,只能剪藏网址,不能保存原文,相对来说,印象笔记剪藏效果最好。
    fresco
        113
    fresco  
       346 天前 via iPhone
    论体验的话 cubox 不错
    sparkinglemon
        114
    sparkinglemon  
       346 天前
    前一阵从 V 友这儿学会的,Safari ,分享到“图书”app ,也能直接生成离线版,方便好用
    abc8678
        115
    abc8678  
       346 天前 via Android
    一开始我也只是保存个浏览器书签,结果后来打不开了。再搜也可能搜不到原文。然后也养成了保存教程的习惯
    suibianzai
        116
    suibianzai  
       346 天前
    我也是用 singlefile 保存 html 上百篇文章仍在网盘一个文件夹里 现在的问题是没办法方便地搜索、查看 于是文章保存下来后就在网盘里吃灰 网上找了找也没有合适的工具 楼里一位朋友做的工具去试用了一下 总感觉不得劲儿 而且个人产品还是不太放心 这类工具最好是能靠谱一点的公司来做
    suibianzai
        117
    suibianzai  
       346 天前
    @suibianzai #116 补充一下 很多人提到 SingleFile 结合桌面搜索软件( anytxt searcher/archivarius 等,知乎上搜到一篇比较全面的评测 https://zhuanlan.zhihu.com/p/371466155?utm_id=0 )的做法是个不错的选择 缺点是只适用于个人电脑 移动端或者换台设备就不行了
    mauve
        118
    mauve  
       346 天前 via iPhone
    @TabGre 自带的 clip 不太好用,具体表现在:
    1. 排版经常混乱,无论 md 还是 pdf 等
    2. 剪切后的文件体积略大,相对于 singlefile 来说
    3. 绘图或者标记功能弱

    转 pdf 的工具是 DEVONThink 自带的,右键一下文件然后选择 convert to pdf ,我一般转成单页的
    TabGre
        119
    TabGre  
       346 天前 via iPhone
    @mauve 感谢分享,另外 singleFile 可以配置直接到 devonthink 吗?我看了一次 配置没有找到
    mamili
        120
    mamili  
       344 天前
    @shuxhan 很好用,感谢~
    eudemonwind
        121
    eudemonwind  
       340 天前
    直接 ctrl+S 保存 mhtml 就一单个文件
    chrome 和 firefox 都有相关设置和插件.
    检索时用 everything 直接搜文件名,
    重要点的会用 onenote 摘录一下
    woyaojizhu8
        122
    woyaojizhu8  
       324 天前
    @mauve
    >SingleFile 配合插件自动到 DEVONThink 的 Inbox
    这里的 插件 是 devonthink 的插件吗?具体是什么插件?
    >最后用上 ocrmypdf 脚本转换一些不能被检索到的文字
    devonthink 自带的 ocr 不能满足需求吗?
    mauve
        123
    mauve  
       324 天前
    @woyaojizhu8 不好用而且我没买高级版,识别出来的结果并不好
    Mickeyy
        124
    Mickeyy  
       244 天前
    @mauve #43 马克一下这套操作
    Rookie01
        125
    Rookie01  
       243 天前
    @LavaC #80 请教一下,为什么我保存微博页面,然后网页内容里的图片和评论区的用户头像都不显示呢?
    LavaC
        126
    LavaC  
       243 天前
    @Rookie01 设置的网络里把图片选项勾勾?
    SachinBeyond
        127
    SachinBeyond  
       58 天前
    @foxio2 老哥,现在还在用 singlefile 吗? 感觉这个的缺点是后期无法天机哎备注?
    hanssx
        128
    hanssx  
       56 天前
    singleFile 什么时候能加上可以选择文件夹和预览、搜索就牛啤了。
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2593 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 11:17 · PVG 19:17 · LAX 04:17 · JFK 07:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.