V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
dada88xyxy
V2EX  ›  程序员

请教一下大伙是怎么样保存互联网文章?

  •  3
     
  •   dada88xyxy · 340 天前 · 12052 次点击
    这是一个创建于 340 天前的主题,其中的信息可能已经有所发展或是发生改变。

    经常会遇到一个事儿,在 pc 的时候,感觉需要保存的文章会收藏在浏览器里面,然后下次就可以点击访问。但是这样会遇到 2 个问题,1 个是 404 了;另外 1 个是不能全文搜索,有时候不记得在哪个网站,只记得某个关键词,想搜索可以找出来。

    在手机浏览器、微信看到的文章亦是如此,请教各位有什么好方式?

    需求:离线保存;全文搜索

    128 条回复    2024-03-05 10:47:07 +08:00
    1  2  
    basiak
        1
    basiak  
       340 天前   ❤️ 1
    Instapaper(保存后不要 reload)
    Joplin
    Wallabag
    后俩个都能满足你的需求。第一个适合轻度,不能搜索,需搭配其他比如 Evernote 或者 IFTTT+Pinboard 实现搜索
    dada88xyxy
        2
    dada88xyxy  
    OP
       340 天前
    @basiak 嗯嗯,好哒,我去学习看看,我就是想把它部署在本地的 nas 上面
    basiak
        3
    basiak  
       340 天前
    @dada88xyxy Nas 上那就 docker 搭建 wallabag
    不过个人习惯 Instapaper+Joplin ,保存并高亮关键部分,设标签,定时清掉不需要的
    建议不要堆积太多,避免拖延症
    ianEros
        4
    ianEros  
       340 天前   ❤️ 1
    简悦插件把网页转 markdown 复制
    保存到本地,typora 自动上传图片到图床
    再用 obsidian 管理和查看
    SenLief
        5
    SenLief  
       340 天前
    evernote
    glogo
        6
    glogo  
       340 天前
    OneNote, Word, 微软 Office 文档公众号
    dellymay
        7
    dellymay  
       340 天前
    浏览器插件:Web Clipper
    我是直接扔语雀里去,需要时直接上语雀查
    JimGreen
        8
    JimGreen  
       340 天前 via iPhone
    印象笔记。长截图。
    LavaC
        9
    LavaC  
       340 天前   ❤️ 6
    浏览器插件 SingleFile ,设置里绑定个网盘,完事。
    上面那些剪藏的截图的肯定不如把网页整个保存下来完整。
    iold
        10
    iold  
       340 天前
    我用的 Twilar
    kidzgy
        11
    kidzgy  
       340 天前
    @LavaC #9 是的,我也是用这个 SingleFile ,非常好用
    glovebx
        12
    glovebx  
       340 天前   ❤️ 1
    我现在用的开源项目 https://github.com/lcomplete/huntly ,docker 部署好了就一直开着
    shuxhan
        13
    shuxhan  
       340 天前
    真不错的文章我会转成 md 放在 Obsidain 里备份
    mamili
        14
    mamili  
       340 天前
    @shuxhan 求教用什么转的 md ?有些网页格式比较多还不好转,特别是图片,我现在还手动存
    Goalonez
        15
    Goalonez  
       340 天前
    感觉还是简悦保存的效果比较好.虽然感觉简悦各种配置项很多,但是只用自己用得上的功能就可以了.
    看你用什么知识库,可以直接转存到 notion 或者语雀,授权一下就行,也可以通过插件保存到本地 obsidian.
    cbythe434
        16
    cbythe434  
       340 天前
    在 pc 的时候?
    inu
        17
    inu  
       340 天前
    我比较好奇大伙都保存什么样的文章,我感觉我都没专门保存过什么...
    MoeMoesakura
        18
    MoeMoesakura  
       340 天前   ❤️ 1
    Telegram @corsabot , Export To Telegraph
    archive.today
    archive.org
    loomoo23
        19
    loomoo23  
       340 天前
    用 SingleFile 插件(浏览器) 直接保存整个网页
    mineralsalt
        20
    mineralsalt  
       340 天前
    我也有一样的烦恼, Joplin 配合浏览器插件可以
    hahastudio
        21
    hahastudio  
       340 天前
    NAS 上装了 archivebox
    hezhile
        22
    hezhile  
       340 天前
    cubox
    c2Ns
        23
    c2Ns  
       340 天前
    edge 浏览器的网页捕获功能。
    whooami
        24
    whooami  
       340 天前
    只有我 ctrl + d 进收藏夹吗?
    DOLLOR
        25
    DOLLOR  
       340 天前
    浏览器自带保存为 PDF 功能
    garipan
        26
    garipan  
       340 天前
    Google Keep ,非常好用呀。配合浏览器插件一键保存网页,自带缩略图,还可以摘录一些重要内容黏贴到文字区域。
    关键是不用担心 Google 跑路。我十年前用 keep 存的东西,今天也还可以查看。
    fengjianxinghun
        27
    fengjianxinghun  
       340 天前
    @garipan google 关闭的服务还少么。。。天国的 GR
    vtexer
        28
    vtexer  
       340 天前
    飞书的剪存,直接存在飞书文档里
    walker2laok
        29
    walker2laok  
       340 天前
    @inu 这段话跟你的头像很配...
    iorilu
        30
    iorilu  
       340 天前
    copy 到 obsidian 就行
    xiparos
        31
    xiparos  
       340 天前
    cubox pro
    Helsing
        32
    Helsing  
       340 天前 via iPhone
    cubox
    Radeon
        33
    Radeon  
       340 天前
    SingleFile
    wqq096737ink
        34
    wqq096737ink  
       340 天前   ❤️ 1
    @kidzgy
    @LavaC
    网页保存下来不是目的把 , 关键是后续如何搜索
    roycestevie6761
        35
    roycestevie6761  
       340 天前
    printfriendlypdf
    toloric
        36
    toloric  
       340 天前
    Notion

    刚弃用印象笔记并迁移到 Notion
    MXMIS
        37
    MXMIS  
       340 天前
    我和楼主一样的需求,看到好文章随手 Ctrl+D 但是容易丢或者只记得关键词,我用 Wallabag
    hamsterbase
        38
    hamsterbase  
       340 天前 via Android
    可以看看我的,我之前发了很多帖子了。

    1. 手感无敌,花了几个月打磨手感。
    2. 全文搜索
    3.数据都在本地,不上传任何数据。 无任何埋点,我连自己多少用户都不知道
    4.支持网页批注。
    5.有 api 和 sdk
    joesonw
        39
    joesonw  
       340 天前 via iPhone
    Evernote 直接 clip ,google 的时候还能同步搜索出现在搜索结果旁边。
    terrysnake
        40
    terrysnake  
       340 天前
    印象笔记吧,有浏览器插件,公众号给他链接也能保存。
    C47CH
        41
    C47CH  
       340 天前
    当然是保存到 archive.org ,然后直接保存书签就行了,不过我不用搜索。
    thinszx
        42
    thinszx  
       340 天前   ❤️ 1
    zotero ,科研利器,也很适合做这个,结合 onedrive 可以多端同步
    mauve
        43
    mauve  
       340 天前   ❤️ 2
    SingleFile 配合插件自动到 DEVONThink 的 Inbox ,然后借助 Smart Rule 配合定期转成 PDF ,最后用上 ocrmypdf 脚本转换一些不能被检索到的文字,以便之后全局文字搜索,乍一看很复杂,其实都是自动化的,只需要点一下 Chrome 的上的 SingleFile 按钮就好了
    0superx0
        44
    0superx0  
       340 天前   ❤️ 1
    ctrl+p 保存为 PDF 文件,
    保存到本地
    hicdn
        45
    hicdn  
       340 天前 via Android
    不需要保存图片的,存 markdown ;需要保存图片的存 pdf 。本地搜索用 recoll 。
    quejuwen
        46
    quejuwen  
       340 天前
    思源笔记,装浏览器插件
    dudubaba
        47
    dudubaba  
       340 天前
    notion 搭配官方的剪裁插件
    abcdxe2v
        48
    abcdxe2v  
       340 天前
    @MoeMoesakura archive.today 最近不能用了
    left7410
        49
    left7410  
       340 天前
    浏览器装个印象笔记插件可以一键保存网页内容
    yangxii
        50
    yangxii  
       340 天前
    @dudubaba notion 怎么做到?
    narip
        51
    narip  
       340 天前
    mushuanl
        52
    mushuanl  
       340 天前
    notion, 复制粘贴然后保持原链接。
    看过一段时间后自己整理一下
    14
        53
    14  
       340 天前   ❤️ 2
    我也是 SingleFile:
    - 使用 Chrome 插件 https://chrome.google.com/webstore/detail/mpiodijhokgodhhofbcjdecpffjipkle 一键点击保存
    - 配合安装 https://github.com/gildas-lormeau/single-file-companion 实现静默保存到 Obsidian 文件夹,iCloud 同步
    - Obsidian 安装 https://github.com/nuthrash/obsidian-html-plugin 插件实现预览 SingleFile HTML 文件
    - iPhone 安装 Obsidian 也能同步查看
    zhangfeiwudi
        54
    zhangfeiwudi  
       340 天前   ❤️ 3
    我比较土, 因为我很喜欢记笔记, 我一般保存文章我都是用自己的话全部写到 Obsidian 里 然后在贴上文章的地址。。 如果不需要写笔记的话 那说明这篇文章不值得我记录
    connection
        55
    connection  
       340 天前
    evernote
    notion clipper
    cubox
    目前主要 cubox
    foxio2
        56
    foxio2  
       340 天前
    以前用 Fireshot 也挺好 pdf 或者图片也方便以后检索,排版原汁原味。现在用 SingleFile ,html 也能够全局搜索到文章的细枝末节。而且不用排版,非常好。
    zololiu
        57
    zololiu  
       340 天前
    有 NAS 的话直接部署 Wallabag 吧,也有手机客户端。
    ispinfx
        58
    ispinfx  
       340 天前
    Raindrop 凑合着用
    zololiu
        59
    zololiu  
       340 天前
    @glovebx 之前试过,占用有点高,另外好像不支持把文章以及文章图片保存到本地。
    XxxxD
        60
    XxxxD  
       340 天前
    instapaper 稍后读,但是我记得之前收藏的一个文章删了就没了
    现在感觉有用的都是 ctrl+S 收藏页面,当然会有个附带的文件夹保存图片 CSS JS 啥的,看前面说的 ctrl+P 打印我也试了下,预览格式不太对,不注重格式可以考虑
    boshok
        61
    boshok  
       340 天前
    evernote web clipper
    catsnl
        62
    catsnl  
       340 天前 via iPhone
    简悦+notion
    91pornshanghai
        63
    91pornshanghai  
       340 天前
    有一个 chrome 插件叫 SingleFile ,可以把网页保存为单个 html 文件
    TabGre
        64
    TabGre  
       340 天前 via iPhone
    @mauve 我也适用这个软件 为什么不适用它自己的 clip 呢?另请具体工具转 pdf 的
    CatCode
        65
    CatCode  
       340 天前
    SingleFile 插件同一个作者还做了个支持压缩的版本 SingleFileZ
    zhengkk
        66
    zhengkk  
       340 天前
    我用的是 Chrome 的阅读清单功能
    piku
        67
    piku  
       340 天前 via Android
    以前是丢收藏夹。现在分两种情况:一种是网页复制到 OneNote 粘贴(会自动带上格式和来源链接)。另一种是捡重点重写到笔记。
    ychen997
        68
    ychen997  
       340 天前 via iPhone
    苹果全家桶的话就 Anybox 吧,用过的最好用的收藏夹 app
    ychen997
        69
    ychen997  
       340 天前 via iPhone
    Anybox 最近还开放 API 可以跟 SingleFile 联动,还有 Raycast Alfred Popclip 的插件
    MetroWind
        70
    MetroWind  
       340 天前
    给你们推荐个神器: https://github.com/Y2Z/monolith
    fuyun
        71
    fuyun  
       340 天前
    自建一个 CMS ,接入 ElasticSearch ,或者直接用 WordPress 等,再找一个 ES 插件。
    keegan
        72
    keegan  
       340 天前
    @mamili maoxian
    hackpro
        73
    hackpro  
       339 天前 via iPhone
    SingleFile
    xsen
        75
    xsen  
       339 天前
    notion
    hamsterbase
        76
    hamsterbase  
       339 天前   ❤️ 2
    @dada88xyxy


    常见的网页归档格式有 MHTML 和 webarchive 。这两种格式都可以将网页的全部图片、样式和 HTML 保存为一个文件。

    操作系统其实自带了保存网页归档的功能:

    安卓 Chrome:点击收藏旁边的下载按钮,保存格式为 MHTML 。
    iOS Safari:点击分享 > 点击选项 > 点击网页归档 > 点击储存到文件,保存格式为 webarchive 。
    Mac Safari:可以按 Ctrl + S 选择网页归档,保存格式为 webarchive 。
    PC Chrome:可以按 Ctrl + S 选择单文件,保存格式为 MHTML 。

    你也可以使用 SingleFile 插件,将网页保存为单个 HTML 文件。

    这些方式可以很好地实现网页的保存和查看。但很难实现网页的检索、管理以及进一步的批注和消化。

    为了更好地管理我之前保存的几千个 html 文件,我开发了 HamsterBase 。它支持解析 HTML 、webarchive 和 MHTML 。导入后支持批注、全文搜索。


    hamsterbase 支持自动导入,放到文件夹下可以自动导入。
    也提供了 API , 可以直接和 singilefile 联动,singilefile 可以一键保存网页到 hamsterbase 。

    ⚠️:hamsterbase 不会修改任何用户导入的文件, 只会压缩后储存。
    ⚠️:hamsterbase 不存储任何用户数据,所有数据都在你的本地。
    tedzhou1221
        77
    tedzhou1221  
       339 天前
    cubox
    helooo
        78
    helooo  
       339 天前 via Android
    飞书剪存
    dada88xyxy
        79
    dada88xyxy  
    OP
       339 天前
    感谢各位大佬啊,好激动好激动,好多干货
    LavaC
        80
    LavaC  
       339 天前
    @wqq096737ink 因为大部分剪藏都不太能保存页面结构。比如我要保存一个带评论区的微博,保存的时候就会发现类似用户头像、点赞数、图标这类元素在缺少 css 后都会占用太多剪藏后的文章内容,降低了可读性。倒不如先把网页连带 css 和 js 保存下来,保证最原始的阅读体验不变,后续你用 vscode 在文件夹全局搜索也好,另外剪藏也好,都有个可操作区间。
    lrzsw2008
        81
    lrzsw2008  
       339 天前
    右键,另存为 /保存。
    matthewzhong
        82
    matthewzhong  
       339 天前
    onenote webclipper 。或者收藏到书签,自己总结一篇文章发到博客。
    codeRhythm
        83
    codeRhythm  
       339 天前
    我常用的是有道云笔记,对微信公众号特别友好,直接手机分享到 app 就可以自动转存了,网页也可以保存。不用搭建什么,简单好用
    PengLiLi
        84
    PengLiLi  
       339 天前
    通过浏览器插件 SingleFile 直接保存网页。
    wzw369
        85
    wzw369  
       339 天前 via Android
    手抄下来[doge]
    huanruiz
        86
    huanruiz  
       339 天前
    直接 fullpage 截屏转 pdf, 好文章值得一个 pdf 的大小
    yellowbean
        87
    yellowbean  
       339 天前 via Android
    obsidian+markdownload 浏览器插件,
    支持直接解析文章下载 md ,
    还支持鼠标右键菜单直接 send2ob ,
    插件设置页还可以预设格式,自动打标签,标来源时间作者等等......
    y051313
        88
    y051313  
       339 天前
    带视频的怎么办?
    Scare
        89
    Scare  
       339 天前
    真的好的,就认认真真用 Word/记事本手动存一下到电脑上,或者截图。
    感觉其他的,就算了吧。。。。
    记得以前翻了翻收藏夹,一大些,基本上都没再第二次看过。。。
    所幸就戒掉了仓鼠症,只选择真的很重要的,其他的就随缘了
    wipbssl
        90
    wipbssl  
       339 天前
    web clipper 插件+joplin+自定义图床
    SachinBeyond
        91
    SachinBeyond  
       339 天前
    @huanruiz 后期怎么 方便查找?保存不是目的,构建知识库,方便快速检索才是目的
    zzboat0422
        92
    zzboat0422  
       339 天前
    印象笔记
    优点是全,目前支持平台最全面( iOS ,安卓,windows ,MacOS ,Linux ),支持浏览器最全面( chrome,edge,safari,各种国内基于 chromium 的浏览器)。
    缺点是慢,卡,运行占资源。

    有道云笔记浏览器剪藏插件不支持 safari
    onenote 没有 linux 版,且不直接支持 markdown
    worldquant
        93
    worldquant  
       339 天前
    wallabag 浏览器插件一键保存,手机同步或者接入 rss 软件读取浏览很方便。
    manasheep
        95
    manasheep  
       339 天前
    飞书剪存。
    Chrome 的 SingleFile 插件,保存网页为单一文件,图片都做 BASE64 转码存入,非常方便,共享时直接传给别人就行了。
    sakishum
        96
    sakishum  
       339 天前
    使用页面工具将网页生成 markdown 存到本地,推荐使用 https://devtool.tech/html-md
    shuxhan
        97
    shuxhan  
       339 天前   ❤️ 1
    @mamili https://chrome.google.com/webstore/detail/obsidian-web/edoacekkjanmingkbkgjndndibhkegad 一个谷歌插件,同时也是 obsidain 插件,两个同时启用,我平时使用还行,没啥问题
    manasheep
        98
    manasheep  
       339 天前
    对了,本地文件搜索,其实可以使用 Anytxt Searcher ,它支持各种办公文档,也可以通过设置添加 html 、htm 文件的支持,非常强大,而且免费,结合 SingleFile 使用很好。
    AItsuki
        99
    AItsuki  
       339 天前
    不保存,放到阅读清单。看完做笔记(如果需要),做完笔记删除。太久没看的表示我可能不关心了,直接删除。
    exposir213
        100
    exposir213  
       339 天前
    太麻烦了 notion 吧
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   996 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 19:57 · PVG 03:57 · LAX 12:57 · JFK 15:57
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.