做了一个 Chrome 插件,自动把访问过的网页全文保存到自己的 WebDAV 上

2023-02-15 15:45:01 +08:00
 greensea

先丢插件地址:

https://chrome.google.com/webstore/detail/page-auto-archiver/inbfhpapklekaajibkklfjieklbbmmke/related

做这个东西起源于我自己的一个很实际的需求:有时候我想找前几天刚刚看过的网页的资料,但是网页标题已经不记得了,所以没办法通过历史记录去搜索,但是我记得网页上的文字内容,如果可以根据网页内容搜索历史记录就好了。

于是就做了这个插件,安装之后,日常浏览的时候会默默地把网页全文保存到自己的 WebDAV 上,等到想搜索的时候,直接去插件里搜索就好了。(当然更极端也更快的方法是去服务器上 grep )

反正做都做了,干脆就完善一下丢出来,万一有和我一样收集癖的人呢。

4473 次点击
所在节点    分享创造
45 条回复
leqoqo
2023-02-15 20:37:05 +08:00
请问一下能支持保存到本地一个目录吗?,最好支持一下点击"加入索引",然后保存该记录.
顺便分享一下我的 iPhone 历史记录方法
https://www.icloud.com/shortcuts/c8320ec70d0b4bfb8b876e5f2509f85e
截屏并 OCR 生成富文本 html 保存到文件
leqoqo
2023-02-15 20:39:52 +08:00
设置成双击手机背面 执行上面捷径
wayne3602
2023-02-15 20:46:26 +08:00
不错,支持一下,我也有这个困扰,而且除了这个困扰之外我有个癖好,我在输入框输入东西的时候不想被曾经输入过的相似内容打扰,我只能清除浏览数据,但是这样一来我以后想找曾经浏览过的网页就彻底找不到了
zouzhi
2023-02-15 21:15:55 +08:00
挺好,我一般是保存到 notion ,也还不错
31415926535x
2023-02-15 21:23:22 +08:00
把所有浏览过的页面都缓存的话,感觉是不是有些冗余(因为一般只需要备份感兴趣的就行,不过好像也没法预知后续是否重新感兴趣)

如果只是为了 backup 浏览过的链接,以及快速回复标签页对应的窗口的话,可以试试 sessionbuddy 这个插件
zooo
2023-02-15 21:27:57 +08:00
支持

之前有过这种想法,没想到挺多人都已经做出来工具了
zooo
2023-02-15 21:29:34 +08:00
@zooo 其实如果支持后续一些功能就能强大了,比如自动分类,自动建立一些帮助人记忆消化的索引,就能好了,相当于第二大脑,人脑用来将建立的索引进行记忆。
wynemo
2023-02-15 22:38:17 +08:00
@greensea #10 老哥 插件描述可以更新下吗 应该是这种形式吧 https://username:passwordmimie@foo:bar:5006/archive/
m4d3bug
2023-02-15 23:06:13 +08:00
能多一个树状图记录浏览痕迹也是极好的
lovestudykid
2023-02-16 03:41:58 +08:00
https://www.rewind.ai
这个工具可以把电脑上浏览过的任何东西存档并可检索
adrianzhang
2023-02-16 04:47:58 +08:00
非常非常棒啊!早就需要这类工具了!
dasenlin
2023-02-16 08:58:24 +08:00
用户名或者密码中含有 @ 是不是就不能用了
Spoter
2023-02-16 09:39:21 +08:00
@wayne3602 直接关闭那一个搜索结果就好了
lelandsu
2023-02-16 11:51:36 +08:00
不能用, 输入带用户名和密码的地址,测试连接失败,DevTools 看了下,密码被当作域名发起了请求。
Rookiewan
2023-02-16 16:30:27 +08:00
试了下,指定文件夹下只有 3 个文件夹,但是却一直搜索,搜索 1000 多个还在继续,被我终止了。不会是从根目录开始搜索的吧?
ufo5260987423
2023-02-16 17:38:18 +08:00
@eaststarpen 我直接用 vim 插件,在打开网页的时候可以直接搜索
XiaoBaiYa
2023-02-17 10:33:26 +08:00
@hamsterbase #18 感谢推荐,挺好用,基本无感,已经存了 1 个 G 的历史记录了
greensea
2023-02-17 11:19:18 +08:00
@wynemo 昨天提交新版本了,现在审核已经通过,应该会自动更新下来了

@wanguorui123 你是想自动保存网页的 mht ,而仅仅是纯 HTML ?这样会很大的哦,估计一天就能有几个 GB 出来

@zooo 曾经想过做全文索引然后加快搜索速度,但是考虑到本地没法实现,而如果在服务端实现的话对个人来说部署又太麻烦,于是还是直接采用扫描的方法搜索

@dasenlin 这是一个问题,做的时候确实没考虑到这种情况,过几天会更新一个版本出来解决

@Rookiewan 如果指定目录的话应该就只搜索这个目录下的,我回头再测试确认一下
greensea
2023-02-17 11:22:09 +08:00
@lelandsu 这个是一个问题,过几天的新版会修复
atshow
2023-02-18 02:38:24 +08:00
@greensea 是的,用户名是邮箱,被识别为网址了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/916365

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX