Wayback Archiver 自托管的个人网页归档系统

3 月 11 日
 codeface

一个自托管的个人网页归档系统,自动捕获并保存你在 Chrome 中浏览过的网页 — HTML 、CSS 、JavaScript 、图片等一应俱全。当原始网页无法访问时,你仍然可以通过归档副本还原当时的页面样式和内容。

工作原理

Chrome + Tampermonkey ──HTTP POST──▶ Go 服务器 ──▶ PostgreSQL (元数据)
  (关闭标签页 / 页面跳转                │              + 文件系统 (静态资源)
   时自动捕获)                          │
                                        ▼
                                     Web UI ──▶ 浏览 / 搜索 / 还原
  1. Tampermonkey 用户脚本在浏览器中运行,当你离开页面时自动捕获完整的 DOM 和资源。
  2. Go 服务器接收快照,下载浏览器因 CORS 限制无法获取的跨域资源,基于内容哈希去重后存储到本地。
  3. 内置 Web UI 可以浏览、搜索和还原任意归档页面 — 完全离线,不依赖外部服务。

功能特性

欢迎体验

https://github.com/icodeface/wayback-archiver

2046 次点击
所在节点    分享创造
10 条回复
codeface
3 月 11 日
记录我所浏览的一切!
arphone
3 月 12 日
amazing...
loading
3 月 12 日
hahastudio
3 月 12 日
感觉这个接 LLM 比 Rewind 这种要轻量
fds
3 月 12 日
防刷新保护 很新颖👍
强制剥离 js 只保留 css 和 html 效果如何?能想象有些动态页面会比较惨。
codeface
3 月 12 日
@fds 尽可能还原了,部分 SPA 网页还是要单独做特殊处理。
hhacker
3 月 12 日
那么,直接存成图片行不行?就是会有点大
xJogger
3 月 12 日
支持火狐么
codeface
3 月 12 日
@hhacker 图片不太方便做正文检索,然后我还想把内容开放给 AI 读,图片效果也没文本好。
codeface
3 月 12 日
@xJogger 经测试是支持的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1197502

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX