被 archive.org 惊到了

264 天前
 gap

刚才在阮一峰的周报中看到一句话「每个人都应该有一个网站。它会被安全地保存在 archive.org 中,供你的后代研究和思考。网站的可持久性,比社交媒体好得多,也比人们以为的更长久。」

其实我都没有怎么用过 archive.org ,刚才跑去将自己几年前做的一个小网站地址输入了进入,该网站早已停了,居然被收录了! archive.org 难道是真的爬全网并收录?!

7325 次点击
所在节点    分享发现
48 条回复
InDom
264 天前
一样,找到了我曾经十几年前的旧博客,回忆满满啊。
titanium98118
264 天前
能收录到的肯定只是一少部分网站,你可以手动让它去收录。
至于它的收录规则是怎样,没去了解过。
Tink
264 天前
不然嘞
cairnechen
264 天前
确实能找到很多历史存照,但用多了你就知道有很多是没有收录进去的
vueli
264 天前
我刚刚去看了一下自己的网站,tmd 被腾讯拦截了,要我去备案
coolair
264 天前
并没有爬全网,我原来自己做过的个人站没有一个被收录的。
goldenalex
264 天前
早年的互联网上数据很小的,全网爬一下没啥。。。

爆发应该是 iphone 出来之后的事情了。。。

而且 archive.org 是爬文本为主的,多数的图片都没了。。。
estk
264 天前
之前滴滴被下架,官网也没 apk 可以下载,去第三方下 apk 不放心,于是去 archive ,它竟然连 apk 文件都缓存,直接下载了。。
GoTop
264 天前
@estk 它真的,我哭死
Morii
264 天前
当时闲鱼买了个洋垃圾音响,官网都挂了,结果在 archive 里找到了缓存,下载到了最后一版固件,正好把我的问题给修复了
davin
264 天前
很想找到当年谷歌还没退出大陆时候的首页快照截图,翻了很久也没找到。记得当年搜索框底下,有几个会动的图标是用纯 CSS 写的,鼠标经过时,精灵图变换坐标位置,在当年看起来还是挺时尚的。有没有大佬能找到当年这个快照截图呀😅
zhangshine
264 天前
一部分,现在 aigc 的原因连 google 都爬不过来了,更别提 archive 了
tony1016
264 天前
初次认识这个网站,是因为 tiny 11
kassol
264 天前
刚进去找到自己十二年前的 blog ,虽然当时的 WordPress 正文页没有 archive ,但是看列表也都满满都是回忆了🤣,倒是后来的 Hexo 有 archive 到全部的页面
maemolee
264 天前
我看了一下,我的博客也能搜得到,厉害了
Biggoldfish
264 天前
Google 就是爬全网收录、定期更新、rank 然后提供检索
gpt5
264 天前
导出不是很友好,我记得必须用他们自己的那个 cms 。
给个导出为静态页面的选项多方便啊!!
Maboroshii
264 天前
有的不行。比如阿里云盘当时说永不限速,结果用 archieve 看,是看不到当时的网站内容的
1423
264 天前
不止呢,再重新惊一次
搜一下 mkv BDMV. 好多影视资料也在,几百 G 的圆盘也有
stillyu
264 天前
我有一个网页,是记录前女友从出生到现在的时间
实现逻辑就是前端获取当前的时间戳 - 出生时间戳
archive.org 上不同日期的缓存,算出来的竟然都是当时的结果

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/966303

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX