Python 实现 archive.org 类似快照的功能,有什么好的思路?

2016 年 8 月 17 日
 cszhiyue

还需要注意些什么?

1456 次点击
所在节点    问与答
3 条回复
imcocc
2016 年 8 月 17 日
页面渲染不需要的。
复杂点的, js 里包含网页地址就需要解析 js 了。

简单点的,类似离线浏览的功能,把所有需要的 htmljs 等网页文件抓好,换个路径供人访问。

你可以试试离线浏览器感受一下,学学思路( Offline Explorer )。
cszhiyue
2016 年 8 月 17 日
@imcocc 这样的话暂时只需要把 js css img 抓取。然后更换路径了。
imcocc
2016 年 8 月 17 日
@cszhiyue 对的,这就是扒站

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/299784

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX