用爬虫把在线教程转换为 PDF 文件

2017-02-13 14:54:05 +08:00
 lzjun

在线教程,顾名思义,需要网络才能学习,但有时没网络,有时手机流量不够。于是萌生一个想法,使用爬虫对内容重新整理后,转换成 PDF 文件离线阅读。

用廖雪峰的 Python 教程做了一个实验,证明是可行的,以后可以根据自己的需求进行定制化了。

参考文章: http://mp.weixin.qq.com/s/LH8nEFfVH4_tvYWo46CF5Q
完整代码: https://github.com/lzjun567/crawler_html2pdf/blob/master/crawler.py

最终生成的 PDF 效果图:

3451 次点击
所在节点    分享创造
9 条回复
kuntang
2017-02-13 15:25:12 +08:00
脑洞大开,能转换成 mobi 格式吗?
keisuu
2017-02-13 19:42:34 +08:00
按照文章的步骤弄, wkhtmltopdf 下载不了
lzjun
2017-02-13 19:43:36 +08:00
@kuntang 原理差不多,可以网上搜 html to mobi ,一定有相应的开源方案
lzjun
2017-02-13 19:44:21 +08:00
@keisuu 国外的节点,网络慢,没法办,换代理试试
fhefh
2017-02-13 22:03:45 +08:00
nice mark 学习了
AltairT
2017-02-13 23:37:35 +08:00
现在的软件技能教程没有网除非只是看书几乎没法学了 太多地方需要网了
lzjun
2017-02-14 01:35:56 +08:00
@AltairT 主要考虑到移动端临时性没网,或者重复的网络请求浪费流量
xiqingongzi
2017-02-14 07:20:57 +08:00
太棒了,很多教程没有离线版本
lzjun
2017-02-14 09:39:52 +08:00
@xiqingongzi 哈,不用谢,向那些写教程的同志致敬

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/340133

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX