突发奇想,准备开坑一个从零开始的 Python 爬虫教程

2017-03-30 13:00:24 +08:00
 borischenc

偶然间发现简书这个网站对 markdown 支持的很不错。界面看起来也很漂亮。

所以就想写一个博客。想了半天博客里面放什么,意识到最近 python 爬虫学的挺带劲的,所以干脆一不做二不休,写了一个 python 爬虫从零开始的教程。

但毕竟对爬虫的了解还是有限,我把__博客-爬虫其实很简单__贴在这里,有什么问题也希望大家多多指正。

(顺便问一下。。之前又一篇相同的文章发错了区,要怎么撤回呢?)

6222 次点击
所在节点    Python
47 条回复
kancloud
2017-03-31 13:43:20 +08:00
@borischenc gitbook 有的功能看云都有 ,主要包括 GIT+MD+团队写作,还支持付费阅读和打赏,帮助开发者通过文档教程创收
mokeyjay
2017-03-31 15:20:29 +08:00
马克,请务必坚持!
ChopMoun
2017-03-31 17:11:28 +08:00
每一件事情,只要坚持做下去都很了不起
andyL
2017-03-31 19:16:35 +08:00
66666 followed
borischenc
2017-03-31 19:38:30 +08:00
@mokeyjay
@ChopMoun
嗯嗯,我会坚持做下去的~
anson2416
2017-04-01 15:27:44 +08:00
我也在学习,请多多指教。
现在测试过程中已经遇到连接数过多的问题了( Max retries exceeded with url )。请问有办法解决吗?
重启路由还是不行。

requests.adapters.DEFAULT_RETRIES = 5
requests.session()
requests.keep_alive = False

try:
response = get(link_iamge, timeout=0.001)
if response.content_type()>0:
with open(file_name, "wb") as file:
file.write(response.content())
except Exception as err:
print("Error: {0}".format(err))
requests.session().close()
borischenc
2017-04-01 18:14:28 +08:00
@anson2416 这方面我也还没辙呢,可能你试一下在 stackoverflow 问问呢?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/351442

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX