面向新人的 Python 爬虫学习资料

2017-06-23 07:59:37 +08:00
 Ehco1996

新人来 v2,这里发帖回帖居然还好社区币,好有趣...

我是一名努力想做 coder 的小伙,目前自学 Python 有大半年了,期间也写过一些小的爬虫。说起来当时想成为程序员就是因为无意间了解到 爬虫 这个神奇的东西。这里会记录自己 重新梳理 学习 Python 爬虫的路线。也希望能成为一篇不错的入门爬虫教程,总之,希望自己能坚持把这个系列专栏写完。

学习之前需要哪些准备?

  1. 一颗热爱学习,不屈不挠的心
  2. 一台有键盘的电脑(什么系统都行。我用的 os x,所以例子会以这个为准)
  3. html 相关的一些知识。不需要精通,能懂一点就成
  4. Python 的基础语法知识 。

如果我一点编程基础都没有怎么办?

现在开始学! Python 是一门非常适合做入门学习的语言。如果你没有任何其他编程语言的基础,那么就来学 Python 吧。

我自己目前同时在学 java 和 Python,就我自己的感觉来说,Python 的语法简直太美妙了 不是有句话叫 Life is short,Use Python

有什么推荐的入门教材么?

具体的学习路线是什么?

总体分为三个大方面:

一: 简单的定向脚本爬虫( request --- bs4 --- re )

二: 大型框架式爬虫( Scrapy 框架为主)

三:浏览器模拟爬虫 ( Mechanize 模拟 和 Selenium 模拟)

具体的步骤:

一:Beautiful Soup 爬虫


二:Scrapy 爬虫框架


三: 浏览器模拟爬虫

随便练练手?

每天的学习记录都会同步更新到:

4887 次点击
所在节点    Python
10 条回复
techmale
2017-06-27 10:49:29 +08:00
感谢分享 :)
Ehco1996
2017-06-28 22:13:46 +08:00
这里人好少喔
ssrtree
2017-06-29 16:49:49 +08:00
谢谢分享
zhifanlo
2017-06-30 15:19:06 +08:00
谢谢分享🙏
gulangyu
2017-07-18 21:44:49 +08:00
谢谢分享!
Ehco1996
2017-07-19 11:35:08 +08:00
@gulangyu 不客气
chengquan17
2017-08-07 10:49:08 +08:00
收藏了,谢谢分享
ciki
2018-01-11 17:05:43 +08:00
不错不错啊
ntuwang
2018-09-24 19:19:12 +08:00
m
dlzer
2020-03-14 21:05:42 +08:00
感谢分享 m

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/370455

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX