玩法收藏/云服务器/Python3 环境安装 PySpider 爬虫框架

2017-03-21 18:08:48 +08:00
 liuliliuli2017

又看到一个关于爬虫的帖子,嘻嘻,收录待用,修改转载已取得腾讯云授权


大家好,本篇文章为大家讲解腾讯云主机上 PySpider 爬虫框架的安装。

首先,在此附上项目的地址,以及官方文档

PySpider

官方文档

安装流程

pip

首先确保你已经安装了 pip ,若没有安装,请参照此文

phantomjs

PhantomJS 是一个基于 WebKit 的服务器端 JavaScript API 。它全面支持 web 而不需浏览器支持,其快速、原生支持各种 Web 标准: DOM 处理、 CSS 选择器、 JSON 、 Canvas 和 SVG 。 PhantomJS 可以用于页面自动化、网络监测、网页截屏以及无界面测试等。

安装方式

以上附有官方安装方式,如果你是 Ubuntu ,还可以使用如下命令:

sudo apt-get install phantomjs

pyspider

直接运行 pip 安装即可

pip install pyspider

测试

安装完成之后,如果没有任何的报错,那就 OK

命令行输入

pyspider all

然后浏览器访问 http://localhost:5000

观察一下效果,如果可以正常出现 PySpider 的页面,那证明一切 OK

在此附图一张,这是我写了几个爬虫之后的界面。


原文来自: https://www.qcloud.com/community/user/542010001488460189

1756 次点击
所在节点    Python
4 条回复
yansyuei
2017-03-22 02:58:54 +08:00
• 这里绝对不会全文转载任何文章,而只会以链接方式分享
Antidictator
2017-03-22 08:49:08 +08:00
@yansyuei 如果是作者,那就可以了吧
yansyuei
2017-03-22 19:22:31 +08:00
@Antidictator #2 又看到一个关于爬虫的帖子,嘻嘻,收录待用,修改转载已取得腾讯云授权
liuliliuli2017
2017-03-22 22:19:46 +08:00
@yansyuei 抱歉才看到使用须知,转载仅供自用,有人感兴趣一起看也好。本以为已申请到腾讯云授权就没事了,之后我会只对文章进行摘抄,以免有违规嫌疑。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/349209

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX