求推荐一个能支持 Python 3 的非阻塞异步爬虫框架 ~

2014-07-30 18:01:53 +08:00
 Feiox
scrapy 貌似不支持唉。Github 上写明了 python 2.7
已经被 Python 2.7 中 unicode 各种烦了。求推荐一个异步爬虫框架吧,不然要用 Gevent 自己写,但是 Gevent 貌似也不支持 Py3K ?
9008 次点击
所在节点    Python
17 条回复
yueyoum
2014-07-30 18:05:52 +08:00
gevent 目前貌似不支持 py3k
但 Py3k 自带了 asyncio
youyudehexie
2014-07-30 18:08:14 +08:00
scrapy Twisted 基于事件驱动,可以粗暴地认为是非阻塞。。至少非同步
Feiox
2014-07-30 18:08:58 +08:00
@yueyoum 听说了没用过, 但 asyncio 不是异步 IO 的吗,网络请求也可以用它异步么?
Feiox
2014-07-30 18:09:34 +08:00
@youyudehexie 但它不支持 Python 3 啊 ~ ಥ_ಥ
clino
2014-07-30 18:26:06 +08:00
为什么一定要3
imn1
2014-07-30 18:29:41 +08:00
用 greenlet 自己写
Feiox
2014-07-30 18:32:25 +08:00
@clino 因为处理中文很舒服 ~ 并且有好多好功能 ~ 为什么大家都不支持呢
wwqgtxx
2014-07-30 19:07:49 +08:00
为何一定用python呢
有很多对中文兼容性很好的语言呀
binux
2014-07-30 19:19:24 +08:00
搞清楚之后不觉得 python2 的 unicode 烦。。
Comdex
2014-07-30 20:54:20 +08:00
用golang啦
liteneo
2014-07-30 20:59:30 +08:00
爬虫用Node.js就很方便,大把的模块
skybr
2014-07-30 21:11:29 +08:00
我记得gevent的开发版支持py3, 只是退出时会报个警告, 一系列支持py3相关的补丁是位国人开发者贡献进去.
love
2014-07-30 21:23:24 +08:00
都py3了还用什么gevent啊,该用高大上的asyncio
Kabie
2014-07-30 21:26:50 +08:00
tornado怎么样?
fdsfsdfsdf3334
2014-07-31 02:28:24 +08:00
requests 可以吗
mengzhuo
2014-07-31 09:22:24 +08:00
@love

测试了一下 asyncio 性能渣渣....并发2000都顶不住
heqing
2014-07-31 11:39:08 +08:00
用Scrapy, 安装一个Python 2.7即可。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/125309

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX