pycurl 相比 requests 是不是效率要高一些？

2014-02-21 14:04:16 +08:00

yakczh

4497 次点击

所在节点

6 条回复

zhwei

2014-02-21 16:37:39 +08:00

pycurl是封装的curl, 效率要高点，但是requests更加人性化，更易用，如果用于爬虫的话推荐requests，毕竟效率可以通过多线程或者异步提高。

piglei

2014-02-21 17:14:54 +08:00

如楼上所说，“效率”这个东西到了网络库上来说，最大的问题是IO，所以库本身的执行效率来说并不是那么重要。和效率有关的指标还是IO相关的，比如这个库是不是支持keep-alive，是不是支持异步化等等等等。

cute

2014-02-21 17:16:57 +08:00

搜索human_curl

import human_curl
r = human_curl.get('http://v2ex.com')

requests不支持100 continue.

wangfengmadking

2014-02-21 17:37:10 +08:00

还有就是requests原生不支持socket5代理。。。

pubby

2014-02-21 18:20:26 +08:00

一直用gearman

再用node写一个worker,支持socks5代理

爬虫直接将抓取任务交给gearman,异步执行

zhwei

2014-02-21 19:26:18 +08:00

@cute api和requests一样啊，好东西！

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.