如何通过httplib来获取ajax的返回值?

2012-03-11 12:22:03 +08:00
 gavingeng
最近想抓取http://www.watchmouse.com/en/ping.php上的host列表,于是就将该页面抓取下来解析,解析js代码中的url参数:
xmlreqGET('api/pingproxy.php?host=www.twitter.com&cp=sg&now=1331439428&mac=488d7c03efb42dbc608d7a6914c42d25','2');

主要是mac和cp,然后与我自己的hosts列表进行参数拼装url,然后循环去请求url来获取值,但是现在的返回状态是200,但一直得不到返回值(有时就可以得到),苦恼啊

已通过socks.py代理来访问墙外信息

请牛人指点,谢谢!
4122 次点击
所在节点    Python
7 条回复
fanzeyi
2012-03-11 12:26:06 +08:00
mac 参数似乎是有他们自己的加密方式的…… 楼主确定你知道他们的加密方式?
CoX
2012-03-11 12:32:06 +08:00
貌似mac和cp有时效性,过段时间就失效了
zhuzhuor
2012-03-11 12:32:12 +08:00
之前貌似看到哪里介绍说httplib不太好,推荐urllib2
gavingeng
2012-03-11 13:39:46 +08:00
@fanzeyi mac是从页面解析得到的,用firebug来看,参数没有问题,我通过页面直接访问之后,再拷贝他们的url,直接在浏览器访问也是可以的,header什么的我都添加了,但就是不好使
gavingeng
2012-03-11 13:40:52 +08:00
@CoX 时效性? now参数是我取的localtime时间戳
gavingeng
2012-03-11 13:41:23 +08:00
@zhuzhuor urllib2也如此,再者,urllib2的底层就是httplib
CoX
2012-03-11 13:50:26 +08:00
@gavingeng 这么说吧,你从页面解析到的mac和cp链接,等上1分钟(具体多少不知道)再去访问,也是没有返回值的;

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/29324

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX