requests 库调用 Session 方法打开关联网站,输出却为空?

2015-04-23 18:05:58 +08:00
 jhony
在爬学校网站,先进入登录界面后再打开成绩页面,发现只有成绩页面的输出为空,我想知道我的session方法哪儿用错了?附上代码
import requests
from bs4 import BeautifulSoup
s=requests.Session()
payload={'userId':'***','userPass':'****'}
soup=s.post('http://jwweb.yzu.edu.cn:8082/xsxt/xsxt.jsp',data=payload)#先进入登录界面
r=s.get('http://58.192.142.134:7777/pls/wwwbks/bkscjcx.curscopre')#进入关联界面
print r.
3137 次点击
所在节点    Python
5 条回复
tikazyq
2015-04-24 02:26:41 +08:00
看看r.status_code和r.content,去网站上看看是不是用了javascript读入内容,requests不能读js
kaneg
2015-04-24 13:39:55 +08:00
用Firefox的调试神器firebug
ca1n
2015-04-25 14:48:49 +08:00
user-agent这个不设定的话发送的就是user-agent:python2/3.。。什么什么的了 有的服务器拒绝这样的ua
jhony
2015-04-27 20:48:47 +08:00
谢谢楼上几位,我查看了chrome里面Resource项,里面相关网页的session均为空,只有cookie项,那就是意味着我根本不需要调用session,直接调用发送cookie的函数就好了吧?
tikazyq
2015-04-28 03:46:05 +08:00
chrome点开看network看response,把http://jwweb.yzu.edu.cn:8082/xsxt/xsxt.jsp这个requst的内容看看

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/185775

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX