尝试用 python 模拟登录,结果卡在 formhash 上。请大神指点一下

2014-07-19 23:15:08 +08:00
 namaste
想用python登这个站抓取订单--> http://www.kadang.com/index.php?act=login&op=seller 卡在登录上,post项里有个formhash,google了一下都是关于discuz的,但我用beautifulsoup抓出来的hash都是失效的。发现网页每次刷新一下,formhash就变一次,有什么办法post正确的formhash呢。我这分析对么,菜鸟求指点
4439 次点击
所在节点    Python
5 条回复
izoabr
2014-07-19 23:21:25 +08:00
你用beautifulsoup抓出来的跟你python里面用的是两个session,我估计这个formhash值是跟session绑了的。
是不是可以用liburl来获取一下网页,然后取值去,再拼接登陆参数
xingzhi
2014-07-20 01:28:37 +08:00
先get页面,获取formhash与cookies,然后post时带上cookies

fyi:http://docs.python-requests.org/en/latest/user/quickstart/#cookies
xingzhi
2014-07-20 01:30:01 +08:00
另外,注意post时的地址是这个: http://www.kadang.com/index.php?act=login&op=logincheck

op参数的值不一样
pandada8
2014-07-20 05:26:21 +08:00
用python-requests然后开一个requests.session()
yingluck
2014-07-20 10:57:45 +08:00
楼上正解
import requests

s = requests.Session()
s.get('http://the.url.to.login')
s.post(url)

但是requests抓取的coockie都是cookieJar的类,不明白怎么存进数据库,然后每次调用都用保存的cookie获得session?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/123519

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX