[求助] DZ 论坛使用 python requests 自动登录成功,回帖时提示没有登陆 = =#

2015-06-26 22:07:15 +08:00
 sophie2805
https://gist.github.com/sophie2805/c2e77d61eed2bfdd7f3a

8d41cd5f
<?xml version="1.0" encoding="utf-8"?>
<root><![CDATA[抱歉,您尚未登录,没有权限在该版块回帖<script type="text/javascript" reload="1">if(typeof errorhandle_fastpost=='function') {errorhandle_fastpost('抱歉,您尚未登录,没有权限在该版块回帖', {});}</script>]]></root>
3190 次点击
所在节点    Python
9 条回复
sophie2805
2015-06-26 22:31:20 +08:00
T……T 大家都看跑男去了吗
yangqi
2015-06-26 22:38:57 +08:00
cookie
sophie2805
2015-06-26 22:46:01 +08:00
@yangqi 我用的requests库,开的session,不是说这个可以保持连接的吗
shiniv
2015-06-26 22:52:46 +08:00
discuz 我记得是用cookie的 不是用session
lincanbin
2015-06-26 23:55:07 +08:00
@shiniv requests的Session只是启动一个会话,自动发送Cookie并处理收到的HTTP Header中的Set-Cookie。
ericls
2015-06-27 08:10:41 +08:00
@shiniv requests 的 session 主要就是用于需要 cookie 的地方的
lujiajing1126
2015-06-27 11:23:56 +08:00
抓个包看看
sophie2805
2015-06-27 18:59:35 +08:00
@lujiajing1126 已经解决了,login post之后,网站返回了两个api URL,分别GET他们,就可以了,估计这个两个api URL就是返回登录认证后的特殊COOKIE的,没有这两个的话,后面做操作,网站总认为没有登录~ 还是太粗心,没有认真看抓包里的东西,crab大神帮忙找到的问题点
hansnow
2015-06-28 10:53:50 +08:00
@sophie2805 所以说写爬虫的时候,如果效果和想象的不一样,一个很可能的原因就是和浏览器“不像”,把header弄得完善点,前后的请求也走一遍,往往就没问题了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/201454

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX