搜狗微信的反爬虫策略又升级了

2015-10-10 11:15:57 +08:00
 macken

继前不久升级反爬策略以后,又来了一次打升级,躺枪一片,非登陆情况下,新的策略使用了服务端生成验证串的方式,要破解很难,除非能破解加密算法了。大家有什么研究?

15529 次点击
所在节点    程序员
35 条回复
macken
2015-10-11 11:03:07 +08:00
@yepinf 估计悬了。。
macken
2015-10-11 11:03:40 +08:00
@blue7wings 应该是的 腾讯也投资搜狗了
macken
2015-10-11 11:03:51 +08:00
icedx
2015-10-11 14:16:40 +08:00
@macken Thx
cai314494687
2015-10-12 21:56:05 +08:00
@johnsneakers 提示:当前请求已过期,请点击重新加载 是什么回事?
johnsneakers
2015-10-13 09:55:34 +08:00
@cai314494687 url 地址换一个就好
cai314494687
2015-10-13 10:01:47 +08:00
johnsneakers
2015-10-13 10:56:06 +08:00
@cai314494687 哦,我和你不一样。 我爬的是搜索页, 取搜索结果列表里面的 url
bowbright
2015-11-15 16:40:37 +08:00
@skip11
1.登录
2.模拟浏览器获取那个串
具体能展开说说么
bowbright
2015-11-15 16:52:08 +08:00
@johnsneakers 实验了你的代码,取到的 data 好像现在不对了。
<html>
<head><title>400 Bad Request</title></head>
<body bgcolor="white">
<center><h1>400 Bad Request</h1></center>
<hr><center>nginx</center>
</body>
</html>
g080166
2016-01-11 15:46:31 +08:00
请问这个问题后来有解决方案了吗?
g080166
2016-01-11 15:47:10 +08:00
搜狗一旦弄得多了,就让我输入验证码,已经被搞疯了,想问下有好心人提供下解决方案吗?
ACzero
2016-01-19 16:30:31 +08:00
@g080166 搜狗对采集限制比较严格,用 ip 代理可以解决
g080166
2016-01-21 11:26:18 +08:00
@ACzero 谢谢你的回答。我想问下用 ip 代理的话,会不会不稳定?另外,搜狗微信方面是否对这部分代理 ip 进行甄别?
ACzero
2016-01-29 14:42:10 +08:00
@g080166 可以去抓一些免费的代理 ip ,有不少都是每日或者每小时更新的,当然这些代理 ip 只有部分能用,提高采集频率就行

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/226844

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX