weibo.cn 爬虫过频 帐号封多久

2015-06-01 23:00:58 +08:00
 airbasic

快一个小时了 所有链接都302到 weibo.cn/pub
-。-过频
要封多久,没有帐号好测试了啊

4324 次点击
所在节点    问与答
9 条回复
acfunny
2015-06-02 00:15:21 +08:00
说( ̄. ̄) 你在做什么
airbasic
2015-06-02 00:35:27 +08:00
@acfunny 爬了爬微博啊,完全搞不懂它ban的规则
acfunny
2015-06-02 02:12:58 +08:00
只是瞎研究啊 要不物尽其用
顺带做个输入账户名,列出所有发表过微博的网站。怎么样≥﹏≤
whywhy36
2015-06-02 06:14:33 +08:00
买帐号啊,我记得不贵的,买个几千个账号,上代理,优化下逻辑,抓数据挺快的
des
2015-06-02 06:58:43 +08:00
微博不是用来发广告的吗?有什么好爬的?
GPU
2015-06-02 07:01:20 +08:00
@des 现在的微博已经小了很多广告。
des
2015-06-02 07:08:22 +08:00
@GPU 在我印象中微博是一个广告和新闻聚集地。
况且还有恶心的关键词审查,比如“蜡烛‘’
582033
2015-06-02 07:19:52 +08:00
记得很久前同一帐号换ip爬是不会被封的,封的时候也就10分钟左右。不知道现在怎么样。
楼主抓点有效代理来挂上,每几分钟换一个爬爬看。
airbasic
2015-06-02 15:09:41 +08:00
@582033
@acfunny

也不是瞎研究,爬相册的,id递增方式一个个爬,抓取所有相册图片
然后有个很蛋疼的问题,同一个帐号换IP首先会要我输入验证码...这样登录起来就不怎么全自动了
感觉有点随机封帐号的样子,封了效果就是所有页面302到 weibo.cn/pub
(我是从weibo.cn这里爬的)
还有就是sleep(),感觉sleep越久...封的反而越快
现在加了些干扰的时不时get下某人微博什么的,爬了100+的时候,还是被封..
而且封的都是好几小时的感觉
淡淡的忧伤

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/195404

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX