百度是怎样检测异常流量的?比如爬虫

2013-03-11 10:09:44 +08:00
 workaholic
今天用服务器爬百度,只有几分钟,就被百度给屏蔽了...... 求大牛指导
3164 次点击
所在节点    问与答
7 条回复
wtser
2013-03-11 12:34:17 +08:00
爬虫也有名字的,在useragent中有显示,通过检测UA就可以知道你是爬虫,当然也可以检测你的行为特征
scriptkids
2013-03-11 13:01:53 +08:00
频率..
workaholic
2013-03-11 19:45:40 +08:00
@scriptkids 恩,少量多次^_^
workaholic
2013-03-11 19:46:48 +08:00
@wtser 恩,useragent好解决,行为得谨慎一些
yangruixuan
2013-03-12 18:37:40 +08:00
频度控制
tysx
2013-03-13 13:12:08 +08:00
同一个IP的并发连接数
workaholic
2013-03-13 15:03:48 +08:00
@tysx 我用的php,应该是单线程的。不过我发现流量低谷(比如凌晨)的时候比较松,其他时间就得少量多次了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/62542

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX