访问记录里同一设备不停换 IP 怎么做到的?

2020-11-25 09:50:56 +08:00
 RickyC

2020-11-25 01:36:43 117.95.165.58 Mozilla/5.0(Linux;U;Android+5.1.1;zh-CN;OPPO+A33+Build/LMY47V)+AppleWebKit/537.36(KHTML,like+Gecko)+Version/4.0+Chrome/40.0.2214.89+UCBrowser/11.7.0.953+Mobile+Safari/537.36 200 0 0 325

2020-11-25 01:36:44 117.95.166.209 Mozilla/5.0(Linux;U;Android+5.1.1;zh-CN;OPPO+A33+Build/LMY47V)+AppleWebKit/537.36(KHTML,like+Gecko)+Version/4.0+Chrome/40.0.2214.89+UCBrowser/11.7.0.953+Mobile+Safari/537.36 200 0 0 324

这个 OPPO 手机一天可能刷上千上万, IP 也有很多很多 他怎么做到的?

2505 次点击
所在节点    问与答
13 条回复
zhs227
2020-11-25 09:52:56 +08:00
如果你会编程你就会发现这个 UA 是可以自己写的,写成阿猫阿狗也可以。对方说自己是个手机,不一定真的是个手机。
Xusually
2020-11-25 09:54:39 +08:00
采集器的日常 UA 伪造+代理池
WhiteSheep
2020-11-25 09:55:48 +08:00
难道是 Tor ?(划掉
RickyC
2020-11-25 09:56:06 +08:00
@zhs227
@Xusually 那这个 IP 是真实的吗? 是 IIS 显示的
raaaaaar
2020-11-25 10:01:50 +08:00
ua 可以坏,IP 有代理池
meik2333
2020-11-25 10:04:12 +08:00
IP 可能是代理,UA 应该是伪造的,毕竟现在还是 Android 5.1 的手机已经不多了。
Xusually
2020-11-25 10:06:07 +08:00
@RickyC 看情况吧,如果是采集的话,一般是真实的代理 ip 。如果是攻击的话,可能是伪造的。
lbp0200
2020-11-25 10:09:59 +08:00
都是真实的 IP 地址,某宝上很便宜的,自动随机切换 IP 地址。
用 IP 地址区分爬虫? too young too simple
qiayue
2020-11-25 10:11:16 +08:00
一个常识,相同厂家相同型号官方浏览器的 UA 都是相同的,所以根本就不应该用 UA 来认定唯一用户,UA 是一类设备的特征,不是某个特定设备的特征
zhs227
2020-11-25 10:13:34 +08:00
IP 一直不停的变肯定是代理池。也就是说真实的 IP,但这个 IP 的拥有者(不?)清楚别人在用他的 IP 访问你的网站。这种一般都是爬虫在开采内容。和正常访问差不多,一般也不太容易区分出来。如果他愿意,不停的变换 UA 也是可以的
shiro327
2020-11-25 10:29:26 +08:00
用长城宽带自带这个 buff
worldtongfb
2020-11-25 12:01:16 +08:00
不知道谁写的爬虫,真的是沙雕一样,去重都不做,20w 的数据天天翻来覆去的爬,日志里面都是,统计都没法做了,
就这几个 ua,
````
Mozilla/5.0(Linux;Android 5.1.1;OPPO A33 Build/LMY47V;wv) AppleWebKit/537.36(KHTML,link Gecko) Version/4.0 Chrome/42.0.2311.138 Mobile Safari/537.36 Mb2345Browser/9.0
Mozilla/5.0 (Linux; Android 7.0; FRD-AL00 Build/HUAWEIFRD-AL00; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/53.0.2785.49 Mobile MQQBrowser/6.2 TBS/043602 Safari/537.36 MicroMessenger/6.5.16.1120 NetType/WIFI Language/zh_CN
Mozilla/5.0(Linux;Android 5.1.1;OPPO A33 Build/LMY47V;wv) AppleWebKit/537.36(KHTML,link Gecko) Version/4.0 Chrome/43.0.2357.121 Mobile Safari/537.36 LieBaoFast/4.51.3
````
用 cf 的话这几个 ua 开验证,没有的话直接 nginx 里 ban 掉,他们 ip 都是重复拨号的把,在一个范围里波动,直接封 ip 段也行
````
if ($http_user_agent ~* (wget|curl|python|mj12bot|Bytespider|DotBot|ahrefs|AL00|A33|2345|LieBao|petalbot) ) {
return 403;
}
````
RickyC
2020-11-25 12:44:10 +08:00
@qiayue 问题这个相同的 UA 一天有好几万的访问数据, ip 有好几千个

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/728966

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX