急!为什么会有额外的访问

2019-07-12 14:43:32 +08:00
 qwertyzzz

有一个页面 里面做了获取 ip 增加链接点击次数 点完之后是增加一次没问题 可是过 1-2 分钟会有上海电信的 ip 访问增加访问次数。。导致次数统计不对 想知道是啥情况 是有搜索引擎在扫描吗还是

1519 次点击
所在节点    程序员
13 条回复
darkweb
2019-07-12 14:47:56 +08:00
爬虫
qwertyzzz
2019-07-12 14:49:47 +08:00
@darkweb 有什么办法阻止呀。。ip 除了 101 固定 后面一直在变,101 有时候也在变
TrickWu
2019-07-12 14:50:57 +08:00
试下加 referer 限制下吧
xypty
2019-07-12 14:57:04 +08:00
尝试 nginx 加 lua 的 waf ?
qwertyzzz
2019-07-12 14:58:46 +08:00
@TrickWu 怎么加呀
qwertyzzz
2019-07-12 14:58:57 +08:00
@xypty 这个不太懂
MrUser
2019-07-12 15:02:31 +08:00
IP 不一样,可以算一个“新访客”了吧?新访客访问也应该++吧?
至于如果过滤非正常访问,可以判断 user-agent 试试?
我也遇到过类似问题:发给别人的一次性链接总是失效,后来才知道被安全软件先“访问式检测”了一遍。
这种非正常访问确实烦人
qwertyzzz
2019-07-12 15:04:21 +08:00
@TrickWu 打印了下 HTTP_REFERER 发现是自己的链接。。咋回事。
qwertyzzz
2019-07-12 15:05:00 +08:00
@MrUser 我看了下 HTTP_REFERER 发现是链接自己
qq292382270
2019-07-12 15:10:14 +08:00
你浏览器自己访问了先 估计..
qwertyzzz
2019-07-12 15:16:43 +08:00
@qq292382270 手动点击链接 访问了后就没做什么操作了 然后过几十秒检测到又被访问了。这次访问的 referer 是自己的链接地址
qq292382270
2019-07-12 20:37:52 +08:00
@qwertyzzz 我自己测试一次性链接的时候也有遇到类似的情况. 貌似是浏览器自己会访问. 或者杀毒软件检测什么的. 都有可能的.
cmonkey
2019-07-19 11:35:09 +08:00
很多时候都是 python 程序员的锅,他们上手就是 request 爬虫

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/582380

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX