腾讯云最近是在用 AI 爬虫抓取博客数据吗?把我博客搞崩好几天了

107 天前
 peterjxl

我博客 2022 年就上线了,个人技术博客,访问量一直不大。

但为了以防万一,我还是加了点防护措施,例如流量封顶,带宽封顶等,超过阈值一段时间会暂时下线博客,然后可以自动或手动上线博客

但最近几天,博客访问量突然大了,一天到晚都在崩...

实在忍不住了,就去查了下日志,发现访问最频繁的 IP 都是 175.24.248.xx 开头的,然后查到是腾讯云的 IP

封禁了其中几个,但第二天博客又崩了,然后发现换了 IP ,当还是上面的 IP 段

而且是一天到晚都在访问。现在我已经封了这些 60 多个 IP (请求会返回 403 ),但日志里还是一直在刷请求...

IP 这么多,不太像是个别人的恶意攻击,这是官方在搞什么活动吗? 想起之前看过的新闻:

想请教下是否还有什么法子... 虽然这种 CC 攻击好像是无解的,又不太想上 CloudFlare (有点慢)

以下是截取的 IP:


175.24.248.4
175.24.248.6
175.24.248.15
175.24.248.19
175.24.248.22
175.24.248.29
175.24.248.37
175.24.248.40
175.24.248.53
175.24.248.80
175.24.248.83
175.24.248.84
175.24.248.85
175.24.248.94
......
2929 次点击
所在节点    程序员
22 条回复
peterjxl
105 天前
@liuhai233

1. 不上 CDN 速度会很慢,我都是免费 + 收费 CDN 混合着用
2. 确实挂在那些上面会方便点,而且省去了服务器的费用,就是我之前续费服务器比较久,到期后看看迁过去
cozof
103 天前
也有这个问题,最近看日志一大堆腾讯云的,今天看还是频繁爬取没有消停,这些爬虫吧也不知道干嘛的,UserAgent 也没有,host 也查不到。
比如
host 175.24.248.37
Host 37.248.24.175.in-addr.arpa. not found: 3(NXDOMAIN)

nginx 直接整段 deny 了。
deny 175.24.248.0/24;

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1145121

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX