今天发现微信小程序的数据接口被上百个微信昵称为三个字的新微信用户爬了个遍:

其主要 IP 来源 IP 如下:
101.91.60.x 220.181.108.x 223.166.222.x 101.91.60.x

搜索了一下,发现我不是一个人,
这些用户的访问有以下几个特征:
- 不会被记入小程序前端页面访问统计,都是直接给登陆的接口发送小程序的 code,后端得到的 code 能通过微信授权验证。
- 得到后端授权后目的性很强地开始爬数据,每个用户访问的内容除了列表外基本不交叉,访问间歇都为几秒钟,一个一个 C 段的 IP 轮着来,都是从凌晨开始密集访问。
- UA 类似"Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1 MicroMessenger/6.5 mpcrawler",都带有“ mpcrawler ”字样。
基于此大概率可以认为这是微信小程序的官方爬虫,供大家参考。
PS:对应的微信小程序中“关联公众号设置”是“不允许关联”,“页面收录设置”也是“不允许被收录”,不知为什么还是会被爬。