V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
supermoonie
V2EX  ›  互联网

哪些反爬技术大家没能爬过去?来来来,我先说

  •  
  •   supermoonie · 2020-10-10 16:29:40 +08:00 · 2326 次点击
    这是一个创建于 1292 天前的主题,其中的信息可能已经有所发展或是发生改变。

    1 、APP 开启了 HTTPS 证书双向认证且 APP 经过加壳加固

    2 、基于跨浏览器指纹识别技术的风控

    3 、基于深度学习的鼠标轨迹分析

    18 条回复    2020-10-11 07:25:19 +08:00
    songjiaxin2008
        1
    songjiaxin2008  
       2020-10-10 16:35:55 +08:00
    cpws
    songjiaxin2008
        2
    songjiaxin2008  
       2020-10-10 16:36:26 +08:00
    主要是 瑞数 和 sojson
    cccp2020
        3
    cccp2020  
       2020-10-10 16:39:43 +08:00
    记得携程还是哪里,修改了字体里数字的显示顺序,网页 dom 元素中和实际的不一样,直接下毒一样
    wzzzx
        4
    wzzzx  
       2020-10-10 16:51:10 +08:00
    @cccp2020 #3 这种很好解决丫,做一下替换就好拉
    x86
        5
    x86  
       2020-10-10 16:59:03 +08:00 via iPhone
    有些股票的,你抓的结果有细微的偏差的你就很头疼
    lazyrm
        6
    lazyrm  
       2020-10-10 17:08:01 +08:00
    @wzzzx #4 不是简单的替换,每次都是生成一个字体文件,天眼查吧,似乎还是这样
    supermoonie
        7
    supermoonie  
    OP
       2020-10-10 17:14:49 +08:00 via iPhone
    @cccp2020 我遇到过,直接 ocr 盘它,哈哈
    est
        8
    est  
       2020-10-10 17:15:49 +08:00
    不做反扒。只随机返回假数据。
    supermoonie
        9
    supermoonie  
    OP
       2020-10-10 17:16:52 +08:00 via iPhone
    @x86 确实头疼,爬下来的数据比较难做准确性检验,也不知道爬的对不对……
    supermoonie
        10
    supermoonie  
    OP
       2020-10-10 17:18:27 +08:00 via iPhone
    @songjiaxin2008 你说这家用到的技术基本上是我列举出来的吧,之前分析过,浏览器指纹技术用的比较多
    supermoonie
        11
    supermoonie  
    OP
       2020-10-10 17:19:05 +08:00 via iPhone
    @est 那你总要区分哪个是爬虫吧🌚
    cccp2020
        12
    cccp2020  
       2020-10-10 17:21:46 +08:00
    @wzzzx 是的,不注意的前提下是有迷惑性的


    @supermoonie 你厉害
    kindjeff
        13
    kindjeff  
       2020-10-10 18:02:50 +08:00
    以前贴吧就做了什么鼠标轨迹的东西,就是把发帖前一段时间鼠标的坐标值记录下来,然后 post 的时候带着这个作为参数。看起来很高级。

    然后实际上你可以一直重复用同一个轨迹数据就能过掉。
    supermoonie
        14
    supermoonie  
    OP
       2020-10-10 18:10:45 +08:00 via iPhone
    @kindjeff 哈哈哈,我遇到过,那种看起来吓人,其实很简单,一直传同一种就行
    crab
        15
    crab  
       2020-10-10 18:17:05 +08:00
    淘宝支付宝 UA
    supermoonie
        16
    supermoonie  
    OP
       2020-10-10 19:56:51 +08:00 via iPhone
    @crab 只知道淘宝的那个滑块很难,你所说的是?能详细说下吗🌚
    mmdsun
        17
    mmdsun  
       2020-10-10 21:52:01 +08:00 via Android
    Google reCAPTCHA v3 有没有过的思路。之前这个卡了好久
    supermoonie
        18
    supermoonie  
    OP
       2020-10-11 07:25:19 +08:00 via iPhone
    @mmdsun 有没有试过类似 VMLogin 之类的浏览器?就是价格过于美丽
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   983 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 20:51 · PVG 04:51 · LAX 13:51 · JFK 16:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.