• 请不要在回答技术问题时复制粘贴 AI 生成的内容
yanyiming
V2EX  ›  程序员

小白想做一个爬大麦演出信息的脚本, 但遇到滑块验证码不知道怎么办

  •  
  •   yanyiming · Mar 29 · 3355 views
    This topic created in 47 days ago, the information mentioned may be changed or developed.

    我是做前端的, 想爬一下演出信息供个人使用, 不涉及抢票之类的. 想实现的效果是脚本自动打开网页, 然后手动拖码, 成功后把演出信息保存到本地. 自己用 node 试了试, 思路是把滑块相关的 script 下载到本地, 每次运行脚本时调用, 但各种混淆代码和加密数据弄得人头大, 最后还是只能把滑块展示出来, 过不了验证. 大家有什么更好的实现方案吗?

    18 replies    2026-04-14 17:29:21 +08:00
    triptipstop
        1
    triptipstop  
       Mar 29
    lightpanda
    cairnechen
        2
    cairnechen  
       Mar 29
    手动拖码?你的意思是脚本模拟鼠标操作吧,你自己手动拖码有啥复杂的啊?
    UnluckyNinja
        3
    UnluckyNinja  
       Mar 29
    建个小号用无头指纹浏览器
    ayyayyayy2002
        4
    ayyayyayy2002  
       Mar 29 via Android   ❤️ 1
    node 是 nodejs 吗
    我比较喜欢用 python 和 playwright ,在网页上找要爬取的元素,右键,选择检查,复制元素和 xpath 发给 ai ,让 ai 写爬取代码
    验证码如果是简单的滑动验证码,临时使用的话找个能用命令使用的模拟点击软件,录制下验证码鼠标轨迹,用代码调用就行,缺点是会抢鼠标,如果要长期使用可以用代码在浏览器里跑 js ,用随机数和各种曲线计算模拟人类的滑动
    如果是点选的验证码先看看有没有逆向破解的现成代码,没有就只能自己批量采集数据,手动标注然后训练模型
    uqf0663
        5
    uqf0663  
       Mar 29
    滑块我主要调用 https://github.com/81NewArk/AntiCAP-WebApi 这个解决的,但是正确率不高,只能正确一半左右,相对比较浪费时间但是足够我用了。
    Ackvincent
        6
    Ackvincent  
       Mar 29
    交给 AI
    HMYang33
        7
    HMYang33  
       Mar 29 via Android
    虽然不想给别人免费打广告,但是提供一个渠道,之前用过一个 api ,平台名叫 云码,搜出来第一个就是
    SanjinGG
        8
    SanjinGG  
       Mar 30 via Android
    将滑块部分存图下来自己解,以前游戏用的是模板匹配
    Hashbaby
        10
    Hashbaby  
       Apr 2
    yanyiming
        11
    yanyiming  
    OP
       Apr 7
    @cairnechen 手动拖码后, 每次只能获取一页的数据, 再获取下一页就又要拖码.我想怎么才能一次拖码能获取多次数据呢.
    cairnechen
        12
    cairnechen  
       Apr 7
    @yanyiming 听上去和喜马拉雅有点像
    cairnechen
        13
    cairnechen  
       Apr 7
    @Hashbaby 大佬是用模型视觉识别的吗?怎么解决坐标漂移的问题啊?
    Hashbaby
        14
    Hashbaby  
       Apr 8
    @cairnechen google 的免费模型
    cairnechen
        15
    cairnechen  
       Apr 8
    @Hashbaby 惊了 gemini 这么强吗,我用 Opus4.6 和 GPT5.4 视觉处理图片坐标漂移好大
    Hashbaby
        16
    Hashbaby  
       Apr 9
    @cairnechen 我试了好几家平台的模型 都能够进行准确识别 关键是提示词怎么写 然后还要输出为纯净的坐标 最后拿去使用
    yanyiming
        17
    yanyiming  
    OP
       Apr 14
    @Hashbaby 你是怎么处理混淆和加密的呢?
    Hashbaby
        18
    Hashbaby  
       Apr 14
    @yanyiming 没处理 都交给 AI 识别的啊 然后我处理图片上的坐标就行了 需要源码吗 卖你 之前我随手写的 但是还有点 BUG 识别率不高 估计是加了机器轨迹识别
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1173 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 47ms · UTC 23:53 · PVG 07:53 · LAX 16:53 · JFK 19:53
    ♥ Do have faith in what you're doing.