爬虫时有什么办法处理滑块验证等验证方法吗

2024-05-27 09:15:02 +08:00
 pureGirl
7904 次点击
所在节点    程序员
58 条回复
zealotxxxx
2024-05-27 09:20:32 +08:00
ddddocr
quantum00549
2024-05-27 09:20:37 +08:00
以前用 selenium 时做过 yolo 定位检测, 然后模拟拖动鼠标, 拖动轨迹还得是变加速轨迹啥的, 但是很快发现废了半天劲, 人家滑块验证进化了, 继续投入就是无底洞, 最后的方案就是遇到滑块验证就给人发个邮件
feiniu
2024-05-27 09:22:34 +08:00
这个滑动轨迹很难整
DingJZ
2024-05-27 09:22:35 +08:00
有一些云平台的,调用他们的 api
flowerains
2024-05-27 09:28:40 +08:00
这个问题我也挺想知道的,最近很多内部系统都升级了

不是滑块就是拼图的,整得我写程序都蓝瘦的一批
pureGirl
2024-05-27 09:29:13 +08:00
@quantum00549 发邮件是什么方法
feiniu
2024-05-27 09:43:20 +08:00
发邮件是吧滑块的链接通过邮件发送给某个人,让他手动滑一下吧
garlics
2024-05-27 09:47:58 +08:00
花钱找人工打码平台
shadowyue
2024-05-27 09:48:28 +08:00
这种交互性验证都不太好处理。我在拼多多遇到过更逆天的,一个 3d 的骰子让你自己旋转按顺序点击上面的文字🤣太逆天了
JohnYep
2024-05-27 09:52:02 +08:00
JohnYep
2024-05-27 09:53:10 +08:00
这种怎么弄呢
burymme11
2024-05-27 09:53:59 +08:00
时应该没有吧,当时用 selenium 算坐标,模拟试了很久,匀速,加速度,定时卡顿,各种行为都模拟了,就是不行,偶尔成一次两次,无法稳定。
daliusu
2024-05-27 09:55:12 +08:00
不是有人工验证码平台吗?我记得十几年前我做游戏脚本就有这种,但是还是人工输文字,现在没支持拖拽么
cnfox
2024-05-27 09:58:54 +08:00
超级鹰之类的 。传给他们图片他们会返回为止 ,然后驱动浏览器内核模拟滑动区块。这是我们之前的解决方案
cnfox
2024-05-27 09:59:14 +08:00
@cnfox #14 返回滑动距离之类的
ZnductR0MjHvjRQ3
2024-05-27 10:04:15 +08:00
你可以给图片抓出来 然后发给 gpt-4o 来处理,或者直接用三方,还有一个最笨的办法,将大量的滑块写死做成本地数据然后遇到了就去搜,没有就刷新,不过这种办法现在应该不是那么好用了
ddczl
2024-05-27 10:06:54 +08:00
就是猫鼠游戏,在便捷性和成本上做取舍,现在我们公司大多数情况是发消息,无论是邮件还是短信。
flyv2x
2024-05-27 10:13:07 +08:00
@zealotxxxx 这个 ocr 还不错哦
gaobh
2024-05-27 10:18:04 +08:00
尝试用 gpt-4o+鼠标控制+图片取帧+坐标控制来试试
silencelixing
2024-05-27 10:26:25 +08:00
@Motorola3
@gaobh
我给 4o 识别了一下楼里面的验证码所包含的文字,根本识别不出来,乱答一通,所以 4o 的方案不可行。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1044170

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX