关于用验证码反爬虫

2024 年 8 月 16 日
 shanyang88

用验证码反爬虫可靠吗?我有点想试试。 我希望可以较长时间内只需用户手动输入一次验证码,就可以让爬虫完全无法爬到网站的内容。 有可靠的开源解决方案吗?后端为 laravel 框架。

3271 次点击
所在节点    程序员
18 条回复
gzlock
2024 年 8 月 16 日
cloudflare 有对应保护 api 的方案
https://blog.cloudflare.com/zh-cn/integrating-turnstile-with-the-cloudflare-waf-to-challenge-fetch-requests-zh-cn/
工作原理省流:
在网页上放一个 cf 的 js ,确保后续访问 api 的人是访问过网页的,才允许调用 api ,整个流程对正常用户很丝滑

有个疑问:
app 怎么使用这个方法呢
shanyang88
2024 年 8 月 16 日
@gzlock 两个疑问:1.该方法收费吗?我知道 cf 有个其它方案是收费的; 2.这个方法下在国内访问仍然丝滑吗?
chaoschick
2024 年 8 月 16 日
影响用户体验
wnpllrzodiac
2024 年 8 月 16 日
安全和便捷就是矛盾的
chi1st
2024 年 8 月 16 日
让爬虫完全无法爬到网站的内容这个不可能的,只能找到一个平衡点来限制爬虫
qq78660651
2024 年 8 月 16 日
只是提高爬取门槛而已,还是看你网站内容的吸引力,有价值,别人花些还是能爬,但是能隔绝小白。
macaodoll
2024 年 8 月 16 日
你上完了我可以帮你测试,我是做爬虫的
iyiluo
2024 年 8 月 16 日
开源的不太行,还是商业的靠谱一些。验证码防不了,还有人肉打码这种灰产,防不住
zeusho871
2024 年 8 月 16 日
瑞数都能破。。。
user1284
2024 年 8 月 16 日
@zeusho871 我也喜欢看瑞树
zcybupt2016
2024 年 8 月 16 日
完全无法爬是不可能的,除非让用户也完全无法用
hubaq
2024 年 8 月 16 日
简单粗暴的方案,上来直接极验消消乐验证,可以挡住绝大部分低端爬虫
Masterlxj
2024 年 8 月 16 日
不现实,除非你想让正常用户也这样,不然没法阻止爬虫。反爬虫并不是单一的让爬虫访问不了,而是提升爬虫的成本(时间,经济)
forty
2024 年 8 月 16 日
非公开访问,付费浏览,99%就没有爬虫花钱玩了
namejaho0
2024 年 8 月 16 日
微信登录 限制每个帐号 访问频次
sead
2024 年 8 月 16 日
一些无关带标识的爬虫禁了就可以了,对于有心人这种爬虫你是没有办法的,矛于盾谁最厉害本来就是博弈
jimrok
2024 年 8 月 16 日
ddddocr 可以识别验证码,所以先测试一下你的验证码好不好使。另外大语言模型可以在直接从浏览器结构中提取信息,一些提示词就可以将获得抓取的信息和干扰信息分开。
gzlock
2024 年 8 月 17 日
@shanyang88 我回复里说到的方案是免费的
然后我理解错了楼主的需求
我回复的方案是前后端分离的,用于保护后端 api 的
cloudflare 也有免费用于保护网站的著名 5 秒盾

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1065365

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX