关于用验证码反爬虫

2024-08-16 01:54:09 +08:00
 shanyang88

用验证码反爬虫可靠吗?我有点想试试。 我希望可以较长时间内只需用户手动输入一次验证码,就可以让爬虫完全无法爬到网站的内容。 有可靠的开源解决方案吗?后端为 laravel 框架。

2797 次点击
所在节点    程序员
18 条回复
gzlock
2024-08-16 04:25:43 +08:00
cloudflare 有对应保护 api 的方案
https://blog.cloudflare.com/zh-cn/integrating-turnstile-with-the-cloudflare-waf-to-challenge-fetch-requests-zh-cn/
工作原理省流:
在网页上放一个 cf 的 js ,确保后续访问 api 的人是访问过网页的,才允许调用 api ,整个流程对正常用户很丝滑

有个疑问:
app 怎么使用这个方法呢
shanyang88
2024-08-16 07:34:48 +08:00
@gzlock 两个疑问:1.该方法收费吗?我知道 cf 有个其它方案是收费的; 2.这个方法下在国内访问仍然丝滑吗?
chaoschick
2024-08-16 08:57:15 +08:00
影响用户体验
wnpllrzodiac
2024-08-16 09:05:52 +08:00
安全和便捷就是矛盾的
chi1st
2024-08-16 09:09:48 +08:00
让爬虫完全无法爬到网站的内容这个不可能的,只能找到一个平衡点来限制爬虫
qq78660651
2024-08-16 09:11:46 +08:00
只是提高爬取门槛而已,还是看你网站内容的吸引力,有价值,别人花些还是能爬,但是能隔绝小白。
macaodoll
2024-08-16 09:15:26 +08:00
你上完了我可以帮你测试,我是做爬虫的
iyiluo
2024-08-16 09:16:04 +08:00
开源的不太行,还是商业的靠谱一些。验证码防不了,还有人肉打码这种灰产,防不住
zeusho871
2024-08-16 09:25:45 +08:00
瑞数都能破。。。
yb2313
2024-08-16 09:45:41 +08:00
@zeusho871 我也喜欢看瑞树
zcybupt2016
2024-08-16 10:22:57 +08:00
完全无法爬是不可能的,除非让用户也完全无法用
hubaq
2024-08-16 10:25:09 +08:00
简单粗暴的方案,上来直接极验消消乐验证,可以挡住绝大部分低端爬虫
Masterlxj
2024-08-16 10:44:26 +08:00
不现实,除非你想让正常用户也这样,不然没法阻止爬虫。反爬虫并不是单一的让爬虫访问不了,而是提升爬虫的成本(时间,经济)
forty
2024-08-16 11:08:17 +08:00
非公开访问,付费浏览,99%就没有爬虫花钱玩了
namejaho0
2024-08-16 11:11:22 +08:00
微信登录 限制每个帐号 访问频次
sead
2024-08-16 11:45:24 +08:00
一些无关带标识的爬虫禁了就可以了,对于有心人这种爬虫你是没有办法的,矛于盾谁最厉害本来就是博弈
jimrok
2024-08-16 18:14:47 +08:00
ddddocr 可以识别验证码,所以先测试一下你的验证码好不好使。另外大语言模型可以在直接从浏览器结构中提取信息,一些提示词就可以将获得抓取的信息和干扰信息分开。
gzlock
2024-08-17 02:31:18 +08:00
@shanyang88 我回复里说到的方案是免费的
然后我理解错了楼主的需求
我回复的方案是前后端分离的,用于保护后端 api 的
cloudflare 也有免费用于保护网站的著名 5 秒盾

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1065365

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX