有没有爬虫王!可以教下我 Websocket 怎么爬吗?

74 天前
 JoryJoestar

想要爬的网站: https://crushon.ai/character/7e388767-63c7-45e3-b922-53458b4ae4f7/chat

一直请求 403 ,难受,搞不定,用无头 playwrihgt ,又不过 cloudflare ,请求又被拒绝,难搞!

想请教一下 v2 的各位佬,怎么爬这个网站聊天对话。

5790 次点击
所在节点    Python
30 条回复
testliyu
74 天前
@peteretep 你是懂拿捏人心理的
alexchen7
74 天前
建议你看看 browser use 项目。
nomagick
74 天前
TophTab
73 天前
@peteretep #1 《提问的艺术》
ooTwToo
73 天前
指纹浏览器
ShineyWang
70 天前
huangpingdong
68 天前
@peteretep 怎么大胆,抖音弹幕都有人能爬 websocket 加密的还是
huangpingdong
68 天前
@peteretep 怎么大胆,抖音弹幕都有人能爬 websocket 加密的
JoryJoestar
67 天前
@991547436 牛的
JoryJoestar
67 天前
搞定了,用的有头 playwright ,手动过 cloudflare ,还可以吧,只需要确认一次就行

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1150953

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX