Java 或者 Python 有没有工具可以模拟登陆(不知道 post 的 url)

2020-07-16 11:28:13 +08:00
 dtgxx

比如某个页面是 www.a.com/index.html

但是它源码里面实际是 post 的 www.a.com/login.html

有没有什么工具,可以模拟抓到真实的 post 的 url ?

2338 次点击
所在节点    Java
15 条回复
dtgxx
2020-07-16 11:40:22 +08:00
大意是想 模拟某些未知 url 的登录,并返回真实的登录请求的 url
lxhlxh520
2020-07-16 12:24:24 +08:00
浏览器自带的 debugger
Nich0la5
2020-07-16 12:29:38 +08:00
楼主应该是需要 selenium splash 这种的库吧
Merlini
2020-07-16 12:53:10 +08:00
puppeteer
polaa
2020-07-16 12:55:13 +08:00
burpsuite
soulzz
2020-07-16 13:21:34 +08:00
f12
Fitz
2020-07-16 13:28:05 +08:00
puppeteer
princelai
2020-07-16 13:29:05 +08:00
只要浏览器能访问成功的,你都可以模拟浏览器啊,比如楼上说的 selenium,还能选择用 chromedriver 或者 firefoxdriver 或者无头浏览器
ym1ng
2020-07-16 13:32:09 +08:00
如果只是单纯的人工分析请求,抓包工具一大把甚至如楼上说的浏览器的 debugger 就可以。

不过看楼主的需求似乎是想自动化?那不妨研究一下试试 chrome headless
zqz19941106
2020-07-16 14:02:05 +08:00
fiddler 抓包看看
dtgxx
2020-07-16 14:12:39 +08:00
@lxhlxh520 @Nich0la5 @Merlini @polaa @soulzz @Fitz @princelai @ym1ng @zqz19941106
感谢大家回复,抓包等方法都可以拿到某 url 真实登录请求的 url,但是这是人工在做。

我想实现一个接口,传入一个 url,然后我可以后端模拟一次该 url 的真实登录请求,并返回真实登录的 url 。
enrolls
2020-07-16 16:21:21 +08:00
就是通用型的网站登录,一年前想做,一直都很懒。大概想法是,登录窗口大多数都是表单,表单 post 什么,post 到什么地址,html 上面都有了,通过遍历 html 找含有 login,登入的元素呗。
dtgxx
2020-07-16 16:28:14 +08:00
@enrolls #12 对 差不多是这个思路,formaction 那种的比较容易,ajax 的就想到通过正则去匹配。另外还有很多变种,各种形式的请求方式,很难通过类似穷举的方式获取真实 url 。所以想智能一些,能模拟登录按钮点击,然后拿到请求的真实地址。
wangritian
2020-07-16 17:47:09 +08:00
你碰到的应该是 30X 状态码跳转
polaa
2020-07-16 17:57:19 +08:00
selenium 结合 图像识别 ?
解析网页很难做到通用性

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/690519

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX