动态变化的 js 如何逆向

2020-06-09 17:53:26 +08:00
 a65420321a
boss 直聘,上月破解过一次 cookie 加密正常运行。
昨天发现爬虫跑不通了,按上次的步骤重来一遍,发现 js 加密整体逻辑跟之前类似,但是过程变化不少
昨天时间太晚抠了一半扔着不管了,今天打开再看发现跟昨天的也不一样了...
GG 思密达,这种情况超出了我的预料,没有头绪,求指教
2822 次点击
所在节点    Python
13 条回复
fanhaipeng0403
2020-06-09 17:57:16 +08:00
去直聘 boos 公司底下,蹲员工,拿钱贿赂问
est
2020-06-09 17:58:42 +08:00
你逆出来,下次还会变。。。
a65420321a
2020-06-09 18:02:02 +08:00
@est 现在没头绪就是因为这个。。。
akira
2020-06-09 18:23:51 +08:00
逻辑不管 弄个黑箱去跑他呗
joesonw
2020-06-09 18:28:13 +08:00
总归是要让人阅读的呗. headless-chrome 跑嘛. 如果是字符集实时生成的话, 打印字体这么工整, 随便免费的 ocr 都绰绰有余了.
ericgui
2020-06-10 01:12:43 +08:00
不好意思,我其实有点晕,为何要爬招聘网站呢
wnpllrzodiac
2020-06-10 08:34:47 +08:00
难道是友商。。。
takemeaway
2020-06-10 09:27:25 +08:00
既然是用 JS 加密的,那就直接用他的 JS 运行啊。
a65420321a
2020-06-10 09:34:37 +08:00
@ericgui 拿来分析行业变化之类的东西
a65420321a
2020-06-10 09:35:05 +08:00
@wnpllrzodiac 不是~我们做行研的
a65420321a
2020-06-10 09:35:29 +08:00
@takemeaway 之前是下载他的 js 运行的,不晓得什么情况现在不通。。
a65420321a
2020-06-10 09:36:00 +08:00
@joesonw 太慢了。。。
Harlaus
2020-06-11 09:56:57 +08:00
你逆出来,下次还会变,死磕爬虫的逆向,爬虫是要权衡得失的,我个人觉得得不偿失,弄个 headless 跑吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/680094

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX