今日头条的_signature 是不是又修改了 JS 问题 搞不清楚原因 求帮忙

2019-01-23 00:54:11 +08:00
 Ewig

最近在整理爬虫项目的时候发现

我按照源码穿进去的参数有时候能返回数据,有时候不能返回数据, execjs.compile(_js).call('TAC.sign', "6347006294" +''+ "0") 我这样穿的参数

返回的有时候是这样

{"message": "success", "has_more": false, "data": []},

有时候却能返回正确数据 这到底为啥呢?

我按照源码 js: 传的三个参数 window.TAC && (t = TAC.sign(userInfo.id + "" + d.params.max_behot_time))

d.params.max_behot_time = e.next && e.next.max_behot_time || 0))

这是源码的三个参数,但是 d.params.max_behot_time 这里有这个 next 不知道啥意思,求 解这 max_behot_time 传的是 0 吗?我感觉每次都变化吧????

网址:

https://www.toutiao.com/c/user/6347006294/#mid=6350075797

2839 次点击
所在节点    Python
11 条回复
Loooom
2019-01-23 07:24:21 +08:00
max_behot_time 是上一次请求返回的,翻页用。 刚刚试了下 10 次请求有一半是不返回正常数据 = =
Ewig
2019-01-23 10:48:10 +08:00
@Loooom 这是为啥?
Ewig
2019-01-23 10:49:44 +08:00
@Loooom 每次穿的 max_behot_time 到底是不是 0 ?
Ewig
2019-01-23 11:36:20 +08:00
@Loooom 我在控制台返回的参数 是每次都可以请求到数据的,为啥这个不行
Loooom
2019-01-23 14:56:43 +08:00
@Ewig 第一次传 0 默认刷新最新的页面,请求回来 max_behot_time 给第二次请求用就等于翻页了,你试试。返回空我也不知道为什么,是做了什么限制啥的
xiao38245
2019-01-23 15:53:01 +08:00
老哥匿名了吗, 上一个没 匿名爬头条的还没出来呢
Ewig
2019-01-23 15:53:47 +08:00
@xiao38245 匿名啥意思?
vaidi
2019-01-23 17:25:20 +08:00
算法改了,这个应该是返回的是第 X 页,填个 10 以内的数字看一下
Ewig
2019-01-23 18:07:37 +08:00
@vaidi 这个数字不是随便写吧
Ewig
2019-01-24 16:21:17 +08:00
@vaidi 不行,换其他的,不反数据
Ewig
2019-01-24 16:23:28 +08:00
看来这个头条破解是无解了啊

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/529632

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX