抖音的接口 api 是怎么爬去的

2018-07-02 13:23:53 +08:00
 mrant

最近看到了几个 pc 端可以看抖音、火山、快手的网站, 就好比这个网站: https://kuaiyinshi.com/#video-pannel

有没有大佬知道数据是怎么爬来的,官网都没有提供啊

25378 次点击
所在节点    程序员
29 条回复
mht
2018-07-02 13:30:31 +08:00
抓包?
mrant
2018-07-02 13:34:53 +08:00
@mht 抓包是可以,但是你得手动触发 刷抖音的动作吧。。。
siyemiaokube
2018-07-02 13:38:07 +08:00
这东西见光死吧。。。
tingyunsay
2018-07-02 13:38:15 +08:00
得逆向,ida 动态调试,解密,抖音的 feed 流加密步骤还是挺多的,如果走检索直接抓包,但是没有验证 token 是否有时效性(貌似是有)
jimmyczm
2018-07-02 15:54:19 +08:00
appnium 应该可以看得到吧?
mrant
2018-07-02 16:06:48 +08:00
@siyemiaokube 我看这个网站做的蛮大的
mrant
2018-07-02 16:07:16 +08:00
@tingyunsay 这么复杂,脚本能搞定吗
mrant
2018-07-02 16:08:08 +08:00
@jimmyczm 看到也只是抓包吧,但是做这个的应该不是自己一直刷抖音,拿到的数据吧
xomix
2018-07-02 16:24:29 +08:00
@mrant 一般这种有个更简单的办法,找个人流大的地方挂个免费 wifi,然后拿日志爬一下就行了,刷的事连过来的用户就做完了。
tingyunsay
2018-07-02 16:25:59 +08:00
@mrant 代码肯定是脚本能搞定的,但是过程嘛,得用到很多软件去调试。
实在不行可以用台手机模拟人去点击,获取点击的那个 url,一段时间之内的数据肯定是有效的,url 有时效性,但是就是慢
sjzjams
2018-07-02 16:26:04 +08:00
sjzjams
2018-07-02 16:26:39 +08:00
从他们网站查看视频请求,视频资源规律是什么样的
V392920
2018-07-02 16:31:49 +08:00
之前逆向过抖音,里面的算法确实很多!但是那都是需要做登录操作才涉及到那些算法,如果只是抓视频的话,好像用不上那些加密算法,也是好几个月前的事了,现在抖音估计也都加强改版了很多了!
mrant
2018-07-02 16:34:53 +08:00
@V392920 #13 你看那个网站他的数据一直有
mrant
2018-07-02 16:35:37 +08:00
@sjzjams 我看他连用户视频的赞,评论啥的都拿到了
tianakong
2018-07-02 17:00:15 +08:00
你就爬这个站的
mosade
2018-07-02 17:30:54 +08:00
mosade
2018-07-02 17:32:32 +08:00
nicevar
2018-07-02 17:44:13 +08:00
@mrant 手动触发用 python 写个脚本模拟人工操作就行了,类似之前的微信跳一跳外挂
加密的话如果 so 库没有加壳之类的加固处理还是很好分析的
sampeng
2018-07-02 19:05:06 +08:00
几千工人工在工厂里拿着手机一直刷刷刷。按刷新量结算。。抖个机灵就跑

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/467452

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX