某多多爬虫

2019-04-22 09:46:20 +08:00
 Northxw

  某多多爬虫,anti_content 参数破解参考网上教程(因侵权问题,此处不公开链接),主要是通过是商品 API 完成商品信息的抓取,分析,存储,可视化等功能。

  Github: https://github.com/Northxw/Pinduoduo 欢迎提交 issue

8254 次点击
所在节点    Python
16 条回复
yepinf
2019-04-22 11:38:46 +08:00
请教下,pdd 除了参数加密,还有什么注意点
有闲置服务器,想稳定爬它几个月看看
showHand043
2019-04-22 12:19:39 +08:00
没有反爬措施嘛.比如汽车之家,大众点评那种
AnjingJingan
2019-04-22 13:02:30 +08:00
pdd.txt 不存在
Northxw
2019-04-22 14:06:58 +08:00
@AnjingJingan 跑一边程序就生成了,不可能把大文件放到 github 上啊。
Northxw
2019-04-22 14:07:58 +08:00
@yepinf 目前还未发现其他反爬措施,不过大规模抓取的时候建议上代理。你先试试。
Northxw
2019-04-22 14:09:14 +08:00
@showHand043 反爬措施就是参数加密啊(注意:注意看我的抓取链接),汽车之家和大众点评是网页字体反爬。
AnjingJingan
2019-04-22 14:44:20 +08:00
@Northxw 跑程序报了这个错
Northxw
2019-04-22 14:52:23 +08:00
@AnjingJingan ???贴代码,我看看什么错误。
Northxw
2019-04-22 15:00:11 +08:00
@AnjingJingan 或者你加我 QQ:2443498314, 密保问题:佩奇(备注来意)
luanguang
2019-04-22 15:00:21 +08:00
原本想 star 的,看到这么多有趣的爬虫,还是 follow 吧。
Northxw
2019-04-22 15:00:48 +08:00
@luanguang 哈哈 都行的, 互相学习
stcasshern
2019-04-22 15:07:37 +08:00
露珠下步计划是啥,感觉下步分析比较有趣
Northxw
2019-04-22 15:21:13 +08:00
@stcasshern ???哈哈,你想要什么
ricky0603
2020-05-21 11:57:49 +08:00
楼主的账号问题是怎么解决的?我一个账号抓 300+条数据就被 ban
funtanstic
82 天前
大佬问题解决了么?账号很容易被 ban
Northxw
81 天前
@funtanstic 兄弟,几年前的问题了,我现在已经不搞爬虫了,账号被 ban 就挂代理(真实代理,贵一点的,或者自己维护 ip 池)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/557378

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX