求 1688 爬虫, Python 写,无需界面,只要脚本

2019-07-18 15:47:01 +08:00
 myforgame
需求场景:
1、输入关键词,如“电脑”
2、获取总页数
3、进入每个分页
4、进入每个商品
5、进入“联系方式”页面,获取公司名称、联系方式
6、将信息存入本地文件

其他:
Proxy 可以支持, 也可以不支持,不支持的情况, 需要:
1、能拿到总页数
2、至少能爬一页(搜索结果)数据

费用:
预计改为 1~2 天内完成,费用 1000~1500 元

---

有兴趣站内信联系
1157 次点击
所在节点   物物交换
10 条回复
cdwyd
2019-07-18 15:52:27 +08:00
并没有站内信,如果总页数和第一页的话 这个价格可以考虑
1069401249
2019-07-18 16:45:05 +08:00
我我我举手
yankebupt
2019-07-18 17:19:15 +08:00
现在一个手机号只能换取 1688 一个关键字的第一页的数据了么……再多了就要验证码地狱了么……可怕……
cdwyd
2019-07-18 18:14:03 +08:00
@yankebupt 刚试了下必须登录。。
yankebupt
2019-07-18 18:18:42 +08:00
嗯。其实本来提升反爬强度对他自己一点好处都没还会让用户反感,但后来发现反爬可以诱使部分人去买他自己的大数据分析服务之类后,就开始变本加厉了 233......
exceloo
2019-07-18 18:46:48 +08:00
爬慢点不可以吗
sep1025
2019-07-19 11:12:24 +08:00
一定 python ? js 写 ok 吗?
myforgame
2019-07-19 14:23:21 +08:00
感谢各位,已找到合适的人, 结贴。
maybedk
2019-07-19 15:07:49 +08:00
@myforgame 你好,我来晚了。刚用 scrapy 写好了一个。可以给个联系方式吗?没有站内信
danmu17
2019-08-01 09:34:01 +08:00
@yankebupt 本质上还是筛掉因为数量巨大而破坏力过大的业务玩家,毕竟视他们为整体的话就根本不是爬虫而是 DDOS 了。我在的国家因为法制规范所以游戏规则就和中国完全不同。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/584151

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX