6k/月 招个爬虫兼职

2019-03-23 07:05:09 +08:00
 xiaoyazi

我司要做一个动态比价工具,须爬取大众点评 APP 及携程 web 的酒店价格。 数量大约为 500 家,每家 2 个指定房型,频率 3 分钟。

长期。

请“实测”成功联系我,不要没试过就说我可以。

3669 次点击
所在节点    外包
51 条回复
metrxqin
2019-03-23 10:25:46 +08:00
@q8164305 数据的所有权还是不属于你。
binux
2019-03-23 10:31:43 +08:00
@tabris17 #14 很简单,你和 LZ 签合同的时候加一句,你只是代理 LZ 行使数据获取行为,LZ 需要对数据的所有权和使用权负责。
NeilWang
2019-03-23 10:37:44 +08:00
@binux 活捉 pyspider 作者,我咋说这个 id 这么熟悉😁
airqj
2019-03-23 10:40:25 +08:00
3 分钟爬一次
到后面基本就得面对各种反爬措施了
xiaoyazi
2019-03-23 10:45:48 +08:00
@binux 没问题的
xiaoyazi
2019-03-23 10:46:19 +08:00
@airqj 否则为什么付这月费呢
binux
2019-03-23 10:54:54 +08:00
@airqj #24 反爬要做,但是最后还是靠代理。因为每月 3 千万的流量,傻子都能筛得出来,所以你至少需要有 30 万个 IP。比如 https://luminati.io/ 能提供 36M 个 IP,一个月大概要 12 万。
veike
2019-03-23 12:39:48 +08:00
爬虫真的法律边缘了吗?
liyaojian
2019-03-23 13:45:04 +08:00
慢慢买这类服务也是法律边缘吗?
gabon
2019-03-23 14:03:05 +08:00
哪家公司
belin520
2019-03-23 14:10:08 +08:00
给编译后的程序+使用说明,并且把程序做成看起来是有通用性的,这样这只是把菜刀,杀人砍肉就不关你事了
xiaoyazi
2019-03-23 18:24:48 +08:00
@binux 不是爬全站
xiaoyazi
2019-03-23 18:25:44 +08:00
@gabon 不知名公司
xiaoyazi
2019-03-23 20:51:09 +08:00
我们同时在招专职员工,boss 直聘上投应聘的有 60 多人了,无一能解。我突然在想程序爬 APP 数据靠的是破解,破解就是算法的对抗,反爬与爬虫对抗就是硬刚,如果要爬全站肯定要靠算法,但我们只是爬几百个酒店,与其正面对抗能不能模拟真人操作,买 100 台手机走 100 个进程取 100 个价格。 非技术人员,想法可能贻笑大方
binux
2019-03-23 22:34:16 +08:00
@xiaoyazi 问题是你要 3 分钟的频率,500*2 个房型*2 个网站,你自己算算。
爬全站反而简单点
xiaoyazi
2019-03-23 23:06:44 +08:00
@binux 前两个月 200 个酒店差不多。增加服务器可以解决吗? 500 家酒店*2 个房型呀,不也就是 1000 个价格嘛。我不是很懂,请跟我说说
binux
2019-03-23 23:18:16 +08:00
@xiaoyazi 1000 个价格* 2 个网站/ 3 分钟* 24*60*30
linhua
2019-03-23 23:26:06 +08:00
linhua
2019-03-23 23:41:19 +08:00
@binux 两个网站的流量要分开算,如果 ip 的安全频率是 5 分钟的话,那么 也只需要 500*2*( 5/3 (向上取整))=2000 个 ip
airqj
2019-03-23 23:49:30 +08:00
@binux 如果不是三分钟的频率,估计早就有人接了 哈哈

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/547629

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX