[北京][招聘][人人车] 初/高级爬虫(抓取)工程师

2018-04-09 14:11:16 +08:00
 bobobo80

Hi,v2ex 的朋友们,人人车抓取团队招聘啦,欢迎大牛一起并肩战斗。

关于我们:

  • 人人车二手车致力于打造全新的个人二手车交易模式,帮助人人车网用户买车、卖车、二手车评估、二手车检测。
  • 人人车二手车服务于全国 100 多个城市,帮助买车用户买到合理、优质的个人二手车,帮助卖车用户快速卖个好价钱,在人人车网,买车、卖车流程透明,无差价,更放心!
  • 地址:北京-朝阳-北苑-铁建广场

爬虫(抓取)工程师 10-20k

  1. 负责开发和维护数据抓取、清洗任务;
  2. 保证数据抓取准确性、实时性;
  1. 熟悉计算机相关基础知识,了解基本的数据结构和算法,熟悉 python/go/c++/java 等一种编程语言;
  2. 熟悉 TCP/IP、http 协议,熟悉爬虫原理,熟悉常见的反爬虫技术,熟悉 html、dom、xpath 等;
  3. 熟悉 sql 操作,熟悉 linux 基本操作,了解 redis 等 nosql 应用;
  4. 了解 scrapy/pyspider 等框架或手写过爬虫框架者优先

分布式爬虫(抓取)高级工程师 15-30k

  1. 参与大规模分布式抓取框架建设;
  2. 完善抓取架构,不断提升系统的准确性、实时性;
  1. 熟悉计算机相关基础知识,了解基本的数据结构和算法,熟悉 python/go/c++/java 等一种编程语言;
  2. 熟悉 TCP/IP、http 协议,熟悉爬虫原理,熟悉常见的反爬虫技术,熟悉 html、dom、xpath 等,有至少两年爬虫相关项目经验;
  3. 熟悉分布式系统、消息队列、nosql、数据仓库等;
  4. 对 scrapy/pyspider 等爬虫框架有较深入的理解,或具有大规模的爬虫系统的设计和开发经验;
  5. 有大规模数据处理、数据挖掘、信息提取等经验者优先。

简历投递: wubo@renrenche.com

3375 次点击
所在节点    酷工作
13 条回复
chendajun
2018-04-09 17:45:33 +08:00
对学历有限制吗?平常工作就是基于 scrapy 开发各种爬虫脚本。看过 pyspider 源码,根据需求对 pyspider 定制开发过。
bobobo80
2018-04-09 21:35:47 +08:00
@chendajun 学历没有限制
wl2358
2018-04-09 22:49:35 +08:00
刚自学出来的,基本的请求,动态的,scrapy 以及 scrapy -redis,这样的 ok 吗
stop9125
2018-04-09 23:39:43 +08:00
已发送。希望加入
bobobo80
2018-04-10 08:19:54 +08:00
@wl2358 一般来说更关注基础知识是否扎实,爬虫相关的技能其实还是很容易上手的。
snal123
2018-04-10 08:21:48 +08:00
工作时间? 995or996
bobobo80
2018-04-10 08:25:03 +08:00
@snal123 正常是 10-7-5,晚上可能会加会班,周末一般不加班,周末需要加班的话会有调休或补助。
qwertty01
2018-04-10 09:39:15 +08:00
有意。一直在做 Java 爬虫。
zcguo
2018-04-10 13:42:33 +08:00
招应届生吗,有 8 个月的爬虫实习经验,已经在拉勾上投了简历
Leigg
2018-04-10 22:12:05 +08:00
条件符合,然而在重庆。。
bobobo80
2018-04-12 21:17:48 +08:00
@qwertty01 虽然我们应该还是会维持 python 技术栈,不过有兴趣欢迎来聊一下。
tuzigg
2018-04-17 11:45:13 +08:00
支持远程办公么? python 5 年老司机
bobobo80
2018-05-04 13:28:26 +08:00
@tuzigg 暂不支持

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/445346

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX