[北京] IT 桔子 招募 Python 爬虫工程师和数据挖掘~

2017-04-11 22:07:35 +08:00
 wenfeixiang
IT 桔子( itjuzi.com )是一家聚焦创业公司、产品、投资领域的数据公司,随着数据量的不断增多、需求深入,我们在数据方面遇到了挑战—— 包括 抓取更多的数据并程序化清洗、匹配、入库;对多个数据渠道进行交叉验证、整合;数据的结构化、可视化处理;数据建模与指数算法等~~

所以,我们希望找寻靠谱的 数据爬虫与挖掘工程师,一起升级打怪:

岗位职责:

1.负责设计和开发网络爬虫系统,进行多平台信息的抓取和分析工作;

2.负责网页信息和 APP 数据抽取、清洗、消重等工作,提升平台的抓取效率;

3.参与爬虫核心算法和策略优化,熟悉采集系统的调度策略;

4.实时监控爬虫的进度和警报反馈;


任职要求:

1.熟悉 Linux 系统,掌握 Python ;

2.了解多线程、多进程、网络通信编程相关知识,有数据挖掘经验;

3.掌握网页抓取原理及技术,了解基于 Cookie 的登录原理,熟悉基于正则表达式、 XPath 、 CSS 等网页信息抽取技术;

4.熟悉 APP 模拟及接口验签破解技术,了解 APP 用户授权访问机制,掌握 Selenium , APP 破解技术优先;

5.做过数据处理、 ETL 等相关工作优先。


薪酬: 15-25K/月

欢迎大家和我联系: wenfeixiang@itjuzi.com

O(∩_∩)O 谢谢。
2563 次点击
所在节点    酷工作
2 条回复
appppppp
2017-04-12 09:02:41 +08:00
默默问一句,应届生要嘛
wenfeixiang
2017-04-12 16:08:28 +08:00
@appppppp \(^o^)/~ 抱歉主要找寻有工作经验的, 1-3 年左右,谢谢啦

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/354205

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX