爬虫及数据处理系统外包

2016-10-17 22:52:33 +08:00
 dersu
项目是为客户现有企业分析系统建设一个新的数据渠道。
python 技术栈,基于 scrapy 框架。
抓取网站的数据,并对指定数据进行提取和跟踪。
同时提供接口服务,实现爬虫的管理和数据输出。

项目是我们和合作公司一起做的,但合作公司上周单方面终止合同,临时退出了项目。
团队内部商量后,觉得目前团队的工作量已经很饱和了,所以想找一个靠谱的团队或者个人把这块整体外包。

系统爬虫部分比较简单,最基本的爬虫开发即可满足需求;接口服务对并发、性能要求都不高,实现需求即可。
难点在于目标数据的鉴别,跟踪和提取,可能需要较复杂的算法来实现对特征量的识别和处理。
我们自己团队评估过,数据处理上,有一两个功能点我们目前没想出特别好的处理方式,其他的尽管能实现,但也挺麻烦。
所以,如果只是擅长基本的爬虫开发,请不要浪费时间来谈了,最好是有很丰富的数据处理经验。

具体需求涉及商业机密,联系后另行说明。
我们这边是公司,可以私人交易也可以签订正式商务合同,也可以接受在任意你选择的平台上交易。
有兴趣的请发邮件至 heqiliao2 # outlook.com ,抱歉工作环境没法用 qq。
我会把核心需求在邮件尽可能简单的说一下,如果确定能做,那我在把正式的需求协议发给你,然后商量一下价格和工期。
谢谢
621 次点击
所在节点    外包
4 条回复
songmeiya
2016-10-19 11:14:21 +08:00
给您发了邮件没有收到回复,可以加我微信: shixianteam3,来聊聊。
dersu
2016-10-19 23:39:30 +08:00
@songmeiya 前面有三个人发来的联系邮件都被莫名的自动放到垃圾箱里了,我今天中午都已经回复了。现在你应该已经收到邮件了吧
songmeiya
2016-10-20 15:29:00 +08:00
然而并没有收到回复呀……
songmeiya
2016-10-20 15:29:25 +08:00
@dersu 真的没有收到回复 ,呜呜呜呜

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/313442

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX