这是一个创建于 1255 天前的主题,其中的信息可能已经有所发展或是发生改变。
base 杭州 /北京均可
团队介绍:
我们是来自阿里云流量产品事业部的中台技术团队,流量产品事业部主要产品包括边缘计算、CDN 、直播等核心业务,我们团队的职责是为部门内部十几个业务线提供边缘基础设施、边缘云业务提供运维&监控能力,为业务提供一整套监控运维解决方案,涵盖了从数据采集、异常感知、自动化问题定位、自愈、数据运营、运维平台等。13 薪+年终奖,周末双休。团队氛围好,我们的目标是为边缘云计算和业务打造一套无人值守的运维与监控体系,有兴趣欢迎找我沟通
监控平台研发专家
职位要求:
1. 负责视频云监控系统的架构、设计、开发等工作,包含监控数据处理、异常检测、数据可视化、自动化等
2. 有监控领域的建模能力,构建全面的、准确的、能反映服务业务线特征的整体指标体系, 并基于业务监控指标体系,全链路监控体系,及时发现与定位业务问题;
3. 负责智能监控异常检测与问题定位策略 /算法的设计和工程实现。
技能要求:
1. 精通 1-2 门主流程序设计语言,java,go 优先,扎实的编程基本功
2. 具有大中型系统的架构设计经验、大规模数据采集和处理经验者优先
3. 熟悉流式计算,olap,有 Spark/Flink 的开发经验尤佳
4. 熟悉关系型数据库,熟悉 influxdb 、tsdb 等时序型数据库优先
5. 有机器学习,异常检测,问题定位相关算法实践经验的优先。
6. 良好的思维逻辑性、语言表达能力
7. 熟悉常用的监控系统优先,如 Prometheus 和 Open-falcon 等
AiOps 算法专家
职位要求:
1. 负责监控平台数据与智能模块架构设计与演进
2. 负责业务异常自动化根因定位,实现无人值守的监控体系
3. 负责运维团队智能运维相关业务场景落地
4. 负责智能运维领域相关前沿技术研究
技能要求:
1. 有 3 年以上大型互联网公司或大型 IT 企业智能运维领域相关算法与业务经验;
2. 掌握异常检测、预测、聚类、分类、NLP 等相关算法者优先;
3. 掌握机器学习、模型训练等相关技术,并有实践经验者优先;
4. 适应快速变化的创业环境,乐于寻求挑战和突破自我;
5. 思路清晰,有良好的沟通表达能力和跨团队协调能力,有一定的技术团队管理经验;
运维开发工程师 /技术专家
职位要求:
1. 负责构建边缘云基础设施、边缘云业务的运维数据库
2. 负责设计和开发资源运维、业务运维平台,为运维提供一个全局的运维底座
3. 负责搭建专家系统、运维自动化体系、ChatOps 体系,帮助提升运维效率
4. 和算法同学合作,推动 AiOps 在运维&监控上落地,实现无人值守运维体系
技能要求:
1. 精通 Python/Golang/Java 等一种或多种编程语言;能够独立完成大型项目的系统分析设计,并负责核心模块研发
2. 3 年以上行业大型互联网应用或集团型企业应用的运维、平台开发等经验
3. 对云原生、K8S 、Docker 、OpenStack,对虚拟化、容器等技术有深刻的理解和经验;
4. 熟练掌握一种或多种数据库以及各中间件技术,如 MySQL 、ZooKeeper 、RocketMQ 、ElasticSearch 、Hadoop 生态圈,熟悉 Ceph 、Minio 等存储中间件,对运维体系有深入的研究和理解
5. 善于推动跨部门复杂项目的实施和较强的拿结果能力
6. 具备较强的 ownership,良好的沟通合作能力,热爱技术并善于钻研;能主动思考,有解决疑难问题的毅力和决心;
联系方式 (base64) :
微信:d3lrX2VyaWM=
邮箱:ZXJpYy53eWtAYWxpYmFiYS1pbmMuY29t