岗位职责
1. 负责生产环境 Kubernetes 集群的部署、运维、监控与故障处理,保障集群高可用与业务稳定运行
2. 负责业务应用的发布、变更、容量评估与性能调优,推动 CI/CD 流程落地与持续优化
3. 负责常用中间件(MySQL 、PostgreSQL 数据库、消息队列、缓存、网关等)的部署、运维与调优,处理性能瓶颈与异常问题
4. 负责机房物理基础设施运维,包括服务器、存储、网络设备的日常巡检、上下架、布线与故障处置
5. 负责企业网络运维,涵盖交换机、路由器、防火墙、VPN 、负载均衡等设备的配置与排障
6. 参与公有云资源的规划、迁移与运营,负责云上业务的部署、成本优化与安全合规
7. 参与 K8s 算力平台(GPU 调度、AI/大模型推理训练场景)的运维与优化
8. 编写运维文档、应急预案与自动化脚本,持续提升团队运维效率
任职要求
- 本科及以上学历,5 年以上生产环境运维经验
- 熟悉 Linux 系统与 Shell 脚本,熟悉 Python / Go 者优先
- 熟悉 Kubernetes 架构与核心组件,具备生产集群部署、升级与故障定位经验
- 熟悉 Docker / containerd 与 Harbor 等镜像仓库
- 熟悉灰度、蓝绿、滚动等发布策略,具备应用性能调优经验
- 熟悉至少 2-3 类生产级中间件的部署与运维
- 熟悉 Prometheus + Grafana 监控体系与 ELK / Loki 日志体系
- 熟悉 Jenkins / GitLab CI 等 CI/CD 工具
- 熟悉主流服务器、交换机、防火墙的运维与排障
- 熟悉至少一家主流公有云(阿里云 / 腾讯云 / 华为云 / AWS)的核心产品与运维实践
- 责任心强,具备良好的故障应急能力,可配合值班轮换
加分项
- 持有 CKA / CKS / 公有云专家级认证
- 具备 GPU 算力平台(NVIDIA GPU Operator 、Volcano 、vGPU 等)运维经验
- 熟悉 Terraform / Ansible 等 IaC 工具
- 熟悉等保 2.0 、信创等合规落地经验
- 具备线下到公有云迁移或混合云运维经验
办公环境:事业单位,团队岗位齐全,前后端、测试、产品、目前还有一个驻场运维团队,加班不多
简历发送:vibeTrust#outlook.com
1. 负责生产环境 Kubernetes 集群的部署、运维、监控与故障处理,保障集群高可用与业务稳定运行
2. 负责业务应用的发布、变更、容量评估与性能调优,推动 CI/CD 流程落地与持续优化
3. 负责常用中间件(MySQL 、PostgreSQL 数据库、消息队列、缓存、网关等)的部署、运维与调优,处理性能瓶颈与异常问题
4. 负责机房物理基础设施运维,包括服务器、存储、网络设备的日常巡检、上下架、布线与故障处置
5. 负责企业网络运维,涵盖交换机、路由器、防火墙、VPN 、负载均衡等设备的配置与排障
6. 参与公有云资源的规划、迁移与运营,负责云上业务的部署、成本优化与安全合规
7. 参与 K8s 算力平台(GPU 调度、AI/大模型推理训练场景)的运维与优化
8. 编写运维文档、应急预案与自动化脚本,持续提升团队运维效率
任职要求
- 本科及以上学历,5 年以上生产环境运维经验
- 熟悉 Linux 系统与 Shell 脚本,熟悉 Python / Go 者优先
- 熟悉 Kubernetes 架构与核心组件,具备生产集群部署、升级与故障定位经验
- 熟悉 Docker / containerd 与 Harbor 等镜像仓库
- 熟悉灰度、蓝绿、滚动等发布策略,具备应用性能调优经验
- 熟悉至少 2-3 类生产级中间件的部署与运维
- 熟悉 Prometheus + Grafana 监控体系与 ELK / Loki 日志体系
- 熟悉 Jenkins / GitLab CI 等 CI/CD 工具
- 熟悉主流服务器、交换机、防火墙的运维与排障
- 熟悉至少一家主流公有云(阿里云 / 腾讯云 / 华为云 / AWS)的核心产品与运维实践
- 责任心强,具备良好的故障应急能力,可配合值班轮换
加分项
- 持有 CKA / CKS / 公有云专家级认证
- 具备 GPU 算力平台(NVIDIA GPU Operator 、Volcano 、vGPU 等)运维经验
- 熟悉 Terraform / Ansible 等 IaC 工具
- 熟悉等保 2.0 、信创等合规落地经验
- 具备线下到公有云迁移或混合云运维经验
办公环境:事业单位,团队岗位齐全,前后端、测试、产品、目前还有一个驻场运维团队,加班不多
简历发送:vibeTrust#outlook.com