[外企][北京][部分可远程]大模型推理框架工程师、技术支持工程师、Agent 开发工程师!

1 月 9 日
 xibusangna

Atlas Cloud 公司介绍及招聘信息

公司简介

Atlas Cloud (官网: https://www.atlascloud.ai )是一家快速发展的 AI 基础设施初创公司,专注于模型即服务( MaaS )和基础设施即服务( IaaS )。 公司总部位于纽约,在硅谷、北京和加拿大卡尔加里设有团队,为全球客户提供 大语言模型( LLM )训练、微调与推理服务所需的 GPU 与云基础设施。 我们正在构建面向下一代 AI 应用的高性能计算平台。

招聘岗位

1 、大模型推理框架工程师

工作内容

  1. 负责模型接口调用功能开发集成;
  2. 负责新模型适配上线、bugfix 、功能开发与算子集成;
  3. 负责推理服务镜像的制作、更新与管理;
  4. 负责大模型、图像以及视频场景单节点/服务的工程/算法性能的回归测试与压力测试;
  5. 负责大模型、图像以及视频推理框架的开发以及优化。

任职要求

  1. 计算机科学、信息工程、电子工程、机器人等专业本科及以上学历;
  2. 具备扎实的编程能力,熟练使用 Python/C++ 进行开发;
  3. 了解网络网关基本概念,能进行基础网络问题排查;
  4. 熟悉 OpenAI 接口调用和集成开发;
  5. 熟悉 sglang 、vLLM 等大模型推理系统,熟悉目前主流的大模型推理优化方法,如 pd 分离、分布式推理、投机采样等技术;
  6. 熟悉容器技术,了解云平台技术者优先;
  7. 具备良好的编程风格习惯、文档撰写能力、团队协作和沟通表达能力;
  8. 有高性能计算、计算机体系结构背景,熟悉系统性能调优方式,了解计算访存底层硬件实现原理者为加分项。

2 、首席技术支持工程师

工作内容

  1. 作为一线技术专家,处理复杂问题,包括 GPU 资源、Kubernetes 容器平台、API 调用与集成问题;
  2. 为客户提供 LLM 部署与推理优化建议,协助定位训练和推理性能瓶颈;
  3. 汇总客户问题与工单趋势,推动产品与工程团队持续优化平台稳定性;
  4. 编写并维护技术文档和知识库,降低重复工单,提高客户自助解决能力。

任职要求

基础要求
  1. 计算机、软件工程或相关专业,本科及以上学历;
  2. 5 年及以上云计算 / DevOps / 基础设施相关经验;
  3. 有项目沟通经验和带团队经验优先。
技术能力
  1. 熟悉 GPU 架构及云计算基础设施;
  2. 熟练使用 Kubernetes ,有容器平台运维或排错经验;
  3. 熟悉至少一种主流数据库( MySQL / PostgreSQL / MongoDB 等);
  4. 理解大语言模型( LLM )基本原理,有模型服务或推理相关经验;
  5. 能阅读并调试 Python / Go / Java / JavaScript 中至少一种语言;
  6. 有 REST / gRPC API 排错经验;
  7. 面向全球客户和团队协作,可接受晚间沟通或 on-call 支持。
语言能力

能进行技术层面的中英文沟通(对接海外客户和团队)

其他

可远程工作

3 、资深 Agent 开发工程师(偏算法)

工作内容

  1. 负责大模型应用框架的设计、开发和部署,根据业务需求转化为技术规范;
  2. 利用提示词工程/RAG/知识图谱/Function Call 等技术,设计 Agent 架构,构建金融、房地产等专业领域的大模型 Agent 系统;
  3. 对 Agent 算法性能指标进行分析,和算法团队一起解决算法瓶颈;
  4. 优化 Agent 决策逻辑,平衡计算成本和任务完成率等指标;
  5. 建立 System Prompt 版本管理机制,制定 Agent 测试指标和评级体系;
  6. 对接云平台后端以及推理框架,完成高可用方案实施与工程化落地。

任职要求

必备项
  1. 计算机、经济、金融等专业 985 本科及以上学历;
  2. 熟练掌握 Python ,有使用 Python 编程的大型项目经验;
  3. 熟练掌握大模型 Prompt 优化技巧,熟悉各类大模型的优劣势以及使用场景;
  4. 熟练掌握大模型预训练以及后训练技巧,熟悉大模型思维链以及 ToolCall 相关性能提升技巧;
  5. 掌握 RAG 、知识图谱以及向量库技术原理以及相关工具;
  6. 有较强的问题解决能力和创新思维,能自我驱动并独立开展研究与开发工作。
加分项
  1. 有基于主流 Agent 开源框架实操经验者优先;
  2. 有云端大型工程项目的落地经验以及优化经验者优先。

员工福利

  1. 具有竞争力的薪资;
  2. 五险一金,节假日福利;
  3. 良好的办公环境,轻松的办公氛围。

办公地址

北京市海淀区融科资讯中心

投递方式

请将您的简历发送至 jenny.luo@atlascloud.ai (邮件标题:应聘岗位+姓名),期待您的加入!

1735 次点击
所在节点    酷工作
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1184264

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX