[商汤/大装置] 诚邀 Rust 系统工程师共建下一代 AI 推理基础设施

2 月 8 日
 adamcavendish

Hi V2EXers 👋

我们正在构建全球最具适应性的「推理基础设施底座」——不仅服务于当下的大语言模型( LLM ),更面向未来十年的前沿模型、异构加速器( GPU/NPU/ASIC )以及符合数据主权与合规要求的部署实践。

从单节点开发集群,到横跨公有云、国家级私有云与物理隔离数据中心的多区域 GPU/NPU 异构算力舰队——大装置在「模型实际运行的位置」完成推理请求的智能路由、弹性编排与深度可观测性:保障可预期的低延迟、严苛的服务等级目标( SLO ),且彻底杜绝厂商锁定( zero vendor lock-in )。这一切,均由 Rust 实现——它足够安全,可贴近内核级系统;足够高效,能支撑微秒级关键路径;也足够表达力丰富,可精准建模全权衡:从 HTTP 头字段解析,到 RDMA 队列对( queue pair )调度。

你不会只是"胶水式对接 API"。你将与团队共同设计定义下一代大规模、生产级 AI 推理所依赖的基础设施原语( infrastructure primitives )——让推理真正变得可靠、高效、可持续演进

  • 支持跨地域与硬件代际( H200 、Ascend 910B 等)的全局网关;
  • 面向场景自适应的控制器(适配合规性、延迟敏感性或成本约束);
  • 原生集成 Kubernetes 的 Operator ,将基础设施意图( infrastructure intent )转化为可观测、自愈合的运行现实——服务于研究人员、初创公司、国家实验室,以及中国最具雄心的 AI 战略项目。

商汤/大装置 · AI 推理平台|后端工程师

后端工程师( Rust / 系统 / 基础设施方向)

🔧 你将实际构建并长期负责的核心系统

🌐 全球规模推理编排体系

• 全局网关层( Global Gateway Layer )

基于 pingora 自研高吞吐、低延迟 Rust HTTP 反向代理与智能路由系统:

• 场景专用轻量网关( Scenario-Specific Gateways )

为不同推理模态( LLM 、ASR 、TTS 、OCR 、向量嵌入、重排序、视觉-语言多模态等)定制嵌入式 HTTP 适配器:

• 跨集群服务发现与健康网格( Cross-Cluster Service Discovery & Health Meshing )

深度集成 Kubernetes Endpoints / EndpointSlices / Service APIs,并通过 eBPF 实现毫秒级、业务感知的存活探针( liveness probe ):动态加权路由决策依据包括——实时 token 吞吐量、GPU 显存压力、RDMA/PCIe 互连带宽饱和度等真实负载信号。

⚙️ 基础设施原语(而非抽象封装)

• 微批调度器( Micro-batch Scheduler )

跨硬件部署单元(单机 / 集群 / 跨云)进行智能负载均衡——不依赖传统 CPU/内存指标,而是基于推理引擎反馈的深层 telemetry:请求队列积压率、PCIe 总线带宽利用率、NCCL Ring 健康状态等。

• Token 成本归因管道( Cost-per-Token Attribution Pipeline )

将请求元数据(租户 ID 、模型名称、部署区域、SLA 等级)与底层硬件指标( GPU 显存带宽、DRAM 访问周期、NIC 卸载使用率)精确关联,实现细粒度、可审计的资源成本核算。

🧱 全栈所有权( Cross-Stack Ownership )

与 GPU/NPU 内核与固件团队协同:针对特定模型优化 CUDA/Ascend Kernel 、调优 NCCL 集体通信、加固基于 eBPF 的可观测性模块——因为推理可靠性始于运行时( runtime )之下。

🛡️ 可靠性即代码( Reliability as Code )

📈 复利型工程素养( Engineering Posture That Compounds )

✨ 我们寻找的人——不是"完美匹配 JD 的人",而是"能重新定义问题的人"

✅ 你进化迅速,且刻意为之

✅ 你以基础设施思维思考,以协作者姿态行动

✅ 你对结果负责,而非仅对任务负责

🎯 我们珍视什么?又不看重什么?

🔷 我们极度重视:

❌ 我们不筛选:

⚡ 加分项(非必需,但会让你脱颖而出)

🌟 这不是一个职位——这是一次基础设施的共同创造

在大装置,你不会"支持"AI 推理——你将参与重新定义"生产级 AI 推理基础设施"的内涵:跨越硬件、软件、地理与应用场景。

你将参与决策:

如果你相信:卓越的 AI 基础设施,必须由通晓内核、分布式系统、Kubernetes 控制平面与监管边界的通才型工程师来构建;
如果你渴望以充分的技术自主权、真实的业务影响力、零历史技术债务的方式打造下一代 AI 底座——
我们诚挚邀请你加入这场基础设施的共同创造。


📌 请随申请附上:

3048 次点击
所在节点    酷工作
17 条回复
adamcavendish
2 月 8 日
想要邮箱投递的也可以联系: yangyang18@sensetime.com
Grapevine
2 月 9 日
请问有前端 HC 嘛
adamcavendish
2 月 9 日
@Grapevine 应该是有的,可以发邮件给我,我问问前端组
enrolls
2 月 9 日
举手试试,虽然 Python 才是我 powerful ,不过最近有看 cf 的 pingora ,而且 rust 优化了我 Python 的好多东西,譬如 geoip 的 search ,Loyalsoldier/geoip 的版本产出文件还是大了。rust + python 协助我完成 中国地址的标准化,顺便 支持了 ISO 3166 和相关抽象的
coefu
2 月 9 日
80%的 v2exer 可能看不懂你的 jd 。😄
adamcavendish
2 月 9 日
@enrolls 要不要邮件或者官网投递一下
adamcavendish
2 月 9 日
@coefu 不至于不至于,我们只是抛砖引玉
coefu
2 月 10 日
@adamcavendish #7 完全匹配条件的,不会超过 2 位数。
一则 rust 拦住一波,二则熟悉 ML 底层工程实现的拦住一波,三则 k8s 深入到 operator 能力的拦住一波,四则 sys 内核底层拦住一波,五则可能还得从 ML 原理层面有所理解才能有真正的性能剖析优化的能力。这五个条件一筛,还能有几个人能达到条件?
就不要说 V2EX 上 80%都是搞 web 前后端的了。
simohayha
2 月 10 日
@adamcavendish 咨询两个问题,1 base 只能北京? 2 年龄有限制吗?
soulseen
2 月 10 日
看似是一个岗位,可能其实是 5 个岗位
adamcavendish
2 月 10 日
@simohayha base 可聊的,年龄没有特别限制
freemoon
2 月 10 日
@coefu 还不至于,基本高级后端都能看懂,只是大多没有这方面的实操经验。确实是一份理想的 infra job ,但要求也是是实打实的。
特别是,不筛选学历年限和公司,真的满足了我对提供高级 IC 岗位的公司的所有憧憬,祝公司越来越好!!!
flynnlemon
2 月 11 日
这个 hc 招人的要求,我觉得太高了,整个字节 maas 能搞明白这套的不超过 5 个人,把整个 seed infra 和业务线上的藏龙卧虎的哥们都加上也不会超过 10 个人
coefu
2 月 11 日
@flynnlemon 有点眼力。
flynnlemon
2 月 12 日
@coefu 这种知识没法闭门造车出来,都得实际踩过坑,小厂没有这种踩坑机会,大厂里面想要这么全栈化的 ai infra 视角,需要牵扯的上下游又特别多,至少要 3-1 以上并且还在一线干活的 IC 才有可能。既要方向契合,又要 31 以上,又要一线干活动手能力强,这种人太少了。
mastertsx
2 月 12 日
终于看到一个和自己过往技术栈吻合的职位,想了解工作地点有限制吗?人在广州,去不了其他城市。
adamcavendish
2 月 13 日
@mastertsx 可聊,不过广州我们的确暂时没有人

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1191550

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX