[北京]推理优化相关职位招聘(关键词 CUDA/Triton/trt/量化/压缩/蒸馏)

281 天前
 troycheng
长期招聘,需要有相关经验,有意请站内联系或邮件到 514700125@qq.com

职位描述:
1. 支持搜索/OCR/NLP 等各方向算法模块的落地和优化
2. 方向一:负责深度模型性能优化,提升大规模在线推理集群的吞吐,降低时延,保证在线服务可用性;
3. 方向二:负责分布式模型训练框架的开发和优化,提升整体训练流程的效率
4. 方向三:负责 LLM 大模型推理/训练优化

职位要求:
1. 熟悉 linux 环境,熟悉 C/C++和 Python ,熟悉 GPU 体系结构
2. 熟悉至少一种推理引擎,有引擎/算子开发部署经验,如 TensorRT/OpenPPL/TVM/AITemplate 等
3. 熟悉 Pytorch 等常用训练平台,熟悉 OpenMMLab/HuggingFace 等算法模型池,有实际应用经验

加分项:
1. 有 CUDA 编程经验优先
2. 有推理服务实际部署和优化经验优先
3. 熟悉 ONNX 、TorchScript 等模型转换格式优先
4. 熟悉模型量化、蒸馏、剪枝等压缩方法,有相关应用经验者优先
1007 次点击
所在节点    酷工作
3 条回复
israinbow
281 天前
招聘时请尽量给出薪酬范围
1oscar
280 天前
还有公司也不说,这是猎头吧
tsubin
280 天前
而且工作技术方向和技术要求写得太全面了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/963451

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX