V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
troycheng
V2EX  ›  酷工作

[北京]推理优化相关职位招聘(关键词 CUDA/Triton/trt/量化/压缩/蒸馏)

  •  
  •   troycheng · 265 天前 · 979 次点击
    这是一个创建于 265 天前的主题,其中的信息可能已经有所发展或是发生改变。
    长期招聘,需要有相关经验,有意请站内联系或邮件到 [email protected]

    职位描述:
    1. 支持搜索/OCR/NLP 等各方向算法模块的落地和优化
    2. 方向一:负责深度模型性能优化,提升大规模在线推理集群的吞吐,降低时延,保证在线服务可用性;
    3. 方向二:负责分布式模型训练框架的开发和优化,提升整体训练流程的效率
    4. 方向三:负责 LLM 大模型推理/训练优化

    职位要求:
    1. 熟悉 linux 环境,熟悉 C/C++和 Python ,熟悉 GPU 体系结构
    2. 熟悉至少一种推理引擎,有引擎/算子开发部署经验,如 TensorRT/OpenPPL/TVM/AITemplate 等
    3. 熟悉 Pytorch 等常用训练平台,熟悉 OpenMMLab/HuggingFace 等算法模型池,有实际应用经验

    加分项:
    1. 有 CUDA 编程经验优先
    2. 有推理服务实际部署和优化经验优先
    3. 熟悉 ONNX 、TorchScript 等模型转换格式优先
    4. 熟悉模型量化、蒸馏、剪枝等压缩方法,有相关应用经验者优先
    3 条回复    2023-08-10 11:15:07 +08:00
    israinbow
        1
    israinbow  
       265 天前 via Android
    招聘时请尽量给出薪酬范围
    1oscar
        2
    1oscar  
       263 天前
    还有公司也不说,这是猎头吧
    tsubin
        3
    tsubin  
       263 天前
    而且工作技术方向和技术要求写得太全面了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3116 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 13:38 · PVG 21:38 · LAX 06:38 · JFK 09:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.