V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
zeng207
V2EX  ›  酷工作

高薪内推|高性能计算工程师、大模型推理引擎研发工程师

  •  
  •   zeng207 · 8 天前 · 1550 次点击
    base 上海,GPU 设计公司,不卷不加班,弹性工作不打卡,含中晚饭,补充公积金,交通补贴,每年节假日有礼金。
    如果遇到合适的可以 V 我,我帮你走内推渠道~
    V:TWFyaW5hXzEwOQ== (可联系)
    [高性能计算工程师]

    岗位职责:

    1. 研发高质量的芯片基础软件栈,包括支撑大语言模型在内的深度学习,线性代数,科学计算,信号处理等方向的基础加速库;

    2. 分析重要的性能指标,调优已有软件算法,并且对未来的软件进行优化和提升;

    3. 和硬件/应用的同事协同工作,一起对大语言模型,CV 模型,语音模型,推荐系统,科学计算和其他相关并行算法领域进行分析和优化;

    4. 负责 AI 模型推理/训练的端到端性能整体优化;

    5. 实现 AI/科学计算领域在 GPGPU 上的最新算法和最佳实践;

    6. 负责包括分子动力学、气象、量子力学等科学计算领域最新 AI 科学算法和传统算法在 GPGPU 上的实现和优化。



    任职要求:

    1. 熟悉 C++编程,了解常用数据结构及算法;

    2. 熟悉线性代数,科学计算,机器学习,深度学习,AI 算法等一个或多个领域;

    3. 熟悉 GPU 或 AI 加速芯片的体系结构,有过在不同架构芯片上的算法调优经验;

    4. 熟悉并行算法优化的基本技巧,有对算法性能进行分析和优化的经验;

    5. 熟悉计算机体系结构,操作系统;

    6. 以下情况优先:

    ( 1 ) GPU 的编程和优化经验,e.g. CUDA or OpenCL ;

    ( 2 )有过机器学习方面的开发经验,尤其是深度学习,熟悉 Tensorflow, Pytorch, TensorRT 等框架/引擎的原理和使用方法;

    ( 3 )有过视觉/大语言模型的开发和调优经验,熟悉 CNN/Transformer 等网络的性能瓶颈和优化方向,能够把握相关领域的国际前沿发展趋势;

    ( 4 )有过数据科学,统计科学,图像处理,信号处理等方面的开发和优化经历;

    ( 5 )有软硬件协同优化、基于异构硬件的软件开发经验者优先;

    ( 6 )了解微分方程求解的基本流程以及在 GPU 上优化的经验。有分子动力学、气象、以及量子力学等某一科学计算领域 AI 模型或者传统计算模型的开发经验。


    [大模型推理引擎研发工程师]
    岗位职责:

    负责天数大模型推理技术的探索与研发,提升大模型在天数 GPGPU 上的推理性能:

    1. 负责大模型推理引擎的架构设计与实现;

    2. 负责大模型 server 的架构设计与实现;

    3. 负责大模型推理通信库的设计及算法实现;

    4. 负责大模型相关算子的实现及推理性能的整体优化;

    5. 调研并支持大模型前沿算法;

    任职资格:

    编程基础(必须):

    1. 熟悉 Python/C++ 编程( 11 标准及以上),了解常用数据结构及设计模式;

    2. 熟悉深度学习编程框架,能够使用 PyTorch 构建大模型推理 pipeline 并对模型中的核心模块进行高效实现;

    3. 熟悉 CUDA 编程,了解常见算子的实现及优化手段;

    大模型推理技术(至少满足两项):

    1. 有 vLLM 、TGI 、SGLang 、TensorRT-LLM 等大模型推理框架的使用或优化经验;

    2. 了解 FlashAttention 、PagedAttention 、MoE 、Chunked Prefill 等大模型核心技术;

    3. 了解常见的大模型量化算法(如 AWQ 、GPTQ 、SmoothQuant 等)及量化算子的实现;

    4. 了解大模型通信算子(如 Allreduce 等)及计算通信 overlap 实现;

    5. 有分离式部署( PD 分离)开发经验。
    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   942 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 21ms · UTC 21:49 · PVG 05:49 · LAX 14:49 · JFK 17:49
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.