首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
• 外包信息请发到
/go/outsourcing
节点。
• 不要把相同的信息发到不同的节点
V2EX
›
酷工作
高薪内推|高性能计算工程师、大模型推理引擎研发工程师
zeng207
·
8 天前
· 1550 次点击
base 上海,GPU 设计公司,不卷不加班,弹性工作不打卡,含中晚饭,补充公积金,交通补贴,每年节假日有礼金。
如果遇到合适的可以 V 我,我帮你走内推渠道~
V:TWFyaW5hXzEwOQ== (可联系)
[高性能计算工程师]
岗位职责:
1. 研发高质量的芯片基础软件栈,包括支撑大语言模型在内的深度学习,线性代数,科学计算,信号处理等方向的基础加速库;
2. 分析重要的性能指标,调优已有软件算法,并且对未来的软件进行优化和提升;
3. 和硬件/应用的同事协同工作,一起对大语言模型,CV 模型,语音模型,推荐系统,科学计算和其他相关并行算法领域进行分析和优化;
4. 负责 AI 模型推理/训练的端到端性能整体优化;
5. 实现 AI/科学计算领域在 GPGPU 上的最新算法和最佳实践;
6. 负责包括分子动力学、气象、量子力学等科学计算领域最新 AI 科学算法和传统算法在 GPGPU 上的实现和优化。
任职要求:
1. 熟悉 C++编程,了解常用数据结构及算法;
2. 熟悉线性代数,科学计算,机器学习,深度学习,AI 算法等一个或多个领域;
3. 熟悉 GPU 或 AI 加速芯片的体系结构,有过在不同架构芯片上的算法调优经验;
4. 熟悉并行算法优化的基本技巧,有对算法性能进行分析和优化的经验;
5. 熟悉计算机体系结构,操作系统;
6. 以下情况优先:
( 1 ) GPU 的编程和优化经验,e.g. CUDA or OpenCL ;
( 2 )有过机器学习方面的开发经验,尤其是深度学习,熟悉 Tensorflow, Pytorch, TensorRT 等框架/引擎的原理和使用方法;
( 3 )有过视觉/大语言模型的开发和调优经验,熟悉 CNN/Transformer 等网络的性能瓶颈和优化方向,能够把握相关领域的国际前沿发展趋势;
( 4 )有过数据科学,统计科学,图像处理,信号处理等方面的开发和优化经历;
( 5 )有软硬件协同优化、基于异构硬件的软件开发经验者优先;
( 6 )了解微分方程求解的基本流程以及在 GPU 上优化的经验。有分子动力学、气象、以及量子力学等某一科学计算领域 AI 模型或者传统计算模型的开发经验。
[大模型推理引擎研发工程师]
岗位职责:
负责天数大模型推理技术的探索与研发,提升大模型在天数 GPGPU 上的推理性能:
1. 负责大模型推理引擎的架构设计与实现;
2. 负责大模型 server 的架构设计与实现;
3. 负责大模型推理通信库的设计及算法实现;
4. 负责大模型相关算子的实现及推理性能的整体优化;
5. 调研并支持大模型前沿算法;
任职资格:
编程基础(必须):
1. 熟悉 Python/C++ 编程( 11 标准及以上),了解常用数据结构及设计模式;
2. 熟悉深度学习编程框架,能够使用 PyTorch 构建大模型推理 pipeline 并对模型中的核心模块进行高效实现;
3. 熟悉 CUDA 编程,了解常见算子的实现及优化手段;
大模型推理技术(至少满足两项):
1. 有 vLLM 、TGI 、SGLang 、TensorRT-LLM 等大模型推理框架的使用或优化经验;
2. 了解 FlashAttention 、PagedAttention 、MoE 、Chunked Prefill 等大模型核心技术;
3. 了解常见的大模型量化算法(如 AWQ 、GPTQ 、SmoothQuant 等)及量化算子的实现;
4. 了解大模型通信算子(如 Allreduce 等)及计算通信 overlap 实现;
5. 有分离式部署( PD 分离)开发经验。
目前尚无回复
高性能计算
GPU
深度学习
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
942 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 21ms ·
UTC 21:49
·
PVG 05:49
·
LAX 14:49
·
JFK 17:49
Developed with
CodeLauncher
♥ Do have faith in what you're doing.
❯