高薪内推|高性能计算工程师、大模型推理引擎研发工程师

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

• 外包信息请发到 /go/outsourcing 节点。

• 不要把相同的信息发到不同的节点

这是一个创建于 118 天前的主题，其中的信息可能已经有所发展或是发生改变。

base 上海，GPU 设计公司，不卷不加班，弹性工作不打卡，含中晚饭，补充公积金，交通补贴，每年节假日有礼金。
如果遇到合适的可以 V 我，我帮你走内推渠道~
V:TWFyaW5hXzEwOQ== (可联系）
[高性能计算工程师]

岗位职责：

1. 研发高质量的芯片基础软件栈，包括支撑大语言模型在内的深度学习，线性代数，科学计算，信号处理等方向的基础加速库；

2. 分析重要的性能指标，调优已有软件算法，并且对未来的软件进行优化和提升；

3. 和硬件/应用的同事协同工作，一起对大语言模型，CV 模型，语音模型，推荐系统，科学计算和其他相关并行算法领域进行分析和优化；

4. 负责 AI 模型推理/训练的端到端性能整体优化；

5. 实现 AI/科学计算领域在 GPGPU 上的最新算法和最佳实践；

6. 负责包括分子动力学、气象、量子力学等科学计算领域最新 AI 科学算法和传统算法在 GPGPU 上的实现和优化。

任职要求：

1. 熟悉 C++编程，了解常用数据结构及算法；

2. 熟悉线性代数，科学计算，机器学习，深度学习，AI 算法等一个或多个领域；

3. 熟悉 GPU 或 AI 加速芯片的体系结构，有过在不同架构芯片上的算法调优经验；

4. 熟悉并行算法优化的基本技巧，有对算法性能进行分析和优化的经验；

5. 熟悉计算机体系结构，操作系统；

6. 以下情况优先：

（ 1 ） GPU 的编程和优化经验，e.g. CUDA or OpenCL ；

（ 2 ）有过机器学习方面的开发经验，尤其是深度学习，熟悉 Tensorflow, Pytorch, TensorRT 等框架/引擎的原理和使用方法；

（ 3 ）有过视觉/大语言模型的开发和调优经验，熟悉 CNN/Transformer 等网络的性能瓶颈和优化方向，能够把握相关领域的国际前沿发展趋势；

（ 4 ）有过数据科学，统计科学，图像处理，信号处理等方面的开发和优化经历；

（ 5 ）有软硬件协同优化、基于异构硬件的软件开发经验者优先；

（ 6 ）了解微分方程求解的基本流程以及在 GPU 上优化的经验。有分子动力学、气象、以及量子力学等某一科学计算领域 AI 模型或者传统计算模型的开发经验。

[大模型推理引擎研发工程师]
岗位职责：

负责天数大模型推理技术的探索与研发，提升大模型在天数 GPGPU 上的推理性能：

1. 负责大模型推理引擎的架构设计与实现；

2. 负责大模型 server 的架构设计与实现；

3. 负责大模型推理通信库的设计及算法实现；

4. 负责大模型相关算子的实现及推理性能的整体优化；

5. 调研并支持大模型前沿算法；

任职资格：

编程基础（必须）：

1. 熟悉 Python/C++ 编程（ 11 标准及以上），了解常用数据结构及设计模式；

2. 熟悉深度学习编程框架，能够使用 PyTorch 构建大模型推理 pipeline 并对模型中的核心模块进行高效实现；

3. 熟悉 CUDA 编程，了解常见算子的实现及优化手段；

大模型推理技术（至少满足两项）：

1. 有 vLLM 、TGI 、SGLang 、TensorRT-LLM 等大模型推理框架的使用或优化经验；

2. 了解 FlashAttention 、PagedAttention 、MoE 、Chunked Prefill 等大模型核心技术；

3. 了解常见的大模型量化算法（如 AWQ 、GPTQ 、SmoothQuant 等）及量化算子的实现；

4. 了解大模型通信算子（如 Allreduce 等）及计算通信 overlap 实现；

5. 有分离式部署（ PD 分离）开发经验。

目前尚无回复

高性能计算 GPU 深度学习