2025 年,ai ide/model 协作编程能力大幅度提升,作为后端开发,跟前端相比毫不了太多。做 ai 应用一年了,做了 rag 系统,机器学习图像识别项目,但面对核心的 ai/ml 算法设计部分不得要领。你们是如何与机器学习/ai 模型算法工程师协作以至于能承担部分工作增加核心竞争力的?
1
ranley123 3 小时 54 分钟前 via iPhone
转大模型 infra ,不过现在这个光景很难了。两年前我后端直接转大模型训练 infra 。现在已经杀得一片红海,同组算是国内最顶尖的大模型 infra 团队,进来的全是清北上交的博士,cmu 的也比比皆是。
但是现在如果实在想转,可以看看大模型相关的存储网络等等基础架构相关的,甚至 GPU 和大模型相关的 k8s 团队也行。应该能吃到一些涨幅溢价,只不过都是大厂了。 |
2
jiangbingo OP @ranley123 前外企大厂被优化,现创业小公司待着,无论是后端开发还是测试开发,经过一年多深度 vibe coding 深深的感受到传统程序员的生命周期比预期的要短。
|
3
Elietio 1 小时 30 分钟前 via Android
手头有个 NLP 的项目要做,完全零基础暂时先用 AI 干着。。。
|
4
ranley123 1 小时 19 分钟前 via iPhone
@jiangbingo 是的,我赞同你的观点。所以新时代多往 AI 和大模型靠靠,是能够延长的,甚至还有机会远程。个人经验也是如此。自从我入了 LLM infra ,至少前景和钱景上都得到了爆炸式提升
|
5
ranley123 1 小时 15 分钟前 via iPhone
@jiangbingo 外企大厂该不会是 ms 吧哈哈,如果是的话那就是前同事了。我觉得你可以学习一下大模型的原理,比如 transformer 和 attention 之类的,甚至包括一些推理的框架基本知识 kv cache 之类的,如果对训练感兴趣的话可以看看并行训练的基本框架,不过会比较困难。
|
6
ranley123 58 分钟前 via iPhone
或者自己写写 ai agent 以后找 agent 工作
|
7
richarddingcn 15 分钟前
@ranley123 ai infra 是写算子么?请教下大佬有啥学习渠道感谢🙏
|