深度学习为什么很少提了，普通开发有转大模型的可能吗

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

个人做的普通客户端开发，也了解点服务端开发，之前还学习过深度学习，之前还想转深度学习开发，买张卡还能训练调试下。但是现在的趋势是大模型火，感觉深度学习很少有人提了，都在搞大模型。

但是对于普通的开发想转大模型，是搞开发呢还是搞应用，而且大模型训练 N 张卡，也不是普通人能调试测试的呀，这块不是很了解。所以普通开发，如果没有公司提供资源，基本接触不大大模型开发吗？

现在觉的只做传统的开发感觉没有出路了，所以请教各位，如果转的话什么方向比较好

大模型

开发

方向

20 条回复 • 2026-04-10 19:13:58 +08:00

sentinelK

8 小时 49 分钟前

“普通开发有转大模型的可能吗” 不可能。
再加上你的问题，更加确定了不可能。

机器学习是算法学和计算机科学。软件开发是工程学，除了都要摸键盘以外，没半点关系。

这就像是，一个工地的搬砖工，发现卡车比他搬得快，问：搬砖感觉没有出炉了，我现在想转业界顶流建筑师，怎么做比较好？搞办公楼还是公寓楼方向？

jiangxiaoshui

8 小时 37 分钟前

现在做毛大模型啊，做大模型的应用不是发展前景更好吗？

yuedashi

8 小时 30 分钟前 via Android

@sentinelK 你都没 get 到人家的点。我一律师，想转行程序员，是完全可以啊，一些书，一台电脑就够实操了。人家的意思是，大模型你学了理论后，没训练卡，实操怎么弄？

importmeta

8 小时 27 分钟前

找一些研究生问问，在各个平台发帖问问。估计他们算力也不够。目前前沿还是在国外，我上次刷到一些帖子，在国外上学的那些人，实验室 H200 管够。

tina2998

8 小时 25 分钟前 via iPhone

我记得前几年看到有个外国老哥，也是对 llm 感兴趣，于是去读了个 master,回来说毛用没有一样只能做做应用。llm 是一大帮科学家在后面支持的，普通人就算了吧

herozzm

8 小时 24 分钟前

深度学习是人工智能 AI 前期用的词语，属于过渡词

NoobNoob030

7 小时 6 分钟前

并非很少提，机器学习（学科）->深度学习（分支）->神经网络（架构）->transformer （算法）->大模型（产出）

普通人做大模型应用可以，想做算法开发门槛高学习曲线陡峭，没有赛博天灵根不建议尝试

sentinelK

7 小时 1 分钟前

@yuedashi 你也没 get 到我的点。

1 、律师能跨到程序员，不等于程序员能跨到大模型研究员。同理，你是律师你为何跨到程序员，而不跨到最高院？

2 、想研究统计学模型，“脑补”会卡在算力，就说明他压根就没上手。

3 、目前的 AI 都是基于机器学习的统计学模型。LLM 只是其中的一个分支，深度学习、神经网络也一样。他们目前都需要配合无监督，或者说弱监督的强化学习，LLM 早就不是纯语料机器学习的时代了。

综上，说明他的问题实际是基于 0 实践、0 基础的纯空想。所以不可能。

newtype0092

6 小时 25 分钟前

智能手机这个词也很少提了，很多人只知道 Android 和 iOS 。。。

LLM 本质上还是深度学习，只是参数量大而已。

你要真想搞模型相关而不是应用，起码读个博士再说。否则就好好抓热点搞应用层，搭上这波顺风车其实也是个不错的机会。

fredweili

6 小时 24 分钟前

你不用想了，不是顶尖大学的博士，转了模型训练也干不了啥
普通人就是学怎么用好 claude code

whoosy

6 小时 23 分钟前

LLM 不也是深度学习下的分支？

wengjin456123

6 小时 19 分钟前

大模型也是深度学习，如果要搞深度学习类的工作，看你背景是客户端开发，不知道有没有硕士学位和 paper ，有的话可以先去 RA 攒点资历然后 phd ，这是比较稳妥的方式，公司就那几个，走实习/校招/社招你最起码都得有个对应的硕博经历，所以又转回去了。

gam2046

6 小时 1 分钟前

几乎不可能转，专业壁垒极高，脱产学三年，大部分人也没戏，尤其是数学基础，这个东西和计算机的关系反而没那么大。基础模型的迭代，基本上就靠科学家，而不是程序员。哪怕是模型微调，也不是一半程序员能干的。

落到计算机领域里，更多的是应用方向了，比如 AI Agent ，就更多的展示了，对于大模型的应用，编排等，比如像 openclaw 这样的工具，就是具体应用的工具，他本身并不依赖于特定的大模型。又比如像 DroidRun 这种垂类的 agent 编排。

再下游，就是做具体工作流的，比如各种自媒体吹嘘的，“三天打造一个数字分身”这种，本质上就是在编排好的 agent 上，进一步做任务特化，聚焦到某个精细的点上。

JoeDH

5 小时 21 分钟前

985 硕博+相关专业才有可能，其他就别想了

Suger828

4 小时 53 分钟前

基本别想了

lance07

3 小时 57 分钟前

何意味，现在 92 的 nlp 组普通硕士都难去大模型

Eathein

3 小时 20 分钟前

搞大模型更像是搞数学吧..

stoneabc

3 小时 11 分钟前

我觉得楼上说的太绝对了。
大模型相关开发，涉及的可太广了，从纯粹的模型算法开发，到 LLM 训推框架层开发（ vLLM 这类），再到训推系统开发（偏集群管理、任务调度、快恢等），再到应用层（ Agent 等）等等，如果你毫无经验的话，算法开发确实不用想了，但后面几种，还是可以搞一搞的，门槛没想象中那么大。

kpprotector

2 小时 32 分钟前

你没有数据啊，朋友，卡和机器都可以租，但是数据你怎么搞定？
过去 Kaggle 上一个机器学习项目十几 KB 深度学习几百 GB 到头了。

Pre-train Post-train 基本上都是十几 T token 的语料，更不用说数据清洗了。
如果没那个条件，能在有限的数据里做做微调、Agent 就很不错了。

其实微调的意义也不好评价，去年我们画了几千块微调了一个内容审核模型，效果勉强能用。
俩月之后 Qwen-Guard 出了……

sadfasdfa

1 小时 30 分钟前 via iPhone

先学会用吧，现在 AI 大模型已经层出不穷了，用 AI 都用不完