个人做的普通客户端开发,也了解点服务端开发,之前还学习过深度学习,之前还想转深度学习开发,买张卡还能训练调试下。但是现在的趋势是大模型火,感觉深度学习很少有人提了,都在搞大模型。
但是对于普通的开发想转大模型,是搞开发呢还是搞应用,而且大模型训练 N 张卡,也不是普通人能调试测试的呀, 这块不是很了解。所以普通开发,如果没有公司提供资源,基本接触不大大模型开发吗?
现在觉的只做传统的开发感觉没有出路了,所以请教各位,如果转的话什么方向比较好
1
sentinelK 8 小时 49 分钟前 “普通开发有转大模型的可能吗” 不可能。
再加上你的问题,更加确定了不可能。 机器学习是算法学和计算机科学。软件开发是工程学,除了都要摸键盘以外,没半点关系。 这就像是,一个工地的搬砖工,发现卡车比他搬得快,问:搬砖感觉没有出炉了,我现在想转业界顶流建筑师,怎么做比较好?搞办公楼还是公寓楼方向? |
2
jiangxiaoshui 8 小时 37 分钟前
现在做毛大模型啊,做大模型的应用不是发展前景更好吗?
|
3
yuedashi 8 小时 30 分钟前 via Android
@sentinelK 你都没 get 到人家的点。我一律师,想转行程序员,是完全可以啊,一些书,一台电脑就够实操了。人家的意思是,大模型你学了理论后,没训练卡,实操怎么弄?
|
4
importmeta 8 小时 27 分钟前
找一些研究生问问,在各个平台发帖问问。估计他们算力也不够。目前前沿还是在国外,我上次刷到一些帖子,在国外上学的那些人,实验室 H200 管够。
|
5
tina2998 8 小时 25 分钟前 via iPhone
我记得前几年看到有个外国老哥,也是对 llm 感兴趣,于是去读了个 master,回来说毛用没有一样只能做做应用。llm 是一大帮科学家在后面支持的,普通人就算了吧
|
6
herozzm 8 小时 24 分钟前
深度学习是人工智能 AI 前期用的词语,属于过渡词
|
7
NoobNoob030 7 小时 6 分钟前
并非很少提,机器学习(学科)->深度学习(分支)->神经网络(架构)->transformer (算法)->大模型(产出)
普通人做大模型应用可以,想做算法开发门槛高学习曲线陡峭,没有赛博天灵根不建议尝试 |
8
sentinelK 7 小时 1 分钟前 @yuedashi 你也没 get 到我的点。
1 、律师能跨到程序员,不等于程序员能跨到大模型研究员。同理,你是律师你为何跨到程序员,而不跨到最高院? 2 、想研究统计学模型,“脑补”会卡在算力,就说明他压根就没上手。 3 、目前的 AI 都是基于机器学习的统计学模型。LLM 只是其中的一个分支,深度学习、神经网络也一样。他们目前都需要配合无监督,或者说弱监督的强化学习,LLM 早就不是纯语料机器学习的时代了。 综上,说明他的问题实际是基于 0 实践、0 基础的纯空想。所以不可能。 |
9
newtype0092 6 小时 25 分钟前 智能手机这个词也很少提了,很多人只知道 Android 和 iOS 。。。
LLM 本质上还是深度学习,只是参数量大而已。 你要真想搞模型相关而不是应用,起码读个博士再说。否则就好好抓热点搞应用层,搭上这波顺风车其实也是个不错的机会。 |
10
fredweili 6 小时 24 分钟前
你不用想了,不是顶尖大学的博士,转了模型训练也干不了啥
普通人就是学怎么用好 claude code |
11
whoosy 6 小时 23 分钟前
LLM 不也是深度学习下的分支?
|
12
wengjin456123 6 小时 19 分钟前
大模型也是深度学习,如果要搞深度学习类的工作,看你背景是客户端开发,不知道有没有硕士学位和 paper ,有的话可以先去 RA 攒点资历然后 phd ,这是比较稳妥的方式,公司就那几个,走实习/校招/社招你最起码都得有个对应的硕博经历,所以又转回去了。
|
13
gam2046 6 小时 1 分钟前
几乎不可能转,专业壁垒极高,脱产学三年,大部分人也没戏,尤其是数学基础,这个东西和计算机的关系反而没那么大。基础模型的迭代,基本上就靠科学家,而不是程序员。哪怕是模型微调,也不是一半程序员能干的。
落到计算机领域里,更多的是应用方向了,比如 AI Agent ,就更多的展示了,对于大模型的应用,编排等,比如像 openclaw 这样的工具,就是具体应用的工具,他本身并不依赖于特定的大模型。又比如像 DroidRun 这种垂类的 agent 编排。 再下游,就是做具体工作流的,比如各种自媒体吹嘘的,“三天打造一个数字分身”这种,本质上就是在编排好的 agent 上,进一步做任务特化,聚焦到某个精细的点上。 |
14
JoeDH 5 小时 21 分钟前
985 硕博+相关专业才有可能,其他就别想了
|
15
Suger828 4 小时 53 分钟前
基本别想了
|
16
lance07 3 小时 57 分钟前
何意味,现在 92 的 nlp 组普通硕士都难去大模型
|
17
Eathein 3 小时 20 分钟前
搞大模型更像是搞数学吧..
|
18
stoneabc 3 小时 11 分钟前
我觉得楼上说的太绝对了。
大模型相关开发,涉及的可太广了,从纯粹的模型算法开发,到 LLM 训推框架层开发( vLLM 这类),再到训推系统开发(偏集群管理、任务调度、快恢等),再到应用层( Agent 等)等等,如果你毫无经验的话,算法开发确实不用想了,但后面几种,还是可以搞一搞的,门槛没想象中那么大。 |
19
kpprotector 2 小时 32 分钟前
你没有数据啊,朋友,卡和机器都可以租,但是数据你怎么搞定?
过去 Kaggle 上一个机器学习项目十几 KB 深度学习几百 GB 到头了。 Pre-train Post-train 基本上都是十几 T token 的语料,更不用说数据清洗了。 如果没那个条件,能在有限的数据里做做微调、Agent 就很不错了。 其实微调的意义也不好评价,去年我们画了几千块微调了一个内容审核模型,效果勉强能用。 俩月之后 Qwen-Guard 出了…… |
20
sadfasdfa 1 小时 30 分钟前 via iPhone
先学会用吧,现在 AI 大模型已经层出不穷了,用 AI 都用不完
|