V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
devzhaoyou
V2EX  ›  职场话题

深度学习为什么很少提了,普通开发有转大模型的可能吗

  •  
  •   devzhaoyou · 9 小时 23 分钟前 · 2207 次点击

    个人做的普通客户端开发,也了解点服务端开发,之前还学习过深度学习,之前还想转深度学习开发,买张卡还能训练调试下。但是现在的趋势是大模型火,感觉深度学习很少有人提了,都在搞大模型。

    但是对于普通的开发想转大模型,是搞开发呢还是搞应用,而且大模型训练 N 张卡,也不是普通人能调试测试的呀, 这块不是很了解。所以普通开发,如果没有公司提供资源,基本接触不大大模型开发吗?

    现在觉的只做传统的开发感觉没有出路了,所以请教各位,如果转的话什么方向比较好

    20 条回复    2026-04-10 19:13:58 +08:00
    sentinelK
        1
    sentinelK  
       8 小时 49 分钟前   ❤️ 1
    “普通开发有转大模型的可能吗” 不可能。
    再加上你的问题,更加确定了不可能。

    机器学习是算法学和计算机科学。软件开发是工程学,除了都要摸键盘以外,没半点关系。

    这就像是,一个工地的搬砖工,发现卡车比他搬得快,问:搬砖感觉没有出炉了,我现在想转业界顶流建筑师,怎么做比较好?搞办公楼还是公寓楼方向?
    jiangxiaoshui
        2
    jiangxiaoshui  
       8 小时 37 分钟前
    现在做毛大模型啊,做大模型的应用不是发展前景更好吗?
    yuedashi
        3
    yuedashi  
       8 小时 30 分钟前 via Android
    @sentinelK 你都没 get 到人家的点。我一律师,想转行程序员,是完全可以啊,一些书,一台电脑就够实操了。人家的意思是,大模型你学了理论后,没训练卡,实操怎么弄?
    importmeta
        4
    importmeta  
       8 小时 27 分钟前
    找一些研究生问问,在各个平台发帖问问。估计他们算力也不够。目前前沿还是在国外,我上次刷到一些帖子,在国外上学的那些人,实验室 H200 管够。
    tina2998
        5
    tina2998  
       8 小时 25 分钟前 via iPhone
    我记得前几年看到有个外国老哥,也是对 llm 感兴趣,于是去读了个 master,回来说毛用没有一样只能做做应用。llm 是一大帮科学家在后面支持的,普通人就算了吧
    herozzm
        6
    herozzm  
       8 小时 24 分钟前
    深度学习是人工智能 AI 前期用的词语,属于过渡词
    NoobNoob030
        7
    NoobNoob030  
       7 小时 6 分钟前
    并非很少提,机器学习(学科)->深度学习(分支)->神经网络(架构)->transformer (算法)->大模型(产出)

    普通人做大模型应用可以,想做算法开发门槛高学习曲线陡峭,没有赛博天灵根不建议尝试
    sentinelK
        8
    sentinelK  
       7 小时 1 分钟前   ❤️ 3
    @yuedashi 你也没 get 到我的点。

    1 、律师能跨到程序员,不等于程序员能跨到大模型研究员。同理,你是律师你为何跨到程序员,而不跨到最高院?

    2 、想研究统计学模型,“脑补”会卡在算力,就说明他压根就没上手。

    3 、目前的 AI 都是基于机器学习的统计学模型。LLM 只是其中的一个分支,深度学习、神经网络也一样。他们目前都需要配合无监督,或者说弱监督的强化学习,LLM 早就不是纯语料机器学习的时代了。

    综上,说明他的问题实际是基于 0 实践、0 基础的纯空想。所以不可能。
    newtype0092
        9
    newtype0092  
       6 小时 25 分钟前   ❤️ 1
    智能手机这个词也很少提了,很多人只知道 Android 和 iOS 。。。

    LLM 本质上还是深度学习,只是参数量大而已。

    你要真想搞模型相关而不是应用,起码读个博士再说。否则就好好抓热点搞应用层,搭上这波顺风车其实也是个不错的机会。
    fredweili
        10
    fredweili  
       6 小时 24 分钟前
    你不用想了,不是顶尖大学的博士,转了模型训练也干不了啥
    普通人就是学怎么用好 claude code
    whoosy
        11
    whoosy  
       6 小时 23 分钟前
    LLM 不也是深度学习下的分支?
    wengjin456123
        12
    wengjin456123  
       6 小时 19 分钟前
    大模型也是深度学习,如果要搞深度学习类的工作,看你背景是客户端开发,不知道有没有硕士学位和 paper ,有的话可以先去 RA 攒点资历然后 phd ,这是比较稳妥的方式,公司就那几个,走实习/校招/社招你最起码都得有个对应的硕博经历,所以又转回去了。
    gam2046
        13
    gam2046  
       6 小时 1 分钟前
    几乎不可能转,专业壁垒极高,脱产学三年,大部分人也没戏,尤其是数学基础,这个东西和计算机的关系反而没那么大。基础模型的迭代,基本上就靠科学家,而不是程序员。哪怕是模型微调,也不是一半程序员能干的。

    落到计算机领域里,更多的是应用方向了,比如 AI Agent ,就更多的展示了,对于大模型的应用,编排等,比如像 openclaw 这样的工具,就是具体应用的工具,他本身并不依赖于特定的大模型。又比如像 DroidRun 这种垂类的 agent 编排。

    再下游,就是做具体工作流的,比如各种自媒体吹嘘的,“三天打造一个数字分身”这种,本质上就是在编排好的 agent 上,进一步做任务特化,聚焦到某个精细的点上。
    JoeDH
        14
    JoeDH  
       5 小时 21 分钟前
    985 硕博+相关专业才有可能,其他就别想了
    Suger828
        15
    Suger828  
       4 小时 53 分钟前
    基本别想了
    lance07
        16
    lance07  
       3 小时 57 分钟前
    何意味,现在 92 的 nlp 组普通硕士都难去大模型
    Eathein
        17
    Eathein  
       3 小时 20 分钟前
    搞大模型更像是搞数学吧..
    stoneabc
        18
    stoneabc  
       3 小时 11 分钟前
    我觉得楼上说的太绝对了。
    大模型相关开发,涉及的可太广了,从纯粹的模型算法开发,到 LLM 训推框架层开发( vLLM 这类),再到训推系统开发(偏集群管理、任务调度、快恢等),再到应用层( Agent 等)等等,如果你毫无经验的话,算法开发确实不用想了,但后面几种,还是可以搞一搞的,门槛没想象中那么大。
    kpprotector
        19
    kpprotector  
       2 小时 32 分钟前
    你没有数据啊,朋友,卡和机器都可以租,但是数据你怎么搞定?
    过去 Kaggle 上一个机器学习项目十几 KB 深度学习几百 GB 到头了。

    Pre-train Post-train 基本上都是十几 T token 的语料,更不用说数据清洗了。
    如果没那个条件,能在有限的数据里做做微调、Agent 就很不错了。

    其实微调的意义也不好评价,去年我们画了几千块微调了一个内容审核模型,效果勉强能用。
    俩月之后 Qwen-Guard 出了……
    sadfasdfa
        20
    sadfasdfa  
       1 小时 30 分钟前 via iPhone
    先学会用吧,现在 AI 大模型已经层出不穷了,用 AI 都用不完
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2770 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 41ms · UTC 12:44 · PVG 20:44 · LAX 05:44 · JFK 08:44
    ♥ Do have faith in what you're doing.