希望行业内前辈指导:
1
tcper 14 小时 20 分钟前
最早期那几篇 transformer 都读不懂?
不过也没事,毕竟不是每个人都要去研发新模型的,你把大模型基本原理搞清楚了,在大厂里负责洗数据,训练,也没啥问题吧 |
2
icchux OP @tcper 是的。。。不知道是刚开始读的原因,看到一篇文章就很难都进去,不知道在讲啥,之前老师给了一篇 LeNET-5 的文章,也是读了好长时间。至于研发新模型这个没想过,能在大厂负责训练模型调参啥的就不错了。
|
3
coefu 12 小时 6 分钟前
又是人工智能,又是大模型发展方向。你要顺利毕业就找导师给个课题,按照导师的思路搞出来。要整自己的想法,还得沉淀几年先。能力是一回事,毕业和找工作又是另外一回事。
btw ,LLM 还能撑多久都是未知的,并且果实越来越难摘了,加之大家都蜂拥而入,你这个入场时机导致你在读的时候不一定有资源能搞出什么新东西(动不动就万卡集群才可能整出点儿新花样)。 还不如找个小众没什么人关注的领域,先整出点能毕业的先。 |
4
Fastmail 8 小时 54 分钟前
放弃吧,llm 作为扩展知识算是加分项,你既不是科班也没有论文或者成果你想找到开发工作难上加难
(我就是公司转型从数开到大模型开发,大模型市场已经饱和,已提离职下份工作还是找数开 |
7
tickingMachine 6 小时 11 分钟前
AI 应用开发还是挺有前景的,即便模型能力现在这么强了依然没有“chatgpt”级别的 Agent 产品落地,另外其实很多中小型公司的业务场景中还有很多可以靠接入 AI (大模型/非 LLM 的小模型)来转型提效的需求。
最后还有一个方向就是 AI infra ,比如底层硬件,以及 AI app 的 infra (开发框架等) |