学习大模型算法,针对面试,大佬有什么方法或者资料可以分享一下吗

192 天前
 gewuzhizhi

本人目前从事大模型工作,8 个月之前从后端工程转到做大模型,目前大模型相关技能都掌握,但是停留在操作层面,原理掌握的很浅,如果面试大模型算法岗位,有哪些方法或者资料,求大佬们分享

1816 次点击
所在节点    程序员
4 条回复
metmit
192 天前
大佬,怎么转的,自己做项目、还是公司内部给的机会?
metmit
192 天前
https://www.v2ex.com/t/1110790?p=1#;
这个帖八楼有分享
yukino
192 天前
读读基础论文 Attention is all you need
再看看简单代码 nanoGPT
之后就看看 sparse attention 跟强化学习吧
gewuzhizhi
190 天前
@metmit 自己换方向找的,现在做大模型的工程方向。但是算法做的 stf 啥的都会操作,我就想针对面试学习一下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1115032

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX