最近写了介绍大模型推荐系统的免费课程,面向的是对推荐系统基本没了解的读者。不讲代码和算法细节,主要是通过一些操作,让读者能感知工程上推荐系统一般在做什么,集中在特征和模型,没有 ETL 数据处理和展示层。大致是这么组织的内容:
- 搜广推的区别,讲目前三个系统的融合趋势,再重点讲推荐系统,推荐系统的核心是算法,是机器学习的分支。介绍召回 - 排序 的背景,DLRM 。提供一个写好的纯演示项目,模拟商品推荐,演示系统包含最基础的 ItemCF 协同算法过滤,说明这种方法的缺陷,引入整个课程的结构。
- 从 LLM 做特征工程的最基础的 [数据增强] 开始,就是调 LLM 接口,让它返回标签,然后用 BGE 转向量,演示语义召回。
- 用评论演示 RAG ,介绍 GReaT 生成评论这种数据合成方式,让推荐商品通过 RAG 能考虑评论因素。
- 到用户塔的操作,用 LLM 根据用户行为序列,生成自然语言的用户画像。结尾演示一个 LLM 的语义重排,说明这种点对点排序的问题,引入下一章。
- 生成式推荐系统,用 LLM 目前主流的架构——混合,堆叠,生成——演示返回的 SFT 数据和 DPO 数据。
- 可解释性问题。对话式的推荐系统,考虑历史对话。
- Agent (规划、记忆、工具、行动)的推荐形式
- 测试。
因为定位是 0 基础,预设的用途比如毕设项目找一个新的方向做参考,或者刚入行的新人能大致有个宏观的了解。
想问下对推荐系统了解不多的 V 友,会觉得有什么基础的概念遗漏的吗?