基于 ai 开发推荐系统的可行性?

237 天前
 hahaha121

假设有 10W 的用户数据,每天浏览新闻,是否是可以通过把用户的 id 和用户看过的新闻记录给过去,然 ai 自动分析用户对那些种类的新闻更感兴趣?

2890 次点击
所在节点    程序员
19 条回复
woscaizi
237 天前
今日头条是一款信息类互联网产品,它会基于数据挖掘的推荐引擎向用户推荐文章。它由中国互联网创业者张一鸣于 2012 年 3 月创建,于 2012 年 8 月发布第一个版本。
hahaha121
237 天前
@woscaizi 这种需要搭建数据分析后台技术栈有点多哦,我指的是直接用现有的通义之类的 ai 模型,然后之后得到推荐结果
qiniu2025
237 天前
当然可以,但是很不可控,要控制 AI 按需要的方式推荐,还需要做很多工作,比如建立标签库,抖音给每个人都有 3000 个标签,训练专用的模型才能降低成本,用这些公开几十亿,几百亿参数的模型亏死
hahaha121
237 天前
@qiniu2025 亏死是指 token 太多吗? 每个人 3000 个标签,是啥玩意好奇
ns09005264
237 天前
如果标签系统好的话,推荐系统用不上昂贵的模型就能有好的效果。
所以可以在源头上使用昂贵的模型对文章或视频进行标签分析,建立完善的标签系统,剩下的就可以用廉价的模型进行推荐。
gaobh
237 天前
可以是可以,花的 token 估计不是一般的多
hahaha121
237 天前
@ns09005264 好主意,成本巨降;
hahaha121
237 天前
@gaobh 数据格式提前做压缩,压缩成特地的协议好的简化格式可以省一点,但可能扩展性不高; 5L 的方案感觉非常完美
R4rvZ6agNVWr56V0
237 天前
@woscaizi 最早最算法推荐的不是张一鸣的今日头条,而是郑钧的玩聚 sr ,那会儿大概是 2008 年左右。
huluhulu
237 天前
别把现在的 AI 神话,不过是 LLM 、AIGC 而已。
做这种事情,用数据挖掘/ML 之类的推荐系统足够了,效果比 LLM 好多了,成本还省很多。
要了解 LLM 的边界。
musi
237 天前
v2 现在的标签也是由大模型驱动了,你可以去搜一下 livid 发的帖子
Yadomin
237 天前
这不就是最新最热的 Generative Recommendation 吗
w568w
237 天前
这个想法早在 LLM 刚流行那年就被研究烂了,结论是系统更重要。LLM 在系统中的地位固然重要,但系统设计本身和 LLM 其实没有太大关系,反而要为了 LLM 做出许多妥协(例如输入不能太长,输出要经过校验,优化硬件满足实时性要求等等)。
woscaizi
236 天前
@GeekGao 郑昀-玩聚 SR 貌似和个性化推荐不一样
murmur
236 天前
推荐系统核心算法 :selelect title,content,author from articles order by paid_money desc
murmur
236 天前
你这个东西有点悖论,就是新闻是没法推荐的,因为新闻的发生不以用户的主管爱好为转移,除非是编造的假新闻和洗稿新闻

比如我喜欢看美国着火,美国枪击,这事即便是美国也不够我看的啊
R4rvZ6agNVWr56V0
236 天前
@woscaizi 非要说算法那肯定不一样(具体你可以看看他博客的历史存档),但是效果是差不多的。只是那会儿没有移动端。相比头条收集信息的维度少(例如性别、LBS 数据),底线更高,只推荐全网大 v 的内容,而非头条系杂七杂八的自媒体小黄文
RealMan
236 天前
LLM 和推荐系统的结合一直都很火,我自己也是研究相关方向的。现在比较认可的方向是生成式推荐和对话式推荐,和用户的多轮对话,不断捕获用户兴趣,生成跟用户兴趣相关的推荐产品。和传统推荐系统是互相促进的关系,不是取代。
neptuno
236 天前
术业有专攻,你可以按照大模型技术栈训练一个推荐系统,而不是调用 api

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1104537

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX