推荐系统是如何做到每次推荐都不重复的?

2021-06-13 23:00:05 +08:00
 LeeReamond

有没有老哥能大概描述一下大数据推荐系统的实现逻辑?

我有两个疑问

1 、大数据是如何做到你点击某类内容后,它就更倾向于给你推荐该类视频的,这个背后聚类、筛选、排序的逻辑大概是怎么样的

2 、具体技术实现上,典型例子比如 B 站,我每次下拉刷新,都会推送出新的视频,后端是如何做到每次推送视频都不重样的呢,如果要针对每个用户记录已经推送过的视频,这种数据结构在工程上显然是不可接受的。但是如果使用布隆过滤器之类的取巧办法,这个过滤器总是要定期清理的,不可能说每个用户初始化一个过滤器对象之后就永远地只增不减,然而布隆过滤器又怎么能删东西,这很矛盾。

2464 次点击
所在节点    问与答
17 条回复
zengming00
2021-06-13 23:05:39 +08:00
B 站推荐重复率很高的
你说的过滤说不定是在客户端实现的呢?
ch2
2021-06-13 23:29:41 +08:00
粗排+精排
lhx2008
2021-06-13 23:34:06 +08:00
肯定要存的,然后一个人 1k,十亿人也才 1T,根本不是事
LeeReamond
2021-06-13 23:59:22 +08:00
@lhx2008 如果直接存值的话 1K 能存的数据太少了,应该是不对。
haruhi
2021-06-14 00:00:03 +08:00
不是在推荐你相同类型的视频,而是在推荐给你和你行为一样的人所点赞、完播率高(当然有更多指标)的视频。
LeeReamond
2021-06-14 00:05:48 +08:00
@haruhi 具体是个什么逻辑,针对用户行为聚类,然后维护若干个指定类别的推荐名单?
haruhi
2021-06-14 00:10:57 +08:00
@LeeReamond

举个简单的例子:

我一共看了视频 1 、2 、3 、4 、5,所有视频都点赞了。

你一共看了视频 1 、2 、3 、4 、5 、6,所有视频都点赞了。

这时候我和你的行为是非常类似的,那么会判断大概率我也会喜欢视频 6,这时候就把这个视频推荐给我了。

这个推荐的方式,叫协同过滤( Collaborative Filtering )。
learningman
2021-06-14 00:15:25 +08:00
并不是,知乎就日常重复。。。
LeeReamond
2021-06-14 00:18:03 +08:00
@learningman 只能说明知乎不光内容少而且菜吧。。
LeeReamond
2021-06-14 00:21:17 +08:00
@haruhi 实现方式?
3dwelcome
2021-06-14 04:23:43 +08:00
B 站确实记录下我看过的每一个视频,他可以一次分析 200 条不重复的推送,然后我下拉一次,推送 10 条。
这样就可以短期不重复了。
DCjanus
2021-06-14 09:49:25 +08:00
一般的实现是存一段时间给你推荐过的内容,并且推荐系统只给你推荐一段时间内上传的视频,定期滚动就行了。
Vitor
2021-06-14 09:49:54 +08:00
@LeeReamond User-CF / Item-CF / Deep&Wide,很多经典的算法网上一大堆,感兴趣的话可以看看项亮写的推荐系统入门书
masterclock
2021-06-14 15:17:55 +08:00
B 站重复率非常高,看过的也会再推。
某小说软件的推荐下拉一页能重复一大半。
Ptu2sha
2021-06-14 16:08:05 +08:00
虽说千人千面 但是用户一百万啊 自需要筛选一千面 然后定期更新
刷新又不是实时分析的
shuxhan
2021-06-15 09:37:57 +08:00
@learningman 有一说一,知乎的推荐机制真的垃圾,我屏蔽好多关键词,结果还是推送同类型的,字节这方面的算法是真的牛逼。
hpu423
2022-09-25 19:28:00 +08:00
布隆过滤器了解一下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/783253

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX