V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
LeeReamond
V2EX  ›  问与答

推荐系统是如何做到每次推荐都不重复的?

  •  
  •   LeeReamond · 168 天前 · 1498 次点击
    这是一个创建于 168 天前的主题,其中的信息可能已经有所发展或是发生改变。

    有没有老哥能大概描述一下大数据推荐系统的实现逻辑?

    我有两个疑问

    1 、大数据是如何做到你点击某类内容后,它就更倾向于给你推荐该类视频的,这个背后聚类、筛选、排序的逻辑大概是怎么样的

    2 、具体技术实现上,典型例子比如 B 站,我每次下拉刷新,都会推送出新的视频,后端是如何做到每次推送视频都不重样的呢,如果要针对每个用户记录已经推送过的视频,这种数据结构在工程上显然是不可接受的。但是如果使用布隆过滤器之类的取巧办法,这个过滤器总是要定期清理的,不可能说每个用户初始化一个过滤器对象之后就永远地只增不减,然而布隆过滤器又怎么能删东西,这很矛盾。

    16 条回复    2021-06-15 09:37:57 +08:00
    zengming00
        1
    zengming00   168 天前
    B 站推荐重复率很高的
    你说的过滤说不定是在客户端实现的呢?
    ch2
        2
    ch2   168 天前
    粗排+精排
    lhx2008
        3
    lhx2008   168 天前
    肯定要存的,然后一个人 1k,十亿人也才 1T,根本不是事
    LeeReamond
        4
    LeeReamond   168 天前
    @lhx2008 如果直接存值的话 1K 能存的数据太少了,应该是不对。
    haruhi
        5
    haruhi   168 天前
    不是在推荐你相同类型的视频,而是在推荐给你和你行为一样的人所点赞、完播率高(当然有更多指标)的视频。
    LeeReamond
        6
    LeeReamond   168 天前
    @haruhi 具体是个什么逻辑,针对用户行为聚类,然后维护若干个指定类别的推荐名单?
    haruhi
        7
    haruhi   168 天前
    @LeeReamond

    举个简单的例子:

    我一共看了视频 1 、2 、3 、4 、5,所有视频都点赞了。

    你一共看了视频 1 、2 、3 、4 、5 、6,所有视频都点赞了。

    这时候我和你的行为是非常类似的,那么会判断大概率我也会喜欢视频 6,这时候就把这个视频推荐给我了。

    这个推荐的方式,叫协同过滤( Collaborative Filtering )。
    learningman
        8
    learningman   168 天前 via Android
    并不是,知乎就日常重复。。。
    LeeReamond
        9
    LeeReamond   168 天前
    @learningman 只能说明知乎不光内容少而且菜吧。。
    LeeReamond
        10
    LeeReamond   168 天前
    @haruhi 实现方式?
    3dwelcome
        11
    3dwelcome   168 天前
    B 站确实记录下我看过的每一个视频,他可以一次分析 200 条不重复的推送,然后我下拉一次,推送 10 条。
    这样就可以短期不重复了。
    DCjanus
        12
    DCjanus   168 天前 via Android
    一般的实现是存一段时间给你推荐过的内容,并且推荐系统只给你推荐一段时间内上传的视频,定期滚动就行了。
    Vitor
        13
    Vitor   168 天前   ❤️ 1
    @LeeReamond User-CF / Item-CF / Deep&Wide,很多经典的算法网上一大堆,感兴趣的话可以看看项亮写的推荐系统入门书
    masterclock
        14
    masterclock   167 天前
    B 站重复率非常高,看过的也会再推。
    某小说软件的推荐下拉一页能重复一大半。
    Ptu2sha
        15
    Ptu2sha   167 天前
    虽说千人千面 但是用户一百万啊 自需要筛选一千面 然后定期更新
    刷新又不是实时分析的
    shuxhan
        16
    shuxhan   167 天前
    @learningman 有一说一,知乎的推荐机制真的垃圾,我屏蔽好多关键词,结果还是推送同类型的,字节这方面的算法是真的牛逼。
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   4059 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 03:29 · PVG 11:29 · LAX 19:29 · JFK 22:29
    ♥ Do have faith in what you're doing.