求推荐算法,用户行为预测方面

2015-04-21 11:10:39 +08:00
 lsylsy2
简要概括
学习用数据:若干的用户访问日志(带时间戳)
输入:用户当前的一个访问
输出:用户接下来可能的访问
要求:看重准确率高过召回率

目前的想法是把“一段时间内,用户先后访问了A和B”设置为AB之间的一条有向边,然后构造出一张图在里面处理。但是没有想出很明确的算法……
现有的各种数据挖掘工具有处理这种问题的现成算法么?
4362 次点击
所在节点    问与答
8 条回复
binux
2015-04-21 11:24:02 +08:00
你想多了,输入只有「当前的一个访问」,统计这「一个访问」最多的下一个访问就完了。
lsylsy2
2015-04-21 11:35:50 +08:00
@binux 需要的不是“下一个”,而是“下若干个”;
具体的说是“输入用户当前的访问,输出一个集合,集合内是用户接下来若干时间(比如半小时)内可能访问的东西”
lsylsy2
2015-04-21 11:38:06 +08:00
然后“看重准确率高过召回率”的意思是
P(集合内的某个元素被访问)优先级大于P(用户访问的元素在集合内)
所以这个集合不能过大而包罗万象
yangff
2015-04-21 12:51:56 +08:00
隐马?
aszxqw
2015-04-21 12:54:29 +08:00
@binux 哈哈,真相就是这么简单。但是就是这么实用。
yangff
2015-04-21 12:56:02 +08:00
哦。。就是马尔可夫模型。。
mfinal
2015-04-21 12:57:34 +08:00
带顺序的时间戳预测属于比较高级的了,应该需要用到带记忆功能的时序算法。
@binux 的意思是你的输入太少了,如果你的模型不能从学习数据中构建出接下来用户的profile,那仅根据新用户当前的“一个访问”来预测之后会很差。
lsylsy2
2015-04-21 13:00:23 +08:00
@mfinal 唔,我可以用一定的办法保证用户行为由比较高的一致性……也许我可以先用一些办法对用户进行“分类”。

@yangff 我去看看马尔可夫模型……可能挺有用的样子

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/185164

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX