一个简单的网络小说推荐系统

2017-04-24 13:55:16 +08:00
 nladuo

大概去年的时候 10 月份的时候,看到了 v 友的这篇帖子:一个简单的网文推荐系统,解决书荒

这位 v 友当时没有给出源码地址,于是我就打算自己也实现一个。不过,由于算法复杂度太高以及自己学习的很浅(现在学习的也不深),也没有想到好的办法就暂时搁在了一边。拖到了最近,使用了局部敏感哈希(LSH)的方法降低了最近邻搜索的时间复杂度,也算简单的把它实现了,推荐结果算是勉强可以看了,效果如下图:

算法流程如下:

由于小说爬取的比较杂乱,什么女频的男频的都有,所以有些推荐结果可能有些诡异,另外使用局部敏感哈希来搜索也会影响推荐的准确度,下面贴出链接希望 v 友能给出些改善建议。
推荐测试地址:http://tx.kalen.site:38438/
github 链接: https://github.com/nladuo/novelRS

5762 次点击
所在节点    分享创造
25 条回复
smdx
2017-04-24 18:27:03 +08:00
我总觉得程序员没有人文素养,说话和天涯得人,简直一个是油,一个是水,区别太大了
tumbzzc
2017-04-24 19:25:17 +08:00
图中的搜索完全和结果没有关联吧?
FYK
2017-04-24 22:03:08 +08:00
@smdx #21 啥意思啊 没太看懂
MyFaith
2017-04-25 09:55:52 +08:00
楼主头像和代码不太匹配呀
nicoljiang
2017-04-25 16:32:55 +08:00
这个推荐思路本身我觉得就有问题。
小说的相关度是靠题材、背景、设定、情节等来判断的,其中最复杂的是设定。
用关键词的方式来做,可预见的就不会很准。
最近向量分析工具被玩坏了~

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/356968

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX