一个简单的网文推荐系统,解决书荒

2016-09-25 14:04:18 +08:00
 shidenggui
最近在学习机器学习,以前很喜欢看网文,当时最烦的就是看完一本书之后找不到其他类似那么好看的书,俗称书荒。就收集了一点数据来做一个书籍相似度的查询,用了最简单的余弦相似度计算。貌似效果比预期中好点。

目前服务托管在 daocloud 上,地址: http://netbook.daoapp.io/ 。 欢迎大家试用 && 提出意见

下面是 《亵渎》 的匹配结果

17041 次点击
所在节点    分享创造
101 条回复
shierji
2016-09-25 16:36:39 +08:00
楼主 阿里布达年代祭都没有……
haiyang416
2016-09-25 17:14:06 +08:00
依据什么做的相似性对比?
yyyyyyyhb
2016-09-25 18:22:01 +08:00
搜索一本小说结果里还有这本小说
lcorange
2016-09-25 19:25:10 +08:00
还不错,我搜了一本喜欢的,答案前十本都一样都很喜欢,还都看过
kenken
2016-09-25 20:04:53 +08:00
不错。
woniu127
2016-09-25 20:07:56 +08:00
我想你需要一个域名, shujia.me 书架
iA7489
2016-09-25 20:13:02 +08:00
相当符合
赞一个
dlsflh
2016-09-25 20:15:26 +08:00
使用了一下感觉还不错,用了才发现原来大家调侃的“霸道总裁爱上我”并不存在啊!
支持楼主!
wyx
2016-09-25 20:20:17 +08:00
速度好快啊
kamen
2016-09-25 22:40:41 +08:00
很不错啊,提个建议,做一个自定义排序和分类选择会更好
kamen
2016-09-25 22:42:28 +08:00
建议放到 git 上,大家一起出力
a87150
2016-09-25 23:00:37 +08:00
感觉只是单纯把有名的凑在一起,史上第一混乱和无限恐怖的相似度居然比和都市妖奇谈还高。

异常生物见闻录以及张小花其他作品(除了我就是妖怪)这些明显更相似的居然没有出现。
ipconfiger
2016-09-25 23:07:35 +08:00
输入后宫, 失败
输入穿越, 失败
感觉, 毫无用处
a570295535
2016-09-25 23:14:30 +08:00
加载速度太快了,牛啊,书的数据从哪爬下来的哇?建议把代码放到 git 上,大家一起出力,做出更精准的网文推荐系统。。。
clearbug
2016-09-25 23:22:23 +08:00
不明白上面为啥辣么多称赞的。。为啥我搜的书都木有:龙族,黑客与画家,人月神话。。。难道数据都是作者自己搜集后放到自己数据库的
wogong
2016-09-25 23:25:38 +08:00
@clearbug 说了是网文。
est
2016-09-25 23:43:06 +08:00
赞。
tscat
2016-09-26 00:14:13 +08:00
手里有个 sobook.org
wizardforcel
2016-09-26 00:16:29 +08:00
你都收录了悟空传居然不收录龙族??
hatcloud
2016-09-26 00:21:00 +08:00
@wizardforcel 龙族不是网文

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/308827

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX