一个简单的网文推荐系统,解决书荒

2016-09-25 14:04:18 +08:00
 shidenggui
最近在学习机器学习,以前很喜欢看网文,当时最烦的就是看完一本书之后找不到其他类似那么好看的书,俗称书荒。就收集了一点数据来做一个书籍相似度的查询,用了最简单的余弦相似度计算。貌似效果比预期中好点。

目前服务托管在 daocloud 上,地址: http://netbook.daoapp.io/ 。 欢迎大家试用 && 提出意见

下面是 《亵渎》 的匹配结果

17078 次点击
所在节点    分享创造
101 条回复
yzongyue
2016-09-26 00:42:21 +08:00
不错
icylogic
2016-09-26 01:23:37 +08:00
感觉还挺准。

如果多本同时匹配就更好了。
还有往复杂做的思路,就是建立账号系统然后像网易一样有书单,可做的事就多了。
当然现在简洁一点也挺好。
Yinz
2016-09-26 01:27:29 +08:00
猜一猜原理,从各大小说站抓小说的分类标签,然后对标签向量算余弦距离这样?:D
gzlock
2016-09-26 02:18:25 +08:00
然而楼主发个帖就跑了
kakay
2016-09-26 08:59:42 +08:00
竟然没有飘渺之旅
cosgbgas
2016-09-26 09:02:22 +08:00
看见 幽冥仙途 减肥的确是我的大爱。
shidenggui
2016-09-26 09:14:55 +08:00
@kakay 飘邈之旅
quericy
2016-09-26 09:19:40 +08:00
shidenggui
2016-09-26 09:30:47 +08:00
@quericy 修复了,现在应该有了。你再搜下看看
timeship
2016-09-26 09:41:18 +08:00
还行,测试了几个,还蛮准的。喜欢看雪中悍刀行,匹配到了老猫和烟男的几本书
wandero
2016-09-26 09:49:38 +08:00
赞,简单试用了下,发现乱臣贼子的类似收了猛兽记,虽然都是好书,但这两不搭边
然后收了习惯呕吐的求索这一足球小说,反而却没有作者的陌上行这种真正类似的架空

书荒还是推荐优书网
能看到这楼的都是同好,
我的优书网书单 http://www.yousuu.com/user/914383
我的个人书单站点 http://novo.cloudlet.info

lz 加油,我就想过弄出一个可以根据个人全部书目评分评估个人口味,然后推符合个人喜好的书单的书目站,不过代码盲也只能想一想了
shidenggui
2016-09-26 09:52:52 +08:00
@wandero 这是下一步的计划,不过最近估计没时间弄。弄这个 demo 花了我 2 天多的时间,后面有机会在把按用户的加上
lcatt
2016-09-26 10:13:47 +08:00
亵渎不匹配 永夜君王。。。。
jasonding
2016-09-26 10:15:33 +08:00
这个不错,以后不担心书荒了,哈哈
jasonding
2016-09-26 10:20:47 +08:00
个人建议可以添加字数范围过滤,以及简单的硬分类,什么科幻、穿越、都市、重生等等,使用体验会更好点
Zzzzzzzzz
2016-09-26 10:20:52 +08:00
@quericy 搜九州·缥缈录
@wandero 就收录情况来看, 楼主爬的书目和语料大概就是优书网.....
shidenggui
2016-09-26 10:27:21 +08:00
@Zzzzzzzzz 恩,我在龙空也发过帖子,不过龙空的管理者貌似觉得这些推荐没啥用。。。
geew
2016-09-26 10:30:55 +08:00

可以
yuhuigreed
2016-09-26 10:35:48 +08:00
用了下感觉推荐的还可以
wanttofly
2016-09-26 10:37:40 +08:00
@timeship 哈哈,纯粹为雪中给你点个赞。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/308827

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX