用 LDA 主题模型, 给拨云搜索加上了相近小说查询

2018-02-25 11:09:32 +08:00
 enenaaa

做法是先用 LDA 把小说文本降维, 每个文本 400 个主题。然后用余弦相似度进行匹配。

体验地址: https://www.boyunso.com/similar/28285

2598 次点击
所在节点    分享创造
6 条回复
chaoil
2018-02-25 11:35:08 +08:00
标签对搜索的影响结果很大啊,搜索盗墓笔记会出现很多无关的结果
JohnChiu
2018-02-25 12:44:42 +08:00
感觉带的标签有点问题,搜索斗破苍穹,出现的都是带斗破标签的都市言情小说~
enenaaa
2018-02-25 12:56:11 +08:00
@chaoil
@JohnChiu
我上面没说清楚。搜索是按小说标签检索的。 相近小说是在详情页里的“更多类似小说”链接。

比如 斗破苍穹 的相近小说页面是:
https://www.boyunso.com/similar/292
freedot
2018-02-27 21:24:58 +08:00
啥是“真抓实干”😳
enenaaa
2018-02-28 09:24:58 +08:00
@freedot 顾名思义尔
shidenggui
2019-10-22 22:18:14 +08:00
楼主还在吗?想交换下友链,拨云搜索的邮箱联系不上,我的网站是 https://www.tuishujun.com

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/432428

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX