关于目前 V2EX 的主题的自动打标签功能

2014-02-20 16:17:47 +08:00
 Livid
是的,有时候确实会产生一些奇怪的结果。

我们用的是结巴中文分词这个库算出来的结果,如果你对分词方面有研究,有信心做出更好的结果,或许你可以考虑给他们提一个 pull request:

https://github.com/fxsjy/jieba

这是我之前提的 issue:

https://github.com/fxsjy/jieba/issues/130
5874 次点击
所在节点    V2EX
26 条回复
caomu
2014-02-21 00:29:36 +08:00
tag收藏
tag之间关联,类似于子话题
tag维护者
tag wiki(简短描述)

好像有点像知乎。。。
onemoo
2014-02-21 00:37:52 +08:00
能不能设置手动编辑?
或者设置一个tag库,放上常用的tag,供大家选择。
virushuo
2014-02-21 05:54:05 +08:00
我对分词算略有经验,以我们当年做搜索的经验看,如果不是通用搜索,只面对一个领域,最好的办法是自定义词库。所以开放tag编辑功能,用户修正错误,然后稍微用个算法过滤一下,生成自定义词库补充进去,效果能好很多。这种情况反而在分词引擎本身上能提高的余地不大。
0bit
2014-02-21 08:01:22 +08:00
@tension 糖蒜女子脱口秀?
xiaket
2014-02-21 09:04:07 +08:00
@Livid, 附议@virushuo

可以扫一遍已有的标签们, 编辑成一个列表, 后面的新标签也更倾向于从列表中取.
cxshun
2014-02-21 13:57:19 +08:00
@tension 牛叉,果断博大精深。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/101091

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX