v2ex 根据文章提取标签,用的什么模型?

2023-02-27 13:08:14 +08:00
 ALLROBOT

如题,V2EX 发帖后,下面自动生成标签,感觉标签划分挺正确的,模型想拿来参考参考

能发 github 链接供参考学习?

1966 次点击
所在节点    程序员
8 条回复
leimao
2023-02-27 13:24:28 +08:00
经典的是 Latent Dirichlet Allocation 模型
https://en.wikipedia.org/wiki/Latent_Dirichlet_allocation
fengleiyidao
2023-02-27 13:50:09 +08:00
划分正确么?比如隔壁一帖的 tag ,我就感觉驴唇不对马嘴啊 https://www.v2ex.com/t/919496
SeeWlind
2023-02-27 13:54:48 +08:00
NLP
ALLROBOT
2023-02-27 14:15:01 +08:00
@fengleiyidao 大多数情况比较正确,只要正文标题写清晰了

@leimao 自动标签生成用的这模型?

@SeeWlind 自然语言处理。。听君一席话,如听一席话
weidaizi
2023-02-27 14:44:33 +08:00
@fengleiyidao 我觉得那个帖子,"硕大无比" 划分的挺正确的呀 (doge
leimao
2023-02-27 15:02:09 +08:00
@ALLROBOT Topic Modeling 的历史有二十多年了
veike
2023-02-27 21:26:53 +08:00
jieba 就可以😄
OpenSSH
2023-02-28 07:32:22 +08:00
我点开了你的帖子的“标签”这个标签,第一个就看到了站长 2014 年发的这个帖子 /t/96918 ,用的是 jieba

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/919485

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX