命名实体识别产品名的方法?

2017-01-25 15:42:50 +08:00
 neurocomputing

如题,对于产品名有什么好的命名实体识别算法?

如:

“提到安卓系统的车机手机互联方案,可能你首先想到的就是谷歌的 Android Auto ,当然,还有百度家的 CarLife 、乐视的 ecolink 以及 MirrorLink 等,但是在全球范围内能和 CarPlay 一战的,恐怕只有 Android Auto 了,基于谷歌强大的生态系统, Android Auto 在使用体验和功能上并不比 CarPlay 差,而且,苹果和谷歌在车载领域的竞争,也能从这两个系统里面直接看出”

Android Auto , CarLife , ecolink , MirrorLink 应该被识别出来

再如:

“从 9 月 6 日开始,细心地用户应该能发现,滴滴打车 APP 的启动界面有了变化,此前的“滴滴打车,再见”的载入界面已经消失,取而代之的是“滴滴打车全新品牌升级倒计时”字样。根据滴滴内部人士透露,此番动作并不像外界猜测的那样涉及多项业务调整,而只是将更换品牌名称,从“滴滴打车”改变为“滴滴出行”。滴滴将不再只是打车,而是要做移动出行的综合性入口。”

滴滴打车,滴滴出行 应该被识别出来

发现目前开源的 NLP 库都无法进行产品名的命名实体识别, bosonnlp 有这项服务,准确度也还可以 但是究竟是什么样的算法呢?

4205 次点击
所在节点    自然语言处理
1 条回复
zix
2017-07-05 08:52:17 +08:00
暴力的办法:用检索或自动机的办法,自己收集好大量的产品名,直接匹配。

模型的方法:收集你要处理的实际场景里带产品名的文本(人工标注,或者上述匹配方法的日志数据),上序列标注模型,LSTM+CRF。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/336881

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX