最近遇到一个复杂的需求,不知如何去实现.....

2019-05-27 08:53:37 +08:00
 IfEles
对复杂的一段话(里面的商品或者地点信息,这些都是有数据库基础表维护的)筛选出里面的关键信息,拼装成后端(用的是 java,框架是 springboot)可以解析的一条数据,问题就是出在如何解析这条不规则的话,目前想象到的逻辑是想锤子科技开源的大爆炸 Big Bang 那套逻辑,用 HanLP( https://github.com/hankcs/HanLP)的自然语言处理方案来实现中文分词,然后用户去选择需要的关键词,但是选择后的数据拼成哪种形式给后端始终没想到很好的解决方案.回头想这个需求其实只要一纸固定的模板就能解决,硬是要做成这么复杂😂,各位大佬有啥更好的建议或者解决方案吗?小弟才疏学浅能想到的就这么多.
5323 次点击
所在节点    Java
26 条回复
IfEles
2019-05-27 21:00:57 +08:00
@seraphv3 好的,多谢我去了解一下
guyeu
2019-05-28 10:10:39 +08:00
@IfEles #20 前端要做这个不是难为人么。。。让后端训练一个专门做这件事的模型去做啊。。。不过我觉得不靠谱,模型是有准确率问题的。。或者语法相对固定的话直接字符串匹配吧。
IfEles
2019-05-28 10:31:54 +08:00
@guyeu 我也觉得模型的准确率不可能百分百,只能用关键词字符串去匹配了
luw2007
2019-05-28 11:23:00 +08:00
里面的商品或者地点信息,这些都是有数据库基础表维护的
luw2007
2019-05-28 11:24:29 +08:00
里面的商品或者地点信息,这些都是有数据库基础表维护的。
这就是简单的一个匹配的问题。
应该由后端自己处理。前端只管传话就好了。

匹配关键词的方法很多。分词,双尾后缀树,自动机等等。
sazima
2019-05-28 12:40:36 +08:00
有个想法, 分词功能使用 python 的结巴, 用 java 调用就好. 比如借助 thrift.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/567905

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX