再次优化了一下我们的 NLP 规则

2018-04-11 14:24:28 +08:00
 quu

搞个 demo 很容易实现,打磨这个事儿就是个长期的事情了,折腾了好长一段时间,正式将 NLP 迁移到我们的文智平台,后端还在开发的 to do list 里,人手吃紧要干的事儿有点多。

还是先来个尝鲜吧。

http://txtai.com/product/nlp.shtml

自然语言处理围绕情感分析的场景,目前还是适用于标准的新闻内容,以及文档内容的情感识别,口语化识别可能还是一个超级漫长的过程。

欢迎大家帮忙提提建议,这套业务已经集成到我们的舆情监控业务里,对这方面应用,或者对舆情产品感兴趣的可以联系我,我发 0.1 折体验卷。

8448 次点击
所在节点    云计算
61 条回复
tailf
2018-04-11 14:28:21 +08:00
NLP:你老婆?
164607638
2018-04-11 14:29:40 +08:00
我觉得啊,这个项目小看了中华文化尤其是汉语的魅力
ryV60s
2018-04-11 14:32:47 +08:00
比如:"草泥马,哈哈"
正面 57%
负面 42%
-.-
zhangzhang
2018-04-11 14:36:35 +08:00
「你说的真对,嘻嘻」
正面 77.24%
负面 22.76%
timwei
2018-04-11 15:06:45 +08:00
"我今天是作为一个长者来跟你们讲的"
正面 83%
负面 17%

8-)
LadyChunsKite
2018-04-11 15:20:03 +08:00
“无 fuck 说”

正面:89.6%
负面:10.4%
murmur
2018-04-11 15:21:08 +08:00
以前做舆情项目
现在认为中文情感分析就是做梦
以中文的博大精深
以及资深网民多年对抗关键字过滤的经历
绝大多数人都可以笑嘻嘻的骂你 mmp
takato
2018-04-11 15:23:21 +08:00
压缩的维度太小了。。。。实在不是 NLP 的正确用法。。
cosmic
2018-04-11 15:23:40 +08:00
华为手机电池用得太快了
结果:0%负面,100%正面
私以为这样的结果,用来做口碑监控,怕不是要把一些公司坑死。
只用情感词典的话,要做的规则太多了,建议增加语料库,电商网站的评论多标注,用 CNN 或者 LSTM 训练
fanhaipeng0403
2018-04-11 15:24:26 +08:00
呵呵



正面 100%
ucaime
2018-04-11 15:34:11 +08:00
http://nlp.qq.com/
腾讯的也叫文智,有什么关系吗?
yianing
2018-04-11 15:53:03 +08:00
水不在深,亦可赛艇
正面:97.74%
exciting ?
wy315700
2018-04-11 15:57:10 +08:00
怎么联系楼主
Devilker
2018-04-11 15:59:26 +08:00
还是太年轻
正面:92.8
负面:7.2
lanyi96
2018-04-11 16:05:48 +08:00
我是你爸爸
正面:100
Greatshu
2018-04-11 16:13:38 +08:00
qiyuey
2018-04-11 16:17:05 +08:00
你们还是要学习一个闷声发大财
正面:79.36
负面:20.64
reeonce
2018-04-11 16:23:35 +08:00
特朗普
正面: 50%
负面: 50%
weizhen199
2018-04-11 16:36:01 +08:00
呵呵
正面: 100%
负面: 0%
ThirdFlame
2018-04-11 16:37:15 +08:00
我去你妹,妹家
正面:80.87%
反面:19.13%

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/445923

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX