再次优化了一下我们的 NLP 规则

2018-04-11 14:24:28 +08:00
 quu

搞个 demo 很容易实现,打磨这个事儿就是个长期的事情了,折腾了好长一段时间,正式将 NLP 迁移到我们的文智平台,后端还在开发的 to do list 里,人手吃紧要干的事儿有点多。

还是先来个尝鲜吧。

http://txtai.com/product/nlp.shtml

自然语言处理围绕情感分析的场景,目前还是适用于标准的新闻内容,以及文档内容的情感识别,口语化识别可能还是一个超级漫长的过程。

欢迎大家帮忙提提建议,这套业务已经集成到我们的舆情监控业务里,对这方面应用,或者对舆情产品感兴趣的可以联系我,我发 0.1 折体验卷。

8484 次点击
所在节点    云计算
61 条回复
duowb
2018-04-12 09:41:14 +08:00
澳门荷官在线发牌

正面:100% (#^.^#)
cluulzz
2018-04-12 09:41:31 +08:00
"蛤蛤蛤蛤蛤蛤蛤"

正面:50%
负面:50%
LeoNG
2018-04-12 12:15:55 +08:00
你好棒棒哦

正面:100%
quu
2018-04-12 12:37:04 +08:00
@zhangzhang 希望能看一下前提条件哈 [目前还是适用于标准的新闻内容] ,中文太伟大,很多语义换个环境就不是原有的意思了,让机器去理解这些实在太难完成。
quu
2018-04-12 12:38:44 +08:00
@cosmic 感谢建议,已打赏,这块其实已经加了一些行业语料库了,但是体积确实不够大。
我看了一下历史内容,你的这条确实要深度优化。
quu
2018-04-12 12:39:54 +08:00
@ucaime 没有关系,文本智能化 = 文智
quu
2018-04-12 12:44:57 +08:00
@roychan 作为一个安全背景出身的团队,我想问一下,SSL 到底解决了什么问题?在我们这个场景应用又可以帮助我们解决了什么?是否有直接性影响?
pmispig
2018-04-12 13:50:40 +08:00
作为一个安全背景出身的团队,居然还能问,SSL 到底解决了什么问题....?
看来你是个小白吧,我只说一点,网站内容劫持。
zhangsen1992
2018-04-12 14:14:56 +08:00
samples:呵呵
你妈逼你结婚了吗
去你大爷家给你大爷祝寿
fiht
2018-04-12 14:34:36 +08:00
base64: 5Lmg5YyF5a2Q5oiQ55qH5bid5ZKv
正面:98%
base64: 5Lmg5YyF5a2Q6KaB5YGa55qH5bid5LqG
正面:57%
Greenm
2018-04-12 14:43:31 +08:00
有注册功能涉及用户资料不上 https,还能大言不惭的问 SSL 到底解决了什么问题。

现在是不是安全背景门槛这么低了?使用过漏扫是不是也算有安全背景的团队?
xiongshengyao
2018-04-12 14:51:02 +08:00
天冷了,我妈逼我穿秋裤
负面: 80.84%
正面: 19.16%

这个很负面吗?明明就是中性吧
CloudnuY
2018-04-12 15:02:57 +08:00
xiangyuecn
2018-04-12 15:14:06 +08:00
apoclast
2018-04-12 17:28:31 +08:00
领导:“你这是什么意思?”阿呆:“没有意思,意思意思。”领导:“你这就不够意思了。”阿呆:“小意思,

正面:62.72%
负面:37.28%
shiny
2018-04-12 17:33:46 +08:00
都 2018 年了还在问 SSL 到底解决了什么问题
BoiledEgg
2018-04-12 17:46:48 +08:00
全楼看下来,这广告效果很好,哈哈哈哈哈
cnallenzhao
2018-04-12 20:37:24 +08:00
小米手机太卡了,别买
正面 63%
?
roychan
2018-04-13 21:37:17 +08:00
@quu

SSL 解决的问题只需要用搜索引擎搜索一下就可以,有人可以比我说得更加清楚。SSL 对于 NLP 本身当然没什么用,但是既然用户需要使用浏览器和 HTTP 协议去使用你发出来的这个 demo,那么我认为加上 SSL 是有必要的。抛开“保护用户”不谈,首先也是保护你们自己。:)

It's 2018.
quu
2018-04-14 16:29:14 +08:00
先感谢,各位基于标准“新闻”下帮忙找误报问题的朋友,NLP 这东西要持续打磨,这些问题永远解决不完,所以我们后续会考虑把接口放开,找志同道合的朋友来一起完善。

对于一些没看清前置条件,就开始用“口语话”、“网络语”、“谐音错别字”来刻意找问题的朋友,我只能用“调皮”来形容,NLP 想要理解这些东西,三五年都搞不定,中文太复杂了,目前没有看到任何一个对这种复杂语境,处理的很得心应手的,我们只能尽量完善自己,持续打磨。

对于某些学了点狗屁基础的,就拿着眼界里的理解来看待业务张嘴乱喷的,我想用“心理畸形”来形容,不是所有的东西都是绝对的,尤其是安全这件事儿上,以为引用了什么就会怎样,怎样,只是知道如果不做这些也许会导致出现某个结果,先别急着喷,闷头问问自己你真的会利用吗?

那再问问自己,是不是真的用了就万事大吉了吗?

如果还想张嘴闭嘴“不了解点背景就用个过来人身份调侃和口出狂言”,我不和你争,你是对的!

安全无绝对,过度的依赖所谓的经验和标准,就是最大的问题。

有没有用?

有点用!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/445923

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX