有没有文本自动分类的 api?

2014 年 2 月 12 日
 shinebay
现在项目需要自动进行文本归类,比如输入“大家觉得<环太平洋>这部电影好不好看呀?”,程序判定其分类为:娱乐>>电影,有没有这方面好的api或程序,祝回答的人天天开心
6480 次点击
所在节点    程序员
14 条回复
keller
2014 年 2 月 12 日
关系到分词算法和语意分析
具体能够直接应用的API应该还没有
9hills
2014 年 2 月 12 日
没有这么高级的API。。
RangerWolf
2014 年 2 月 12 日
我只知道有一些api 能自动的检测是不是垃圾评论
比如 wordpress 自带的那个
名字一下不记得了
shikailun
2014 年 2 月 12 日
如果分类事先确定的话,贝叶斯分类算法貌似可以实现楼主的需求
y051313
2014 年 2 月 12 日
shikailun
2014 年 2 月 12 日
朴素贝叶斯在文本分类中的应用 http://yzmduncan.iteye.com/blog/1930695
txlty
2014 年 2 月 12 日
这东西应该很值钱的。可以直接用于做垃圾站赚钱。
chlx
2014 年 2 月 12 日
@txlty 是么?能具体说说不
cctvsmg
2014 年 2 月 12 日
jieba分词,自己做个词库
shinebay
2014 年 2 月 12 日
@txlty 真的吗?能具体一点吗?怎样用这个api赚钱啊,谢谢了
YouXia
2014 年 2 月 12 日
@shinebay 卖服务就可以啊。大公司养这么多科学家,比如做数据挖掘,文本分类,聚类等等相关的,就是为了解决此或类似的问题啊。小公司没有这么多人力和财力,如果需要用到这种东西,可能会考虑买别人的服务了。
crossmaya
2014 年 2 月 12 日
mark一下。
cjjer
2014 年 2 月 12 日
@y051313 能透露一下这个的价格么?我用户名@163.com 也可以,非常感谢。
y051313
2014 年 2 月 12 日
具体价格我不是很清楚,是global负责的,他们提过一句这个是按照用量来收费的。
我们用到这个CatEngine的是一个多语言数据库,这个程序实现了对全部13种语言文档的自动分类识别。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/99901

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX