问一个关于垃圾信息过滤的问题

2014-02-10 08:36:09 +08:00
 jingwentian
比如在发帖或者回复中出现一些垃圾信息:

1. 我要上春晚场外抽奖活动是真的吗(欢迎致电)℡ 0105-6705152分别由人工接听!网上预订值得您的信赖!为方便旅客取票,铁路部门在全国较大车站设置专门取票窗口,其他车站和代售点也将采取增加窗口、设置专门窗口等举措。

2.(400-0117077)订票,改签,退票: (400-0117077) 受 理 :改签,改期,退票,特价预订火车退票价格查询业务

3. 爸爸去哪儿发来消息说我的手机账号被抽中二等獎真的吗→颁獎热线(400-0117077分别由颁奖负责人王经理接听全程为您监督! )-记者拨打热线也已证实到!活动期间有很多不法分子正在冒充本栏目客服当中、获奖用户在进行领奖时请勿拨打其他均为陌生客服、 以免您被受骗!

如果手工审核的话太麻烦, 有什么办法可以过滤掉呢?
2192 次点击
所在节点    问与答
3 条回复
jingwentian
2014-02-10 10:58:56 +08:00
通过bad words 关键词过滤比较简单 但是灌水的人一般会用一些特殊符号之类的 有什么好办法么亲们?
binux
2014-02-10 11:07:25 +08:00
你有多少数据?没有的话,就提高发帖回复门槛吧。。
jingwentian
2014-02-10 11:10:25 +08:00
@binux 是门户 资讯类的信息.. 数据很多 只能在已有数据的基础上 各种: 发-票 找-小-姐

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/99516

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX