V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
goofansu
V2EX  ›  分享创造

用 Golang 写了一个屏蔽字过滤器,可根据字库判断或替换屏蔽字,一句命令更新字库

  •  
  •   goofansu · 2016-10-08 21:20:15 +08:00 · 4545 次点击
    这是一个创建于 2770 天前的主题,其中的信息可能已经有所发展或是发生改变。

    项目地址: https://github.com/repong/hope_word

    关于项目

    这是一个基于 sego 的屏蔽字过滤器

    用法

    go get -u github.com/repong/hope_word
    hope_word -port 8000
    

    例子(请把测试看看改为dict/assets/文件夹中的屏蔽字)

    curl -XPOST http://localhost:8000/validate -d "message=测试看看"
    {"result":"false"}
    
    curl -XPOST http://localhost:8000/filter -d "message=测试看看"
    {"result":"**看看"}
    

    更新字典

    make update_dict
    

    PS

    用 travis 自动编译并提交到 Github 上,在 Releases 标签中选择版本即可使用,支持 linux 系统。

    使用了 go-bindata 把 txt 文件一起打包了,方便部署。

    游戏审核要用,没办法,我也不想搞屏蔽字的 : (

    第 1 条附言  ·  2016-10-11 18:30:23 +08:00
    第 2 条附言  ·  2016-10-11 20:40:43 +08:00

    0.1.1版本开始,会构建osx和linux版本,可以下载直接使用

    https://github.com/repong/wego/releases/tag/0.1.1

    tar zxf wego-linux-0.1.1.tar.gz
    ./wego -port 1234
    
    22 条回复    2017-06-13 10:00:36 +08:00
    est
        1
    est  
       2016-10-08 22:01:51 +08:00
    LZ 文明用语。
    goofansu
        2
    goofansu  
    OP
       2016-10-08 22:18:30 +08:00 via iPhone
    @est 哈哈,真会玩
    ivvei
        3
    ivvei  
       2016-10-08 23:55:05 +08:00
    看标题的时候还以为是把**替换为文字呢…… 点开才发现彻底理解反了。
    goofansu
        4
    goofansu  
    OP
       2016-10-08 23:58:40 +08:00 via iPhone
    @ivvei **替换成文字也太牛 X 了吧
    skycham
        5
    skycham  
       2016-10-09 00:31:17 +08:00 via Android
    我点完感谢 /收藏之后才发现是把汉字变成**,我还以为是把**变成汉字。我在想能把**正确的变成汉字,得微软小冰这种级别吧,还不一定行。
    goofansu
        6
    goofansu  
    OP
       2016-10-09 00:53:18 +08:00 via iPhone
    @skycham 标题有那么不清晰吗,不只你一个人看错了
    skycham
        7
    skycham  
       2016-10-09 07:03:03 +08:00 via Android
    @goofansu 我猜,大家,内心呼唤**变汉字很久了。
    goofansu
        8
    goofansu  
    OP
       2016-10-09 08:37:28 +08:00 via iPhone
    @skycham 哈哈,无奈啊
    flyingfz
        9
    flyingfz  
       2016-10-09 12:05:26 +08:00
    在电脑上 搭一个 go 环境挺麻烦的,
    想问问这个情况: “欢迎进群交流,群号: 1234567890. ” , 是什么样的响应?
    如果是: “欢迎进**流,群号: 1234567890.” , 那就没什么意思了。

    昨天正好看了一篇这个领域的文章,感觉这个领域水很深。。。。
    goofansu
        10
    goofansu  
    OP
       2016-10-09 12:19:28 +08:00 via iPhone
    goofansu
        11
    goofansu  
    OP
       2016-10-09 12:20:29 +08:00 via iPhone
    @flyingfz 这个可以设置词频的,比如交流是 3 ,群交是 2 ,就不会匹配到后者
    flyingfz
        12
    flyingfz  
       2016-10-09 14:17:58 +08:00
    感谢。

    如果能把 readMe 完善一下, 就更好了。
    flyingfz
        13
    flyingfz  
       2016-10-09 14:18:13 +08:00
    goofansu
        14
    goofansu  
    OP
       2016-10-09 16:41:41 +08:00
    @flyingfz 好的,有空了写,最近游戏要上线了比较忙
    pandachow
        15
    pandachow  
       2016-10-10 00:42:48 +08:00
    多模匹配啥做的, AC 自动机吗还是 wumanber ?
    goofansu
        16
    goofansu  
    OP
       2016-10-11 10:16:17 +08:00 via iPhone
    @pandachow 我也不知道,你可以看下 sego ,我只是照文档用顺便打包
    goofansu
        17
    goofansu  
    OP
       2016-10-11 20:42:55 +08:00
    @flyingfz macOS 可以直接下载 0.1.1 的 release 测试,具体看主题里第二条 Append
    goofansu
        18
    goofansu  
    OP
       2016-10-14 12:05:20 +08:00
    flyingfz
        19
    flyingfz  
       2016-10-14 12:11:44 +08:00
    @goofansu 非常感谢, 有心了。
    goofansu
        20
    goofansu  
    OP
       2016-10-14 12:17:56 +08:00
    @flyingfz 哈哈,应该的
    kaywu11
        21
    kaywu11  
       2017-06-13 09:57:07 +08:00
    地址失效了啊, 有没有新的地址,刚学习 GO,想学习敏感词过滤怎么做
    kaywu11
        22
    kaywu11  
       2017-06-13 10:00:36 +08:00
    @goofansu 能否给个项目地址, 非常感谢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5098 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 01:10 · PVG 09:10 · LAX 18:10 · JFK 21:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.