我基于大模型写了个 Telegram 群反垃圾机器人

1 月 21 日
 lovelilili

一、为什么要做这个 Bot

维护 Telegram 群组的朋友应该都遇到过类似问题:群里突然冒出一堆广告,机器人批量加群发垃圾信息,正常讨论都被打断。最头疼的是,管理员每天要花不少时间清理消息,删广告,封机器人。

我自己也管理几个技术交流群,看着群从清净变成垃圾场,心里挺不是滋味的。传统方法要么效果一般,要么太麻烦。后来想了想,为什么不做一个更智能的解决方案?既能自动识别垃圾信息,又不会误伤正常用户,还能防住新出现的机器人。

于是就开始折腾这个项目,希望能帮更多群主省心。

二、技术方案的选择

在实现上,我参考了很多现有方案,最后选择了几种互补的技术:

基础规则过滤:设置一些关键词和模式,明显广告直接拦截。这个最快,但只能对付最简单的垃圾。

媒体内容检查:有些垃圾是图片或链接,需要专门分析。

大模型智能检测:这是最关键的一环。用 AI 来判断消息是否合适,比单纯的关键词匹配准确得多。为什么选大模型?因为它能理解上下文,识别那些绕过规则的"聪明"垃圾。

为了不影响群聊速度,我设计了异步处理机制。明显垃圾秒删,复杂内容后台慢慢分析。用户感觉不到卡顿,机器人也逃不掉。

验证新用户时,还加了人机验证环节,确保加群的都是真人。

三、极简使用背后的技术思考

用起来很简单:装好 Bot ,设置一下权限,它就开始工作了。群主不用操太多心,该删的删,该封的封。

但背后其实挺复杂的。要让 AI 准确识别垃圾,又不误伤好人,需要不断优化算法。处理速度要快,不能让群聊变慢。数据库要稳,用户数据不能丢。

我花了不少时间调参数,测试各种场景。目标就是,让复杂的技术变得简单好用。

四、比传统广告拦截机器人强在哪里

传统机器人大多只能防广告,或者只检查新用户。这种新 Bot 更全面:

效果明显,群里干净多了,活跃用户也更愿意发言。

五、实测效果

这个数据让我很惊喜,也证明了 AI 检测的有效性。

六、未来的扩展方向

目前功能已经能满足基本需求,但我觉得还可以做得更好:

还有一些想法,比如更智能的群统计,自动标签分类等。慢慢来,先把基础功能做好。

欢迎邀请我们的管理机器人进群: https://t.me/SageGuardBot

如果你对这些功能感兴趣,或者有更好的建议,欢迎交流!

565 次点击
所在节点    Telegram
1 条回复
madou
1 月 27 日
看了一下网站的部署教程,第一步 Github 的仓库代码找不到.
git clone https://github.com/your-repo/mtphelper.git
cd mtphelper

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1187279

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX