有什么办法避免图片中的文字被 OCR 识别出来呢?

2021-12-14 09:54:42 +08:00
 xianxiaobo

在某社交平台给好友发图被提示内容违规了, 图片内容是自己手机在新浪微博 APP 上的截图, 截取的是一条微博的评论, 所以猜想应该是图片中的文字违规了吧。 然后就很好奇有什么简单的办法可以避免图片里面的文字被 OCR 识别出来吗? 比如换一种奇怪的字体?

13685 次点击
所在节点    程序员
83 条回复
uclort
2021-12-14 10:07:43 +08:00
增加 OCR 难度势必会影响到阅读难度。
AlexLokhart
2021-12-14 10:08:12 +08:00
可以猜测一下新浪的 OCR 训练集里面都是什么东西,训练集决定了 OCR 能适应怎样的数据(图片),然后反其道而行,换字体估计没啥用,加删除线之类的东西试试
Alchemistboy
2021-12-14 10:09:35 +08:00
画几条彩线,参考那些恶心的验证码
SenLief
2021-12-14 10:11:35 +08:00
加个水印?
HankAviator
2021-12-14 10:13:06 +08:00
传统艺能火星文啊
root99527
2021-12-14 10:14:07 +08:00
添加一定的形变(如果有变形字体检测的话此条无效)
添加一定的水印(具体看水印的形式,比如叠加一定的字在上面,不影响阅读的前提下设置一下透明度和大小)
替换一定的字符(比如火星文,一般字符识别的字典不会覆盖这么全)
vocaloid
2021-12-14 10:15:18 +08:00
https://github.com/NitroRCr/Words-away

不过实测国内一些厂商的 ocr 还是勉强能够识别
wolfie
2021-12-14 10:17:24 +08:00
拱桥形状
tabris17
2021-12-14 10:18:30 +08:00
gif 动态图片,栅格化刷新
vocaloid
2021-12-14 10:20:50 +08:00
@vocaloid #7 突然发现贴错项目了,是

https://github.com/yuzu233/anti-ocr
zxcslove
2021-12-14 10:36:24 +08:00
用草书字体的火星文
Ackvincent
2021-12-14 10:39:00 +08:00
这不就是火星文吗?
Kagari
2021-12-14 10:41:00 +08:00
qq 的 ocr 也挺强的,可以把 #10 的图放进去试试
hervey0424
2021-12-14 10:46:58 +08:00
把文字随机打乱, 然后在后面加上顺序编号
hutng
2021-12-14 10:49:30 +08:00
一律写成拼音,它能 OCR 出来我算它牛逼
qsmd42
2021-12-14 10:58:16 +08:00
治标不治本 不如换个沟通渠道吧 网球新闻都是用 imessage 或者 tg 发给朋友的
shakoon
2021-12-14 10:58:50 +08:00
@tabris17 #9 我觉得你这个靠谱,每一帧都很短,不影响人眼识别,但可轻易干翻机器。但是问题是,现在已经有使用这种方式截图的软件了吗(无论手机 app 还是 pc 软件)?
Zy143L
2021-12-14 11:05:07 +08:00
把图片转过来,再打上几条斜纹。 然后正过来再写一些无关痛痒的文字。
tabris17
2021-12-14 11:29:30 +08:00
@shakoon 我一直打算做一个,奈何没有 apple 开发者账户
ekidona
2021-12-14 11:47:49 +08:00
做过一段时间 OCR , 比较容易实现的 attack 是改变文字的阅读方向,比如从下往上读,从右往左读。当然这种方法要求你的文字有多排。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/822041

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX