Java ITEXT 对 pdf 文本部分文本进行隐藏处理求助

2021-11-09 11:58:48 +08:00
 yiqunz

JAVA ITEXT 对 pdf 文本进行处理

需求:隐藏敏感数据,比如把 pdf 里的电话号码删除

问题点:目前使用白色遮挡层去实现,生成的 pdf 表面是去除了电话号码。 但是在空白区域里还是能将电话号码复制出来。

        PdfContentByte canvas = pdfStamper.getOverContent(1);
        canvas.saveState();
        //白色遮挡层
        canvas.setColorFill(BaseColor.WHITE);

不知道各位大佬有什么其他的实现方式处理

1223 次点击
所在节点    Java
9 条回复
wowo243
2021-11-09 12:02:51 +08:00
为啥不直接删除,还覆盖一层
yiqunz
2021-11-09 14:07:48 +08:00
@wowo243 怎么删?
yinzhili
2021-11-09 14:10:10 +08:00
如果是自己生成的 PDF ,在生成之前就抹掉敏感数据是最简单的
yiqunz
2021-11-09 14:24:04 +08:00
@yinzhili 这。。我当然知道,处理别人上传的 pdf 。。
buliugu
2021-11-09 20:08:49 +08:00
读取之后处理敏感信息然后直接重新生成一份新的 pdf
yiqunz
2021-11-10 10:48:05 +08:00
@buliugu 具体怎么处理呢?有参考的博客或者用到的技术么?难点在于我没找到这样做的方法。。。
Jh1n
2021-11-10 10:55:48 +08:00
覆盖然后写入新的内容比如空字符串
yiqunz
2021-11-10 11:00:25 +08:00
@Jh1n 没有用的。。贴图片盖住都不行,还是能复制。。能搜索出来
buliugu
2021-11-11 10:11:59 +08:00
@yiqunz 有个 PdfCopy 类可以看一下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/814116

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX