我做了个数据脱敏工具,结果被陌生人当场抓了仨安全漏洞

21 小时 16 分钟前
 qharbert
背景:我不是法务,但凡公司数据要出境(出海、跨国协作、多地部署),「数据合规」这四个字就来烦我。拆开就是三件事:脱敏、加密、出合规材料。

我以前的"方案":正则脱敏一坨 + openssl 加密一坨 + Excel 手搓合规文档一坨,靠 shell 和祈祷连起来,每次跑完都怕漏个手机号没盖住。

于是写了个工具把它压成一条命令:

pip install cloakpii
cloakpii migrate --source ./data --output ./safe --compliance-profile pdpa --compliance-report
进去一个文件夹,出来一个「脱敏 + AES-256-GCM 加密 + 带合规报告」的副本。支持 CSV / JSON / Excel / Parquet / SQLite 等 8 种格式、11 种 PII;默认不可逆掩码,也能可逆令牌化(脱敏后还能 join)。

本来想低调发的。结果上 PyPI 没几天,一个陌生人给我提了个 PR:SQL 注入、XXE 、还有个 SQLite bug 。一个做「数据安全」的工具被路人当场抓仨漏洞,属实社死。我心虚地把自己代码又审了一遍,果然还藏着个更丢人的——数字类型存的手机号/证件号直接漏过去了。现在修完焊上了 233 个测试。

GitHub:https://github.com/Hellotravisss/cloakpii

想问问大家:你们做跨境数据 / 合规这块,现在最头疼的是哪一步?是脱敏准确率,还是合规材料?欢迎拍砖,尤其欢迎再来抓 bug 的。
443 次点击
所在节点    分享创造
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1221829

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX