大数据时代保护隐私的另一方向:往大数据里投毒

2021-01-29 11:13:15 +08:00
 billytv
大家都说在大数据下隐私都暴露无遗,各种 app 的广告精准投递,与其小心地防着,也许能换个方式向大数据里投毒?如爬虫一样,防守一方往数据里投假数据,混淆虚实,爬虫一方不小心就把假数据当成真,得到无效数据。

简单实现方式:
在已登录淘宝 /京东账号,搜索与自己兴趣毫无关联的产品,如玉石、茶叶等, 模拟长时间浏览 /加购物车 /咨询小二等操作。

经过一轮操作,推荐页面已变得与个人兴趣不太相关,简单实现投毒。

进一步投毒:
所有厂商用于识别个人画像的东西,如手机型号,使用时间(半夜打开)、IP 与地理 (使用代理)、输入法、音频 (如真有偷听) 都可以进行投毒, 另一方面可以多人公用账号来混淆对个人精准识别 (但可能会有安全风险, 而且据说不少 app 能根据用户手指滑动习惯精准识别用户)

自动化:
利用 xposed/圈 x 等工具自动化操作,定时往 APP/sdk/各大广告联盟输送无效数据

如果这个方式有效且落实得好,即使账号已经实名制,但各大厂拿到的个人画像已经变成模糊不清,营销变得毫无意义
7571 次点击
所在节点    奇思妙想
51 条回复
HatMatrix
2021-01-29 13:57:40 +08:00
何必呢,反正数据都会被收集,为啥要给自己找麻烦且让自己的推荐列表看着恶心。
winnerczwx
2021-01-29 13:58:12 +08:00
用如此繁琐的操作, 对抗的是各家大厂背后的精英团队(手动狗头
AA5DE3F034ACCB9E
2021-01-29 14:15:02 +08:00
哈哈,很赞同
littiefish
2021-01-29 14:44:26 +08:00
其实最简单的就是多人共用一个账号
ReinerShir
2021-01-29 14:49:10 +08:00
@Varobjs 理论上可以公安部提供统一实名接口,企业只能拿到类似微信一样的 openid,这样用户实名信息就不会泄露,但是实际上却很难实现。
ruixue
2021-01-29 14:52:18 +08:00
如果不需要实名,根本用不着这么麻烦,佛系一些,随它怎么精准画像,过个三年五年换个设备换个号码换个账号从头再来即可,那些画像画的是过去的我,弃用账号后又影响不了现在的我未来的我。。

比方说我现在用 Firefox 的账号就是如此,随它怎么收集浏览活动,定期换个邮箱新注册账号就行了

只可惜现在国内服务动辄要求绑定身份证,用户隐私画像和个人身份便实现了永久强关联,就算换设备换号码,注销账号再注册新的也白搭,身份证号一输以前的黑历史通通重新关联回来,永远无法摆脱。。毕竟身份证是最强的精准定位自然人的手段,就算搬家改名整容,身份证号仍会伴随一生~

之前美团收购了摩拜,新注册美团会直接调用摩拜的身份证数据,要求用户验证号码的实名信息。。所以不要觉得各个账号之间身份隔离就万事大吉了,今后各家数据互通的情况可能会越来越多,也越来越容易,反正拿身份证号做主键,各家都一样,都不需要转换的~
murmur
2021-01-29 14:56:55 +08:00
投毒是很危险的,你操纵价格这些数据最多劝退一些客户,新闻类网站如果是敢返回违法内容直接自己没了,用户可能看不见代码扫描会看到啊,人家可不管你是能看见还是看不见的
KennyMcCormick
2021-01-29 15:24:20 +08:00
此时此刻正在淘宝和京东搜客户的产品,这也算投毒吧?
mxT52CRuqR6o5
2021-01-29 15:27:04 +08:00
没啥用,你付没付钱淘宝京东还不知道吗
sillydaddy
2021-01-29 16:23:28 +08:00
@ruixue #26, >“如果不需要实名,根本用不着这么麻烦,佛系一些,随它怎么精准画像,过个三年五年换个设备换个号码换个账号从头再来即可,那些画像画的是过去的我,弃用账号后又影响不了现在的我未来的我”

即使不实名,画像的话,也是能识别出不同的账号对应同一个人的。

“用户的浏览历史是独一无二的,可作为指纹使用”,https://www.solidot.org/story?sid=65389
“测一下你的浏览器有唯一的指纹吗”,https://amiunique.org/fp

另外还有“ip 地址”,“浏览器 cookie”,“移动设备信息”,“移动设备内的文件”,“行文风格分析”。。。

想要唯一对应一个人,太容易了。中本聪就是活生生的例子啊。
ruixue
2021-01-29 17:02:25 +08:00
@sillydaddy 嗯,是这样的,现在用来画像的技术手段层出不穷,防不胜防。不过之前说过,如果换了设备换了号码,浏览历史、浏览器指纹、浏览器 cookie 、移动设备信息、移动设备内的文件也相当于推倒重来了,这方面倒是不必太担心。现在基本都是动态 ip,想只通过 ip 地址对应唯一的人也不容易。至于行文风格分析,以及类似的行为习惯分析,这个确实难解,不过这种分析都有一定的误判率,根据贝叶斯定理,除非把误判率降低到一个相当小的程度,否则想只凭这个就确保精准是不可能的~

说来说去归根到底还是成本的问题,实名绑定身份证号了,平台根本不用付出什么成本就能轻易地关联和该身份 ID 绑定的所有隐私画像,用户想一定程度避免,就需要挖空心思搞各种奇技淫巧;而不实名的话,只要用户稍微做一些技术处理,平台想确定唯一的身份需要付出的成本会大幅提高。资本都是逐利的,如果为了精准画像付出的成本还不够精准画像带来的收益的话,对于普通人来说也没必要过分担心了,省下精力做自己喜欢的事不也挺好~
felixcode
2021-01-29 17:06:21 +08:00
买东西前先花三个小时给各网站投一下毒?
Leonard
2021-01-29 17:07:23 +08:00
这么干也太累了吧
ScepterZ
2021-01-29 17:08:34 +08:00
感觉至少淘宝推送的东西还挺好的,我可能就是李彦宏说的那种愿意隐私换便利吧
liujialongstar
2021-01-29 17:11:11 +08:00
投毒不会让 app 不推送信息, 只会让 app 推送些莫名奇妙的东西, 最终恶心的还是自己
helionzzz
2021-01-29 17:13:05 +08:00
你要是一个朋友亲戚都没有平时不跟任何人联系 这事还有那么点实现的可能。你的信息一大半都是你的社交圈泄露的,请问你怎么防
taobibi
2021-01-29 23:14:28 +08:00
扰乱的难度一方面在于你身边的人,你把信息保存的好好的,然后你的亲戚朋友同事老板把你的姓名电话都分享给了 app 。
难点 2 是把你微信支付宝一封,直接 gg,然后呢,想要解封,身份证,银行卡,人脸全交出去了。目前封号微信的杀伤力远大于征信黑名单。
gmm
2021-01-29 23:39:17 +08:00
减少使用有这类软件吧。
medivhs
2021-01-30 07:47:43 +08:00
懂了,这就去搜女装
wolong
2021-01-30 11:30:19 +08:00
我觉得没有用,我的淘宝号时不时会被女同事拿来下单购买一些母婴用品(有些商家搞活动,一个号只能下一单)。即使是我实打实的付款下单购买了这些商品(大概买了 4-5 次吧),淘宝也从来没有给我推荐过这些商品,就更别说靠只浏览不下单来污染人家的数据了。
再说了,商家精准推送广告,对消费者来说未必是坏事,反正人家都要推广告的。能推到自己有兴趣的商品总比推一些莫名其妙的商品要好。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/749476

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX