关于隐私,有个奇怪的想法

2021-01-20 02:02:08 +08:00
 necomancer

这两天到处都是腾讯扫描数据的消息。虽然腾讯宣称并没有泄露数据,但是根据一些网友分析,称腾讯会扫描一些带特定关键词的数据,例如淘宝,京东,股票和金融。原始数据也许没有泄露,但是有没有可能腾讯会离线分析和汇总数据以后再拿走结果?这方面我不是专业人士,也没有在网上看到关于 QQ 分析数据的代码……不过关于数据安全,我倒有一个奇怪的想法,有没有什么可以集成在浏览器上的插件比如会模拟随机在淘宝搜东西(我知道淘宝联想推送,但是实话说这个功能我并不想要)或者模拟随机点各类新闻,或者关键隐私数据部分生成一些虚假信息,让自己的隐私信息淹没在垃圾信息里?其实从 10 年前开始,国产软件耍流氓的新闻就层出不穷,一概虚拟机 /沙盒也不是万能解决方案,所以面对无法反抗的现状,能不能从数据分析一块入手?让自己的隐私数据完全无规化、无价值?

3652 次点击
所在节点    程序员
16 条回复
sasalemma
2021-01-20 02:23:30 +08:00
喵喵喵?当年 hips 盛行的时代,360 还没有收编 md 的时代,comodo 还是 5.1x 的时代,不早就是企鹅搜索全盘的状况,现在又水深火热,感觉这才是真企鹅。

通信软件端到端加密就是双刃剑,毕竟发送了什么,你不知我不知。

另 bug10 都光明正大搜集这些了,还能说什么,比如 v10.events.data.microsoft.com



个人看法,从社会工程学和统计学来说,任何个体的特征行为实际上没有什么意义,有意义的训练样本都是相互之间的关系,所以,支付宝,狗东,和本来就玩设交的腾讯,才会让你填上子女,父母,亲密付的信息。反过来说,要使数据无意义,就做一个普通人,普通人,芸芸众生。

淘宝推什么就点什么,热搜什么就点什么,让它在认识你的路上越来越远。

话说回来,实际上真正的隐私问题,是半真实半虚拟才有,比如你的微信。本来像以前 qq,没有实名,没有手机,就是虚拟的,换个 qq 号就行了,而当虚拟的号码绑在一个实体上才有隐私问题。

如果你的朋友用着你的淘宝,你用着朋友的淘宝,那你买什么,送货到朋友的手机,对于淘宝来说,也是把你朋友这个号和你的实体关联而已,但人家要的也不是你实体的隐私,而已关联的隐私就够了,你用什么号不重要,只要你用了,这个号的这个实体,就是这个兴趣爱好,除非你不用啊。

所以说白了用一个 app 这么辛苦,要混淆,还不如,叫你朋友帮你买东西就算了,或者一家人用一个账号。
kaiki
2021-01-20 04:09:21 +08:00
我连生活中都只说一半真话,那些数据怎么可能提供真的呢。
不过大数据有可能会筛选你资料中可信的部分来给你画像,一味地塞垃圾数据很有可能会被系统轻易筛掉。
necomancer
2021-01-20 04:11:38 +08:00
@kaiki 这只是想法,不过我觉得技术也是很有意思的。就像人脸识别和反人脸识别。怎样才能做到有效的混淆~
lindas
2021-01-20 05:22:00 +08:00
firefox 有个屏蔽广告的扩展组件叫 AdNauseam,作用除了屏蔽广告外,它还会点击所有广告链接,起到混淆的作用,这个应该算是一种
xcstream
2021-01-20 05:30:30 +08:00
可以 但没必要
你不是什么公众人物
nzynzynzy
2021-01-20 06:07:43 +08:00
一个观察

背景:肉身翻墙 6 年了,至今携带着国内的十一年在网的手机号,支付宝微信绑定的是海外手机,淘宝(重度使用)、PDD 和 JD (轻度使用)都是给家人买东西或者直接寄到转运公司,QQ 弃用,微博绑定虚拟号码

现象:
1. 手机号接到的诈骗电话和广告短信越来越少,刚开始 2 天 1 个,现在 1 个月少于 1 个
2. 淘宝的推荐主要是之前搜索过的东西,没有跨平台的现象,从来没接到过淘宝商家的短信
3. 国外的垃圾短信随着在网年龄变长也很泛滥,BTC 的垃圾短信天天都有
4. 蚂蚁分 760+多,其实我在国内资产并不多,没有信用卡,有的卡都是借记卡而且很 low 的那种,这个算法不明
5. 花呗 14K,算多算少?反正没提过额,因为我国内没台面上的工资

在国内的情境下我这种人基本算是隐身了,可以对比你们高度暴露的个人信息。各位有什么需要问、可以作为对比的,随便问
LimeQAQ
2021-01-20 07:29:57 +08:00
@nzynzynzy 虚拟卡都能绑定些什么账号?
S179276SP
2021-01-20 07:33:24 +08:00
@LimeQAQ 基本都可以绑定,不可以注册
Harry1993
2021-01-20 07:35:55 +08:00
學術界有個方向叫 Differential Privacy 挺像你描述的:

https://en.wikipedia.org/wiki/Differential_privacy
wy7305e
2021-01-20 08:21:47 +08:00
用爬虫访问你不会访问的网址。
用 javascript 随机打开网址。
写个 userscript 随机搜索。
jerfoxu
2021-01-20 09:24:30 +08:00
混淆的数据总是有规律可循的,如果流行开来也要设置如果防止识别的机制。
当然与其绕这种弯路,我还是更加的期待去中心化的到来,最起码是多一些想 github 这样的商业性质不大的科技公司。
imn1
2021-01-20 11:01:51 +08:00
隐私问题这样说,是针对一个人分析,还是针对一群人的共性分析,就是目的不同,性质就不同
前者是显然侵犯个人隐私的,后者则是市场需求,但这个目的,只取决于分析人的本意
#1 说的“特征没有意义”,就是指后者。确实,不关心前者的话,真没必要防

如果一个酒店分析单一个顾客的入住情况,真是异常奇怪的事,因为这不是市场行为
但现在流出的那些“个人各地开房记录”,难道不就是各酒店、旅馆收集的么?
数据迁移了(流出),分析的人不同了,分析的目的不同了,性质就不同了

又如小区人脸识别门禁,我也相信针对我的小区出入记录分析没什么市场价值,但如果我和物管产生纠纷时呢?这个采集的公司结业时呢?将来会不会有个“个人各地进出记录”的社工库里面有我的身份证和照片?
港式粤语有个词叫“点错相”,大家了解一下,🐶

回主题
沙箱、虚拟机,甚至多硬件设备,是行为隔离的方案
LZ 说的则是数据污染方案,确实是一个手段,例如我手机通讯录有 1000+个伪造的,以前小米手机提示超过一千条无法同步,现在不知道如何了
感谢父母,估计他们也没想到,现在 google 搜我的名字,前几十页都是和我同名的某个名人(父母不知道这个人),这个几十年前的数据污染方案太成功了,🐶
但是,某社工库还是有我,^$%&)__+)#!%^*)(_)^

但无论前者还是后者,都很难,因为 timeline 问题,电脑记忆数据是不会“遗忘”的,所以这两种方法,能应付一时,但要对付长期、持久的侵犯,个人也要长期、持久地实施的方案,能做到很难,即使做到了,得益者显然是 GDP 数据,很多人因为成本太大放弃了
举个例子,川皇不是多年以前歧视某某阶层的话都被翻出来了么,虽然他那几句话和现今的话相比真是小巫。但换作自己,那些现在不介意被收集的人,认为小 P 民没有价值的人,是否早已放弃将来“功成名就”了?如果是,那他们的豪言还真是真心话呢,或者说到了功成名就那时,说啥都会成为真理,无所谓了,例如福报

如果一个社会长期处于这种收集与反收集的抗衡,发展也不会健康,这是往大了说
往小的说,人们终将会麻木了,因为无时无刻都在收集,各向差异已经磨平,大家就“不介意”了
nzynzynzy
2021-01-20 11:14:13 +08:00
@LimeQAQ 其实就是一个只能接收短信的海外手机号,没啥太大用。公司有好多我就蹭了一个
fruitzerg
2021-01-20 11:28:56 +08:00
其实我也有这样的想法就是国家出来做虚拟账号他们对接国家接口不能对接不能上架,信息让国家去手机做经济规划。
fengwn
2021-01-20 12:00:31 +08:00
怎么说呢,隐私这玩意,只要你不尴尬,就是别人尴尬.主要是看个人心态,有的人信息满网飞,别人根本不在乎.
seesky
2021-01-20 16:12:28 +08:00
即使塞满垃圾数据, 但还是可能从一些特定的场景推断出你的隐私信息的真否, 就像你就算用假名字, 如果你和你的孩子老师交流, 对方不可能称呼你的假名字吧? 就算你用充满虚假的数据, 对于后台来说最差的情况就是丢弃, 另外可以使用其他的数据交叉对比可信度.
其实最好的方法已经有了, 参考 tx 反外挂的那些年, 无论技术再怎么加强, 大佬招多少, 都是游戏不死越反越多. 后面直接送监狱, 才开始收敛不少的.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/746492

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX