广告与监听

2021-09-04 12:48:25 +08:00
 alexkkaa

大家有没有发现有时候自己无意间说起想干一件事, 而且从未在网上搜索过相关话题, 莫名其妙就收到了广告推送, 而且是极其精准的。

个人在日常中经常发现这种现象。 前天, 我给孩子去照相, 遇到一个培训班的老师在门口闲聊了会, 我说孩子学习一门乐器很有必要, 打算让孩子大点学, 今天我就收到了腾讯课堂发来的推广短信, 推广他们的音乐课。 本人以前从未搜索过相关话题, 也没跟任何人说起过相关话题, 也没有在聊天软件提起过。手机是放在兜里的。

当时我的手机是 4g 网, 那位老师我也从不认识, 只是门口闲聊, 大家由双减政策聊到艺术培训。我也没给他还有照相馆的人留下我的任何个人信息。

我日常是很重视隐私泄漏的, 输入法我都不用任何国产的, 不管是电脑还是手机都用的 google 输入法, 手机软件除了微信 qq 之外都没有开启录音权限(视频聊天必须开启录音,无奈之举), 而且我的手机上安装的软件很少,miui 自带的软件能删的我都删了, 第三方软件我也只装了 qq 微信 tg ( tg 本身就没要啥权限) 百度高的腾讯地图(地图软件没有任何权限 只在导航时开启其权限) 头条(也是没开启任何权限) 几个网银软件(没权限) 淘宝 咸鱼(有剪切板权限 定位权限相机权限没录音权限) 京东(为开启任何权限) yandex 浏览器(只开启剪切板 读写手机存储权限)

以当时的情形我实在想不出除了录音之外的其他泄漏渠道, 第一是否是安卓有某些隐藏的功能或者说漏洞, 被某些公司发现了用来门声发财? 第二是否是 miui 自带这种隐藏的 buff ? 第三是否是腾讯做的恶?

以上只是猜测, 不针对任何个人或公司。

另外提一个软件 知乎, 自从卖身后各种恶心的骚操作, 你在里面有什么动作立马就会被反映到其他软件如头条里, 我他妈在知乎浏览的话题怎么头条立马就给我推送了, 而且不是一两次, 很多次了。 知乎早都删了, 跟这次的事件应该无关。

究竟我的谈话内容如何泄漏出去的呢?

8780 次点击
所在节点    程序员
127 条回复
Jooooooooo
2021-09-04 13:58:36 +08:00
@alexkkaa 违法本身就是一方面, 另外还要突破麦克风权限, 这又是谁家能做到的?

再就是本身这个事情很难做

另外你做广告也知道现在本来各家公司画像已经相当精准了
alexkkaa
2021-09-04 14:02:20 +08:00
用户画像不是凭空来的 他们拿什么给我画? 还不是各种信息泄漏吗? 现在那些所谓的大数据 ai 精准广告哪个屁股下面不是一堆屎?

所以这个问题的本意不是他们画像多么厉害而是他们从哪来的素材画像?
hallDrawnel
2021-09-04 14:03:43 +08:00
siri 和小爱不一样的。你给 siri 和小爱说的话都是有限的简单的命令语句,并且有明确的触发条件,有明确的领域相关性。模型训练可以针对性训练提高精度。

假设要监听你的对话,首先要一直采集分析,这就是一个性价比很低的手段,本地分析耗电、精度不够,容易被发现,远程分析需要一直发送网络请求,得到的数据全是琐碎的音频数据,算法需要做到:

1. 过滤出人声,这点很成熟
2. 提取:因为采集的是完全随机的对话信息,没有任何特性,有无数的关键字,得有一个十分全的数据集来训练。
3. 拿到那一大坨噪音(数据噪音不是音频噪音)那么多的原始输入数据,我的天要怎么套模型(逃

这还是解决了不让用户、不让第三方技术分析厂商抓包 app 悄悄录音的情况下,后续才需要去解决的问题。技术能不能是一码事,法务和风控直接就过不了的。

所以说偷听性价比真的很低,就目前的算法水平,弄到了分析起来也是头皮发麻。现在用户画像很强的,大公司的用户画像除了自身平台,还有很多合作数据源,所有和你有关联的人或物都有很多结构化的数据,比录音性价比高多了。公司也没听说过有这种组。

我觉得更有可能的是,假设你的 WiFi 没有开启随机 MAC 地址(即使开启了,还得考验操作系统厂商的节操),那么你去过的大多数地方做了停留就能被探针记录,不需要你连接任何热点,这样的探针无处不在。这些探针厂商基本是拿着数据瞎卖的,你也锤不了他们,然后不知道过了多少手大厂肯定能拿到这些数据,他们的模型接着就能够把你和所有在你这台手机登陆过的账号匹配起来。于是就能做基于地理位置的行为分析,包括时间和空间上的。

接着基于地理位置的一些关联算法就会发现你和培训老师有过交集,然后那个老师也以同样的用户画像方法被分析过。并被打上了各种标签。同时,你有小孩,年龄多大,什么性别估计模型也猜了个八九不离十。

中途省略无数你,以及在空间、时间上和你有过关联的信息流分析。

接着,到了 CTR 预估环节。结合你的其他行为,包括地理位置啊什么的,来猜测给你什么样的广告点击率会高。这其中除了参考楼主的行为,还会参考和楼主相似的用户的行为的点击结果。(最简单的模式是:买了这个商品的用户还买了哪些商品,那就给准备买这个商品的用户推送那些商品的广告) CTR 预估是广告系统核心的核心,它能够综合到的数据源可能比用户自身要多得多,并且是学术和工业界发力的重点。然后,这些信息生成了一个向量,里面的某个值比其他值要高一点,让与之相关的某一条广告被选中了,接着你被命中了,多少成为了 CTR 的一个正样本。而要做到这些都不需要去冒风险录音。
littiefish
2021-09-04 14:06:38 +08:00
这破逼事,都讨论几百回了
alexkkaa
2021-09-04 14:07:01 +08:00
@Jooooooooo miui 以前到处是广告, 而且其广告收入比卖手机都赚钱, 这个有相关报道。 为何这两年突然就很少广告了? 是其脑子抽抽了放弃那么大快蛋糕? 答案只有一个, 那就是在你看不到的地方赚钱
alexkkaa
2021-09-04 14:16:26 +08:00
@hallDrawnel 算法方面并不是问题, 问题是各种数据源各种素材是怎么来的。 就我这个例子如果不是录音, 那么 wifi 探针是种手段? 安卓在没有自动连接的情况下周围的设备可以探测到我吗? 对移动开发不熟悉, 请熟悉的朋友说说。

如果这是种泄漏渠道那么这个问题就简单了, 我跟那老师交谈时周围有设备获得了我们俩的身份, 根据对方培训老师的身份, 和我有小孩的事实,向我发送广告。
ckaock
2021-09-04 14:20:02 +08:00
同遇到在商场里看到小鹏汽车,也跟人讨论了,微信朋友圈当天晚上就推送了
Jooooooooo
2021-09-04 14:20:18 +08:00
@alexkkaa 这个猜想的逻辑链条太弱了.

"卖广告比卖手机赚钱", 财报里这么说吗?
"这两年广告少", 怎么体现?

就算前两条是真的, 你能得出监听推广告的结论吗? 我看完全不能.

"看不到的地方赚钱", 比如云服务 iot 也是一项, 并不要广告.
hallDrawnel
2021-09-04 14:24:00 +08:00
@alexkkaa 你搜索一下 WiFi 探针 就知道了,技术很成熟。从无差别监听录音上来说,算法方面的确是一个难以解决的问题,那样得到的数据太脏了,基本无法用。如果你有做过一些算法的工作,或者打过一些比赛的话,你会发现目前有效的算法对数据的清洁程度要求是很高的。而无差别录音提特征,就有点像一个做车道线识别的 CV 算法,给他输入了大量的图片,但只有 1%是马路的图,那这个模型的召回率肯定很糟糕。

WiFi 探针只是一个被公开锤过,但还在持续用的技术,还有其他各种各样的姿势能做这些事情,有的我们能推测到,有的可能知道的人还不多。比如第三方支付码扫码直接精准定位,还能知道你的消费类型,消费价格,精准画像。各种 app 时不时地获取一下地理位置信息,
alexkkaa
2021-09-04 14:25:18 +08:00
小米成广告收入最高手机公司,MIUI 广告成小米最大营收之一!
https://new.qq.com/omn/20200102/20200102A041LL00.html

数码论:MIUI 去广告的背后是小米良心发现还是另有隐情?
https://new.qq.com/omn/20200102/20200102A041LL00.html

怎么体现? 一前的 miui 被称为 adui 你没听过吗?

录音只是我的一种猜测, 我对移动端不熟悉, 只是提了一种可能
MoeMoesakura
2021-09-04 14:25:46 +08:00
定位?

(建议用 xiaomi.eu/miui eea 试试,感觉确实是定位)
delectate
2021-09-04 14:26:32 +08:00
其实,智能手机的锅只占一部分,八卦一下:
1 、手机里,输入法、batm 系列 app 、广告联盟,没有一个干净的,全员恶人;
1.5 、语音、使用习惯,都会被他们拿去反复分析,扒皮,每一个人只是赤裸裸的数据,隐私是绝对不可能存在的,什么隐私保护法,也都瞎扯淡;
2 、没点名的 app,读通讯录、剪切板、地理位置的也都不是好东西;
3 、那么完全干净的甚至不插卡的智能机,就能 ok 了吗? wifi mac 、蓝牙,对于局域网的其他设备,都是很好的身份识别符,现在智能电视都会很贴心的为你扫描局域网的设备 mac,然后上报后台,所以千万别小看中国人的作恶能力和道德底线;
4 、那么如果用功能机呢?功能机也可以嵌入很多已经开发好的功能,甚至是广告、营销短信,尤其是非智能的老人机,广告多到令人发指;
5 、如果不用手机,那么安全了吗?手机还能限制住 app 的后台运行,但是,pc 你能管控某个程序只读取、写入什么文件吗?嘿嘿,猫腻多的很哦。如果是一刀切的话,趁早删了所有国产 exe,尤其是红衣教主的和全山的;
6 、那么,不用电脑,不用手机,就安全了吗?不不不,你的手环、手表同样可以被识别,被记录哦。
7 、最后,我不带手环、不用电脑,不带手表,不用手机呢?答案是否定的。分众传媒、商汤科技、阿里,只要你能想象得到的,都在公共场合扫你的脸,识别你的身份(现在知道为什么他们大力推广刷脸支付了吧?这是最赤裸裸的利益驱动)。
L0lita
2021-09-04 14:27:56 +08:00
google 输入法照样泄露
alexkkaa
2021-09-04 14:28:34 +08:00
@hallDrawnel 其他手段都需要一定的触发条件 比如扫吗购物之类的 定位权限也可以关闭。 但是 wifi 探测这个就没法了, 相信没几个人离开家里会关闭 wifi 把, 大多数人 wifi 应该是全天开着, 那就意味着只要到了有这种设备的地方就会被识别。
alexkkaa
2021-09-04 14:33:08 +08:00
@delectate 利益面前是的。法律就是个笑话, 跟 google 一样罚他个几百个亿 , 可惜这种事在这里不会发生
alexkkaa
2021-09-04 14:35:21 +08:00
很多人觉得隐私不重要, 那是没意识到隐私在别人那就是钱, 而且是巨额财富
alexkkaa
2021-09-04 14:38:11 +08:00
@L0lita 说实话 就算是泄漏到 google 对我个人而言并不介意, 第一他是个外国公司 而且是被赶出去的, 他就是想作恶也不是那么容易的, 我们自带防火墙。 第二 被欧盟罚过几次我相信他也没那么容易出卖数据
6IbA2bj5ip3tK49j
2021-09-04 14:47:24 +08:00
是的,各大软件都在监听。
开发这项功能的开发者都被转移到深山老林,不允许与其他人接触。
外界的人只要发现了这个秘密,就会被灭口。
xenme
2021-09-04 14:53:09 +08:00
看到现在感觉有点反智。
alexkkaa
2021-09-04 15:03:04 +08:00
@xgfan 你实现不了的功能别人就实现不了吗? 巨大利益面前总有聪明人。 而且就算大公司想这样干你以为他们会蠢到自己亲自来做吗? 白手套你知道什么意思吗?

之前看过一个文章说是可以通过加速度传感器实现类似麦克风一样的功能, 因为加速度传感器和麦克风原理是一样的, 而且目前安卓 ios 好像都没有这项权限的管理。

而且就算应用 app 实现不了, 那么系统本身呢? 系统本身自带这种功能你怎么办

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/799831

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX