关于淘宝的传闻

2020-05-09 15:05:35 +08:00
 Lintech

一开始听说淘宝会在后台录音,然后推荐当时谈论的商品的时候,我是抱着怀疑态度的。直到这事情真正发生在旁边的人身上。前两天,我两个室友在讨论腕力球,结果他今天打开淘宝直接就给推荐腕力球......之后他告诉我,他的手机当时除了联网放在一边外,没有任何动作,后续也没有查询过相关内容。

少装国产软件保平安。

14037 次点击
所在节点    全球工单系统
136 条回复
1iuh
2020-05-09 16:15:05 +08:00
@taby #18 day1:上午对着手机说 10 次网球, 看这一天会不会推网球给你
day2: 上午对着手机说 10 次乒乓球,看这一天会不会推乒乓球给你

以此类推, 如果 1 周都无法复现,我相信能说明问题
nijux
2020-05-09 16:15:35 +08:00
不经过麦克风就可以通过陀螺仪监听。
<amp-youtube data-videoid="PVpBrum-H0Y" layout="responsive" width="480" height="270"></amp-youtube>
https://bitbucket.org/ymcrcat/gyrophone/src/master/
taby
2020-05-09 16:17:00 +08:00
@1iuh 语音监听只是手段的一部分,或者说,未必是语音监听,但还有可能是其他方式“监听”。
taby
2020-05-09 16:17:25 +08:00
@nijux 嗯,这个过年时看过了。
ifxo
2020-05-09 16:17:30 +08:00
@1iuh 有一定概率的,分批次的,不是同时监听所有的人,这样可以制造罗生门,让大家搞不清到底有没有监听
nijux
2020-05-09 16:18:20 +08:00
技术上是可以实现的
shintendo
2020-05-09 16:18:26 +08:00
@taby 你感觉的准确不一定是事实上的准确,你每天会谈论很多不同内容,也会使用到很多 app,这些 app 在不同时候也会推不同的东西,如果你的{谈论集合}和{推送集合}里有一个匹配的元素,这个元素会给你留下深刻的印象,而那些更多的没有匹配的元素很快被你淡忘了,最后留下的就是“准确”的印象。
准确与否需要统计支撑,不能靠体感。
taby
2020-05-09 16:21:28 +08:00
@shintendo 起初也以为“幸存者偏差”,但出现次数足够多的话,不能不引起怀疑。两年前跟他人交流过,几十人里有一半是跟我一样的感觉,将信将疑的。而最近,这些人里接近 80%都觉得不是幸存者偏差了,发生的次数和准确度已经超出既往认知。
1iuh
2020-05-09 16:21:33 +08:00
@taby #23 帖子的主题就是讨论到底存不存在麦克风监听。其他方式肯定存在的。

@ifxo #25 所以要多次测试,1 周不行 2 周。 总得有数据支持吧。 不然就是无法证实的都市传说。
shintendo
2020-05-09 16:24:50 +08:00
@taby 还有一种情况是,某个原因(比如热点事件)间接引起了你讨论某个东西,同样的原因也导致了 app 推送这个东西,但你的讨论和 app 的推送没有因果关系。
1iuh
2020-05-09 16:26:04 +08:00
当然,如果有大佬能反编译搞到相应的源码,或者抓到相关的数据包,那就更能说明问题了。

我们不能只靠“感觉”来判断,对吧?
Jooooooooo
2020-05-09 16:26:35 +08:00
监听麦克风然后分析推荐是做不到的

最简单的就是你找不到阿里内部有部门是做这件事的

reddit 上有在亚马逊做 echo 的员工回答过这个问题
Lintech
2020-05-09 16:31:15 +08:00
@xizismile 当时没有使用 WiFi
taby
2020-05-09 16:31:48 +08:00
@shintendo 歪打误撞?次数少的话,我当然可以理解,但歪打误撞变成常见,是另一种体会了。
183387594
2020-05-09 16:32:05 +08:00
@taby 比如 你 平均每天 讨论 2-3 个商品,交流到 3-5 人(你们 /听到你们讨论的人 去搜索 / 或查看类似) 。 每人每天又看到 20-30 个推广广告。 这样过一个月 总得推广中 几次吧。
比如我们市场做活动 在办公室发货飞机杯。 过几天大家的淘宝 都变成飞机杯了。 (因为我好奇啥牌子 多少钱 偷偷搜了下🐶
jun0205
2020-05-09 16:34:02 +08:00
最近好多次这样的情况,还是三方 APP 全关麦克风的情况下。
hhhsuan
2020-05-09 16:40:27 +08:00
这很容易验证啊,自己验证一下不就知道了?
shintendo
2020-05-09 16:43:57 +08:00
@taby 也不是说误打误撞吧,就是你的谈论和 app 的推送有相关性(是同一个原因引起的),但不互为因果
kruskal
2020-05-09 16:48:42 +08:00
一个人每天说的名词起码数十个,如何决定推荐优先级?销售人员、教师这些口头交流多的人需要分析的量更大。
无论是哪种监听方式总要存储数据进行分析吧,本地分析耗电量上反应不出来?云端分析流量上也会有体现吧,以淘宝的用户规模,那这个数据量得有多大,需要多少计算资源?
我总觉得大规模应用成本上划不来。
xizismile
2020-05-09 16:56:33 +08:00
我感觉监听用户通话数据肯定是没有的,这如果被爆料出来,竞争对手抓住机会能把你搞的死死的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/670004

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX