[头腾大战] 想请教各位技术大佬,头条真的能通过算法去推测出抖音用户的微信关系链么

2019-03-21 13:18:06 +08:00
 ViaSil

最近头条跟腾讯,不是因为多闪获取了抖音已授权的 QQ/微信头像及昵称的事儿,吵起来了嘛……

之前我一直浅薄地认为,在多闪上看到熟人推荐,是因为多闪获取了我的手机通讯录加比对抖音账号的原因,但今天看到这么一个观点,说头条能通过算法算出来用户在微信 orqq 上的好友关系链(暂且理解为微信 orqq 通讯录好友关系)?

小白听起来觉得非常 NB,听说头条算法牛,没想过这么牛啊,想请各位技术大佬科普一下,这个在技术上真的能实现么? 贴个图 贴个原文地址,感兴趣的可以瞅一眼: https://mp.weixin.qq.com/s/UkgouO7ylqYwoGW_PCB21Q

通过这篇文章,我了解到如果某 APP 想实现这个好友关系获取模型,最基本需要获取的有: 1.微信 orqq 的登录授权(获取昵称、头像); 2.用户在微信 orqq 上的分享行为; 3.用户在微信 orqq 上的点击行为; 4.……?还有啥呢? 文章里说到的只是微信用户之间会形成的关系,但是我并没有授权微信 orqq 登录,没有公开分享过抖音链接,印象中也没有点击别人的链接去下载抖音,最后多闪上还是有了微信 orqq 好友的推荐(猜测是拿抖音的数据),所以这个好友关系,到底是怎么去获取的呢。。

十分好奇,求个解答 or 分析 or 讨论 or ……感谢了!!!

5156 次点击
所在节点    程序员
45 条回复
shengcz
2019-03-21 13:52:52 +08:00
感觉要火,头条系和腾讯系 你站哪边?
LicV587
2019-03-21 13:57:38 +08:00
无论算法多牛逼,实质还是在偷微信关系链。头条系的逻辑一直都是我弱我有理
CEBBCAT
2019-03-21 14:16:54 +08:00
原文说的挺符合逻辑,但可行性不知道。楼主的情况信息太少,无法判定。

楼上说是字节跳动我弱我有理,我倒不这么想,使用合法获得的资料使用自己的智慧(算法)得出新的信息不就是数据挖掘的真谛吗?

反观是微信,滥用垄断地位,做了多恶我不说大家也觉得恶心吧?(为防有人不明不白,我举个例子:封杀子弹短信)
dimlau
2019-03-21 14:37:40 +08:00
@CEBBCAT #3 你举的例子可能大家也不明白啊,毕竟子弹短信 /聊天宝,压根就没怎么成过规模……
CEBBCAT
2019-03-21 14:50:37 +08:00
@dimlau 哈哈哈😄,那我有两个解决方案:❶不在规模在性质❷网友上网搜吧
Lin0936
2019-03-21 14:59:10 +08:00
我想了半个小时 orqq 是什么。
这俩家都不站,这两家的产品对我来说都属于“能不用尽量不用”的东西。
southsala
2019-03-21 15:00:59 +08:00
可确认的纬度越多,越能确定好友关系,好比像数独游戏
huangdayu
2019-03-21 15:03:21 +08:00
头条系的都不敢用了
chengzi168
2019-03-21 15:09:38 +08:00
@CEBBCAT 你的例子没法证明腾讯滥用垄断地位啊,你开了一酒店,做推广座做运营人气旺了,有一天有人进来在你酒店里见人就宣传他家酒店更好,去了唠嗑还送钱。你是酒店老板你怎么处理?
ViaSil
2019-03-21 15:11:07 +08:00
@shengcz 哈哈哈不敢站不敢站……

@LicV587 总是觉着还是要看头条具体是怎么干的,才能定义是否在偷……

@CEBBCAT 淘宝分享乱码应该更好作论据

@dimlau 哈哈确实。。而且还有可能是因为讨厌满票圈二维码看起来很乱才关掉的……

@Lin0936 对不住对不住,or 后面应该空个格……
marsgt
2019-03-21 15:12:09 +08:00
只能给个方向,贝叶斯方法,用这个来挖关系链。

不过它俩打架,微信不一定算强势方。就像《脱欧:无理之战》里,老卡也就拿这些个社交平台当个池子,然后一把把摸鱼,脱欧这事也就是这么成的。加上后边的某普上位和法国黄马甲,这才是准玩家。
ViaSil
2019-03-21 15:25:43 +08:00
@southsala 能确认的纬度有

1. 微信 /qq 登录授权:至少可获取头像、昵称;
2. 微信 /qq 用户在各自平台分享过抖音链接;
3. 微信 /qq 用户点击过好友的抖音链接;
4. 用户的手机通讯录获取;

实话讲这是我好像能主动交出去的全部了,还有别的我没有意识到自己交出去的东西么……
ViaSil
2019-03-21 15:49:24 +08:00
@marsgt 哇,搜了一下贝叶斯,怎么说呢……可以这么理解么:

1. 头条定义了 N 个事件(包括授权登录啊、手机通讯录啊 blabla );
2. 通过数据计算每个事件交集的概率;
3. 然后再通过各种组合这 N 个事件交集,用那个贝叶斯公式得出俩用户之间有好友关系的概率;
4. 当这个概率达到一个值(也是之前通过数据观察得出的),那么就可以推荐出去了……

sad,这是我看贝叶斯之后自行理解的极限了。。。

感谢提供方向!!!
binux
2019-03-21 15:53:59 +08:00
@chengzi168 但是你酒店的客人在酒店里讨论别的会所都不允许
KuroNekoFan
2019-03-21 15:55:30 +08:00
web 开发的基础概念串一串,简单提供一个可能的思路:
1.a 用户是微信用户,这是客观事实
2.假设 a 用户发的内容出现在了 b 用户的信息流里,那么可以判断,a 与 b 是有关联的
3.那么接下来需要标记给用户一个 id,而这个东西在微信里是现成的,每个公众号对于一个用户都有唯一的 openid,并且,获取这个 openid 对于用户是静默的(其实是否静默也无所谓,获取更多信息也就是一个弹窗的事)
4.那么,只需要分享出去的链接是?fromUser=openIdA,然后经过静默授权与各种重定向,最终头条的服务器可以得到:?fromUser=openIdA&code=xxxx
5.通过这个 xxx,头条可以查询到用户 b 的 openid
6.那么用户 a,b 的关系就被确定了
chengzi168
2019-03-21 16:03:58 +08:00
@binux 刚才还真试了一下,微信给别人发“聊天宝”并没有屏蔽。这里符合你说的讨论别的会所吧?
CEBBCAT
2019-03-21 16:21:52 +08:00
@chengzi168 ……无法叫醒装睡的人 @binux

别打那么多比喻了,子弹短信网站打不开是石锤(要不别说这个了,这帖的主题不在于此)
learnshare
2019-03-21 16:22:46 +08:00
数据多了,关系网能理出来的
tjsdtc
2019-03-21 16:37:46 +08:00
说起来我记得很久之前新注册的脸书账号进去就会推荐好多可能认识的人,而且大部分都是确实认识的,不知道怎么办到的
chengzi168
2019-03-21 16:38:06 +08:00
@CEBBCAT 这个站里大多数人都是程序猿,程序猿的特点就是理性和懂规则,不然也没法把想法编成代码让志东 0 和 1 的机器去执行。你说的垄断,至少给一个定义,什么叫垄断,你说腾讯垄断就垄断,你说实锤就实锤?举例子打比方只是让大家更好的理解这个世界的运行规则。腾讯自己做的产品聚集起来的流量,凭什么让后来的竞争者利用自己的管道做推广?不让就要你一句垄断一棒子打死是么?腾讯有很多其他的槽点可以吐槽也可用其他的例子证明它垄断,但你这个封杀子弹短信聊天宝的例子真证明不了。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/546961

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX