如何用大数据查询接触过的人?

2020-01-28 22:12:20 +08:00
 miaeLKK

刚才看新闻上直播,李兰娟院士说:“有个患者说他没有接触过武汉的人,但是我们用大数据一查,发现他接触过 3 个。”(原话大概是这样)

有人知道怎么回事吗?我想最多就是查这个人乘坐公共交通路线吧,比如火车飞机什么需要身份证的,或者根据他的车牌号查询去过哪里。但是也不好确认接触的人吧?

突然想到明朝那些事儿里魏忠贤控制下的锦衣卫发现地下室 4 人聚餐抓人那段…

可能我深度不够,没觉得大数据有什么特别神奇的…我觉得它好像被过度神话了,我觉得就跟我们项目里数据库里的数据形式上差不多😂

6333 次点击
所在节点    问与答
37 条回复
d5
2020-01-28 22:17:40 +08:00
刚正巧也看了这个采访,恕我无知,私以为做不到,或者是根据火车、飞机、城市公共交通等数据进行十分粗略的分析的。

或者是三大运营商可以精准绘制用户的轨迹,根据一定的算法计算统计?
d5
2020-01-28 22:20:07 +08:00
仅在浙江范围,根据
全部的地铁闸机、公交刷卡机数据 + 全国范围内的火车飞机数据,理论上应该是可以查到同在一个车厢内的密切接触人吧。
miaeLKK
2020-01-28 22:25:28 +08:00
声明,此贴并没有泼冷水的意思,只是对科技的求知欲促使我问的。闲着也是闲着,大家探讨,也许能有新的发现
miaeLKK
2020-01-28 22:29:20 +08:00
@d5 我突然觉得是不是根据手机定位,根据轨迹找交汇判断的?关键是个人的位置信息是否已知,那就好像牵扯出一些隐私的问题…不过权衡利弊,现在应该是战胜疫情更重要些?
binux
2020-01-28 22:29:52 +08:00
查不到就有人说穿睡衣都能挂出来,火车实名了都查不到同乘者。
查到了又有人说锦衣卫。

合着都被您们包圆了!
d5
2020-01-28 22:32:28 +08:00
根据运营商基站数据计算出来的误差太大了,咸鱼人很多的,几乎没什么价值。

个人感觉还是根据需要买票的交通工具计算出密切接触者,更进一步可以是浙江城市大脑 /天眼提供的数据。


@miaeLKK
Buges
2020-01-28 22:36:40 +08:00
大数据配合无处不在附带人脸识别的摄像头,基本上你任何时间在什么地方见了谁干了什么都能无微不至的显示出来。
imn1
2020-01-28 22:38:43 +08:00
数据足够的话,可以
银行卡的线下(非网络)消费
手机的信号定位
……

其实,你对这句话理解最大的误区你知道是什么吗?你理解为:从这个患者去找武汉人
但实际上这句话是:收治的、接受观察的武汉人中有 3 个和这个患者有关,这才是正确的理解
sugarsalt
2020-01-28 23:04:41 +08:00
@binux #5 穿睡衣的能挂出来,是不该查的乱查;火车实名了查不到,是该发挥作用的时候抓瞎。
allanzhuo
2020-01-28 23:07:30 +08:00
有同事在 ga,输入身份证可以查到你所有的行为,人脸识别各种实名买票
binux
2020-01-29 00:02:56 +08:00
#9 那现在查了,又是什么说辞了?
miaeLKK
2020-01-29 01:30:19 +08:00
@allanzhuo 所有行为怎么理解?
miaeLKK
2020-01-29 01:35:06 +08:00
@allanzhuo 吃喝拉撒都能监控?
zhy0216
2020-01-29 02:17:29 +08:00
应该是查有摄像头的地方 基本上公共场所都有摄像头 而在家里的话就是和家人接触。 录像应该都有存 然后拿这些录像找到这个人 分析出现的地方都和什么人接触。 也可能摄像头在录的时候就已经分析了这些数据
s1th
2020-01-29 04:10:33 +08:00
摄像头录像的时候就可以分析出本人姓名性别住址关系圈活动轨迹。
allanzhuo
2020-01-29 07:03:34 +08:00
@miaeLKK 有市政摄像头就能查到
txlty
2020-01-29 07:51:10 +08:00
大数据很神奇,但要以重度牺牲隐私为代价。大数据的能发挥的作用,愿意和牺牲的隐私成正比。

如果允许无限牺牲隐私的话,那么可以这么做:
1.尽可能多的 拿到确诊病例的 手机定位轨迹。筛选出和定位轨迹有过重合的人群,主要为同一时间出现在同一商场、饭店、车站、交通工具的人群。这部分人为“疑似有接触人群”。
2.获取百度、搜狗、等搜索引擎的关键词数据,如果频繁搜索过类似“发烧 xxx 度是不是新型肺炎”等关键词的,这部人筛选出来,为“疑似有症状人群”。

①疑似接触人群。如果已在疑似病例中,可以优先安排床位及隔离。
①疑似接触人群、②疑似有症状人群,二者重合,即可高度怀疑为“未就医”的潜在感染病例。然后动用基层公安力量逐一上门排查隔离。
Hoshizora
2020-01-29 08:40:42 +08:00
可以看看 疑犯追踪 这剧,里面的机器就是利用的大数据。如果数据量足够多足够详细(隐私侵犯的也更多)那能起的作用也越大。
DT27
2020-01-29 08:51:57 +08:00
媒体逼问领导,领导逼问院士,院士逼问程序员。。。
程序员只好。。。
gamexg
2020-01-29 09:50:44 +08:00
只能查询到部分

例如火车车票信息找到同车厢的,
支付信息找到在同一超市的,
人脸识别找到在同一摄像头下的,
手机基站轨迹相同找到部分同乘一辆通交车的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/640710

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX