请教下,物联网的大量数据采集如何保存数据

2019-05-20 12:20:06 +08:00
 Essaim
公司突然要求做行车轨迹,而且还不调用地图软件的开放 api.然后让我这个半年开发经验,没有任何物联网数据的蔡狗子来搞.一点头绪都没有.
简单的以公司 10W 个设备来计算,每天平均 3 小时在线,每 10 秒钟采集一条数据,那么一天的数据量就能达到上亿条.那么 mysql 等关系数据库肯定是不行了.但是实际数据大小肯定不大,一个设备 ID,一个经纬度信息,一个时间戳.
简单的想了个思路:
以一段路程作为一个单位,从起点开始采集数据,将数据放在 nosql 缓存中,然后当设备发送结束路径请求的时候,将数据打包序列化到文件中,通过 fastdfs 存储起来,然后在 mysql 中存储一条文件索引记录,因为系统的查询量比较少,所以性能应该还是过得去的.
大佬们有没有更好的想法,或者我这个想法有什么不可行的地方,希望大家斧正.
8376 次点击
所在节点    Java
49 条回复
killadm
2019-05-20 21:14:39 +08:00
influxdb+1
Raynard
2019-05-20 21:27:21 +08:00
地图偏移会经常变吗?
smdbh
2019-05-20 21:27:59 +08:00
内存保存不下的,就用硬盘啊
opengps
2019-05-20 21:49:40 +08:00
@Raynard 几乎不会,都是固定的坐标系了。(可以参考 https://www.opengps.cn/Map/offset/offset.aspx )
比如大部分国内地图都采用的国测局 gcj02,百度是自己又做了一次加密的 bd09ll
国内要出版上限的地图服务,必须至少使用 gcj02 坐标系
byteli
2019-05-20 23:25:49 +08:00
楼上的大家 influxdb 有单机瓶颈吧,集群收费
midoks
2019-05-20 23:34:31 +08:00
肯定是大数据的相关软件呀 hadoop,spark...
ryomahan
2019-05-20 23:42:45 +08:00
为啥没看到有用 MongoDB 的,我(同楼主工作经验半年)目前在做一个车联网项目,研究了一下选用了 MongoDB,目前还在做开发,性能方面确实没怎么考虑,不过我结合了阿里云给出的自家 MongoDB 和 时序数据库的介绍,感觉两者差别不大(本人非专业数据库工作人员),有人愿意给我们这些小白科普一下 MongoDB 与 InfluxDB 在读写方面差距在哪吗?关系型数据库暂时不想考虑,貌似得优化不少东西吧。
janxin
2019-05-21 06:27:55 +08:00
@byteli 自己做集群方案
@ryomahan influxdb 在压缩比 io 优化做了很多工作,可以搜索一下 influxdb tsm 相关的东西了解一下。最终还是落到使用场景上,influxdb 也不是银弹
lbxl2345
2019-05-21 14:48:58 +08:00
我在阿里云做物联网平台,楼主有空加个微信交流下~ hunter19901016

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/565778

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX