每天 800 多万条环境采集记录,用什么数据库保存比较好?

2023-05-11 11:08:27 +08:00
 icemanpro
数据要保存 1 年,哪种数据库比较好?现在只会用 mysql.
4030 次点击
所在节点    问与答
30 条回复
sadfQED2
2023-05-11 19:34:02 +08:00
楼上有说 ck 的,也有 doris 的,那我推荐一个 starrocks 吧。根据我们压测数据来看,性能基本上全方位领先 ck
iwishing
2023-05-11 22:46:39 +08:00
TDengine
huzhizhao
2023-05-12 08:14:43 +08:00
采集应该是什么物联网设备的吧?
上个时序数据库吧,具体你就再问问其他人吧
superliy
2023-05-12 09:26:43 +08:00
@0ice 你说的是单次查询性能,我说的是 qps ,刚刚搜索了一下

ClickHouse can handle very high query per second (QPS) rates, compared to traditional data warehouses. On a single server, it can run sustain hundreds to thousands QPS, depending on query complexity. We recommend starting at a maximum of 100 queries per second, and tuning this number as needed from there.

大部分确实够用了
superliy
2023-05-12 11:03:37 +08:00
@sadfQED2 starrocks 好像挺牛的,有和时序数据库对比过吗,以后设备数据采集是不是可以直接 starrocks 了,不考虑时许数据库了?
sadfQED2
2023-05-12 12:01:08 +08:00
@superliy 我们只和 ck 对比过,我们压测了聚合和普通查询,查询性能均领先 ck 一个数量级。

并发性能和 ck 差不多

我们 72 亿数据,3 台 be 两台 fe 的技术,单机 96 核 200G 的配置,qps 只能压到 20 ,单次查询 1 秒以内(聚合 sql+having 条件过滤)
superliy
2023-05-12 13:14:08 +08:00
@sadfQED2 qps 只能压到 20 ??
ck 的文档写 qps 至少 100 以上啊,https://clickhouse.com/docs/en/faq/general/why-clickhouse-is-so-fast#throughput-when-processing-a-large-quantity-of-short-queries

On a single server, it can run sustain hundreds to thousands QPS

qps 很小的话是不是要搞个队列缓存查询的请求啊
sadfQED2
2023-05-12 13:59:04 +08:00
@superliy 别人 ck 写的是默认配置最大 100 。实际上能达到多少 qps 得看你的查询复杂度,这类实时引擎能支持 qps 都不高,我们是在引擎前面加了 gateway ,gateway 做负载均衡,然后硬堆机器把并发堆上去
sadfQED2
2023-05-12 14:00:57 +08:00
@superliy ck 可以改配置文件,把并发 100 的限制调高,到其实意义不大,真正数据量大了,查询复杂以后,个位数并发就把 cpu 打满了。想撑并发的唯一办法就是无脑堆机器
zagfai
2023-05-12 16:12:35 +08:00
时序数据库

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/939124

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX