你们都是怎么做大规模的 prometheus 服务方案的?

2024-05-23 00:54:37 +08:00
 annoygaga

如题,小弟想咨询一下大规模的 prometheus 的方案

规模主要体现在:

但目前 prometheus 主要是单机的方式,想问问分布式的扩展方法

3125 次点击
所在节点    程序员
28 条回复
duanzhanling
2024-05-23 07:23:17 +08:00
可以使用 vm 平滑替换 prometheus
seers
2024-05-23 07:44:47 +08:00
k8s operator 直接放集群里面
chankay
2024-05-23 08:43:29 +08:00
vm 集群版
F7TsdQL45E0jmoiG
2024-05-23 09:03:52 +08:00
联邦,分层聚合
DAPTX4869
2024-05-23 09:13:24 +08:00
@duanzhanling #1 vm 的全称是?
standchan
2024-05-23 09:25:06 +08:00
@DAPTX4869 #5 VictoriaMetrics
nicholasxuu
2024-05-23 09:27:53 +08:00
thanos
qW7bo2FbzbC0
2024-05-23 09:28:34 +08:00
VictoriaMetrics
coyove
2024-05-23 09:34:24 +08:00
关于数据量和 qps ,可以在 prometheus 或 influxdb 前做一层代理,在那里聚合 metrics 每 30s 上报一次
yph007595
2024-05-23 09:57:30 +08:00
@DAPTX4869 #5 VictoriaMetrics
ounxnpz
2024-05-23 10:00:16 +08:00
thanos ,长期数据存对象存储
realpg
2024-05-23 10:06:01 +08:00
prometheus
没必要搞很大规模的集群
拆解开就完事 拆解成多个 prometheus 也不集群化 各自独立采集 每个 exporter 采集至少两份就好
在可视化层, 比如 grafana 进行数据展现时带逻辑
tramm
2024-05-23 10:12:46 +08:00
数据量多大?
说不定根本用不到集群...
chesha1
2024-05-23 11:53:24 +08:00
首先对于 Prometheus 的前后,最好有一个 mq (比如 kafka )和持久化组件(比如 mimir )

对于 Prometheus 本身,比较简单的方法就是在不同的机器(集群)上手动多建几个 Prometheus 实例,反正都是放到同一个远程的存储里

如果单个集群就已经大到超过单 Prometheus 实例的抓取能力了,Prometheus 支持联邦: https://prometheus.io/docs/prometheus/latest/federation/,相当于有多个 Prometheus ,后面的 Prometheus 从前面的 Prometheus 抓取数据
liuliancao
2024-05-23 13:37:57 +08:00
目前我们是这样
prometheus 1 抓取 federate1 federate2
prometheus 2 抓取 federate1 federate2
proemtheus 用负载均衡去读 alertmanager 配置成 cluster 的方式

你也可以使用 remote_write 功能 这样你的 remote write 配置成 influxdb 两个 prometheus 用同一个数据源就可以了
sampeng
2024-05-23 18:06:40 +08:00
唯一解 thanos

prometheus 自带的联邦集群就是个玩具。。。。运维成本其实极其高。thanos 反正一个集群扔一个。反正都是汇总在 s3 的。查询就看你要求了。随便横向扩容。
我以前线上 2000 多个 pod 。查 1 年随便查
annoygaga
2024-05-24 00:37:35 +08:00
@duanzhanling VM 本地存储,是不是很折腾?
annoygaga
2024-05-24 00:37:55 +08:00
@chankay VM 看上去是单机器存储,是不是很折腾?在 k8s
annoygaga
2024-05-24 00:38:11 +08:00
@nicholasxuu thanos 看上去不错,性能如何?多租户好做么?
annoygaga
2024-05-24 00:38:19 +08:00
@qW7bo2FbzbC0 VM 多租户如何?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1043123

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX