监控系统神器- 普罗米修斯 prometheus 快速入门

2022-09-07 00:25:17 +08:00
 ggvm

最近负责的项目比较细碎,需要监控一堆主机、服务可用性、业务指标等。在本 V2EX 论坛搜索监控系统, 虽然说有各种推荐,但各种评论指向 prometheus ,于是花了一些时间,研究一下 prometheus + grafana 结合,觉得方案非常不错,为了帮助大家节省时间,把一些部署经验总结如下。

prometheus 是一个开源的监控系统解决,可以独立运行,并提供了可视化的界面。prometheus 可以应对常见的主机、数据库、网络监控,同时也可以监控自定义的指标。更厉害的事,prometheus 生态有大量的现成解决方案。

做网络监控系统的同学,在自己发明轮子之前,最好先研究一下普罗米修斯。以免白白浪费时间造了一个早已存在的轮子。

阅读本文基本无需写代码,只需要理解相关概念,所有工程人员均可搭建一个基本可用的监控系统。以后你在选择监控系统的时候,就没有必要找各种付费产品或者一些完成度很低的小作坊产品。事实上,主机差评君使用一个 1C1G 的机器,已经完全可以搭建一个可用的监控系统,很多开源产品非常复杂,搭建好一个系统 4C4G 的系统资源都相当吃紧。

本文展示详细的使用步骤,帮助大家节省部署时间。

prometheus 的安全是相对繁琐的,所以我们尽量使用 docker 去简化步骤。我们将主要安装两个服务,一个是 prometheus ,主要负责序列数据存储和提供数据源;二是 grafana ,主要负责 UI 展示和序列数据分析。

新建 monitor 文件夹,并进入我们的步骤

一 安装普罗米修斯 prometheus 1 拉取 docker image

docker pull prom/prometheus #下载配置文件例子 wget https://raw.githubusercontent.com/prometheus/prometheus/main/documentation/examples/prometheus.yml 上面的配置文件很简单,就是 prometheus 在监控自己这个节点

docker run --name myPrometheus -d -p 9090:9090 -v pwd/prometheus.yml:/etc/prometheus/prometheus.yml prom/prometheus 运行上面的命令,把 prometheus 运行起来

如果 打开 http://ip:9090 看到 web 界面,就是运行起来了。

可以到这里,下载一个 node_exporter 这里可以上报节点主机的状态

https://prometheus.io/download/

下载好 node_exporter 之后,请你运行他,看到一堆输出

ts=2022-09-06T13:25:33.142Z caller=node_exporter.go:115 level=info collector=uname ts=2022-09-06T13:25:33.142Z caller=node_exporter.go:115 level=info collector=vmstat ts=2022-09-06T13:25:33.142Z caller=node_exporter.go:115 level=info collector=xfs ts=2022-09-06T13:25:33.142Z caller=node_exporter.go:115 level=info collector=zfs ts=2022-09-06T13:25:33.142Z caller=node_exporter.go:199 level=info msg="Listening on" address=:9100 ts=2022-09-06T13:25:33.144Z caller=tls_config.go:195 level=info msg="TLS is disabled." http2=false 其中最重要的是看到 9100 。这里有 node_exporter 端口。

访问 http://ip:9100//metrics

看到输出了一堆节点信息,这就对了。

修改 pro 的配置文件,增加一段节点配置信息。

配置好了之后,重启 docker 实例

docker logs myPrometheus

在上面的框内,输入 up ,并点击 execute ,看到了我们刚才添加的节点,表示成功了。

这个 prometheus 虽然提供了 UI 界面,但是 UI 展示并不是他的强项,一般使用 grafana 来进行数据系列的展示。

二 使用 grafana 展示数据 安装 grafana

docker run --name myGrafana
-d -p 3000:3000
grafana/grafana 如果没有问题后,访问 http://公网 IP:3000 。 使用 admin : admin 登陆,并修改密码。

在主界面,configuration / add data source

第一个就是普罗米修斯

添加 prome 的 http://xxx:port 进去设置,并测试。

grafana 的目的是展示我们的 node_exporter 上的数据。所以我们到 grafana 的主界面上,import 一个 id 为 8919 的模版。

8919 是一个 grafana.com 上网友贡献的模版,直接可以使用。 需要找模版,也是到 grafana.com 去。

导入后,一个吊炸天的 主机监控结果就出来了。

后续设置告警规则,也可以在 grafana 上进行设置。

到此,已经使用 prometheous 和 grafana 进行了一个非常简单又专业的监控系统设置。

后面的内容,主要是给大家举多几个例子加深理解。

预计将包括:

1 mysql 等数据的监控

2 自定义指标的监控

敬请期待关注 https://zhuji188.com/571.html 后续更新

2430 次点击
所在节点    分享发现
6 条回复
Jzdoxc
2022-09-07 01:19:24 +08:00
插眼,明天给 unraid 试试
ggvm
2022-09-07 10:58:33 +08:00
@Jzdoxc 值得关注
julyclyde
2022-09-07 11:55:44 +08:00
好像也没发现什么新东西啊
咋就分享出来了呢?
GoodRui
2022-09-07 13:42:44 +08:00
插眼,感觉又得从零开始学习了…
ckxZzz
2022-09-07 14:56:37 +08:00
可以讲讲自动发现那方面的规则
jun4rui
2022-09-07 17:22:04 +08:00
@Jzdoxc unraid 市场自带,直接安装吧。因为我刚装好

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/878216

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX