用 prometheus 监控 Linux 系统的实时数据会导致机械硬盘无法停转,有什么办法解决吗?

2023-03-22 16:27:07 +08:00
 LeeReamond

如题,在用 node_exporter + prometheus + grafana 三件套监控 linux 服务器的状态,但是出现一个问题是机器上有一张机械硬盘,做冷备份用的,大概每天 0 点时候会同步一些数据库的备份数据,出于寿命的考量其他不工作时间是希望它自动停转的,但是加入系统信息采集以后感觉可能是因为这个采集的原因还是怎么的,硬盘一直没有停转,有什么办法能自动闲时停转同时还不影响信息采集吗?

因为采集倒也不是真的要去硬盘上读什么数据。。。

1104 次点击
所在节点    程序员
7 条回复
dhq
2023-03-22 17:00:26 +08:00
这个硬盘是系统盘? prometheus 的数据目录在这个盘上? prometheus 默认两个小时落一次盘,可能是这个?
Les1ie
2023-03-22 19:52:02 +08:00
没注意到过这个现象,但是我个人猜测可能是 node_exporter 读取磁盘状态导致的? 试试忽略这块硬盘。 --collector.diskstats.ignored-devices

https://github.com/prometheus/node_exporter/issues/1724
azusematsuri
2023-03-23 02:28:40 +08:00
我用 windows_exporter + prometheus + grafana ,不影响机械硬盘正常停转,机械硬盘是数据表,prom 存在 ssd 盘上
LeeReamond
2023-03-23 05:05:46 +08:00
@Les1ie
@dhq
@azusematsuri 不是系统盘,只是冷存数据而已,但是确实想不出来还有什么其他原因导致了,毕竟乜有任何程序依赖机械硬盘的数据啊,所以 exporter 并不会激活硬盘?
noahzh
2023-03-23 09:19:24 +08:00
exporter 排除这个硬盘监控就完了。
sc104501
2023-03-23 10:50:37 +08:00
我用的 Grafana agent ,采集的数据比 node_exporter 少很多,但是基本的都有。而且完全不影响仓库盘休眠。
没有敏感信息的话,感觉用 Grafana cloud 送的面板和数据库就够了。服务器只要装一个采集器。

/dev/sda: Tigo SSD: no sensor
/dev/sdb: WDC WD30EZRZ-00Z5HB0: drive is sleeping
/dev/sdc: Hitachi HUA723030ALA641: drive is sleeping
/dev/sdd: CT240BX500SSD1: 30°C
/dev/sde: WDC WD5000AAKX-08U6AA0: drive is sleeping
julyclyde
2023-03-26 19:18:36 +08:00
这么冷的机器,你还监控它?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/926237

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX