如何用监控宝做自动化运维?

2016-12-15 15:05:41 +08:00
 Aaron123

我们公司刚刚买了监控宝,请问如何用监控宝做自动化运维呢?

1608 次点击
所在节点    问与答
1 条回复
cloudwise
2016-12-16 15:29:55 +08:00
监控宝可以多区域去监控服务器,网站的健康状况,还包含了一些国外节点(我们的业务涉及海外),而且阀值这块可以自己去定义。其中最重要的就是 callback 告警消息。如果我们在服务器网络或者其他原因导致宕机,收到的不是告警消息,而让他们能够根据消息去自动处理是不是会更好呢。给大家一副图来理解下:

![]( )

根据回调信息,事先将其定义成一些规则,当我们匹配到了告警信息中的特定信息可以自主切换.

监控宝的 URL 回调可以在这里设置:

![]( )

运维监控的发展: 
过去: nagios 、 cacti 、 zabbix 监控单一,对告警后知后觉
现在: API 监控数据聚合、告警信息收敛,自动化感知
未来:挖掘故障信息,制定故障自愈规则,提前感知
所以我们未来要做的就是要收集告警信息进行自动化处理,而不是通知运维上线处理。
我们要脱离那种每天等着告警信息去处理故障,要主动出击,不要等到故障了再去处理,及时处理好了,那么时间成本也是很高的。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/327833

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX