服务器挂了如何自动提醒运维或则对应的后端人员?

2019-06-17 11:21:57 +08:00
 Eugene1024
背景: 因为某种原因服务器挂掉了或则程序挂掉了,经常在休息的时候公司的人或则用户就打电话来,“小明,服务器又挂了,快起来看看是咋回事? ”
我:怎么又挂了,等下我起来看看

每次接到这种电话的时候都怀疑人生,而且在消息传递的期间有时间延迟,所以想到服务器挂了的时候能不能第一时间就提醒下运维或则后端人员,具体的提醒可能就有多种方式了,如短信,微信,邮件,电话等等,这里主要想了解下这种自动提醒的实现方式

自己想到了一种方法: 找一个服务器 B 部署一个测试程序,测试程序打开,定时(比如一分钟)访问 A 服务器,如果访问 A 访问不到了触发提醒

想知道还有其它哪些实用的实现方式
3501 次点击
所在节点    问与答
28 条回复
turi
2019-06-17 15:51:21 +08:00
没脚本监控?
我们的运维直接撸脚本,挂了发一封邮件,然后重启服务器。
第二天我们来 gdb XXXXX 看原因。
okwork
2019-06-17 16:03:29 +08:00
首先要有异常提醒,其次要有宕机自动重启的机制,第三要用负载均衡的策略。这样基本就可以不用人肉等候了
PHPJit
2019-06-17 16:05:57 +08:00
zabbix +1
akira
2019-06-17 17:13:07 +08:00
@Eugene1024 云服务一般都会有提供监控 /告警服务的。
如果是托管主机,国内也有不少三方的云监控 /告警服务,直接用就是了.
Shirakawa
2019-06-17 17:25:54 +08:00
python 写个脚本请求 http 状态码 然后联动钉钉机器人就好了
cominghome
2019-06-17 17:58:52 +08:00
最优解: 用云的话,大部分有自带的,理论上你只需要配置一个告警规则就行。
次解: 搭建一个 zabbix 把服务器监控上,应该花不了 1 天。
Mazexal
2019-06-17 18:03:34 +08:00
心跳包......不过必须要两台服务器以上才可以这么搞
zqx
2019-06-17 21:16:26 +08:00
一个服务,每隔半分钟就调目标机器的服务,超时就把机器信息回传给企业微信,企业微信推送到具体机器的应用的负责人

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/574645

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX