第一次遭遇云服务器完全崩溃

2018-10-09 22:45:45 +08:00
 godbmw

第一次遭遇云服务器完全崩溃:CPU 突然 100%、控制台无法重启、控制台无法强制关机。到目前为止,腾讯云的工程师和我本人都没有找到具体原因。

本文所示图片使用的是 github 仓库图片,网速过慢的朋友请移步原文地址或者来我的小站godbmw.com

1. 案件陈述

2. 灾难现场

首先是,个人网站无法进入,如下图:

![]( https://raw.githubusercontent.com/dongyuanxin/markdown-static/master/网站搭建与运营 /第一次遭遇云服务器完全崩溃 /2.png)

首先是,无法强制重启和强制关机,如下图所示,请注意截图上方的报错提示信息

![]( https://raw.githubusercontent.com/dongyuanxin/markdown-static/master/网站搭建与运营 /第一次遭遇云服务器完全崩溃 /1.png)

腾讯云的控制台已经说明了,强制关机是强制切断电源的物理操作!这都没法进行,我本人表示很迷。

在提交的工单的过程中,有大概 20 分钟的时间,是没有任何回复的。然后大概到了 2018-10-09 14:00,多次尝试后,终于可以强制关机和重启了。有图为证:

![]( https://raw.githubusercontent.com/dongyuanxin/markdown-static/master/网站搭建与运营 /第一次遭遇云服务器完全崩溃 /3.png)

以上情况,不得不让我怀疑,是工程师们手动去关的服务器电源:)

3. 如何补救?

经过这次服务器事件才体会到:云服务的稳定性是多么重要! 这次事件腾讯云的工程师也没语焉不详,我只能猜测是:服务器的物理问题。

所以,我这次果断准备了两个服务器,开始做“负载均衡”(还要修改备案)。除此之外,日常备份数据也是非常重要。

最后,还是希望云服务商的服务尽量保持稳定,至少在服务器崩溃的情况下,可以找出崩溃原因并且修复。

2916 次点击
所在节点    服务器
3 条回复
514146235
2018-10-10 00:07:51 +08:00
强制关机只是效果类似于切断电源,其实并不是切断电源。

服务器如果负载巨高,的确会出现系统无响应的情况。重启当然也无法执行。
强制关机也是要等待一段时间才能完成。

很正常。阿里云出现这样的情况也会是这样的状况。
kslr
2018-10-10 01:43:51 +08:00
@514146235 让我想起来当初 pve 时候,只能重启母鸡
godbmw
2018-10-10 11:39:37 +08:00
@514146235 嗯嗯好的,多谢提醒。仔细看了下,确实有“相当于”这 3 个字。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/496124

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX