阿里云 ECS 重启后开不了机了 怎样把数据盘的文件考出来?

2021-01-23 15:15:57 +08:00
 chijince

ECS 重启后无法远程连接。通过 VNC 远程连接后画面一直停留在进入系统的进度条,快照已经恢复到 1 月 14 日,依然无法连接。

怀疑是磁盘空间满了,用系统盘快照镜像创建了一个新的 ECS,新的 ECS 从之前的数据盘创建新的云盘。

发现还是连不上。

发送远程命令(云助手)无响应。

请问有没有好的解决办法?

如果恢复不了,数据盘的文件有没有办法弄出来?

求教

3976 次点击
所在节点    程序员
31 条回复
jjx
2021-01-24 09:49:29 +08:00
@gricn

的确, 阿里云服务同 阿里系的完全不同


我上次端午节, 两台老旧机器监控显示并发数异常, 直接搞到凌晨 2 点多, 后来我觉的不好意思了, 就没让他们继续搞
dream4ever
2021-01-24 11:09:57 +08:00
我们公司用的阿里云 ECS 和你出现过类似的问题,一台运行了四年多的 Windows Server 2012,业务需要装过各种软件,也经常安装系统更新,结果有一天 IIS 下面的网站都无法访问了,重启之后就卡在那个“疑难解答”界面,进不去系统,给阿里云提交了工单,他们的技术工程师尝试了各种办法也没解决。

最后给系统盘创建了一个快照,用来把上面的数据库文件之类的拷出来。然后在系统盘上重新安装的系统,数据盘还都在,不放心的话也可以给数据盘做个快照,有备无患。

尽管给阿里云提交工单就行,我们现在有相关问题都提交工单,回复都还算及时,服务挺不错的。
CoderLife
2021-01-24 11:43:08 +08:00
上上周遇到同样的问题:
空间满了, 删掉文件后, Postgres 无法启动, 重启后无法 ssh, 后面提的工单, 经工单查询原因, 因为导致挂载出问题了, 经过一个小时的解决. 终于解决
总结:

1. 定期自动测试磁盘空间大小, 发邮件.
2. 买单独盘, 定期备份关键数据到单独盘.
lbyxiaolizi
2021-01-24 11:56:38 +08:00
去机器人那边随便说两句,然后发工单让他帮你解决,可能一个下午就好(划掉
chijince
2021-01-24 11:59:00 +08:00
@fredcc 这个方法有效

我重新安装了系统,fdisk -l 查看分区,使用 mount /dev/vdb1 /mnt 挂载成功。
chijince
2021-01-24 12:09:29 +08:00
我的数据都在 RDS 上,所以重新获得数据盘的文件即可,系统无所谓。数据和 WEB 服务器分离、系统和网站文件磁盘分离,这是有必要的。

其实在发帖之前已经提交了工单了,就是等了好久,后来阿里云的工程师的回复是这样的:
--------------------------------------
您的服务器系统在启动过程中会卡住,不能正常启动完成。 在系统启动时,设置用单用户模式可以正常进入系统,单用户模式进去,检查系统里边也没有发现异常,尝试把 /etc/rc3.d/ 下边开机启动的服务都取消了,重启服务器还是会卡在,目前没能修复系统启动的问题。
当前是单用户模式进去的,您也可以从控制台登录服务器里,检查一下系统里的启动服务情况。
可以备份一下服务器里的数据,考虑给服务器重新初始化系统,恢复到最初正常的系统启动。
---------------------------------------

我后来重新创建了一个 ECS,使用和故障机器一样的系统版本,增加一块数据盘,数据盘以此前备份的快照创建。

启动后,fdisk -l 查看分区,使用 mount /dev/vdb1 /mnt 挂载成功。

到这里心里基本有底,备份故障机器,重新装系统,直接用 mount /dev/vdb1 /mnt 挂载成功。
jeriyeh
2021-01-24 12:40:36 +08:00
你这问题还不算太严重,我们前段时间用微软的 azure 云服务器, 硬盘空间只用了一半,一切看似都很正常,通过服务器管理面板添加网站都时候卡住了,重启了下,就整个硬盘( vhd )都没了, 启动诊断截图显示 “no boot device”,什么文件都找不到的那种,复制挂载查看就是个空盘,微软的技术支持也搞不了,只能恢复 1 天前的镜像,瞬间对云也失去了信心,因为这种问题看似硬件级别的错误,很像是以前那种启动扇区坏道的问题,但 vhd 文件就是无法修复
QBzzz
2021-01-24 15:33:05 +08:00
装监测应用撒,等出问题再解决麻烦得很
matrix67
2021-01-24 16:00:15 +08:00
大佬们都不监控吗,推荐监控宝啊!!!快满了给你短信
TophTab
2021-01-24 21:17:48 +08:00
最近几天,我的轻量服务器在我折腾之下,死机了 3 次,两次都是 reboot 后连不上了,停止后再开机有几机率能用。
chijince
2021-01-25 11:27:28 +08:00
@TophTab 重装系统吧 一直折腾不划算啊

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/747686

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX