有无懂 ESXI 的大佬帮忙看一个故障

290 天前
 simplove

事情是这样的:
在经历过连续两次意外断电之后,ESXI 出现了故障
登录之后部分主机显示无效,如下图所示:
在浏览器文件的时候发现图标不对,并且生成了一个.lck 的文件
正常是这个样子的

处理过程:
1 ,显示无效的只能取消注册,无法开机,取消注册之后,再重新注册,仍然是无效。
2 ,新建虚拟机引用原有的 vmdk 文件,也报错
3 ,web 端尝试删除.lck 文件也报错
4 ,ssh 删除.lck 文件也不行
报错:rm: can't remove '2016.vmx.lck': Invalid argument
5 ,用 vmfsfilelockinfo 查看文件锁定
发现 MAC 地址是另外一个 10G 网口,这个网口都没用。 请问是不是只有把网线插这个口才能解除锁定?
用 vmkvsitools 工具查看程序运行也没有

6 ,尝试用 scp 命令把文件复制到另外一台 ESXI ,也报错。vmck 文件不给复制,其它文件可以!

原本我大概的思路是按照这个 https://blog.csdn.net/weixin_43343803/article/details/106728015 拉取日志重建 vmx 文件的。可是.vmx 文件它不给删除。
我重新找了一块硬盘装 ESXI 系统,还是文件被锁定。

有没有人遇到过此类情况,后来又是如何解决的

1878 次点击
所在节点    程序员
12 条回复
idclight
290 天前
机器是跑在 vCenter 里吗?这里有篇官网的文档 https://kb.vmware.com/s/article/10051?lang=zh_cn
idclight
290 天前
如果是跑在 vCenter 里那就是另外一台主机锁定了这台虚拟机,按照文档无脑操作即可。
simplove
290 天前
@idclight 是跑在 vcenter 里,不过 vcenter 是安装在一台 win2012 里面的,正好它也在此次断电中挂了。
然后我又装了一台 vcenter ,我再试试,谢谢。
idclight
290 天前
@simplove 如果集群节点不是很多的话可以直接跳过 vmfsflelockinfo ,在每台机器上直接跑 lsof | egrep 'Cartel|****.vmdk',然后继续文档下一步
wheat0r
290 天前
要不然先重建一个 vCSA ?
simplove
290 天前
@idclight 不行跑这个直接提示为空。
lsof | egrep 'Cartel|2016.vmdk'
Cartel | World name | Type | fd | Description
[root@localhost:~]
也就是说 这个 esxi 没有任何 vmdk 在栈。
我想也是,毕竟我连 ESXI 系统都换了一个,只是存储盘没换,是由 3 块 8T 组成的 Raid5 。
在新系统上它自动挂载了,卸都卸不掉
idclight
290 天前
vmdk 文件拉下来在别的机器上注册呢?
simplove
290 天前
@idclight 拉不下来,文件锁定,下载不了,也不让复制和移动
idclight
290 天前
开 SSH 让我来,telegram: c3VtbWVyb2No
Achophiark
289 天前
vc 一般都有备份的,回复一下
simplove
289 天前
@Achophiark vc 是 6.7 ,安装在 windows 上,正好这台 windows 也位于这台损坏的 ESXI 上面,恰好这台 windows 也损坏了。。。所以无解,正在重装中。
shiyunjin
289 天前
我上次出现类似的情况是因为强制断电之后硬盘挂了,但是你 3 块组成的 raid5 的话应该不是这个原因了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/960072

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX