[有偿咨询]zfs 的 pve 服务器无法启动

42 天前
 vone

具体情况

1 、通过 pve 自带的 zfs ,使用两块 nvme 做软 raid1

2 、系统也安装在 zfs 的分区上

3 、今天启动后,提示 PANIC: rpool :blkptr at 00000000ac54239? DUA 0 has inualid OFFSET 72058398811901952

5 、执行 zpool import rpool 或者类似命令,会无响应

6 、pve 上跑的都是开发环境的虚拟机,虽然没有影响生产,但是数据丢了也很糟心。

目前尝试的方案有:

1 、使用 ubuntu live cd 进入 ubuntu 桌面后,手动挂载,结果:系统无响应

2 、windows 平台安装 open zfs for windows ,挂载磁盘后系统蓝屏

3 、分别拆除 raid1 其中一块硬盘后,重新启动,结果:与原故障情况一致

4 、分别将 raid1 其中一块硬盘安装在其他机器上启动,,结果:与原故障情况一致

怀疑触发的原因:

1 、磁盘之上部署了 sentry ,最近两个月写入了大量数据,大概在 180T

2 、机房温度较高,无空调

github 类似报错:

https://github.com/openzfs/zfs/issues/12019

图片:

1327 次点击
所在节点    程序员
14 条回复
NessajCN
42 天前
> 使用 ubuntu live cd 进入 ubuntu 桌面后,手动挂载,结果:系统无响应

这具体啥意思?
ls /dev 有盘在吗?
有的话 mount /dev/md0 /mnt 啥结果?
vone
42 天前
@NessajCN 盘是正常的,但是没办法挂载。
使用 ubuntu live cd 的意思是,pve 的磁盘挂了以后是没办法正常引导进入系统的。只能通过另外一个系统加载后执行命令。
ooxxcc
42 天前
ubuntu live cd 的 zfs 版本可能比较低,尝试用 proxmox 的 live cd 引导尝试能否挂载

参考 https://pve.proxmox.com/wiki/Root_Password_Reset 中 method 2 对于挂载 zpool 的描述
ooxxcc
42 天前
应该无效,试一下这里的方法能否把数据倒出来

https://niziak.spox.org/wiki/linux:fs:zfs:issues:dva_0_has_invalid_offset
vone
42 天前
@ooxxcc 好,感谢,正在试
vone
42 天前
@ooxxcc 有效,通过最后一个命令,加载出 pve 主机的磁盘了,但是还没找到虚拟机对应的磁盘。
ooxxcc
42 天前
@vone 截图一下 zfs list 命令的输出
vone
42 天前
vone
42 天前
vone
42 天前
@ooxxcc 使用只读模式进入 pve 系统了,但是目前没能挂载出虚拟机的磁盘。
ooxxcc
42 天前
@vone 不需要挂载,/rpool/data 下面就是虚拟机磁盘的 zvol ,备份出来就好
yanest
42 天前
以前用过一阵 zfs ,现在基本弃用。劝大家还是尽量别用了。用阵列或分布式吧
bkmi
41 天前
是 zfs 问题还是硬盘问题,两块盘一起坏也太背了吧
vone
35 天前
@bkmi 单块硬盘故障后没有发现,然后卡了什么 bug 吧,正常的硬盘也没办法加载哪个故障的卷了。

zfs 加载池的代码一直报错。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1030698

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX