再次遭遇 BTRFS 文件系统损坏事件

236 天前
 CitizenR

主机系统Fedora 37,安装在一颗固态硬盘上。

最近某日开机直接进GRUB命令行界面,使用 live 盘进去一看,只剩EFI分区,原BTRFS分区显示unlocated

相较之下,另一台Fedora主机,使用XFS文件系统,稳定运行数年;一台Ubuntu主机,使用ext4+XFS文件系统,从2004一路升级至2304,也稳定运行数年。

再早前另一台机器安装的Manjaro使用BTRFS也出现过开机系统直接没了的事情。

两次独立的文件系统损坏事件想要再让人相信BTRFS稳定可靠已不可能了。

大家可以分享一下Linux文件系统遭遇过的类似惨剧,如果有的话;或者,BTRFS文件系统稳定运行的个例。

4694 次点击
所在节点    Linux
43 条回复
python35
236 天前
我的群晖瑟瑟发抖
anytk
236 天前
btrfs + compress=zstd 跑了 3-4 年了,系统也迁移了几次换了盘,没啥问题
anytk
236 天前
系统是 debian sid, 一直用最新内核,挂载参数 noatime,compress=zstd
514146235
236 天前
应该是从 kernel 3.x 开始用 btrfs ,全部系统都是 btrfs ,有全 hdd 的,有全 ssd 的。经历过至少十几次的 device add, del ,没有出现过任何问题。几乎都是 7 * 24 小时运行,也没有 ups ,几年可能也会有一两次意外停电。

包括冷备服务器也是 btrfs ,会开启 compress=zstd ,而且硬盘还是 smr ,除了性能差,稳定性没有问题。

linux 版本主要是 archlinux ,内核 lts 滚动升级。
Jirajine
236 天前
以前双系统被 btrfs for Windows 驱动弄坏过一次,不过数据都恢复出来了。
leonshaw
236 天前
bcachefs 咋样了
longxk
236 天前
这种情况有没有可能是 SSD 出问题了?
毕竟群晖和 SUSE 都在线上大量使用 BTRFS 了,应该没那么不堪吧。
libook
236 天前
从 Debian11 推出就开始用 Btrfs 了,没有因为这个文件系统出过问题。

最近一次 NAS 出问题是每天早上掉盘,但数据没坏,持续了大约半个月,一开始我还以为是文件系统问题,但跟文件系统开发者一起 debug 一阵之后没发现问题在哪,后续推测可能是硬件问题,换了新硬盘果然问题不再出现,可能本身就有质量缺陷用了 4 年就提前发作了(厂商检测后确认问题并给我换新了)。

现在我用了不少 Btrfs 子卷快照增量备份方案对系统盘和重要数据进行备份,用 btrbk 脚本也挺稳的。
pagxir
236 天前
@514146235 只能说明你用的不够多,强度不够大。看这些年 btrfs 的 bug 列表就知道了。这东西能用也好用,但是说稳定我不同意
flyqie
236 天前
最稳的还是 ext4 。。
willamtang
236 天前
话说,我的程序员同事,用 Fedora ,开始用的 btrfs ,弄崩了,又用 xfs ,又崩了,最后换了 CentOS+xfs 倒是稳住了。
enihcam
236 天前
有没有一种可能,你使用了一个 btrfs buggy 的 linux 内核,然后还不知道(或不愿意)升级?

不然,换成最新的 LTS 内核试试?截至 2023/09/15 ,最新的 LTS 内核是 6.1.53 。
chronos
236 天前
btrfs 崩溃的时候最好检查一下硬盘本身是不是正常的。我以前也崩过几次 btrfs ,其中有两次都是硬盘本身出了问题,还有一次硬盘盒不稳定导致的。
a632079
236 天前
之前跑 Unraid 缓存盘调用策略 Raid0 用 btrfs ,有些忘记去管 BT 下载进度了,回来一看写满了,btrfs 在内核疯狂报告 corrupted data ,以及盘变成 Readonly……经过官方手册,以及网上(英文)流传的一些抢救方案,没救回来……哪怕 Readonly 的情况,也就抢救回来了百分之四十左右的数据,大概 四百五百 G 的资料丢失了……从此我就不在觉得 BTRFS 可靠了。
PP.SS 现在 Unraid 官方支持 ZFS 了,重新做缓存盘成 ZFS ,现在稳如老狗了已经。BTRFS 是啥?真不熟( tui )
a632079
236 天前
@enihcam #12 原文:“有没有一种可能,你使用了一个 btrfs buggy 的 linux 内核,然后还不知道(或不愿意)升级?不然,换成最新的 LTS 内核试试?截至 2023/09/15 ,最新的 LTS 内核是 6.1.53 。”
======
回复:Fedora 默认的更新策略和 ArchLinux 一样,都是直接滚最新的内核。但至少也不应该在 Stability 为 OK 下 BOOM 的吧,要知道,这可是文件系统……

稳定性参考: https://btrfs.readthedocs.io/en/latest/Status.html
P.S:让我们假设 UP 使用的都是 Stability 为 OK ,譬如 RAID56 的特性
cheng6563
236 天前
没 ecc 内存没数据校验,说不定你 ext/xfs 文件系统的数据也损坏了部分,但你没有发现而已。
cheng6563
236 天前
btrfs 每次读写都有数据校验,发现校验和不对就会尝试从 raid 中修复,修复不了就会直接 readonly 。
mark2025
236 天前
要么陈旧稳定的 ext4 , 要么高效稳定的 xfs ,其它小众文件系统不要放重要资料
zhixi
236 天前
在 Archlinux 下用了两年的 Btrfs 了,没出过什么问题,一开始比较担心,后来就没管过。
楼上说的对,确实有的时候 ext4 坏了都不知道的
hyperbin
236 天前
我也崩过,不过一看 SSD 的 smart 时发现 0E 变成 2 了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/974021

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX