3 块硬盘做 raid5,现在因硬盘故障抽走一块,剩余的两块能否正常运行

201 天前
 wolfcdd

3 块硬盘做 raid5 ,现在因硬盘故障抽走一块,剩余的两块能否正常运行,是否会影响两块硬盘上数据及服务呢?剩余的两块还算一个阵列吗?如果后续再换上一块好的硬盘,原来的 raid5 阵列会自动构建吗?剩下的两块硬盘中的数据是否还会有 raid 同步呢?

1376 次点击
所在节点    硬件
11 条回复
263
201 天前
如果是坏了一块,先确认阵列状态,确保其它两块是正常状态,然后可以拔掉坏硬盘,要及时替换新硬盘上去,然后正常情况 RAID 会自动开始重建,重建期间不能拔出任何硬盘,替换上去的硬盘容量要和其它硬盘一致。
ferock
201 天前
这就是 raid5 的风险

1. 其他两块现在很容易坏,坏了数据就全 GG
2. 插上新的硬盘,重构整列,其他两块更容易坏,坏了数据就全 GG
chronos
201 天前
坏了一块 raid5 就降级了,数据还能取出来,但风险很大。尽快换一块硬盘上去重建吧。
winterx
201 天前
1 、可以正常运行,阵列会降级
2 、换上新盘,阵列会自动重新构建

以上基于 DELL H745 阵列卡亲测答复
murmur
201 天前
不一定,因为数据重建这种大负载可能让以前濒临挂掉的磁盘也挂掉,如果是寿命不是点背某个盘提前坏
ReactRails
201 天前
先备份数据,再重建阵列!!!
先备份数据,再重建阵列!!!
yolee599
201 天前
@ferock #2 不同批次,使用时间不一样的硬盘应该能减少同时坏概率吧
ferock
201 天前
@yolee599 #7

你也说“应该”,显然心里没底呀
hcocoa
201 天前
1.抓紧备份数据
2.切到备份系统
3.插硬盘等重建
4.切回生产系统
lqzhgood
200 天前
我来解释一下上面说的 R5 重构整列 为啥更容易坏

1T * 3 R5 A,B,C C 损坏更换

1. 阵列恢复是针对全盘的,不是数据的
数据只有 1K ,全盘恢复也是针对 1T 全盘空间计算的,因为阵列并不知道什么叫 ”有效数据“,A B 两个盘都需要从 0 读完 1T 空间

2. 基于以上,夸张 夸张 夸张 三点说,若盘中因为宇宙射线、灰电平衡等各种原因,盘上有个 0 -> 1 了,那么校验失败就会导致整个阵列重建崩溃。(平时的电脑里可能就有因为以上原因损坏的文件,只是你并不会全盘去检查)

3. 单盘空间越大,故障率直线上升 (单个 0->1 故障率 10^-14 ,1T * 10^-14 这个意思。 ) 盘数越多同理

1T *3 错误率 10^14 的情况下 理论重建成功率 R5 85%

重建成功率计算: http://magj.github.io/raid-failure/


总结:
说的如此夸张是为了让大家重视 Raid 只是提升数据可靠性,备份一定要多处

这里有 100TB R5 重建成功的案例。https://post.smzdm.com/p/a6lnpx9z/


小知识:来自 [维基百科]
> 独立硬盘冗余阵列( RAID, Redundant Array of Independent Disks ),旧称廉价磁盘冗余阵列( Redundant Array of Inexpensive Disks ),简称磁盘阵列。
Inexpensive !!!
RexKang
193 天前
楼上已经解释的很清楚了,所以日常要做好数据备份。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/983509

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX