V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
GobyHsu
V2EX  ›  问与答

RAID 6 下,"10 个 20T 硬盘"和 "20 个 10T 硬盘"谁相对更安全?

  •  
  •   GobyHsu · 18 天前 · 1183 次点击
    • 单盘出问题概率相同的话,则"20 个 10T 硬盘"中硬盘数量更多,风险高于"10 个 20T 硬盘"
    • 但是,10T 单盘容量远小于 20T ,需要重建时,"20 个 10T 硬盘"的重建速度又会显著快于"10 个 20T 硬盘",从而避免长时间对硬盘产生压力

    如果不考虑其他因素,比如盘位成本的话,实践中哪种方案更加靠谱一点?

    (当然,这么多硬盘组一个 RAID 阵列本身可能就不靠谱,这里只是为了举个容量相同,但是盘位配比不同的例子)

    11 条回复    2025-05-12 06:17:52 +08:00
    Foxkeh
        1
    Foxkeh  
       18 天前
    个人拙见:
    如果"靠谱"指的是数据丢失概率比较, 那就是您说的第一句那样, 10 盘更靠谱.
    而且我觉得重建速度跟靠谱没有明显相关性.
    IsA26hN4DcQDS7Z9
        2
    IsA26hN4DcQDS7Z9  
       18 天前
    20 个 10t 靠谱

    原因如下:
    1.单盘数据少
    2.坏盘概率远远低于恢复失败的概率
    zuotun
        3
    zuotun  
       18 天前
    不需要了解 RAID 相关的东西,一个最简单的道理:坏的机率相同的情况下,盘越少越不容易坏。
    如果真有这么多盘肯定分开存储进行 321 备份了,非要把鸡蛋放在同一个篮子里翻车只是早晚的事。
    w2er
        4
    w2er  
       18 天前 via Android
    从某种意义说,是的,或许更多的盘可以分担风险。
    但是,一是组成越复杂可能的故障点就会越多,二是挂盘越多 raid 卡的压力就越大。
    所以我用的话会选尽可能小数量的大容量盘
    someonesnone
        5
    someonesnone  
       18 天前
    某天 nas 电源击穿,面临的是修 10 块硬盘板还是 20 块的问题。。。。
    wheat0r
        6
    wheat0r  
       18 天前
    实际上很难说。
    20 块盘发生 1 次故障的概率比 10 盘高一倍,但是 20T 硬盘重构的时间又比 10T 高一倍。
    wheat0r
        7
    wheat0r  
       18 天前
    @Foxkeh 重构速度对可靠性的影响还是很明显的,一个上了年头的 raid 阵列,一块大容量硬盘重构过程中再次发生硬盘故障的概率还真不低。所以类似银行、证券这类的客户采购阵列时都要求硬盘不是同批次产品。
    GrayXu
        8
    GrayXu  
       17 天前
    那你就在 20 个盘上 round-robin 地做 8+2 条带呗
    uprit
        9
    uprit  
       17 天前   ❤️ 4
    根据 Backblaze 的过往报告上看,10T 的 AFR 要高出 20T 的不少。
    10T 盘目前应该是最大容量的空气盘,希捷 10T 去年的 AFR 是 5.41%。
    20T 盘目前都是氦气盘,东芝 20T 去年的 ARF 是 0.87%

    假设都运行 1 年,10 块 20T 的故障率大概是 8.37%,20 块 10T 的故障率大概是 66.08%.
    接近 6 倍差距。
    单纯从年故障率这个数据来看,显然是 10 个 20T 相对来说更安全。

    而且,盘位越多,对硬件的电气要求更高,管理也更复杂。所以还是 10 个 20T 更靠谱一些。

    至于重建失败的概率问题,这个不知道该怎么算。但无论怎么做 raid ,核心数据多做备份才是王道。

    附:Backblaze 报告 https://www.backblaze.com/blog/backblaze-drive-stats-for-2024/
    IsA26hN4DcQDS7Z9
        10
    IsA26hN4DcQDS7Z9  
       17 天前 via iPhone
    @uprit 有理有据,令人信服!
    datocp
        11
    datocp  
       17 天前 via Android
    根据这些年的经验,2 组 raid0 1t/8t 各出现一个硬盘有坏道重映射提示都是电工未通知情况下断电,当然山特似乎也可以通过软件实现。
    今年供应商给我搞了 22 个 ssd ,2 组 raid10 ?这下更傻眼了,连硬盘是好是坏怎么看都不知道了。。。

    老 r720 重新上线,直接 it 直通,掌控了 smart 读数预判断,企业级又有大量可映射坏道,多处备份,如果公司更有钱采取 5 年一换,这次心大连 raid0 都不用。。。平时反正也只是 mssql 一天生成 3 个备份,定时同步,9 年下来真正的威胁反而是交换机可能受外部供电影响会烧毁坏网卡接口。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5555 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 39ms · UTC 02:54 · PVG 10:54 · LAX 19:54 · JFK 22:54
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.