我们有一个大数据的项目生产环境,用的 raid0 ,大家觉得有毛病吗?

2017-09-20 12:31:06 +08:00
 psirnull

我是觉得很坑。。

3119 次点击
所在节点    问与答
36 条回复
Morriaty
2017-09-20 14:21:01 +08:00
如果是 hdfs,不需要 raid
aheadlead
2017-09-20 14:22:32 +08:00
@psirnull 在重建的时候 很容易接二连三的挂盘

楼下接着补充 我不是存储专家 不敢多说
mhycy
2017-09-20 14:23:01 +08:00
@AntiGameZ
@psirnull

RAID5 上硬卡不会有写入性能问题
问题在于 RAID5 有可能无法完整恢复数据(如果另一个盘有坏道的话)

所以建议上 RAID6,至少存在交叉比对的可能
(现在硬卡 RAID6 其实性能很不错的, H730P 能做到持续读写 1GB/s+)

至于虚拟机跑在 RAID0....等着完蛋好了
natforum
2017-09-20 14:28:13 +08:00
用 5 或者 7 吧,0 太古老了
psirnull
2017-09-20 14:59:59 +08:00
所以说是坑很大嘛
tianwm
2017-09-20 16:44:08 +08:00
至少 RAID 5 吧....再加时时备份..
wekw
2017-09-20 17:37:45 +08:00
这显然是作大死行为,经理可能想坑死公司。


更不推荐 RAID5,谁用谁知道,坑死人没商量。


老老实实 RAID 1 或者 RAID 10,看钱多钱少喽。
lydasia
2017-09-20 18:46:21 +08:00
5 重建的时候有大概率 gg
7654
2017-09-20 18:56:33 +08:00
我们还有个庞大的磁带库呢
oaix
2017-09-20 20:48:57 +08:00
如果你的 hdfs 设置了多个副本,用 raid0 也没什么问题。
如果有钱可以用 raid10,不要用 raid5。
ryd994
2017-09-20 21:06:41 +08:00
@natforum 哦,那 RAID10 一定很新咯?
msg7086
2017-09-21 01:06:01 +08:00
@psirnull RAID 5 比 RAID 0 安全一些,但是由于 URE 的固定概率,数据损坏率依然极高。

URE 是每多少读取中有多少数据损坏的比率。这个比率基本是固定的,所以硬盘越大,在读完硬盘之前遇到数据损坏的概率越高。单盘 2TB 应该就是 RAID 5 的极限了,一般而言 TB 级硬盘都应该上至少 RAID 6,保证一块硬盘挂掉,一块硬盘读取错误的情况下,还有第三份数据做后备。

我们 12 盘 4TB 直接上了 RAID Z3 阵列,可以保证两块硬盘同时挂掉,第三块盘读取错误的情况下,有第四份数据的后备。
psirnull
2017-09-21 11:02:27 +08:00
@msg7086 学习了。 了解了下, 主流用 10 的还是挺多的。
lianxiaoyi
2017-09-21 11:13:13 +08:00
我就是 raid 0 啊 。跑的挺爽的。。。。。。
ryd994
2017-09-21 11:54:20 +08:00
@psirnull RAID10 其实有个坑就是,如果很不巧的挂的是同一侧的两块的话就 GG 了
psirnull
2017-09-24 18:10:05 +08:00
@ryd994 那都没得用了。。。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/392217

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX