请问 hadoop 多块磁盘只部署一个 datanode 好还是每块磁盘各部署一个 datanode

2022-07-27 13:01:09 +08:00
 pmispig

CPU 24 核 256G 内存的机器,有 10 块硬盘.
请问部署方式是选择仅部署一个 datanode ,让这个 datanode 使用 10 块磁盘?
还是部署 10 个 datanode ,每个 node 仅使用一块磁盘?
请问两种姿势各有什么优势和缺点呢?

1232 次点击
所在节点    Hadoop
7 条回复
israinbow
2022-07-27 14:36:53 +08:00
10 块硬盘准备如何给一个 DataNode 用? 首先 RAID 0 不推荐给 HDFS 用, RAID 0 会造成磁盘数量 (n) 倍的不可用几率;
而 HDFS 本身就是多个磁盘共用, 并发读写, 在多个磁盘上部署 DataNode 可以满足高可用 (互备) 和高 IO 性能.
详见 https://stackoverflow.com/questions/27988955/why-is-raid-not-recommended-for-hadoop-hdfs-setups
superchijinpeng
2022-07-27 14:41:24 +08:00
只部署一个就可以了,我司是每个 DN 22 块盘
liprais
2022-07-27 14:46:12 +08:00
配的时候每个磁盘上一个目录就行
Anybfans
2022-07-27 16:10:53 +08:00
不知道 lvm 格式行不行,有大佬指导一下吗
pmispig
2022-07-27 19:57:51 +08:00
@Anybfans 没必要 lvm,就是要独立驱动器,这样可以充分利用磁盘的性能。做 lvm 还不如做 raid
Anybfans
2022-07-28 09:03:13 +08:00
@pmispig #5 😂 目前公司用了 lvm + raid
pmispig
2022-07-29 20:42:57 +08:00
@Anybfans 也毛病,lvm 对性能也没啥损失,我以前也是用 raid,现在测试 raid 速度比直通模式速度差了好多

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/868999

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX