15 台规模的 hadoop 集群的机器的硬件配置选择问题

2016-03-15 11:02:35 +08:00
 madfrog1984

请问一下大家公司的集群的机器硬件配置是怎么样的,我们公司的集群的存储使用的是存储设备,不是机器自带的硬盘。由于运维对于存储设备不熟悉,导致经常因为存储设备的问题导致集群宕机,本来应该是运维部门的问题,现在领导要求我们开发部门给出对集群机器的硬件配置 ,集群规模在 15 台左右。

最简单的就是统一购置,但是领导说了,各个组件的作用还是不一样的,有的是需要 CPU 强劲,有的是需要存储厉害的,非得要做实验找出最佳配置,小公司没有办法。
在这方面踩过坑的 V 友都来说说

8455 次点击
所在节点    Hadoop
15 条回复
knightdf
2016-03-15 11:06:32 +08:00
小公司还自己买服务器? AWS 满足你一切需求
signifox
2016-03-15 13:20:39 +08:00
24 core Intel(R) Xeon(R) CPU E5-2630 v2 @ 2.60GHz
192G memory
1 * 800G 三星 SSD
12 * 6T SATA 盘

Are you OK ?
liprais
2016-03-15 14:03:54 +08:00
aws 搞定收工
goodryb
2016-03-15 14:39:00 +08:00
这种为啥不用云计算服务呢?资源使用灵活
allen9527
2016-03-15 15:16:22 +08:00
什么业务,能放网上么? aws Azure 都有解决方案的。自己配的话根据你们的业务大概计算一下量再上吧。。。
madfrog1984
2016-03-15 16:05:57 +08:00
@allen9527 数据确实不能放网上 一是安全性问题,二十数据量比较大,网络传输慢
madfrog1984
2016-03-15 16:06:35 +08:00
@knightdf 以前定的方案就是在公司内部部署集群
madfrog1984
2016-03-15 16:08:50 +08:00
@signifox 这个配置还 ok , datanode 的内存好像有些大,预算是紧箍咒
defunct9
2016-03-15 17:51:23 +08:00
AWS 是不行的。 R730XD 合适, datanode 要求是硬盘大,选最大的硬盘满配即可,以前在京东弄这个。
julyclyde
2016-03-15 23:13:32 +08:00
@defunct9 aws 是不行的这句话有证据支撑么?
jerryshao1984
2016-03-16 08:54:19 +08:00
yarn.nodemanager.resource.memory-mb 这个配置和 hdfs 没有关系,这是 yarn 的配置。 DN 是不需要内存的配置的。

如果你的机器内存规格不一样,同时你需要 yarn 服务的话, yarn-site.xml 可以根据不同的机器进行单独的配置。
madfrog1984
2016-03-16 09:17:31 +08:00
@jerryshao1984 多谢,后来网上也查到了之前用的机器配置是一样的 没有注意这个
defunct9
2016-03-16 16:28:12 +08:00
@julyclyde 噢。 aws 是卖服务的,有钱也是可以。但是 hadoop 这种你既需要算容量, cpu 、内存、乃至是否用 gpu ,还有电力等等,就不适合了,当时的 hadoop 基本是 600 台机器,跑起来是山河一片红,机房要限电,热点数据每天要挪移,还有各种 spark 、 storm 、 impala 各种新鲜的玩意不断要上,弄到 aws ,怎么搞起?得交多少钱?运维愿意估计老板也不愿意。
julyclyde
2016-03-17 11:59:43 +08:00
@defunct9 嗯,举出钱的理由确实很有说服力
xianlin
2016-07-15 11:28:33 +08:00
穷,就远离 AWS ,请便宜的运维人员搞搞,但就不要指望性能和 up time 能达到 AWS 的水平了,一分钱一分货。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/263588

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX