怎么搭建一个大数据分析平台呢?想搭建一个自用的平台,数据量也不是很大 5T 左右吧

2018-02-05 22:29:12 +08:00
 jahan

现在想如何才能搭建一个大数据平台呢?有没有文档可以参考? 数据库都文本形式的, 有没有可视化的数据分析工具呢?拖动组件实现分析?

5322 次点击
所在节点    数据库
96 条回复
jahan
2018-02-06 01:05:40 +08:00
@SoulSleep 主要是不知道如何才能搭建一个可用的环境,有没有 step by step 的教程呢
manfred4527
2018-02-06 05:46:42 +08:00
SAS SPSS
defunct9
2018-02-06 08:09:05 +08:00
自搭 hadoop
jahan
2018-02-06 08:16:12 +08:00
@defunct9 机器最低需要多少呢,不知自用的话,需要何种性能
bayker
2018-02-06 09:05:35 +08:00
借楼提问: 数据存储到数据库( elasticsearch )后,是用 elasti 的 API 方法做数据分析,还是有其他工具可以自动分析?
jahan
2018-02-06 09:20:29 +08:00
@bayker 感谢提供又一个信息
rockyou12
2018-02-06 09:23:53 +08:00
@bayker kibana 可以直接可视化
suixn
2018-02-06 09:25:36 +08:00
clickhouse
defunct9
2018-02-06 09:27:34 +08:00
@jahan 单台 Dell R730 就可以。虚拟出来 kvm 搭建 hadoop,减配的话,两个 namenode,一个管理节点,三个 datanode。足够了,4G×2+4G+32G×3,128G 内存够了。硬盘就越大越好
defunct9
2018-02-06 09:28:07 +08:00
@jahan 也可以直上 aws 的 emr,按需付费。
v2xe2v
2018-02-06 09:33:49 +08:00
elk + kafka
mejinke
2018-02-06 09:37:19 +08:00
@defunct9 你这个估计也不行,你的硬盘 IO 是瓶颈
bzzhou
2018-02-06 09:41:46 +08:00
@defunct9 kvm 这个对 IO 性能多伤呀

如果一台机器,就直接多挂磁盘,replication 设置为 1 (备份好原始数据),直接在本地文件系统开跑
fireapp
2018-02-06 09:44:10 +08:00
druid 很好用,使用官方套件 imply,不依赖第三方存储,支持 sql,可视化,拖拉,还是开源免费的,对内存要求不高,可以试试
madNeal
2018-02-06 09:44:20 +08:00
defunct9
2018-02-06 09:49:39 +08:00
@bzzhou emr 也是开 kvm 的 cluster,io 也不伤啊,hadoop 对 io 的要求不高撒。
liyer
2018-02-06 10:07:32 +08:00
elasticsearch+kibana
jahan
2018-02-06 10:17:02 +08:00
@madNeal 非常感谢。
@liyer 非常感谢。
这个是不是借用传统数据库就可以了?
jahan
2018-02-06 10:17:52 +08:00
elasticsearch+kibana 这个模式是不是都不用数据入库?
jahan
2018-02-06 10:19:36 +08:00
很多时候的应用场景是,多人之间的关联关系,比如转账,比如物品交换等等。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/428727

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX