求推荐大数据方向经典书籍

2014-04-09 22:06:05 +08:00
 Ransford
大家好,我是一个菜鸟,想了解下大数据方向的东西,希望大家能给推荐几本书籍。我最近在看《Hadoop权威指南》,快看完了。希望多了解一下思想方面的东西,然后再着手做项目。谢谢大家~~
4219 次点击
所在节点    问与答
3 条回复
kenlen
2014-04-10 00:06:05 +08:00
数据方向是很宽阔的一块领域,我个人认为大体上包括五个方面

1. 数据平台的搭建,就是你现在看的hadoop, spark, storm的生态圈。

2. ETL 也是很重要的一块 ,flume databus 等解决方案来搞.

3. 建设好了基础设施一般上还要有关系型数据库来做data mart,比较牛逼激进的公司会使用些nosql ,hbase之流 这也是一环。

4. 再来就是数据挖掘,对算法要求比较高,把业务问题抽象成数据模型来解决

5. 最后一块是数据展示层或是说数据产品,把你的算法模型也好,牛逼的基础架构也好,要通过数据展示让业务买账,促进公司业务的发展,这才是“大”数据的本质。

自学呢

1,2基本脱离了环境只能学到皮毛,没什么意思,生产环境和书上,实验环境上是完完全全不一样的,倒不如多花点时间在java上面

3. 偏向数据库,可以学学数据库,MYSQL 是很好的方向,也很多东西可以学

4. 学统计学,学机器学习,各式技巧,网上爬数据或公开的数据自己做分析

5. 很多做技术的人比较忽略这点,数据怎么打包成数据产品是很有学问的。这点需要很好的business sense,前端怎么展现的技术点不难.

综合上述,根据你提的问题,我个人建议3对你现在还是是比较合适的,学mysql,很多公司还没大到一定要scale-out才能生存下去,靠谱的DBA现在还是非常吃香的。
acpp
2014-04-10 00:48:17 +08:00
@kenlen 收藏了
Ransford
2014-04-10 09:12:58 +08:00
@kenlen 非常非常感谢~~

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/107891

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX