目前学了 Hadoop 全家桶,但是我发现数据存储现在不是都放在云端了吗,不论是 google 的 bucket 还是国内的一些云产品,对于数据存储,作为开发者我们直接可以把数据丢进去,不需要考虑如何让数据更有保证,除了一些超级大厂还有人在多个服务器搭建集群来存放数据吗?
Spark 进行数据计算,我觉还是有点用的,主要用来从存储中的数据进行汇总整理成为结构化数据,放到数据库中,方便开发进行数据分析和整理。
那么目前的所谓大数据技术,其实主要方向是在数据计算、数据整理、对于服务器搭 Hadoop 全家桶这些,是不是就不管了?
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.