请教下各位我这水平怎么入门大数据啊,目标是一年后能写个辣鸡论文毕业就行=W=

2019-07-06 10:21:24 +08:00
 781931641

首先我很菜,现在的话是自己在学 python 搞搞机器学习,爬虫什么的。结果导师突然叫我做大数据,但是我这方面毛都不会,想着去看看系统性学习的视频但是没什么时间了(年底就开题了),直接啃书的话有推荐书籍吗(最好 python 的,java 的话只能说是学过。。。),或者各位诸位有什么其他学习途径推荐吗。成功毕业了致谢里面一定谢谢各位

3486 次点击
所在节点    程序员
9 条回复
terencelau
2019-07-06 10:49:38 +08:00
做大数据就是提取庞大数据中的核心价值,然后机器学习、数据挖掘、深度学习这些都是处理数据的方法(获取核心价值的方法)而且之间方法有不小的共通性。
enaxm
2019-07-06 11:13:22 +08:00
入门容易,你想专业从事的话肯定搞不了

入门看林子雨的书、教程什么的
之后搭个简单的画像系统就行,参考下面这贴,这哥们只用了一周:

http://www.voidcn.com/article/p-esoabbfy-brr.html
enaxm
2019-07-06 11:19:13 +08:00
学习路径的话你可以先去牛客找找,不过从我的经验上来看,网上说的路线都比较片面,缺乏系统性。不过对你搞个毕设肯定是够了。
最近没大有时间,你问的足够细的话我可能解答一下。

https://www.nowcoder.com/discuss/41091

https://www.nowcoder.com/discuss/120918
yangmiemie
2019-07-06 11:22:49 +08:00
希望你首先理解大数据的相关概念,要做这东西你最起码要知道这东西是什么,从 what,how 的角度去做,最后实现出来之后思考 why 才是你更上一个台阶的步骤。大数据无非就是两个基础部分,存储和计算。后续再利用机器学习,深度学习结合 TensorFlow 利用你的数据分析训练处一个模型,或者直接数据分析得到有价值的东西,能够帮助人们预测或者知道某件事情或者数据的走向。java 需要学习,毕竟主流的大数据工具 Hadoop 就是 java 搞的。第一阶段可以先了解 Hadoop 的体系结构、原理、编程,第二阶段需要知道 NoSQL 数据库是什么,然后学习一下 Hadoop 生态的 NoSql ( HDFS、MapReduce、HBase ),第三阶段就是去学习数据分析引擎了,Hadoop 生态的数据分析引擎 Hive、Pig 等。再者再去学习一下流引擎,如 Spark、Apache Storm 等。最后在学习一下现在流行的实行计算引擎 Apache Flink,以及处理消息队列的 kafka。如果只做数据分析的话 python 也是可以的,要学习 numpy 和 pandas 等等。视频资源网上一搜一大把,实在不行就去哔哩哔哩找。希望能帮助你。
danshendog
2019-07-06 12:40:28 +08:00
不知道你是本科还是硕士...
若是本科的话,除非真的是很厉害的学校否则毕设都是想不过都难吧……
ljpCN
2019-07-06 14:27:23 +08:00
啃论文,善用 google scholar 以及 ieee 和 ACM 等等出版社的电子论文库
ljpCN
2019-07-06 14:27:43 +08:00
@ljpCN 加一个 dblp
iyaozhen
2019-07-06 16:32:43 +08:00
大数据的话还是得 java,绕不开。

话说大数据不都是几年前风口吗?你们导师怎么开 dao 车。现在完善的教程还是很多的,是在不行就买网课
qq544230987
2019-07-06 16:35:18 +08:00
毕业,应该简单吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/580527

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX