请教下,转数据分析,还需要学哪些?

2020-03-06 13:04:40 +08:00
 Colorful

1、我现在在看爬虫,一些简单的会爬 2、在看数据清洗这块,还不太懂。( numpy、pandas、matplotlib ) 3、数据展示,这块,Power BI 和 Tableau Public 会。但假如说一个库里面是有价格,而我想展示,区间的占比,这个还不会。 4、数据库,mongo 和 mysql 都会一些基础的,mongo 比较熟一些。

PS:之前一直是做前端的,这次想转数据分析,花了一些时间和数据。 之前有做过一些大数据展示的项目。

所以想问下,如果转数据分析,还要学哪些啊?

5045 次点击
所在节点    Python
25 条回复
andylsr
2020-03-06 13:30:11 +08:00
学业务逻辑,脱离业务无从谈分析
Colorful
2020-03-06 13:46:45 +08:00
@andylsr 这个只能在工作中才能去学到的吧?
p2pCoder
2020-03-06 14:07:21 +08:00
你是数据分析,核心在于发现数据的价值
而现在 我感觉你还仅仅是想做可视化
conge
2020-03-06 14:10:57 +08:00
统计知识
q8164305
2020-03-06 14:13:05 +08:00
数据分析你不能脱离业务啊
ccoming
2020-03-06 14:14:54 +08:00
面向 JD 学习,招聘信息上面都有。
aladdindingding
2020-03-06 14:15:33 +08:00
大数据的存储可不是随便的 mongo 和 mysql 之类的
NeezerGu
2020-03-06 14:18:11 +08:00
1、学会忽悠。(不开玩笑),运营问你 xx 数据有问题,你能不能给一个令人信服的理由;你写了一个报告,别人有质疑,你能不能给出一个为什么这么写的原因?

2、excel。各公司可能会有不同的 BI 软件,但 excel 通常都会用到。你可以基于 excel 做一些简单的报告就好,对应的 BI 甚至可以入职了再了解(个人感觉这些也不难吧……)

3、sql。通常搞数据分析就是各种 sql 写的飞起,不过多数公司应该只要求会就行,不会要求你写的多么棒之类的。。

所以你会发现从上往下三个,越往上越重要,花的精力也越多( sql 甚至稍微看一下就会了)。几乎多数公司也都是重视你对数据的理解,而这个理解很多时候说白了,就是你如何忽悠出来一个令人信服的理由。

另外,数据清洗不用太关注。讲白了就是有点异常值你给去掉就行了。以及 python 使用的频率没那么高,甚至不会 python 的多了去了。
Colorful
2020-03-06 14:32:26 +08:00
@NeezerGu 这样子的吗?我看知乎上,很多说数据分析,要学会数据清洗。所以想问下,数据分析,要学哪些算法?还要看数据挖掘方面的吗?
Colorful
2020-03-06 14:33:12 +08:00
@p2pCoder 我只是写了一些自己了解的,自己不懂的就没写,我也不知道数据分析,要懂哪些。这段时间打算好好看看那些
NeezerGu
2020-03-06 14:53:26 +08:00
@Colorful 啥叫数据清洗。。
比如你跑一份日活,开发告诉你有一批错误的数据是 0,以及这两天数据有点重复。
你就从
select day,count(*) from 日活表 group by day
变成
select day,count(distinct uid) from 日活表 where uid!=0 group by day
就好了。
这就是数据清洗…………

当然,更多的时候是出现在你做分析的时候。
你拿到不熟悉的表,第一件事就是了解一下数据,而不是直接拿上做。
不然后期你发现这个数据中有异常值(比如以直播为例,发现有用户开播时间超过 24 小时的,拉高了平均开播时间等),你再重头开始写 where 清洗一遍就花时间了。
NeezerGu
2020-03-06 14:55:52 +08:00
@Colorful 算法、数据挖掘方面主要看你们公司的结构。
有些地方给我感觉数据分析、挖掘不分开的。
两种活都接,或者应该说是做数据分析的顺带把数据挖掘的给做了。这种对算法的需求可能就会大一些。

纯数据分析个人感觉并不需要算法支持,需要的时候百度看一下就好。反正我个人是那种学了忘的,最后通常是用到了就百度谷歌看一下就好。
Colorful
2020-03-06 17:41:29 +08:00
@NeezerGu 你这样说的话,我就有点理解了。那我现在应该多看哪些方面的?
NeezerGu
2020-03-06 18:02:28 +08:00
@Colorful
首先按说你是前端的话,sql 应该接触过,我假设你有基本的 sql 技能。
那主要我推荐你基础的了解一下 excel 的常用函数(其实主要就是一些 vlookup、countif 之类的),数据透视图,制图(折线图什么那些),这些应该 1、2 天就能搞定(百度一下应该都不难的),太复杂的组合函数不推荐专门去学,真要用的话还不如直接上 python

接着,如果想公司内部转岗的话。公司数据敏感问题不严重的情况下,我推荐你问一下公司的数据同事,要点需求自己试一试(其实我真感觉数据组很多基础需求就是干一发 sql,excel 划拉两下,给产品 /运营说几句,就完了……),
如果你能解决这个,你问问数据的 leader 能不能转过去。某种意义下比较懂行的数据 leader,在缺人的情况下,会比较愿意要转岗的人(一方面对公司的业务稍微有一定了解,培养成本低,另一方面转岗至少一年吧,都会比较吃苦耐劳一些,愿意做一些其他人不愿做的基础活)

如果你想直接跳其他公司的话,我觉得会比较难。推荐你先按照该公司的主要产品,去学一些数据技能,比如对方公司主要产品是直播方面的,你可以直接用爬虫抓一些直播的数据(比如我抓过 twitch 的,印象里几乎不设防),然后试着分析一下,无论啥东西都行,只要你觉得这个分析比较有意思。个人感觉会成为一个加分项。

数据分析这行业,缺人缺的厉害,但主要还是看老板们的心里预期投入吧。
个人感觉为了满足产品 /运营很多对数据的好奇心,会需要大量“取数机器人”,理论入职门槛极低。但有些团队会要求比较严,学历啥子的都有要求,进去往往刚开始依旧还是取数,做 bi 什么的。
所以真想做的话不要气馁,面试可能也比较看运气。
bozhongshao
2020-03-06 18:07:08 +08:00
数据整个的可以 从采集->存储->建模->分析->变现 几个步骤 。 你说的 实际上是数据研发的范畴。 如果是分析的话 就需要针对具体的行业,先了解业务 然后根据业务构建你的分析模型(指标+平台) 然后 去分析指标的问题 挖掘价值点。
我们这边就是 开发+建模+分析 阿里巴巴国际站欢迎你。
hello2060
2020-03-06 18:33:54 +08:00
dataquest 上试用一下或者买一个月的课程
ccoming
2020-03-06 21:58:25 +08:00
@p2pCoder
@NeezerGu
@conge
@andylsr
其实,上面 @到的几位都提到了,做数据分析重要的还是在于业务方面:对数据的理解、现象的解读和对应的建议。
而 lz 提到的那么多技术名词,其实走的是数据工程师或者数据可视化的方向。
一个偏业务、营销,一个走技术、研发,不一样的。
不知道 lz 真正想走的是数据分析还是啥。
如果是数据分析的话,其实用啥工具、语言根本不重要,领导也压根不在乎。
他要的是你捣鼓完那堆数据后,发现了什么东东,对此给出的建议是啥,公司应该怎么做。
lz 真想走数据分析的路,我给的建议是:
1、征得公司同意后(重要),用你觉得趁手的工具,给业务、运营人员做基础的日报、月报、销售仪表盘。报表简洁易懂就行,花俏的可视化就免了。这样,你不但能接触公司机密的业务数据,知道公司的销售构成、成长轨迹、发展方向,也能接触一线业务人员,了解公司最新的业务发展方向,销售难点等等。过程很枯燥,看到哪些屎一样的数据,各种吐槽。不过没关系,毕竟只有这样才能摸清公司的业务;

2、经过摸底阶段后,lz 由于不断地和业务部门打交道,对公司的业务、销售模式都基本了解。可以尝试主动介入到业务部门的工作中:给业务部门解决业务难题。例如,最近 A 区的销售下滑特别明显,是哪里出现问题了,数据能不能跟踪到;我们的产品,跟市场的竞品对比,有哪些差异?实际工作中,业务部门的问题往往都很广大空,不会提出像“我要哪个区域什么时间的产品销售数量比例,饼图!”的问题。不管没关系,你经过 1 后,已经清楚业务的数据有哪些,尝试去跟他们沟通,去追问,去明白他们真正想要的数据。这期间,你应该也要逐渐了解他们的思考方式,业务经营思路。为什么会要这些数据,看了数据后,有做什么举动。这里,他们的想法很重要;

3、当你在日常工作中,能了解数据需要输出报表后,尝试多做一步:给出建议。这时候,你要在思想上当自己是业务人员,出现问题后自己要从数据中找出原因,并尝试让数据产生价值。模拟 2 中的业务人员去思考去工作:A 区业绩下滑的原因是什么,这情况会出现在别的地方吗?怎么样才能解决这个问题?甚至再进一步:怎么样才能避免出现这个问题?

做到上面 3 点后,你已经是一个称职的数据分析人员了。

以上,只是我个人见解,仅供参考。
NeezerGu
2020-03-06 22:59:36 +08:00
![image.png]( https://i.loli.net/2020/03/06/X3rOcZguB7xaNef.png)

吐个槽,看到群里发的,这就是我说的忽悠。。。
Colorful
2020-03-07 19:12:46 +08:00
@NeezerGu 不是转岗,跳到其它的公司。sql 的查询这些,基本没问题,mongo 比较熟一些。数据这块还算懂一些吧,之前有做过 2 个项目的大数据展示这块,算是可视化吧,只是数据不是我处理,只是纯粹的展示以及逻辑这些。
像 PowerBI 和 Tableau 这两个工具,会用,自己也有试着做了一些。爬虫,简单的会,这几天在看复杂的。

我待的几家公司,都没有专门做数据这块。所以只能在网上参考一些。
看了拉勾的这些,大部分都要会算法以及机器学习。
Colorful
2020-03-07 19:19:16 +08:00
@ccoming 其实我是想往数据挖掘这块走。但我完全没接触过数据分析这块,身边也没有人做这块,所以无人着手。
只是在提问的时候,说明一下自己会的哪些。现在是想去其它公司面试数据分析。

也不知道数据分析到底是哪些。
但看到有些人说,分析和挖掘是一起的,所以我不清楚,自己应该要有个怎么样的定位

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/650367

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX