我想问一个悲伤的问题,恳请会大数分析,机器学习的大佬进来一下吧,特别是自学的大佬们

2018-08-15 13:20:52 +08:00
 jakeyfly

本人会 PYTHON 基,会用 FLASK,DJANGO 做网页(不精通)。会写比较复杂的爬虫

因为爬了许多某方面的数据,就想做分析与机器学习用数据来训练程序。

以上这些都是自学的,花了半年时。

现在悲伤的事情来了,数据分析与机器学习,需要概率论,统计学等基础,最要命的是要会高等数学

作为一个初中数学水平都达不到的吊丝,我是不是可以放弃了!!!!!

如果我硬要坚持,我该如何补上我缺失的这些基础!!!!

1468 次点击
所在节点    问与答
16 条回复
starcraft
2018-08-15 13:34:36 +08:00
你学了是为了兴趣,那就从数分 线代慢慢开始啊。你要为了向往招工信息的年薪五六十万,那就洗洗睡吧,梦里什么都有。挤破了头,还有一堆赶热度渣硕在你前面排着。
jiangnanyanyu
2018-08-15 13:34:45 +08:00
读个本硕出来吧 2333
noNOno
2018-08-15 13:35:34 +08:00
推荐<<机器学习导论>>
一遍一遍地看,遇到没见过的知识就去查资料.
人一能之己百之,人十能之己千之,虽愚必明...
ballshapesdsd
2018-08-15 13:40:10 +08:00
想搞算法研发基本不可能,如果你真能投入那么多精力学到能搞算法研发的程度,干别的事挣的钱更多
imn1
2018-08-15 15:14:12 +08:00
这个就是创算法和用算法的区别,实际上就是辅助分析还是分析
搞算法实际上只是辅助分析,因为算法是通用型的(泛分析),但行业分析却是针对特有数据的
说个俗一点的例子,数学家对老板说:这个结果表明和 A 数据线性相关;但分析员对老板说:这表明 A 产品会定期消耗,所以会持续购买
现在的行业招聘有点误区,好像都想找数学家,但能分析出实际因果的才是最好的分析员,因为这个分析员只是分析自家产品,不是做个算法给同行共用啊。有能力做算法的人,其实留不住的,他搞定了这个行业的数据分析,自然就想尝试自己的算法能否用到其他行业,一定走的

搞分析不一定要创算法,会用也是足够的
当然,能创是最好的,毕竟不是现成的算法都符合你的数据条件
上世纪早期的市场统计软件,实际上也没多少用户可写的东西,基本上都是把软件提供的模块组合起来用

但是,一些基本的概念是需要知道的
例如,交并差(集合)、行列式计算、数据变形(行列式转换)、量化、移动统计……
实际上这上面说的很多并不需要高数微积分这些也能算,只是用高数算方便快捷,有些直接可用定理推导
最最基础的一种分析方法叫做交叉分析,实际上就是交并差,基本会数据库 select 的人都会做,只是很多搞数据库的人没入职过市场调查公司,脑子里不知道该 select 谁跟谁交叉而已

顺带提一下,移动统计还是比较重要的,现在很多数据有 timeline,前一个记录和后一个有相关性,我移动统计用得越来越频繁

你不需要看懂现成的算法是怎样实现的,但要清楚这个算法做什么,用在什么条件和场合,数据格式如何

我高数、线代成绩都不怎么样,大学硬着头皮在 DOS 上自己写马氏距离,做聚类分析
但现在,现成的马氏距离一些工具都内置了,如 scipy,会用就行

话分两头说,虽然前面吐槽了一些招聘,但现实就是这样,人家要这样招聘,谁能改变他们的想法,这就是市场需求
只能满足需求才能成交,怎样做到还是自己想,有本事就自己接单,但前期没点业绩也是没人理你的
ackfin01
2018-08-15 15:19:25 +08:00
不可能了。
对于本科高数线代 85+,概率论 95+,学过矩阵论,最优化方法现在的我来说,数学都忘了不少了,想补起来也没觉的那么容易。
且不说数学,数据结构和算法你弄懂了么。
fl2d
2018-08-15 15:25:26 +08:00
其实很多问题,遇到了去查书就可以,比如你不用为了知道 l1、l2 是啥意思,就去刷一遍泛函。

不过真想好好学的话,高数+线代+概率论与统计,一年半载功夫,也能刷一遍了。
viator42
2018-08-15 15:36:05 +08:00
即使学会了能捣鼓一些东西,不是科班出身的野生科学家会有公司要么
怕就怕机会为〇,怎么努力都没用
oyosc
2018-08-15 15:41:22 +08:00
为了兴趣爱好就加油,为了挣钱就放弃...
whereabouts
2018-08-15 16:35:04 +08:00
自身情况和楼主有好多类似,运维和编程这块都是自学的,当初碰到大数据分析这块要用到高等数学等知识,感觉真要学习的话得有小几年的规划,迫于资金压力的话学习条件有限 学习来可能更困难一些。不过因为大数据这块跟自己的未来职业规划搭边不多+兴趣不大,所以就放弃了,小几年的学习时间学点别的也行。
3d3ec7a
2018-08-15 16:38:52 +08:00
turicreate 了解一下
jakeyfly
2018-08-15 20:46:37 +08:00
@imn1 我不是要搞算法呀,我只是用别的库来做自己分析啊!大佬们 我没说我要写算法呀!!我只是要分析数据啊
jakeyfly
2018-08-16 16:00:31 +08:00
@fl2d 大哥 说的好轻松啊
jakeyfly
2018-08-16 16:05:53 +08:00
@imn1 谢谢大佬说了这么多,我想这里回复的人只有你是了解我问这人问题的本意的,我其实也就是想会用就行,没有想去创算法,也就是要知道这些模型算法是做什么用的。我了不是为了从事这个行业,只是个人兴趣,有了一个想法想要实现他。按您说的,我应该算是对要分析的数据是比较了解的,等于业内人士,那应该跟你说的相符,那如果要达到你说的那样会用就行,需要什么数学基础呢。
imn1
2018-08-16 17:18:00 +08:00
@jakeyfly
什么基础难以一一列举
大致上需要在传入数据到某个算法前,预处理用到的所有相关知识
因为当你手上的原始数据不符合格式要求,你就必须通过正确的数学方法,「转换」为算法可用的数据格式
这个转换过程是需要符合逻辑和准确的

线代和概率论基本是跑不掉的,中间一些定理的推演详解看不明,可以死记硬背前后的形式(最好还是知道大概)
线代学到线性方程组可以边做边学,概率随机事件可以结合《采样学》一起,学到分布就难了,有实例或者有帮助
再说下去可以开讲坛了,先搞懂行列式、排列组合、集合、随机取样,到时候你自己就知道下一步要学什么了
jakeyfly
2018-08-16 20:19:20 +08:00
@imn1 谢谢大佬指点

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/479996

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX