机器学习/数据挖掘应该怎么学?

2016-03-05 18:11:20 +08:00
 gunshot

正在看 《数据挖掘导论》 ,吴恩达的 CS229 。冒昧问一下 kaggle 上面的题目是什么水平?

3779 次点击
所在节点    程序员
31 条回复
murmur
2016-03-05 19:54:39 +08:00
能冒昧的问题一下楼主微积分、概率论和线性代数(矩阵理论)的分数么。。。
CrazySpiderMan
2016-03-05 19:56:56 +08:00
@murmur 哈哈, 你这个我得点赞!
microhan
2016-03-05 20:55:40 +08:00
@murmur 这个和分数有必然关系?后面再学不行?
chlx
2016-03-05 21:03:29 +08:00
如果没有比较扎实的数理基础的话, CS229 还不是那么容易上手,推荐先看完这本书 <a first course in machine learning> 入门很好的一本书,写得很 intuitive
allan888
2016-03-05 21:07:12 +08:00
@microhan 不行。。。
knightdf
2016-03-05 21:30:15 +08:00
这东西。。。一般人用就可以了,我反正看得懂大概模型,看不懂公式,哈哈
pandachow
2016-03-05 22:00:13 +08:00
@microhan 不太懂什么叫「必然关系」,考了 90 分的人和考了 95 分的人关系区别不大,不及格的话,关系就大。不行。
gunshot
2016-03-05 22:01:39 +08:00
@murmur 数分&概率论算好,线代全靠自学。
@chlx CS229 看得懂,不过有些东西需要暂停去翻书
ltrans
2016-03-05 22:09:04 +08:00
机器学习这些如果没有比较好的数理基础……你会发现很多公式都很难推导出来。亲身学 coursera 的《机器学习基石》感受到的,不过当你推导出来会有豁然开朗的感觉,贼好玩~
gunshot
2016-03-05 22:17:27 +08:00
@ltrans 我是读工科的,数学教育上重计算轻证明...
ppdg
2016-03-05 22:19:53 +08:00
那就得看你是要研究学习模型本身还是研究应用了,
研究模型本身那你的数学功底一定是极好的.
研究应用那你就要对不同类型的模型,尤其是目前主流的一些模型的习性有一定感悟.
楼上的很多人都感觉你是要研究模型本身.
ltrans
2016-03-05 22:36:31 +08:00
@ppdg 的确,若只是想应用,知道什么模型得出什么结果,直接套用相关 py 库或 matlab 库,数据挖掘的话 R 语言也有专门对应的函数。
gunshot
2016-03-05 22:38:56 +08:00
@ppdg 那就是从 Kaggle 的 playground 开始边看书边练习?
ppdg
2016-03-05 23:08:36 +08:00
@gunshot 不了解这网站,刚去看了看,是竞赛的啊.比如那个 mnist 的手写识别.我是搞 CV 领域的,数据挖掘不是太了解.虽然很多基础模型都是一样的,但是在不同领域的应用还是有很大差别的.吴恩达的视频课程还是不错的,比你直接看书要更容易接受,直接看书容易睡着.看完那个课程再去看书事半功倍.但是那个仅仅是一个基础,距离现在前沿的方法...还是要多看 paper 的.
奥对,如果有师兄带你的话,事半半功倍,哈哈..
modkzs
2016-03-05 23:21:04 +08:00
其实感觉 kaggle 更偏向于 DM 而不是 DL=。=
WildCat
2016-03-05 23:22:30 +08:00
去名校读个 Master
nevin47
2016-03-05 23:24:03 +08:00
@microhan 作为正在做相关研究的表示,绝对不行
数据研究不像做开发,遇到问题去查找相关资料,然后很多时候可以顺利解决问题
但是数据研究时遇到问题,很难只学习相关内容然后解决问题的,主要是关联太过于复杂

我记得你是送书的那位吧……不至于这么说吧
gunshot
2016-03-05 23:44:26 +08:00
@ppdg CV 是计算机视觉吧?和 ML 交叉大吗?
@WildCat 有此意
ppdg
2016-03-05 23:57:50 +08:00
@gunshot 这不是一个层面的事儿。。。计算机视觉是个很大的研究领域,比如做分类,做语义分割,做 detection ,等等,里面肯定都会用到机器学习。现在视觉领域最火热的就是深度学习了(不只是这个领域),这个又跟传统的机器学习有很大差异。也就是说,计算机视觉是方向,是领域,机器学习是工具,是方法。很多领域都在用。
goubenger
2016-03-06 00:22:02 +08:00
做研究或者做深入应用的话至少去读个 master 才行;
如果是项目中简单的应用一下网上有很多针对程序员的书和教程都不错。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/261346

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX