机器学习日报 2015-02-20

2015-02-21 03:29:03 +08:00
 haoawesome

机器学习日报 2015-02-20

@好东西传送门 出品, 过刊见 http://ml.memect.com

订阅:给 hao@memect.com 发封空信, 标题: 订阅机器学习日报

可点击加长版31条 http://ml.memect.com/archive/2015-02-20/long.html


Wiki2Vec从维基百科Dumps生成Word2Vec向量

@爱可可-爱生活

关键词:自然语言处理

[开源] Wiki2Vec —— 从维基百科Dumps生成Word2Vec向量的工具,包括词向量和主题向量

长微博图: http://ww2.sinaimg.cn/large/5396ee05jw1epfedr29wsj20l42p21h4.jpg

 


Netflix开源大数据异常检测模块RAD

@爱可可-爱生活

关键词:算法, Java, PCA, 代码, 可视化, 异常检测

[开源]《RAD - Outlier Detection on Big Data》 [1] Netflix开源大数据异常检测模块RAD(Robust Anomaly Detection),采用Robust PCA检测异常点,主页上有可视化Demo。RAD是Java语言的开源项目Surus的一部分 GitHub: [2]

[1] http://techblog.netflix.com/2015/02/rad-outlier-detection-on-big-data.html

[2] https://github.com/Netflix/Surus

长微博图: http://ww1.sinaimg.cn/large/5396ee05jw1epg2vvef9ij20i11pd1bv.jpg

 


word2vec的工作原理

@网路冷眼

关键词:自然语言处理

[word2vec的工作原理] [1] word2vec是一个将单词转换成向量形式的工具。可以把对文本内容的处理简化为向量空间中的向量运算,计算出向量空间上的相似度,来表示文本语义上的相似度。本文是讲其工作原理的,作者声明公式较多,慎入[doge]转需!

[1] http://andyljones.tumblr.com/post/111299309808/why-word2vec-works

长微博图: http://ww4.sinaimg.cn/large/663aa05ajw1epflaiwuwzj20k923gndj.jpg

 


BIDMach高性能机器学习库

@好东西传送门

关键词:架构, 算法, Spark, 代码, 集成学习, 聚类, 主题模型

BIDMach是一个高性能机器学习库,是Berkeley BID Data Project的一个产品,在一些评测中跑出了比spark还好的结果。 [1] 目前支持罗 辑回归、K-means、矩阵分解、随机森林、LDA、PageRank等算法 @晨晨_20130325 推荐

[1] https://github.com/BIDData/BIDMach

 


达沃斯世界经济论坛:人工智能-专题

@达沃斯DAVOS

关键词:应用, 机器人

[人工智能-专题] #春节涨知识# [大红灯笼]人工智能是天使还是魔鬼? [1] 自动化对人类意味着什么? [2] 幼儿之于人工智能的启示 [3] 第二次机器时代对工人意味着什么? [4] 机器人革命已经到来? [5]

[1] http://wef.ch/1uZW1Re

[2] http://wef.ch/1vDTfHv

[3] http://wef.ch/1GFpoTE

[4] http://wef.ch/12jUdeq

[5] http://wef.ch/1oWmRFP

1611 次点击
所在节点    机器学习
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/171999

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX