机器学习现在很火, 但有个疑问: 这跟普通程序员有多大关系? 或者说我们的价值在哪里

机器学习的算法, 基本就那几大类, 都是根据各种教授研究员们的论文出来的, 各种库也有了, 我们非科研人员能做的就是利用现有的深度学习 /机器学习的库给的 API, 拿一批种子数据训练一下, 然后拿另一批数据验证, 调一下参数. 然后呢? 普通程序员 /架构师在这方面的价值在哪里?

还请给专家指点.

q397064399

2017 年 1 月 27 日

你有听说一种职业叫做调参狗

snnn

2017 年 1 月 27 日

举个例子，几个月不写 c++，你会觉得自己什么都懂了，语法上没有什么需要继续学的。但是一旦回到天天写 c++的日子，就会时不时的有新收获，发现要学的还很多，这东西很难

机器学习呢，现在还是很幼稚的阶段，理论欠缺甚多，远未成熟。实际做事也是，摸索着前进。

murmur

2017 年 1 月 27 日

这跟普通程序员没多大关系，但是培训班是绝对不会讲这些东西的，就算是调参要么靠直觉要么靠数学两个都不会你能干嘛
一个训练程序多少个参数呢都是阿尔法北塔伽马的
这是核心竞争力
对了调参你以为很简单么？训练数据放多少合适？迭代次数多少合适？多了会不会过拟合？

当然了，迫于经济压力，现在的机器学习算法都给竞价排名让步了

bravecarrot

2017 年 1 月 27 日

调参方法都是商业秘密
model 都差不多看谁调参厉害

binux

2017 年 1 月 27 日

机器学习是一个工具，在不同的场景需要搭建大量的 pipeline 才能使用。而大量现成的库和模型让一般程序员也能利用机器学习的成果。
其次机器学习，数据远比模型重要，你其实并不需要一个 ML 博士，也有可能做得更好。即使你做不到最优的模型，一个最简单的概率模型也能带来 80%的提升。
最后，机器学习不是魔法，它无法噗地一下就解决你的问题，启发式算法并不可耻。详见 rules of ml 我觉得写得很好。

UnknownR

2017 年 1 月 27 日

什么火做什么，乘机捞一笔走了，跟着资本走才有钱赚，只要不忘了技术的本质就好，或者能下定决心跳槽

18600491593

2017 年 1 月 27 日

人的作用在于，思想创作。

tinybaby365

2017 年 1 月 27 日

@snnn 深度神经网络理论早已提出，后来的 GPU 计算能力也证明其可行。现在各种接近梯度消失，训练过拟合的方法不断出现。图像的机器分离效果已经超过人类，再觉得不成熟就是保守了。

matrix67

2017 年 1 月 27 日

广告推荐啊，滴滴打车最短路径选择啊。我就想的到这些东西了。

还有比如知乎你一点进去很多乱七八糟的你不感兴趣，以后会有更好的 feed 流推荐？

ipwx

2017 年 1 月 27 日

首先反驳“机器学习的算法就这么几种”这一观点。少年你得去看看 Graphical Models ，针对每一个实际问题要先建概率图模型，这一步就得兼顾可计算性和对问题的刻画能力。然后你找一种分布式算法去算吧， Parameter Servers 在向你招手。可以说每一个不同的数学模型建出来的 Graphical Model 就是一个不同算法，要是不同意，你就得承认 HMM 和 Logistic Regression 是同一种算法（都可以由 Graphical Model 刻画）。

要能精确通过数学语言刻画一个实际问题，这就是功力。

如果你不想用 Graphical Model 而投降“黑箱”算法——深度（神经网络）学习。呵呵，你真以为神经网络是完全黑箱吗？你明白 CNN 是针对数据的什么特性在工作吗？（ local receptive field + 平移不变性）应用到具体的问题上就更复杂了，比如两分类，我如果保证正例标注只会漏标不会错标，你如何修改标准的 loss function 以提升在这个具体问题上的性能？

神经网络现在有很多零件，包括结构上比如 CNN, LSTM, Auto-Encoders ，启发式约束比如 L1/L2 正则化，各种 Sparsity Constraint ，训练方法比如 Nesterov Momumtum （一阶方法）， L-BFGS （二阶方法）。网络结构尚且不说，其他每一个超参都会影响到最终训练出来的模型。如何训练神经网络是一种艺术而非技术。

ipwx

2017 年 1 月 27 日

接上面没说完的话。楼主问普通程序员的价值在哪里？那我可以明确说，价值就在调参。每一个公司、每一个不同应用，都是要调参的，不可能让学术界的人在这上面浪费大量时间（他们还要研究新的结构、新的模型呢）。

而调参需要很多知识，否则你只能暴力调参，吃力不讨好。所以现在的“普通程序员”是没有调参的能力的。至于怎么办？我不知道。如何培养“普通程序员的调参能力”，这需要工业界去摸索。

laoyuan

2017 年 1 月 27 日

干什么都脱离不了业务

t6attack

2017 年 1 月 27 日

你不知道做什么，那对你来说就没价值。

zgqq

2017 年 1 月 27 日

这个领域太高深，普通人能连砖都没得搬

wdlth

2017 年 1 月 27 日

比如把静态分析加上机器学习，可以研究出写多少代码后就会出现大 BUG ……

snnn

2017 年 1 月 27 日

还是那句话，你懂得越少，越是觉得什么都知道。你懂得越多，越发现这简直就是伪科学。
举个例子， SGD 被用了 10 几年，这东西真有什么理论基础吗？要说 paper ，早在 1950s 就有了。可是如果你拿它和 GD 、 BFGS 之流相比，你根本说不出来这东西为什么会 work ，你连优化的目标函数是什么都不一定能搞清楚。

snnn

2017 年 1 月 27 日

你要是身在此行，必定需要经常读 paper ，关注行业动态。每年那么多大会，那么多 paper 发出来，总有几篇会启发到你，需要你去尝试。这时候你需要去准备 data ，去写 code ，去尝试你的想法。在别人那工作的好好的东西，在你这未必就有效。可能是他在撒谎，也可能是你工作做的不细致。总之，你不能坐等着，等着别人把这些都在 tensorflow 上面实现了，等着别人把一切都准备好了你只管输入几个参数点下 run 。那你就等着吧，等个 3-5 年肯定会有的。

ipwx

2017 年 1 月 27 日

@snnn 我觉得随机梯度下降优化的是整体目标函数的期望，随机变量是 mini-batch 。收敛性可能不满足，但是大体思想是没错的。至于收敛性…… 有多少数学方法的收敛性在实际计算机应用的时候是仔细考量过的？差不多收敛就行了。

http://i1.piimg.com/4851/bb15e992a91de3c8.png

googlebot

2017 年 1 月 27 日

看着像江湖骗子，和治疗癌症一样，整天都有所为新的突破，都在忽悠，

不过治疗癌症能骗钱，看来机器学习也能骗钱，

Neveroldmilk

2017 年 1 月 27 日

到最后就是建模优化，基本都是码农的活。
@matrix67
寻路算法跟深度学习关系不大。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/337098

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.