求教下 tensorflow 入门要什么基础吗?很难么?

2017-11-09 21:45:13 +08:00
 PaulKK
今天下午跟同事聊到这事,一个经理群里发了个消息,问问有没有会 TensorFlow 的程序员,用一个月,7.5W ,
之前有了解过应该是 Google 的一个智能机器学习方面的框架,是不是必须具备高数算法之类的基础啊?
8569 次点击
所在节点    程序员
40 条回复
bashbot
2017-11-10 09:45:45 +08:00
都不用的,哪有那么复杂。
日常工作的标准流程是确定问题类型,然后去找相关的论文或代码,看看用什么网络结构做的,然后在 TF 里面写一个看看效果。
TF 里面常用的算法都实现了,用起来就像搭积木。了解算法可以让你更灵活,不了解就照抄别人。
难的是还没有好的解决方法的问题,或者没有数据集,或者没有 GPU 算力。

每天重复调参很无聊的,毕竟理论基础不完备,很多时候也是跑出来看结果,说不清楚道理的。
谁能说清楚,我要拜师!
rogwan
2017-11-10 10:08:48 +08:00
@bashbot 哈哈,时间有限,来不及深究 ... 很多库不都是拿来先用了再说么,掣肘了,才会去研究内部思路,tf 这个级别的大库,比小库复杂度高多了
takato
2017-11-10 10:26:39 +08:00
建议玩 pytorch,Tensorflow 整体上不适合研究使用,而适合“工业生产”
而很多 AI 并不需要那么“工业”的
PaulKK
2017-11-10 10:33:30 +08:00
@bashbot
@p2pCoder
@coolmenu
@kuhung
@takato 谢谢指教,受益了,感觉要走的路挺多的啊
winglight2016
2017-11-10 11:02:35 +08:00
@bashbot 个人感觉目前 NN 都是属于玄学,基本解决思路是每个算法都试一遍,那个成功率高再细调
geek123
2017-11-10 11:06:35 +08:00
heliumhgy
2017-11-10 11:30:03 +08:00
@Curtion CNN 的卷积和积分变换的卷积不是一个东西。。。而且就算是积分变换的卷积,也不过只是一个算子罢了,没必要虚,就和加分乘法一样,只不过性质多一些而已
yang2yang
2017-11-10 11:37:46 +08:00
感觉人工智能真的是火啊,,
graetdk
2017-11-10 13:32:18 +08:00
7 万多?我给你找一打
PaulKK
2017-11-10 16:49:03 +08:00
@geek123 好的,多谢!!!
PaulKK
2017-11-10 16:49:32 +08:00
@yang2yang 趋势所在啊
lonelygo
2017-11-10 17:08:25 +08:00
@PaulKK
1、Python、C++任意一门手艺过关,最好是 Python ;英语还行,看文档能不太费时间;
2、有一个 Nvidia GPU 的电脑,GPU 不要太差,显存大一点可以节约很多时间;
3、跟着官方教程把几个训练都走一遍,走的过程起码熟悉了大致 TF 在干嘛,也能理解基本的超参数、过拟合等;
4、models/research/ 下面有很多已经做出来的例子了,基本涵盖了深度学习主流的应用场景,结合自己准备上手的领域,看代码,run 起来;
5、过程中看看“花书”等还不算非常难到看不懂的书,补基础;
6、到这里基本算是知道门在哪里了,就看自己的方向和学习毅力了;
wuyuchenshishabi
2017-11-10 17:28:13 +08:00
@takato 写个啥?自动交易的程序?
genius2k
2017-11-10 23:19:13 +08:00
@dangyuluo 有什么推荐的书吗?
inflationaaron
2017-11-10 23:36:44 +08:00
AWS 开 spot,V100 一个小时就$0.5,没有 Nvidia 显卡也能做实验。
Ruin
2017-11-11 10:02:05 +08:00
建议先学习机器学习原理,推荐 Coursera 上的课程: https://www.coursera.org/learn/machine-learning
NumberFairy
2017-11-11 10:53:27 +08:00
其实,现在入门这块的很多,经常跑些实验是最好的。先用 tensorflow 去写,然后尝试理解其中的原理。如果有条件的话,可以看看 Andrew Ng 的机器学习视频,经典中的经典,但是比较枯燥,做好心理准备。
PaulKK
2017-11-11 11:19:19 +08:00
@lonelygo 很详细,太感谢了!!
crackhopper
2017-11-11 14:15:37 +08:00
取决于 tensorflow 干啥。

如果就是弄个能用的模型,能搞点简单的设计和调参,看看基础的神经网络就能搞了。http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial。然后把 model zoo 里面的模型都了解了解,相关论文看一看(不用都看懂,很多论文内容都是胡扯,真正有用的部分不多),跑一跑实验。

如果是开发实现算法和部署 tensorflow,我觉得偏向于纯工程的吧。如果实现算法得会 CUDA 编程,部署什么的,其实现在有 container 也没那么麻烦。

如果是搭建训练平台,估计还得懂一些 ASP,BSP 之类的架构,也需要深入懂 tensorflow。分布式训练的论文貌似也不多,偏实践多一些。
crackhopper
2017-11-11 14:17:23 +08:00
我指的是基于 ASP 和基于 BSP 梯度更新,架构上也需要进行一些支撑,比如 parameter sever 之类的。(不是说 ASP 和 BSP 是架构)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/405091

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX