市面上 GPU 服务器都好贵,机器学习跑 model 用顶级 CPU 服务器行吗?

2017-04-28 10:05:03 +08:00
 Reign

在自己的服务器上用别人训练好的 caffemodel 来测试图片,每张图片处理平均耗时半分钟,实在太慢,当然我的服务器机器也太差,双核 ATOM 的 CPU+4G 内存,想换成 GPU 服务器,逛了逛 GPU 服务器好贵,目前就在想两种方法:

  1. 用核心数和线程数最好的 CPU 来跑 model,这样能把单张图片处理时间控制在 3 秒之内吗?
  2. 用自己的台式机 7*24 小时来跑,但台式机配置也很老了:E3-1230V3+8G+GTX770,但是个人有点强迫症,始终担心安全隐患(小时候自己研发的电气设备半夜把房子烧了,还好自己和家人一点事都没有),运行大型 3D 游戏比如使命召唤时,机箱基本就是一个火炉了,白天没人在家,始终担心安全问题。另外,自己要从国外网站抓图片来跑,电信出口带宽慢成蜗牛,也是我顾及的地方

求好心 V 友给点意见

1816 次点击
所在节点    机器学习
26 条回复
dream7758521
2017-04-28 10:08:49 +08:00
这个你开个高配置的云服务器试一下啊
mason961125
2017-04-28 10:11:08 +08:00
我想知道为什么你的服务器会用 Atom...
hiboshi
2017-04-28 10:12:24 +08:00
楼主开云主机的时候提前告诉我们是哪家。以便我们尽快转移,担心机房被烧了。
Reign
2017-04-28 10:12:41 +08:00
@mason961125 一个很普通的网站,不需要很高的配置
Reign
2017-04-28 10:14:24 +08:00
@hiboshi 机房有 UPS、空调还要监控等等,我就一台机器大夏天房子啊沙发旁边,哎,心理阴影
mason961125
2017-04-28 10:14:42 +08:00
@Reign 不是说要多高的配置,而是现在大部分云服务商用的都是 E5 了,Atom 的性能真的跟不上。
irainsoft
2017-04-28 10:16:03 +08:00
想到这个月月初 ikoula 特价机最底下一个 GTX 1080 的服务器....
c0878
2017-04-28 10:28:42 +08:00
直接 AWS 上面按小时租 跑完任务释放掉 其实没多少钱
caomaocao
2017-04-28 10:38:51 +08:00
为啥会是 ATOM....
Morriaty
2017-04-28 10:43:50 +08:00
关键你是要学习还是应用,学习的话,哪怕处理时间超过半小时都能接受啊

应用的,去找老板要钱
ivmm
2017-04-28 10:47:43 +08:00
GPU 也得专门用来计算的,而不是游戏显卡
denghongcai
2017-04-28 10:50:21 +08:00
这个担心有点诡异吧…… E3 1231 v3 大奶,E5 2683 v3 二奶二十四小时开机一年多了都,总不至于电源是垃圾吧
wangzhangup
2017-04-28 11:03:19 +08:00
@ivmm 我是深度学习从业者,非常负责任地告诉你,行业内大部分都是 gtx 系列的 gpu。
jarlyyn
2017-04-28 11:04:37 +08:00
换个风扇?
wangzhangup
2017-04-28 11:09:40 +08:00
1. 主要看你的 model 结构怎么样,比较 tiny 的网络 CPU 多线程速度也很快。但是网络复杂的话 cpu 还是吃不消的。

2. 这个问题我从侧面回答吧。目前行业内用的比较多的 gpu 是 gtx titan x 和 1080 以及 1080ti,价格分别是 9000+,4000+,5500+。同样 model 的情况下,同价位的 gpu 要比 cpu 的速度快 30 到 50 倍。所以 gpu 服务器是必须的,但是“私搭”还是云服务就看你具体情况了
ivmm
2017-04-28 11:26:43 +08:00
@wangzhangup
Azure 用的是:NVIDIA Tesla
AWS 用的是:NVIDIA Tesla
Aliyun 用的是:AMD FirePro
腾讯用的是 :NVIDIA Tesla

精密计算用游戏 GPU 还是不太行的, 用 AMD 的游戏显卡在初期临时代替还行,GTX 真的是专注打磨游戏的 GPU
shengyu
2017-04-28 11:32:05 +08:00
aws 竞价服务器
Aliencn
2017-04-28 11:55:09 +08:00
然而我们免费 GPU 的测试服务器分配完了。
如果付费使用 GPU 服务器的话,你想要什么样的配置,以及什么价位你能接受
longbye0
2017-04-28 12:17:21 +08:00
@ivmm 你需要知道双精度浮点性能和单精度,对于计算化学这类需要双精度,但是对视觉任务来说,比如楼主的跑个 caffemodel,单精度足够,所以 titan x 是最经济的
h4x3rotab
2017-04-28 16:48:30 +08:00
google 里经常看见人用 1000 个 cpu 跑 tensorflow,意思就是有钱的话,cpu gpu 也没什么太大关系

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/357876

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX