keras 的多显卡并行没有加速效果

2017-12-20 12:42:07 +08:00
 zhiqiang

我用的 keras 提供的 multi_gpu_model,用法参考了 keras 的官方文档:

from keras.utils import multi_gpu_model

# Replicates `model` on 8 GPUs.
# This assumes that your machine has 8 available GPUs.
parallel_model = multi_gpu_model(model, gpus=8)
parallel_model.compile(loss='categorical_crossentropy',
                       optimizer='rmsprop')

# This `fit` call will be distributed on 8 GPUs.
# Since the batch size is 256, each GPU will process 32 samples.
parallel_model.fit(x, y, epochs=20, batch_size=256)

但就我的应用(一个时间序列 LSTM 模型)而言,用两块 GPU 运算单轮训练的时间甚至还稍高于用单块 GPU。

现在 multi_gpu_model 功能还没有正式 release,网上公开信息不多。有人用过这个吗,来谈谈优化方法吧。

1924 次点击
所在节点    机器学习
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/416233

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX