Python 深度学习训练神经网络模型时无故暂停问题的请教

2019-12-10 13:36:22 +08:00
 LoveIsPain

在这里想请教一个问题:

在用迁移学习训练网络模型的时候,运行到第一个 Epoch 最后的时候,卡在那里不再往下走了,但程序并没有停,Cuda 也显示是仍在加速着,请问下这个是什么原因呢?谢谢!(这个做的是图片分类的任务,之前选用很少的几个类别进行训练的时候是完全没有任何问题的,但是类别扩展到几千类之后就出现这种情况了)

3042 次点击
所在节点    Python
2 条回复
yoshiaki
2019-12-13 14:04:47 +08:00
我认为这是程序在跑 val 数据集导致的,跑完一个 epoch,显示的 val_acc 和 val_loss 就是这时候计算的,你几千类,batch_size 应该会大不少,不过详细也需要看过你代码才知道
LoveIsPain
2019-12-14 20:53:46 +08:00
谢谢您

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/627595

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX