深度学习训练神经网络模型无故暂停的问题请教

2019-12-10 11:06:17 +08:00
 suifengingo

在这里想请教大佬们一个问题:

在用迁移学习训练网络模型的时候,运行到第一个 Epoch 最后的时候,卡在那里不再往下走了,但程序并没有停,Cuda 也显示是扔在加速着,请问下这个是什么原因呢?谢谢!

(这个做的是图片分类的任务,之前选用很少的几个类别进行训练的时候是完全没有任何问题的,但是类别扩展到几千类之后就出现这种情况了,苦于这个问题,百思不得其解)

938 次点击
所在节点    问与答
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/627543

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX