神经网络模型在训练第一个 Epoch 报出 Warning 然后继续从头开始训练循环往复,请问如何解决?

2020-08-30 17:51:41 +08:00
 suifengingo
神经网络模型在第一个 Epoch 训练时,报错“12872/21931 [================>.............] - ETA: 3:55:38 - loss: 1.8393 - accuracy: 0.7415/usr/local/python3/lib/python3.6/site-packages/keras/utils/data_utils.py:616: UserWarning: The input 12494 could not be retrieved. It could be because a worker has died.”
然后就会继续从第一个 Epoch 开始重新进行训练,请问这种情况如何解决?先谢谢了!
1058 次点击
所在节点    问与答
4 条回复
imn1
2020-08-30 18:45:51 +08:00
你用你的出错信息去搜搜,so 和 git issues 都有类似的提问,自行参考
suifengingo
2020-08-30 19:13:37 +08:00
@imn1 搜索无果,便来万能的 V 站求助
superlc
2020-08-31 12:51:54 +08:00
keras 没用过,如果是 pytorch 的话出现类似的情况可以把 shuffle 关掉然后记下来数据 id,先看下是不是每次都挂在同一个样本上,是这个样本有问题还是程序有问题
suifengingo
2020-09-01 19:56:03 +08:00
@superlc 程序好像没问题,之前类别少且批次为 16 的时候就可以正常运行,现如今类别多改为 64 后报出这样的警告,后来改为 16 后仍会报错,实在是不知道该怎么办了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/702616

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX