suifengingo
V2EX  ›  问与答

神经网络模型在训练第一个 Epoch 报出 Warning 然后继续从头开始训练循环往复,请问如何解决?

  •  
  •   suifengingo · Aug 30, 2020 · 1907 views
    This topic created in 2099 days ago, the information mentioned may be changed or developed.
    神经网络模型在第一个 Epoch 训练时,报错“12872/21931 [================>.............] - ETA: 3:55:38 - loss: 1.8393 - accuracy: 0.7415/usr/local/python3/lib/python3.6/site-packages/keras/utils/data_utils.py:616: UserWarning: The input 12494 could not be retrieved. It could be because a worker has died.”
    然后就会继续从第一个 Epoch 开始重新进行训练,请问这种情况如何解决?先谢谢了!
    4 replies    2020-09-01 19:56:03 +08:00
    imn1
        1
    imn1  
       Aug 30, 2020
    你用你的出错信息去搜搜,so 和 git issues 都有类似的提问,自行参考
    suifengingo
        2
    suifengingo  
    OP
       Aug 30, 2020
    @imn1 搜索无果,便来万能的 V 站求助
    superlc
        3
    superlc  
       Aug 31, 2020 via iPhone
    keras 没用过,如果是 pytorch 的话出现类似的情况可以把 shuffle 关掉然后记下来数据 id,先看下是不是每次都挂在同一个样本上,是这个样本有问题还是程序有问题
    suifengingo
        4
    suifengingo  
    OP
       Sep 1, 2020
    @superlc 程序好像没问题,之前类别少且批次为 16 的时候就可以正常运行,现如今类别多改为 64 后报出这样的警告,后来改为 16 后仍会报错,实在是不知道该怎么办了
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2280 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 00:47 · PVG 08:47 · LAX 17:47 · JFK 20:47
    ♥ Do have faith in what you're doing.