V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
zxCoder
V2EX  ›  问与答

请教炼丹师们一个二分类的问题

  •  
  •   zxCoder · 2020-05-10 20:55:22 +08:00 · 995 次点击
    这是一个创建于 1445 天前的主题,其中的信息可能已经有所发展或是发生改变。
    用 pytorch 实现的一个 FM 模型做一个二分类,然后 logloss 很大,然后发现训练样本大多数是准确的,但是有几个比如实际值是 0,预测值是 9.9999999,实际值是 1,预测值是 0.00000...,这是因为数据太少(数据集只有 600 行左右)的原因吗,还是因为模型撘错了。
    第 1 条附言  ·  2020-05-10 21:46:31 +08:00
    而且感觉训练结果特别不稳定的样子,每跑一遍的结果都不太一样,loss 从 0.6 到 1.2.。。
    第 2 条附言  ·  2020-05-10 22:08:26 +08:00
    换成了 focal loss 损失函数,效果就变好了
    4 条回复    2020-05-11 11:16:58 +08:00
    Liyiw
        1
    Liyiw  
       2020-05-10 21:13:55 +08:00
    1 、先统计正负样本的数量
    2 、准不准确要在 val set 或者 test set 上面测,在训练样本上测没用的
    zxCoder
        2
    zxCoder  
    OP
       2020-05-10 21:37:03 +08:00
    @Liyiw 测试集效果也很差,用的交叉熵损失函数是 0.8 左右。。。有几个样本偏差得很奇怪,完全反的
    neosfung
        3
    neosfung  
       2020-05-11 08:51:14 +08:00 via iPhone
    不对吧,你一个二分类模型,预测值只有 0 和 1 两个标签的概率。预测值怎么跑到 9.9999999
    zxCoder
        4
    zxCoder  
    OP
       2020-05-11 11:16:58 +08:00
    @neosfung 写错了,应该是 0.999999999
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3307 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 12:32 · PVG 20:32 · LAX 05:32 · JFK 08:32
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.