深度学习,目标检测 quick start 求助

我想做一个验证码的识别,第一步是要把验证码从背景图片中扣出来,但是我是完全没有深度学习方面的经验,本来都不打算搞这块的但是看到了 yolo ,看起来还挺简单的,好像只是需要手动标注一些数据,然后让他训练一下就可以帮忙识别图片中的东西,并把它标注出来于是我就开始了标注加训练,最开始我标注了一张图,但是发现他然后把原图给他,他也无法识别,我以为是我标注的不够多,所以又标注了几张,发现还是无法识别,所以我现在不知道问题出在了哪里,请求大佬帮忙看看..

命令是

python train.py --img 240 --epochs 3 --data test.yaml --weights yolov5s.pt

结果数据: ps:我真的完全看不懂这些曲线..但是我跟官方提供的数据集做了对比,发现是有些地方不一样,而且我也试了官方数据集只训练一张图片,然后让他 predict 同样的图片,能识别出来..所以我现在不知道问题出在哪是 我需要更换权重吗,或者还是继续标注 n 张图片?

result.csv

一张都没有预测成功

lpf0309

328 天前

@yangyuhan12138 曲线只是测试的损失函数、回收率准确率之类的，观察多个 epoch 的训练效果，只能看出来训练的准确率很低。我 3 年以上目标检测经验，你也不用准备几百张图片，先用二十张图片，训练 50epoch 以上，直接检测训练集图像，正常都能成功。没成功就是你数据或者设置出了问题。yolov5x 和 yolov5s 的 cfg 文件不一样，你用哪个权重用哪个 cfg 文件就行。

SorryChen

328 天前

@yangyuhan12138 没办法深度学习就是 data hungry 的。要么为什么说有多少人工就有多少智能。

如果你的数据集比较简单，且训练数据和你的应用场景真实的数据分布差别不大的话，百张级别也能试试。

否则就需要大量数据，增加模型泛化性。当你发现你的模型可以完美识别训练集里面的图片，但是非训练集里面的图片效果很差的时候，就代表着你的数据量不够，模型过拟合到了训练集。

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/949133

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.