小白请教,请问这种数据集要怎么分割训练集和测试集,并且建立训练模型呢?

2018-12-27 15:36:32 +08:00
 stevech
我的想法是把 CSV 文件中若干行的数据作为一个样本(列数定长,但行数不定长),然后在 n 个样本中分割训练集和测试集。
请问这种变长的数据集可以用来建立训练模型吗?
2311 次点击
所在节点    Python
5 条回复
eagle40
2018-12-27 22:01:20 +08:00
还真挺白的:) 先找个 demo 照猫画虎做一遍不就知道了嘛
tottea
2018-12-28 08:58:54 +08:00
是目标检测的数据集吗?我最近做也用到 CSV 的数据格式
stevech
2018-12-28 19:02:16 +08:00
@tottea 是的 QAQ
tottea
2018-12-29 00:21:46 +08:00
@stevech 那这样按图片为单位来分割为训练 /测试集就好了,先把 csv 读进来,注意要以图片为单位,然后打乱,划分为两个集合,再分别写到 train.csv 和 val.csv 就好了
stevech
2018-12-30 21:53:50 +08:00
@tottea 谢谢!!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/521546

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX