有没有懂机器学习的 V 友,有偿长期合作,帮忙指教检查一下代码。

39 天前
 seetheworld
2137 次点击
所在节点    Python
36 条回复
ZedRover
39 天前
深度学习吗 我平时做 tabular 数据跟时序数据多一点
Yuhyeong
39 天前
什么方向,最近做 StableDiffusion 多一些。传统机器学习也没什么问题
seetheworld
39 天前
@ZedRover 不是深度学习,就是传统机器学习,新手,不太懂如何保证训练出来的模型(比如 RF 、XGBoots )是正确的,没有过拟合或欠拟合
seetheworld
39 天前
@Yuhyeong 是传统机器学习,最近写了一个代码,训练出来了一个 RF 模型,在训练集和测试集上的 R^2 都达到了几乎是 1 ,不知道是不是有问题
Yuhyeong
39 天前
强化学习?这个没怎么接触过
Yuhyeong
39 天前
@Yuhyeong 刚看成 RL 了,有点太传统了,这个属实记不起来了
jasonlee16819
39 天前
菜狗 AI 训练师一枚,只知道训模型,数据或者模型训练方法层面上了解的比较多
kkjz
39 天前
sklearn 包+dl 的 cv ,欢迎交流~
kkjz
39 天前
@kkjz 也是菜狗,想找找讨论的地方)
airqj
39 天前
@seetheworld #4 是不是训练集数据分布不均匀
seetheworld
39 天前
@jasonlee16819 模型训出来,如何判断靠不靠谱,目前很迷茫
seetheworld
39 天前
@airqj 意思是数据范围跨度不够广?集中在某一范围内么?
seetheworld
39 天前
@kkjz 我们也是用的 sklearn 包,摸索学习阶段,多多交流
fengzc
39 天前
各种指标对一对 什么 PR F1 (去看看每个指标的意义)就能看出是不是过拟合和欠拟合了,也可以去找找更多的数据集试试?一般机器学习在小规模数据集上到 1 其实都是可能的,因为一些特征可能给大家摸索烂了
leopod1995
39 天前
多跑点数据集试试呢?

https://www.heywhale.com 推荐一个国内的平台
seetheworld
39 天前
@fengzc PR F1 是不是分类器的指标?我们训练的是 RF 回归模型,看的 R^2 ,RMSE, MAE 。在训练集上 R^2 是 1 ,MAE=0.4, RMSE=4.2 ,在测试集上 R^2=0.96, MAE=1.2, RMSE=11.2 。但纯看这几个指标不知道能否确定模型是否正确。
v24radiant
39 天前
RF 是指随机森林吗?怎么不试一下 xgboost?
Sawyerhou
39 天前
机器学习应该有三个数据集,训练、验证、测试,你是省略了一个?
R 方是线性回归的评估指标,非线性的不太适用,
你这个 R 方非常高,是课本数据?生产中 R 方应该不会这么高
模型收敛了,可以满足场景需求就可以了,其他不用太在意
Djaron
39 天前
一直在做 ML 和 DL ,绿色软件: Vy1KZWZmcmV5LURvbmc=
jasonlee16819
39 天前
@seetheworld
首先得确定数据,训验集划分是否正确,数量,分布情况如何?是否有数据集泄漏或者同源情况,是否是训练集过大而测试集过小或丰富度远不如训练集的情况......
上边也有一些大佬说了这些问题,比如过拟合啥的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1030478

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX