sklearn 混合特征工程如何进行训练呢?

2020-01-10 23:20:02 +08:00
 SlipStupig

想用 sklearn 做个多特征的分类器,特征分别是:

我现在做的时候使用TF-IDF,做分类,单其它特征就没有用上,有什么办法能把所有特征用上呢?

1508 次点击
所在节点    程序员
5 条回复
qza1212
2020-01-11 02:29:56 +08:00
直接特征拼起来 + 树形分类器 e.g. rf xgboost
GrayXu
2020-01-11 03:25:21 +08:00
看你的模型是什么呗,比如 ls 说的如果使用 xgb 之类的重家伙,直接 concat 就好了
xmoiduts
2020-01-11 07:55:11 +08:00
树形结构例如 rf 的话,特征数量会不会有点少……最近做项目用的是 9 个特征,多个 rf 模型做 4 个输出的回归 /分类。效果(也就那样吧),很神奇的是:均方差比神经网络低一半,rf 和 xgboost 表现几乎一样。
kuhung
2020-01-11 08:29:16 +08:00
直接拼接。不过事先要观察相关性,无脑上特征不一定好。
xou130
2020-01-11 10:12:43 +08:00
lightgbm, 但是这类分类器吃特征数量,做比赛一般是 40 个特征起

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/636991

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX