请问如何用训练集的参数标准化测试集?

2018-07-11 05:33:42 +08:00
 acone2003
train_features 是训练集的原始特征,test_features 是测试集的原始特征。我现在想先把训练集中每列进行标准化,然后用它的参数(平均值和标准差)去标准化测试集对应的列,问一下该怎么做?
3380 次点击
所在节点    Python
4 条回复
acone2003
2018-07-11 06:52:15 +08:00
我这样做对吗?
scaler = preprocessing.StandardScaler()
Ens_seg1_all_std_probaes = scaler.fit_transform( Ens_seg1_all_probaes )
Ens_seg2_all_std_probaes = scaler.transform( Ens_seg2_all_probaes )
其中 Ens_seg1_all_probaes 为训练集特征矩阵,Ens_seg2_all_probaes 为测试集的
capo
2018-07-11 09:43:19 +08:00
没有思考过这个问题,一直都是先在整个数据集上做标准化这样的工作,然后再划分训练集之类的
glasslion
2018-07-11 09:48:10 +08:00
对的
Morriaty
2018-07-11 10:01:01 +08:00
训练集和测试集特征空间不一致,这模型还有什么用.....

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/469770

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX