交叉验证:一种用于评估模型泛化能力(在新数据上的表现)的统计/机器学习方法。常见做法是把数据分成若干份(folds),轮流用其中一部分做验证集、其余做训练集,并对多次结果取平均。常用于模型选择与调参。(也有其他形式,如留一法、分层K折等。)
/ˌkrɔːs ˌvælɪˈdeɪʃən/
Cross-validation helps us estimate how well the model will perform on unseen data.
交叉验证帮助我们估计模型在未见数据上的表现。
After tuning the hyperparameters, the team used 10-fold cross-validation to compare several classifiers and reduce the risk of overfitting.
在调好超参数后,团队使用10折交叉验证来比较多个分类器,并降低过拟合风险。
cross- 有“交叉、轮换”的含义,强调在不同数据切分之间轮流验证;validation 来自拉丁语 validus(“有力的、有效的”),表示“验证、确认有效性”。合起来即“通过轮换切分来验证(模型)有效性”。