train-test split(训练-测试划分):机器学习中把数据集按一定比例分成训练集(用来训练模型)和测试集(用来评估模型在未见数据上的表现)的方法。常见比例有 80/20、70/30 等;有时还会另外划分验证集。(该术语也可写作 train/test split 或 train–test split。)
/ˈtreɪn tɛst splɪt/
We used a train-test split to evaluate the model.
我们使用训练-测试划分来评估这个模型。
After a stratified train-test split, the classifier achieved higher accuracy on the test set without changing the algorithm.
在进行分层的训练-测试划分之后,即使不更换算法,这个分类器在测试集上的准确率也提高了。
该词组由三个常用词组成:train(训练,指用数据拟合模型参数)、test(测试,指在未参与训练的数据上检验表现)、split(切分,指把整体数据分开)。作为机器学习术语,它随着统计学习与实践型数据科学工具的普及而广泛使用,强调“训练”和“评估”要在不同数据上进行,以减少对模型效果的误判。