KaggleTPSFeb-22数据集-去重训练集与分层交叉验证数据集

KaggleTPSFeb-22数据集-去重训练集与分层交叉验证数据集 数据来源:互联网公开数据 标签:Kaggle, TPS, 机器学习, 竞赛, 数据集, 分层, 交叉验证, 去重, 训练集 数据概述: 本数据集专为Kaggle平台上的“TPS (Tabular Playground Series) Feb'22”竞赛设计。它基于原始的TPS Feb'22训练集,经过了关键的数据处理步骤,包括去除重复值,并添加了分层交叉验证的折叠(folds)。

数据用途概述: 该数据集主要用于加速机器学习模型的训练过程,并降低因重复数据导致的过拟合风险。参赛者和研究人员可以使用此数据集进行模型训练、参数调优,以及评估不同机器学习算法在表格数据上的表现。此外,数据集中的分层交叉验证折叠有助于进行模型评估和比较,提高模型的泛化能力。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 161.43 MiB
最后更新 2025年4月26日
创建于 2025年4月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。