国际数据分析竞赛2022-轻量级特征数据集

国际数据分析竞赛2022-轻量级特征数据集

数据来源:互联网公开数据

标签:梯度提升算法,轻量级特征,国际数据分析竞赛,材料科学,图特征,机器学习,特征工程

数据概述:
本数据集是2022年国际数据分析竞赛(IDA竞赛)中NESCafe团队(金牌3in1战队)提供的轻量级特征工程结果,属于竞赛中的优秀解决方案之一。数据集包含了基于原始数据计算的特征,主要分为两类:一类是无缺陷(no_defects)特征,另一类是基于肖特基缺陷(defects)的特征。此外,数据集还包含了一系列图特征,如图的PageRank值、Adamic-Adar指数、边数、密度、全局效率、度数 assortativity 系数等。这些特征为竞赛中的梯度提升算法提供了高效的特征表示,帮助模型在竞赛中取得了优异成绩。

数据用途概述:
该数据集适用于机器学习模型的特征工程研究、梯度提升算法的优化、材料科学领域的数据分析以及图特征提取与应用等场景。研究人员可以利用这些特征进行模型训练和性能评估,探索特征工程对模型性能的影响。同时,数据集中的图特征可用于图结构数据的分析,为材料科学领域的研究提供支持。此外,该数据集还可用于教学和培训,帮助学习者理解特征工程在机器学习中的重要性及实现方法。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 2.36 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。