半导体晶圆缺陷预测数据集SemiconductorWaferDefectPrediction-gilcamelot
数据来源:互联网公开数据
标签:半导体, 晶圆, 缺陷检测, 机器学习, 预测模型, 质量控制, 数据分析, 制造业
数据概述:
该数据集包含来自半导体制造过程的晶圆缺陷检测数据,用于构建预测模型,以识别和预测晶圆的缺陷。主要特征如下:
时间跨度:数据未明确标明时间,但可推测为特定生产批次或时间段的静态数据。
地理范围:数据来源未明确,但可推测为半导体制造工厂的生产数据。
数据维度:数据集包含多个字段,包括:No.(序号),LOT_ID(批次号),WF_ID(晶圆编号),X_AXIS(X轴坐标),Y_AXIS(Y轴坐标),GRADE_CD(缺陷等级),G_A到G_T(晶圆表面特征测量值),Neighbor_A到Neighbor_T(相邻晶圆特征),Weight_Base_A到Weight_Bound_T(权重相关指标),以及PKT_Y(目标变量,表示晶圆是否出现缺陷)。
数据格式:CSV格式,包含challenge_train.csv(训练集),challenge_test.csv(测试集)和challenge_sample_submission.csv(提交样例)三个文件,便于数据分析和模型训练。
来源信息:数据来源于公开的挑战赛或数据集,已进行脱敏处理。
该数据集适合用于半导体制造过程中的缺陷预测、质量控制和生产优化。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于半导体制造、机器学习和数据挖掘领域的学术研究,如缺陷预测模型的开发、特征重要性分析等。
行业应用:为半导体制造企业提供数据支持,尤其适用于提高生产良率、降低生产成本、优化质量控制流程。
决策支持:支持生产管理人员制定更有效的生产策略,预测潜在缺陷,并进行预防性维护。
教育和培训:作为数据科学、机器学习和工业工程等相关课程的实训素材,帮助学生和研究人员理解半导体制造流程。
此数据集特别适合用于探索影响晶圆缺陷的关键因素,构建预测模型,并优化半导体制造过程。