学生学业状况预测数据集-入学至毕业
数据来源:互联网公开数据
标签:学生,辍学,毕业,入学,成绩,教育,预测,分类,机器学习
数据概述:
本数据集旨在预测学生的学业最终走向,是一个适用于分类问题的真实世界数据集。它包含了与学生人口统计学特征、学业表现、以及社会经济因素相关的各种特征。数据集提供了学生入学和学业进展的全面视图,非常适合用于分类任务。
数据集中包含以下特征:
婚姻状况:学生的婚姻状况。
申请方式:申请方式(例如,在线、亲自)。
申请顺序:申请提交的顺序。
课程:学生申请的课程或项目。
日间/夜间出勤:指示学生是在白天还是晚上上课。
之前的学历:学生的之前的学历。
之前的学历(成绩):在之前的学历中取得的成绩。
国籍:学生的国籍。
母亲的学历:学生母亲的学历。
父亲的学历:学生父亲的学历。
母亲的职业:学生母亲的职业。
父亲的职业:学生父亲的职业。
入学成绩:入学时取得的成绩。
流离失所:指示学生是否流离失所。
特殊教育需求:指示学生是否有特殊教育需求。
负债:指示学生是否负债。
学费是否已付清:指示学生的学费是否已付清。
性别:学生的性别。
奖学金获得者:指示学生是否持有奖学金。
入学时的年龄:学生入学时的年龄。
国际学生:指示学生是否是国际学生。
第一学期课程单元(已获得学分):第一学期已获得学分的课程单元数量。
第一学期课程单元(已注册):第一学期注册的课程单元数量。
第一学期课程单元(评估):第一学期评估的课程单元数量。
第一学期课程单元(已通过):第一学期已通过的课程单元数量。
第一学期课程单元(成绩):第一学期课程单元的平均成绩。
第一学期课程单元(未评估):第一学期未评估的课程单元数量。
第二学期课程单元(已获得学分):第二学期已获得学分的课程单元数量。
第二学期课程单元(已注册):第二学期注册的课程单元数量。
第二学期课程单元(评估):第二学期评估的课程单元数量。
第二学期课程单元(已通过):第二学期已通过的课程单元数量。
第二学期课程单元(成绩):第二学期课程单元的平均成绩。
第二学期课程单元(未评估):第二学期未评估的课程单元数量。
失业率:当地失业率。
通货膨胀率:当地通货膨胀率。
GDP:当地GDP。
目标变量:
目标:多类别分类问题,包含以下类别:
毕业:指示学生是否已毕业。
辍学:指示学生是否已辍学。
在读:指示学生是否仍在读。
数据用途概述:
该数据集主要用于预测学生的学业最终走向,可用于学生辍学率预测、学业进展评估、教育政策制定等多种应用场景。研究人员可以利用该数据进行分类建模,分析影响学生学业表现的关键因素,帮助教育机构识别高风险学生,并制定相应的干预措施。该数据集也有助于深入理解学生辍学的原因,从而制定更有效的教育策略。