比塞普学生表现预测数据集
数据来源:互联网公开数据
标签:学生表现,比塞普,教育数据分析,预测模型,学术历史,社会经济因素,回归分析,分类分析
数据概述:
本数据集包含了比塞普教育局(BISEP)下注册的90,000名学生的记录,涵盖高中(9年级和10年级)和预大学(11年级和12年级)学生的数据,来自包括白沙瓦、查尔萨达、开伯尔、莫汉曼德和奇特拉尔在内的多个地区。数据集的主要目的是基于学生的学术历史和社会经济因素预测他们在12年级(HSSC Part 2)考试中的最终成绩和等级。
字段定义:
Student_ID:每个学生的唯一标识符(数值型)。
Region:学生所在地区(类别型:白沙瓦, 查尔萨达, 开伯尔, 莫汉曼德, 奇特拉尔)。
Gender:学生的性别(类别型:男性, 女性)。
Enrollment_Type:学生的入学类型(类别型:正规, 私人)。
Subject_Group:学生所选科目组(类别型:科学, 文科)。
SSC_I_Marks:学生在9年级(SSC Part 1)考试中的得分(数值型,范围为300到850)。
SSC_II_Marks:学生在10年级(SSC Part 2)考试中的得分(数值型,范围为300到850)。
HSSC_I_Marks:学生在11年级(HSSC Part 1)考试中的得分(数值型,范围为300到850)。
Attendance_Rate:学生在学年内的出勤率百分比(数值型,范围为50%到100%)。
Parent_Education_Level:学生家长的教育水平(类别型:高中, 大学, 研究生)。
Parent_Income:家庭收入水平(类别型:低, 中, 高)。
Study_Hours:学生每天平均学习小时数(数值型,范围为1到5小时)。
Extra_Tuition:学生是否在课外接受辅导(类别型:是, 否)。
School_Type:学生就读的学校类型(类别型:公立, 私立)。
Previous_Failures:学生在以往考试中不及格的次数(数值型,范围为0到2)。
Co_Curricular_Activities:学生是否参与课外活动(类别型:是, 否)。
Exam_Attempts:学生参加最终考试的次数(数值型,范围为1到2)。
目标变量:
HSSC_II_Marks:学生在最终考试(12年级,HSSC Part 2)中获得的分数(数值型,范围为300到850)。这是回归任务的目标变量,用于预测分数。
HSSC_II_Grade:学生在12年级考试中获得的最终等级(类别型:A-ONE, A, B, C, D, Fail)。这是分类任务的目标变量,用于根据分数预测等级。
数据用途概述:
该数据集适用于预测学生在高中最后一年(HSSC Part 2)的表现(包括分数和等级),基于他们的学术历史和社会经济及个人因素。数据集可用于:
回归模型:预测学生在最终考试(HSSC Part 2)中的具体分数。
分类模型:预测学生将在最终考试中获得的等级类别(如A-ONE, A, B等)。
机器学习应用:
该数据集非常适合用于教育数据挖掘(EDM),特别是用于构建预测模型,帮助教育机构识别可能需要额外支持的风险学生。通过分析历史表现和其他因素,教育管理者可以为可能表现不佳的学生提供个性化的干预措施,帮助他们改善最终成绩。