智利学生学业表现与留级预测数据集ChileanStudentAcademicPerformanceandRetentionPrediction-gabrielsotomayorl

智利学生学业表现与留级预测数据集ChileanStudentAcademicPerformanceandRetentionPrediction-gabrielsotomayorl

数据来源:互联网公开数据

标签:学生表现, 留级预测, 教育数据, 学业成绩, 统计分析, 机器学习, 教育公平, 数据挖掘

数据概述: 该数据集包含来自智利教育系统的数据,记录了学生的学业表现、个人信息以及留级情况,旨在用于分析影响学生学业成就的关键因素。主要特征如下: 时间跨度:数据未明确标明具体时间,可推断为某个或多个学年学生学业表现的综合记录。 地理范围:数据主要覆盖智利地区的学校和学生。 数据维度:数据集包含多个关键字段,包括:RURAL_RBD(学校是否位于乡村地区),GEN_ALU(学生性别),EDAD_ALU(学生年龄),PROM_GRAL(总平均成绩),ASISTENCIA(出勤率),COD_DEPE22至COD_DEPE25(学校依赖类型编码),Beneficio(是否享受福利),promedio_simce(SIMCE考试平均分),Retencion(是否留级)。 数据格式:CSV格式,文件名为datosTarea3.csv,方便数据分析和模型构建。 来源信息:数据集来源于公开的教育数据库,经过整理和清洗,确保了数据的可用性。该数据集适合用于教育研究、学生学业表现分析和留级预测等领域。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于教育学、统计学和机器学习等领域的学术研究,如分析影响学生留级的因素、评估教育政策的效果等。 行业应用:可以为教育机构提供数据支持,帮助学校识别高风险学生,制定干预措施,提高学生的学业表现和留级率。 决策支持:支持教育部门进行教育政策的制定和优化,促进教育公平。 教育和培训:作为教育数据分析、预测建模等课程的辅助材料,帮助学生和研究人员深入理解教育数据分析。 此数据集特别适合用于探索影响学生学业表现和留级的因素,以及构建预测模型,帮助教育工作者和研究人员更好地理解和改善学生的学习环境。

数据与资源

附加信息

字段
版本 1.0
最后更新 四月 29, 2025, 23:03 (UTC)
创建于 四月 29, 2025, 23:03 (UTC)