开放大学学习分析学生学习行为数据集
数据来源:互联网公开数据
标签:学习分析,开放大学,虚拟学习环境,学生行为,在线教育,学习过程,课程,学生表现,数据挖掘
数据概述:
本数据集,即开放大学学习分析数据集(OULAD),提供了关于开放大学学生与虚拟学习环境(VLE)交互的匿名化数据。该数据集涵盖了七门选定课程(称为模块)的数据,这些课程的开课时间分别为2月和10月,分别以“B”和“J”标记。数据集由通过唯一标识符连接的表格组成,所有表格均以CSV格式存储。
数据包含以下几个核心文件:
courses.csv:包含所有可用模块及其呈现方式的列表,字段包括:模块代码(code_module)、呈现方式代码(code_presentation)、模块呈现时长(length)。
assessments.csv:包含模块呈现中的评估信息,字段包括:模块代码(code_module)、呈现方式代码(code_presentation)、评估ID(id_assessment)、评估类型(assessment_type,包括TMA、CMA和Exam)、提交截止日期(date)、评估权重(weight)。
vle.csv:包含VLE中可用材料的信息,例如HTML页面、PDF文件等,字段包括:站点ID(id_site)、模块代码(code_module)、呈现方式代码(code_presentation)、活动类型(activity_type)、材料使用起始周(week_from)、材料使用结束周(week_to)。
studentInfo.csv:包含学生的个人信息和学习结果,字段包括:模块代码(code_module)、呈现方式代码(code_presentation)、学生ID(id_student)、性别(gender)、居住地区(region)、最高学历(highest_education)、贫困指数(imd_band)、年龄段(age_band)、先前尝试该模块的次数(num_of_prev_attempts)、已修学分(studied_credits)、是否有残疾(disability)、最终结果(final_result)。
studentRegistration.csv:包含学生注册模块呈现的时间信息,以及退学学生的退学时间,字段包括:模块代码(code_module)、呈现方式代码(code_presentation)、学生ID(id_student)、注册日期(date_registration)、退学日期(date_unregistration)。
studentAssessment.csv:包含学生评估结果,字段包括:评估ID(id_assessment)、学生ID(id_student)、提交日期(date_submitted)、是否为转存成绩(is_banked)、评估得分(score)。
studentVle.csv:包含学生与VLE中材料交互的详细信息,字段包括:模块代码(code_module)、呈现方式代码(code_presentation)、学生ID(id_student)、站点ID(id_site)、交互日期(date)、点击次数(sum_click)。
数据用途概述:
该数据集适用于多种学习分析和教育研究场景,包括:学生学习行为分析、课程设计优化、学习效果评估、预测学生表现、个性化学习推荐等。研究人员可以利用此数据分析学生在VLE中的行为模式,探索影响学生学习成绩的因素,从而改进教学方法和学习资源,提升学生的学习体验和学习效果。此外,该数据集也常用于数据挖掘和机器学习模型的构建,例如预测学生是否会退学、预测学生的最终成绩等。